查看原文
其他

欢迎来到提示词的美丽新世界

王艺 创业邦 2023-12-22
提示词的未来充满无限可能。

作者丨王艺

编辑丨海腰


与大模型一同诞生的提示词(Prompt)已成为AI领域绕不开的概念。

Sam Altman在与领英联合创始人Reid Hoffman对谈时表示,五年后我们将不再需要提示词工程(Prompt Engineering),或者只需在这方面做少量工作;将来的AI系统不会因为增补了某个特定词就产生截然不同的输出,而是可以较好地理解自然语言。用户只需以文本和语音形式输入指令,就可以让计算机完成图像生成、资料研究、心理咨询等复杂任务。

Sam Altman的表态让外界普遍认为其不看好提示词的前景。

但Sam Altman的不看好,针对的是提示词工程,而不是提示词本身。

在大模型愈发完善,愈发成熟的未来,以提示词工程的形式,让大模型更好的理解自然语言大可不必,但提示词本身却有着无限可能。

红杉一代目Don Valentine曾回忆,自己见过最会提问题的人是乔布斯和红杉二代目Michael Moritz。

提示词的本质是好问题,而不是提示。不管有多好的大模型,好问题永远都有价值。


提示词产品创新浪潮


提示词的发展是与生成式AI和大模型的发展紧密相关。

在去年8月美国科罗拉多州艺术博览会上的作品《太空歌剧院》大火之后,Midjourney、Stable Diffusion、DALLE等AI绘画大模型迅速火爆全网,相伴而生的是各类AI绘画提示词网站和课程,比如做提示词交易市场的PromptBase、做提示词生成器的AI画廊等。


第二波浪潮是ChatGPT、尤其是GPT-4发布后,用户看到了AI聊天机器人的强大实力,开始探索各种各样提示词的玩法,“Prompt Engineer”这一职业也应运而生,抖音上出现了很多打着“成为年薪百万的提示词工程师”的旗号售价199、299等的提示词课程,门槛费用在200-1000不等的提示词社群、知识星球等也如雨后春笋般出现。

第三波浪潮则是今年11月GPTs发布之后,提示词的创作过程和使用场景发生了极大的变化——GPTs通过对话的形式,将一些“原始提示词”封装在了一个小小的对话机器人里,用户通过和GPT对话(对话的过程也是输入原始提示词的过程)创造出自己的GPTs之后,可以自用也可以分发,GPTs能够基于其原始的训练数据,更加高效、专业地解决用户问题。


GPTs发布之后,一批非官方的GPTs商店如Supertools、Suefel、GPTs Hunter等如雨后春笋般出现,用户对“手搓大模型——打造自己的GPTs”表现出了前所未有的热情,搞出了数据分析、学术论文、英语学习、武林秘传、塔罗测算、为你写诗、模拟老爸……等形形色色的GPTs。截至12月16日,也就是GPTs开放给用户之后大约一个月的事件里,GPTs Hunter上已汇聚了61818个GPT,而整个ChatGPT上的GPTs数量更是远远超过这个数字。

GPTs让人们的想象力和创造力得到了极大的发挥,他们搞出了一些相当“炸裂”的GPTs:

  • 比如AI产品经理陈财猫制作的“提示精灵小富贵(Prompt Pet)”,可以让用户通过输入需求获得自己想要的提示词;


  • 比如,有国外大神制作了一个名为“Grimoire (魔法书)”的GPTs,它可以被看做一个“无代码编程系统”,用户通过输入一句话、或者不断和Grimoire进行对话,就可以创建网站和应用程序。



  • 再比如,品牌设计师兼作家Jackson Greathouse Fall在今年3月15日给了GPT-4 100美金,然后让它命令自己做各种各样的事情。ChatGPT先是让他做了一个环保主题的网站,去卖各种各样的周边产品;然后 ChatGPT 教他怎么样用 DALL·E 2 设计这个网站的 logo,甚至给了 DALL·E 2 的 prompt 让他直接放入这个模型里面;接着,教他怎么样去写一个网站,给了他一部分的源代码,他很快就把这个网站搭好了。到后来,GPT甚至还告诉了他应该怎么样去融资,帮他做了一个融资商业计划书的 PPT 。


上下滑动可查看长图

一周后,HustleGPT帮他赚了130美元,在Discord上获得了2095个粉丝;Jacson也真的获得了一个天使投资人的投资,他现在公司的估值是 25000 美金。

这三波AI浪潮在让人们惊叹技术发展速度的同时,也助推了“提示词”这一概念的热度。越来越多人关注到了这一领域,开始寻找“提示词”更多的可能性,「INFOARK方舟」社区主理人刘芮麟就是其中一位。

刘芮麟此前是一家互联网医疗公司的内容负责人,也是最早一波接触ChatGPT的用户之一。ChatGPT发布之后,他发现原本一天需要10个小时才能完成的工作只需要四个小时就能完成,这让他十分激动,开始探索各种AI工具的同时,也成为了一名AIGC领域的忠实信徒。今年6月,他离职创业,和几个朋友一起推出了「INFOARK方舟」社区。


INFOARK方舟社区原名“Info.Ark明日方舟”,是一个AIGC领域的开源知识库,主要提供AIGC领域的基础知识、相关课程、信息源推荐、学术论文、工具介绍等内容。目前INFOARK主要聚焦的赛道是提示词领域,在INFOARK方舟社区主文档中,提供了关于Prompt非常详细的原理介绍、相关教程和指令库, 即使是小白也能轻松阅读。


目前,INFOARK社区已经积累了不少付费用户,刘芮麟的创业团队也通过知识星球订阅、高端付费课程和企业合作商单获得了稳定的现金流。

然而,这并不是他们最终想要达到的目的,在他们看来,INFOARK方舟社区只是聚拢流量的第一步,他们真正想要做的,是一个类似最近大火的动画片《万神殿》里“上载智能(Uploaded Intelligence)”的东西——一个数字化的“第二大脑”。

“我们认为人类的智能还有很大一部分没有被开发,比如很多人数学不好是因为没有数形结合的思维,可能需要开发一款产品,通过可视化、数形结合的方式让人理解数学;再比如人脑的信息过滤能力是有限的,无法处理海量的信息。那么我们就要找到一套过滤信息的手段。这都意味着,你需一套基于“第二大脑”的软件来帮助你,更好的构建你的心智算法、心智模型。这套心智算法和心智模型是‘软件’,是需要依附在硬件之上的,它存在于人的肉身之上可能会消亡,但是存在于计算机硬件之上不会,因为硬盘是可以拷贝和转移的,但是这要消耗巨大的能量。和机器相比,人类最后的尊严可能是,利用极少的能量,调用我们体内的‘认知模型’去消化知识、获得洞见,这是人类相比于机器的优势,有点类似于‘直觉’。

我们应该强化这种优势,因此我们想做一个‘知识生命周期管理’的产品,它能够模拟人的心智,实现知识的创造-继承-利用-分发-销毁这一整套的流程,把人类在认知和心智上的优势流传下去,构建一个类似Avatar的‘数字分身’,它听起来可能和笔记软件比较像,但是它的输入方式和思考方式与笔记软件完全不同,是通过对话的方式进行的。我们会设计一种新的Prompt——「一套问题体系」去和你聊天,通过这套问题体系,它就能获知你的内在价值观、认知模型、决策模型等底层的心智算法,从而构建出你的模拟‘第二大脑’”,刘芮麟说。

在刘芮麟看来,Prompt是一种数据清洗、把信息处理得更加“工程化”的手段,由于在大模型的训练过程中,不断追求用更低成本实现更好的训练效果,所以才出现了Prompt。他认为,Prompt最大的价值就在于怎么把隐性知识通过流程化、标准化、自动化变成显性知识;好的Prompt包含对业务的理解和思考,好用的Prompt流程应该是一个系统化的流程,而好用的Prompt,则应该封装成为解决实际问题的工作流,这也是他们在未来的“第二大脑”产品中所要做的尝试。

除了刘芮麟,同样在Prompt领域做知识付费的还有袁六伟。

袁六伟是知识星球“AI指令俱乐部”的主理人,也是ChatGPT发布后民间最早一波自学成才的指令工程师。他为海尔、科大讯飞等三十多家公司定制过Prompt,一条Prompt的报价在5000-2万元不等,通过指令定制实现了月入10万,也通过对Prompt的深度钻研创办起了没有技术背景的“2人公司”,依靠指令定制、训练营、付费咨询、付费社群等方式,获得了一年近百万的营收。


袁六伟认为,Prompt未来会有两种发展路径:在普通用户侧,随着AI对语义的理解越来越深,Prompt会变得越来越简单易上手,越来越接近自然语言在专业用户侧,Prompt会发展成一门“语言”,类似编程语言一样,会有专门的Prompt Engineer职位来使用AI,比如科研、数据分析、技术开发、内容创作等垂直领域,需要专门的指令工程师来设计和优化Prompt,以引导AI进行复杂的任务。

“未来AI肯定会像电力一样,成为人们生活中的基础设施,但是AI真正的价值在于‘服务’。OpenAI官方肯定会打磨一些指令嵌入到大模型当中去,让用户更好地使用,但是人的需求是多种多样的,官方没有这个精力也没有这个能力去覆盖各个领域的指令,所以在垂直领域,就需要我们这样各行各业的专家们去打造指令。我认为Prompt会像现在的编程语言一样会成为一门语言、一门学科,它的市场会比编程语言大百倍、千倍,因为它是基于自然语言的,它的受众范围和使用场景比编程语言大得多”,袁六伟说。


技术派眼里的提示词


如果说刘芮麟和袁六伟代表了非技术派的观点,那么在技术派眼里,提示词还有非常多可改进的地方和想象空间。

云中江树是最近火热的“结构化提示词”写作范式的发起人,也是GitHub上有着8k+ star的「ChatGPT中文指南」项目和有着2k+star的「LangGPT」项目的作者、EmbraceAGI开源社区的联合创始人。LangGPT项目给提示词设定了一套“模板”和“框架”,通过设置层级结构、标识符、属性词等形式,让很多小白用户通过完形填空的方式就能轻松写出效果还不错的提示词。


以调教GPT生产“诗人Prompt”为例,LangGPT写出来的提示词是这样的:


而当我们把这套提示词输入ChatGPT,它给出的结果是这样的:


云中江树向我们分享了一个他心目中用LangGPT结构化提示词方法撰写的最酷的提示词案例:一个超级酷的老师,擅长使用最简单的词汇和通俗的语言来教会0基础的学生。


上述提示词的作者李继刚是一位互联网产品经理,他同样也是有着技术背景的提示词爱好者。他认为,图片生成领域,现在基本做到了去Prompt化,以前的很多咒语性的写法,现在都不太需要了;但是在文字生成领域,提示词还是需要的。

李继刚提出了提示词的“织梦理论”——写提示词的过程是在为大模型营造一个“梦境”,写Prompt就是在织梦,Prompt Engineer就是织梦师。“Prompt”就像一根根线索,引导ChatGPT走进你所编织的梦境深处。织梦师的技巧越高超,通过Prompt织出的梦境就越真实,越能让ChatGPT成为“梦中人”。

云中江树和李继刚都把Prompt看做AI时代的编程语言,而且都旗帜鲜明地反对“提示词消亡论”。

“提示词有一个非常明显的特点,它用的是自然语言,各个国家都能用自己的语言去使用它和机器进行对话。如果你把它看做一门编程语言,那么会得出两个结论——第一,编程人员会变多,只要有账号、能访问大模型的人都可以编程,那么各种千奇百怪的创意也会多一些;第二,编程人员会分化,一定是有一波人钻研的比较深(提示词工程师)、另一部分比较浅(普通用户),提示词工程师会尝试着把织梦这个事情做得更重、更结构化、逻辑更复杂,而普通用户端则是更加轻量化、更容易的撰写提示词。一个往前端的方向走,一个往后端的方向走,一切都是为了梦中人对话的那个环节更加轻量化。”李继刚说。

而基于上述结论,李继刚认为,微调模型的时代会到来,各家公司一定会把自己的数据结合大模型的能力去微调,形成自己公司独有的“小模型”,这种“小模型”更贴近应用场景、理解能力更强,也是GPT-4到GPT5所必然要经历的一种演化路径。

云中江树则认为,未来的提示词可能是多模态的。“提示词本身不但不是过渡产品,反而是产品演进的长期趋势。随着多模态大模型技术发展,未来我们可以将表情包、动态视频等都作为提示词的一部分,我们得到的输出,也可以是图文音并茂的结果。Prompt的上限并没有被拉低,反而因为这种东西的出现,Prompt的上限还被提高了。”

《ChatGPT进阶 提示工程入门》的作者陈财猫同样提到了未来提示词会变得“多模态”的观点。他认为,随着AI技术的进步,Prompt(提示词)可能会消失,但是“Prompt Engineering(提示词工程)”会持续存在。

陈财猫将Prompt分为了两类:

  • 第一类是弥补AI缺点的Pompt。此类 Prompt 的作用主要是“弥补”模型能力的不足;
  • 第二类是“帮助AI理解人类需求”的Prompt。我们实际上是通过 Prompt 来给AI定义一个目标,交代清楚业务,帮助它理解清楚人类的需求。


针对第一类Prompt,一个很经典的例子是“扫地机器人遇到狗屎没有避开”。一个扫地机器人在遇到狗屎的时候没有避开,反而继续“清洁”。结果就是脏东西拖满了整个屋子。这种情况下,提示词工程师就不得不下类似于“扫地的时候要避开脏东西,不要把它拖得全屋都是”,“遇到脏的地方需要多扫几遍”这种看似废话的Prompt。

这其实是AI智能程度低,或理解人类需求(对齐)不足的表现。然而,随着技术发展的日新月异,我们甚至都不用等模型本身改进,一些产品上的设计就可以解决掉一些这种case。因此,此类 Prompt 可能会很快退出历史舞台。

针对第二类Prompt,同样以机器人扫地为例,假设现在 AI 很聪明了,不仅知道见到狗屎要避开,还知道拿一个小铲子把它铲起来丢掉。但是在你家扫地就要有你家的规矩,比如必须先扫客厅再扫厨房,打扫的时候不准发出一点声音;如果遇到你的女朋友,还必须“向尊敬的少奶奶请安”;为了增强娱乐效果,这个机器人还要一边打扫一边做后空翻。

在这种情况下,就算AI再聪明,它也很有可能搞不清情况和我们想要的效果,这就是“不懂业务”。这时候,我们需要用很清晰的语言把业务规则列出来,比如用特定的顺序打扫”的“顺序”是什么样的。因此,第二类Prompt还可以存活很长一段时间。

此外,陈财猫还提到了提示词发展的一个很重要的趋势——去设施化,现在以软件与功能为中心的人机交互会演变成以AI为中心的人机交互,用户只要说一句自己的需求,不需要任何介质,AI就能立即实现用户的需求。


“这段时间最让我印象深刻的是一个叫「Open Interpreter」的开源项目,这个项目的官方宣传标语叫’A new way to use computer‘——’使用电脑的新方式’,也就是说,你可以随时向它下命令,AI 就会去分析、计划,然后写代码实现你的需求。举个例子,在以前我们要做一个功能或者软件,这背后需要写需求文档-过评审会-开发-测试等一整套复杂流程。但是现在, AI 越来越强,就算这个需求在世界上只有你一个人有,它也有可能写代码当场满足你”,陈财猫说,“在这种情况下,想法就会变得比实现有价值的多。”


提示词的下一个趋势:GUI+CUI


如果上述设想太过遥远,那么未来一到两年,生成式AI和提示词的下一个趋势是什么?

知名提示词工程文档LearningPrompt.wiki的创作者、开源应用PoleStar Chat创始人Jimmy Wong坚信,是GUI(Graphical User Interface,图形化交互界面)+CUI(Conversational User Interface,对话式交互界面)结合的产品。

他认为,一个通过 GUI 弥补 CUI Prompt 不足的很好的例子是,以ComfyUI为代表的文生图、文生视频工作流。

ComfyUI 是一个基于节点流程式的Stable Diffusion AI 绘图工具,它可以将 Stable Diffusion 的流程拆分成节点,以实现更加精准的工作流定制和完善的可复现性。


ComfyUI的界面直观易用AI绘画的每个步骤都被拆成了一个节点,比如加载模型(Load Checkpoint)、采样器(KSampler)、提示词(Prompt)等都是以节点的形式存在,用户可以快速上手并轻松绘图。


通过ComfyUI,用户可以用微调节点、修改笔触或者提示词的方式,就可以实现实时的AI绘画效果。它比传统的文生图大模型最大的优势就在于“指哪打哪”——之前我们总是吐槽AI绘图全靠抽卡,但是ComfyUI的出现让文生图变得可控了。同时,ComfyUI还可以制作AI动图、生成AI动画,效果不输Runway和最近大火的PIKA。


“现在是Stable Diffusion模型的战国时代,而且相对LLM来说没有像 OpenAI 那样的巨头存在。我认为 AI-Native 产品可能会出现在这个领域,甚至明年都有可能出现AI生成的电影。对于小创业者来说,这可能是更有机会的方向”,Jimmy Wong说。



继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存