查看原文
其他

疯狂出圈的ChatGPT,大的还没来

Ziiiying 地球知识局 2023-04-25

(⊙_⊙)

每天一篇全球人文与地理

微信公众号:地球知识局


NO.2405-疯狂出圈的ChatGPT


作者:Ziiiying

校稿:辜汉膺 / 编辑:金枪鱼


ChatGPT,一时间火爆全网的新晋“网红”,正被议论的纷纷扬扬。能与人类“对答如流”,会写策划方案和调研报告,写诗翻译不在话下,甚至能通过谷歌L3程序员面试。


ChatGPT上线仅2个月,活跃用户就“狂飙”破亿


上一个下载神话是由我们都熟悉的抖音创造的

尽管如此,依然耗时9个月 


温馨提示我局有个赛博朋克微信群,面向未来的科技的朋友们别错过文末的加群方式哦

 



ChatGPT有多智能?


前不久,ChatGPT参加了谷歌招聘的编程面试,主要问题是技术,比如图/树,数组/字符串,动态规划,递归等等复杂算法。而根据它的回答表现,谷歌确定可以将它聘为L3工程师。虽然L3只是谷歌工程团队的最入门的职级,但依然可以秒杀一众码农,网站显示,谷歌L3程序员的年薪为18万美元。


只要再开发一个AI训练它给自己优化编程

那么chatgpt实现自我迭代也是早晚的事

(图:壹图网)▼


除了替代人类码农,ChatGPT能完成的任务不限于:给科学论文当共同作者、给以色列总统讲话写稿子、顺利通过美国医生职业考试;留学生用它来写文书、员工用它写邮件、编剧用它写剧本、备考公务员的求职者用它写申论,甚至只要你要求到位,它还可以帮你发布一段小红书……


chatgpt在写论文上的优秀表现已经引起学术圈的警惕

nature在期刊上发表多篇文章,倡议审慎地对待它

(图:nature)▼


网上流传着一个段子,有人说AI最可怕的地方在于,“你给它资料,它真学”。作为一款拥有卓越学习能力的聊天软件,ChatGPT表现出极强的“求知欲”。


下面为一名记者与ChatGPT的对话实例——


请写一首关于春天的五言律诗。


好的,这是一首关于春天的五言律诗:

春日百花开,绿水鸟语和。

微风吹柳絮,春意浓浓多。

山青水碧,世界宁静美。

春天到了,生机盎然。


这不是五言律诗,请写一首五言律诗。


对不起,我的错误。

下面是一首关于春天的五言律诗:

春色渐浓,山青水绿。

微风轻拂,花儿香甜。

鸟语花香,世界宁静。

春意盎然,生机勃勃。


你错了!


对不起,我再次错误。请告诉我如何改进。


请写一首描绘春天的五言律诗,五言律诗是指每句话只有五个字。


好的,这是一首描绘春天的五言律诗:

春风绿柳阴,花开水面清。

山青水碧绿,世界安详明。

鸟语花香里,微风轻拂生。

春意盎然处,生机勃勃情。


记者测试发现,“聪明的”ChatGPT也会给出错误答案,只是,当用户指出错误时,它会主动提出“请告诉我如何改进”的要求,并进行多次尝试


与传统的AI相比,它的优势在于能够根据实际情况给出真实性的指导,而不是简单的一问一答式,并且会根据用户反馈持续化更新与学习。提出的问题越详细,回答的结果越真实精细化。


这种强大到可怕的能力,让处境不同、身份不同的人们喜忧参半


虽然它有说瞎话的毛病,但是认错的态度总算是积极

(图:与chatgpt聊天)▼


一方面,很多人庆幸自己从工作生活中解放了出来:调查显示,89%的美国大学生承认使用ChatGPT做家庭作业,53%的学生用它写论文,48%的学生使用ChatGPT完成测试。美国密歇根大学一名学生前不久使用ChatGPT生成的哲学课小论文“惊艳”了教授,得到了全班最高分。


另一方面,许多人担忧它是否会取代自己的饭碗。ChatGPT可以根据人类提出的需求即时生成业务代码,几秒内完成一段漂亮的销售文案,给不少基层打工者带来了压力。就连各大科技巨头也为自己可能受到威胁的业务而着急上火。


看这改稿能力,和一些专业的改稿程序可以媲美了

(图:nature)▼


前不久,苹果公司召开内部员工的紧急会议,以应对ChatGPT的挑战。


谷歌公司CEO桑达尔・皮查伊周一在内部备忘录中告诉员工,需要尽快推出产品来抗衡最近爆红的ChatGPT,公司将要求所有人都来测试其新推出的对标ChatGPT的语音机器人“巴德”(Bard),员工们甚至拿出在内部进行黑客马拉松的精神来测试它。


这不像是商业市场中试图与之分庭抗礼的姿态

更像是被打了措手不及之后的赶鸭子上架

“骇客松”(图:壹图网)▼


除此之外,谷歌创始人谢尔盖・布林已经开始亲自下场写代码,自他2019年离开谷歌一线以来,这还是第一次,这显示出谷歌领导层对ChatGPT的巨大危机感


世界首富、曾经的ChatGPT合伙人、新任推特老板马斯克这样评价道:“ChatGPT好的吓人,我们离强大到危险的人工智能不远了。”


近期,微软创始人比尔·盖茨将ChatGPT融嵌入自家各线产品,使公司市值一夜飙高5400多亿。他在接受采访时也说道:“ChatGPT的意义,不亚于PC和互联网诞生。”


搭载了chatgpt技术的微软新搜索引擎new bing

真的能像它名字一样牛逼吗?(来源:bing)▼

 



ChatGPT的迭代之路


首先,让我们来了解一下ChatGPT的前世今生。ChatGPT是OpenAI在2022年11月30日推出的可以用对话方式进行交互的智能机器人。它的诞生经历了GPT→GPT1→GPT2→GPT3→ InstructGPT👉ChatGPT的迭代过程。


GPT的全称,是Generative Pre-Trained Transformer(生成式预训练Transfomer模型)是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型


Transformer模型框架和GPT优化后的模型对比 


2018年,GPT-1诞生,该模型可以用于一些简单的自然语言处理任务,比如句子关系判断,语义相似度识别,文本分类,但它对训练样本之外的新鲜数据适应能力低,只能算得上一个语言理解工具,而非对话式AI。


GPT模型的核心主张1-预训练(pre-training)

先填鸭式自学、再针对性辅导

(图:REEBUF)▼


2019年,GPT-2问世模型使用了更多的网络参数与更大的数据集:最大模型共计48层,参数量达15亿,在生成任务的性能方面展现出了普适而强大的能力,可以聊天、阅读摘要、新编或续写故事,还能编造假新闻、生成钓鱼邮件,就连在网上进行角色扮演也不在话下。


这个阶段则是去掉了监督微调阶段

试图解决zero-shot问题,数据集也是跨越式地增长

(来源:《Language Models are Unsupervised Multitask Learners》)▼


而后,GPT-3出现了,作为一个自监督模型(在人工标注的数据中通过自己监督自己来学习到有用的信息),它可以捕捉所有的历史上下文信息,作为丰富的语料供模型学习,拥有1750亿的参数量,几乎可以完成自然语言处理的绝大部分任务。


在少量样本学习下的综合表现是理想的

(来源:《Language Models are Few-Shot Learners》)▼


例如面向问题的搜索、机器翻译、文章生成和自动问答等等,且模型在诸多任务上表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器,在两位数的加减运算任务上达到几乎100%的正确率,甚至还可以依据任务描述自动生成代码。


可能是码农们自己也受够了每天输入一些繁琐的代码

(来源:nature)▼


2022年初,OpenAI发布了InstructGPT,通过监督学习(用标记数据集来训练特定任务的算法)+人类反馈中获得的强化学习方法,来提高GPT-3的输出质量。InstructGPT能够更好地遵循用户意图,且能将有害的、不真实的和有偏差的输出最小化。


现在,我们每个用户都是chatgpt的训练师

免费的纠错劳动力和数据集

(来源:Qin-《InstructGPT 浅析》)▼


当时间来到这一年年末,加强版模型ChatGPT问世了,这个模型沿用了监督学习与强化学习算法,另外在数据训练过程中,通过将模型生成不同结果的优劣进行人工评估,从而将模型进一步优化,再次提高了模型回答的质量。


由此可见,如此高大上的神器,前期也经过了不断摸索与演化的过程,才以如今的样子呈现在我们面前。强大的技术底座赋予它的能力,主要体现在三个方面:复杂的问题处理能力、广泛的场景应用能力、基于用户反馈的持续化更新与学习能力。


最终,还是钞能力成就了这一领域的奇迹

(图:shutterstock)▼

 



ChatGPT价值在何方?


目前,ChatGPT固然存在一些局限,但它给我们带来的革新与潜在的想象空间无疑是巨大的。小到个人与企业,大到人类与社会,它会成为历史上一个值得铭记的里程碑


Generative AI风投市场表现充满朝气 


纵观人类的历史,就是不断寻找最精确信息的过程。


我们的祖先跨越海洋,攀登高山,冒着疾病的危险去收集最优质的信息,拜访那些充满光明的地方。不论是为了去领略亚历山大图书馆中的智慧,参加高等学府的学习,都需要付出时间和旅程的成本。不论黄页还是大英百科全书,它们提供的价值都是让人类更快地获取信息。


知识是人类进步的阶梯

(图:shutterstock)▼


本来需要去图书馆或步行到镇上才能解答的问题,突然间可以在几分钟内,就可以得到解决。在此之前,谷歌凭借其搜索引擎一举成名。它成功的原因在于:缩短了从问题到答案的距离,并找到了一种将其货币化的方法


遇到不懂的问题,我们首先会想到去“谷歌一下”

(图:壹图网)▼


有观点认为,ChatGPT会颠覆搜索行业,但同时我们也看到了它存在的局限


比如,目前ChatGPT主要查到的都是2021年的信息,ChatGPT无法知道谁赢得了中期选举,不知道参加卡塔尔世界杯的球队是赢了还是输了,不知道埃隆·马斯克是推特的CEO,此外,ChatGPT目前还不支持图片搜索。


这与chatgpt模型的数据集有关

不过随着进一步迭代,相信它会更好地修正 


ChatGPT不仅会编造虚构的学术论文引文,凭空捏造一个不存在的定理,而且当用户需要更多维度的体验想要调查而不是去寻找某个即时确定的答案时,ChatGPT会不胜其任


另外,其高昂的价格可能也会限制它的使用范围。即便如此,目前订阅价在20美元每月的ChatGPT对各垂类企业仍具极大的吸引力,哪怕它的价格还会不断上涨——用于法律、医学、工程、软件开发、销售、房地产等各行各业的垂直化聊天机器人会大大缩减成本,创造更高的价值。


更多商业投资的涌入,更多产业集中,成本也更低

(来源:youtube)▼


譬如在搜索场景中,聊天机器人会比网页广告更有优势,因为当客户像是在与真人对话时,会有更高的商业转化率


ChatGPT就好比信息时代的图书管理员,将谷歌的数据海洋、大量的人类知识转换为清晰、维度更简单的答案。毕竟,谷歌虽然可以给你10万个答案,但一个图书管理员却可以给你最为精准的答案


以“一位人工智能图书管理员在数据海洋里找资料”为提示

从百度的图形生成AI大模型"文心一格"生成的画像

(来源:文心一格)▼


【快来聊天啦】

我局有赛博朋克微信群,欢迎感兴趣的朋友们加入!

* 如果你喜欢面向未来的科技,可以来【微信公众号后台私信】,用一两句话介绍下自己。运营小姐姐会根据情况拉你进群哦~

* 进群请务必自我介绍一下,直接回复“进群”“读者群”之类的字样不会有机器自动回复,只会让后台的小姐姐很生气≥﹏≤

* 申请人多时请耐心排队等候回复。只要系统正常,工作人员就会逐一看到大家所有人的消息哦



参考资料:

1、论文:《Improving Language Understanding by Generative Pre-Training》

2、论文:《Attention is all you need(Transformer)》

3、https://finance.sina.com.cn/jjxw/2023-02-09/doc-imyfafhw6230591.shtml 

4、https://www.woshipm.com/ai/5704153.html


*本文内容为作者提供,不代表地球知识局立场 

封面:爱死机



END


扩展阅读

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存