文心一言来了！李彦宏：百度是全球大厂中第一个做出来的！

CSDN 2023-03-23

整理 | 郑丽媛屠敏

出品 | CSDN（ID：CSDNnews）

对于昨日 GPT-4 的意外发布，相信多数人都有如下想法：

1、多模态大模型 GPT-4 真的很强大！

2、恰好赶在了文心一言发布前夕，百度要如何应对压力？

蓄势了一个多月，承载着无数人或期盼或好奇的目光，“国产版 ChatGPT”「文心一言」今天终于正式亮相！

“「文心一言」并不完美，大家想要将其对标 ChatGPT，甚至是 GPT-4，但放眼全球大厂，百度是第一个做出来并真正发布出来的”，李彦宏说道。

“十月怀胎，一朝分娩”，那么接下来，就让我们开始这场万众期待的震撼发布，共同揭开「文心一言」的神秘面纱。

百度在大厂中第一个做出来的「文心一言」，实力几何？

在发布会伊始，对于外界频频问及的“为什么现在发布，百度是否真的做好了准备”等疑问，百度 CEO 李彦宏在开场进行了回应：

“过去多年，百度一直在进行 AI 技术的研究与研发。文心大模型首个版本在 2019 年便已发布，文心一言只是过去多年研发成果的延续。之所以现在发布，是因为现在市场有强烈的需求，包括百度从搜索、智能云到自动驾驶，再到客户、用户，都需要这样的技术。同时，大模型只有发布了，才会有用户反馈，只有通过不断地反馈，才能加速模型自身的迭代。”

紧接着，李彦宏就带着 5 个 Demo “炸场”，让大众一饱眼福。

（1）多模态生成

如果说昨日 GPT-4 带着多模态出现，用一张草图生成一个网站，让众多程序员感到惊艳，那么今天的「文心一言」在覆盖多种模态方面做得更为全面，可用文字生成图片、音频（方言）、视频等多个维度。

不过目前，由于生成视频的成本比较高，百度尚未对所有用户开放，未来会逐步接入。

（2）数理推算

「文心一言」还具备了一定的思维能力，能学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题，「文心一言」能理解题意，并有正确的解题思路，进而像学生做题一样，按正确的步骤，一步步算出正确答案。

同样，现阶段「文心一言」在这方面准确率并不是 100%：“我们还需要给它更多的时间来学习和成长。”

（3）文学创作

在回答事实性问题时，生成式 AI 产品时常会出错，而「文心一言」延续了百度知识增强的大模型理念，大幅度提升了事实性问题的准确率。不论是总结《三体》的核心内容还是续写《三体》，「文心一言」都展现了其优越的总结分析能力和内容创作生成能力。

（4）中文理解

作为扎根于中国市场的大语言模型，「文心一言」具备中文领域最先进的自然语言处理能力，甚至可以理解“洛阳纸贵”并写出“藏头诗”。

「文心一言」能在中文领域领跑，相对应的，它对英文语种、代码场景的训练还不够多，这也是百度接下来加紧训练和完善的方向。

（5）商业文案创作

在商业文案创作上，「文心一言」也可以帮企业起名字、写 Slogan、写新闻稿等。

AI 要写好一篇稿子，除了要能准确理解用户意图，还要有清晰的表达能力——这背后有一个必要基础，那就是庞大的数据规模。「文心一言」的训练数据包括万亿级网页数据，数十亿搜索数据和图片数据，百亿级语音日均调用数据，以及 5500 亿事实的知识图谱。基于此，李彦宏指出：“这让百度在中文语言的处理上，能够处于独一无二的位置。”

背后的技术

百度 CTO 王海峰表示，「文心一言」是新一代知识增强大语言模型，是在 ERNIE 及 PLATO 系列模型的基础上研发的。

早在 2019 年 3 月，百度就发布了文心大模型 ERNIE 1.0，当时的文心 ERNIE 已经用上了知识增强的概念。同年 12 月，ERNIE 在自然语言处理领域权威数据集 GLUE 中登顶榜首，以 9 个任务平均得分首次突破 90 大关刷新该榜单历史。到了 2021 年，ERNIE 迭代至 3.0 版本，并刷新了 54 个中文 NLP 任务基准，其英文模型在国际权威的复杂语言理解任务评测 SuperGLUE 上，以超越人类水平 0.8% 的成绩登顶全球榜首。

百度研发的文心 PLATO 更是全球领先的开放域对话大模型，具备多轮流畅的聊天能力，并让对话具有人格属性，包括人设稳定性、知识增强、跨模态对话、情感抚慰、主动对话、长期记忆等。

王海峰指出，「文心一言」的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术，ERNIE 和 PLATO 中也已经有应用和积累，在「文心一言」中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新，也是「文心一言」未来越来越强大的基础。

李彦宏预测大模型时代的三大产业机会

微软引入 OpenAI 的 ChatGPT API 接口之后，紧接着便推出了新版 Bing，Google 也发布了 Bard 大模型，欲开启属于人工智能时代的搜索引擎竞争。那么对于百度而言，「文心一言」的到来，会有什么样的不同？

在李彦宏看来，「文心一言」能够影响的不仅仅是搜索或者互联网公司，而是会影响到每一家公司。他表示，“生成式AI，将催生新产品、新业态，会有很多创业和投资机会。对于大部分创业者和企业来说，真正的机会并不是从头开始做 ChatGPT 和文心一言这样的基础大模型，这很不现实，也不经济。”

为此，李彦宏也针对大模型时代，做了三大产业机会预测：

第一类是新型云计算公司，其主流商业模式从 IaaS 变为 MaaS。「文心一言」，将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来，更多会看框架好不好、模型好不好，以及模型、框架、芯片、应用这四层之间的协同。

「文心一言」将通过百度智能云对外提供服务，帮助企业构建自己的模型和应用，农业、工业、金融、教育、医疗、交通、能源等重点领域，都会因此效率大幅提升，并在每一个行业快速形成新的产业空间，助力数字中国的实现。百度智能云将于近期举办新闻发布会。主题围绕文心一言的云服务和应用产品，我们既有公有云服务和也可以做私有化部署，请大家期待。

第二类是进行行业模型精调的公司，这是通用大模型和企业之间的中间层，他们具有行业 Konwhow，调用通用大模型能力，为行业客户提供解决方案。我们的文心大模型，已经在电力、金融、媒体等领域，发布了 10 多个行业大模型。在各行各业都有机会。非常欢迎大家来跟我们合作。

第三类是基于大模型底座进行应用开发的公司，即应用服务提供商。今天，基于文本生成、图像生成、音频生成、视频生成、数字人、3D 等场景，已经涌现出很多创业明星公司，他们可能就是未来的新巨头。这里面的机会非常多，可以说每家企业在现在这个阶段都有机会。

李彦宏表示，“我们相信，人工智能会彻底改变我们今天的每一个行业。AI 的长期价值，对各行各业的颠覆性改变，才刚刚开始。未来，将会有更多的杀手级应用、现象级产品出现，将会有更多的里程碑事件发生。”

「文心一言」将陆续开放

当前，百度表示，3 月 16 日起，首批用户即可通过邀请测试码，在文心一言官网体验产品，后续将陆续开放给更多用户。此外，今日起，百度智能云面向企业客户开放「文心一言」 API 接口调用服务（https://cloud.baidu.com/survey_summit/wenxin.html?track=C896034 ）的预约。

最后，对于「文心一言」的发布，我们也询问了一下 ChatGPT 的看法，不过在其答案中，有些数据存在一定偏差。

整体而言，正如李彦宏所说，目前的「文心一言」并不完美，这类大语言模型也还远未到发展完善的阶段。但未来这段时间，它一定会飞速发展，日新月异。

那么你对于「文心一言」的发布，又有什么想说的呢？

☞ChatGPT 的开源“替代”来了！前 OpenAI 团队出手，能用中文提问，3 天斩获 3k+ Star

☞烧数亿美元、耗上万颗英伟达 GPU，微软揭秘构建 ChatGPT 背后超级计算机往事！

☞GPT-4 发布：在考试中击败 90% 的人类；谷歌开放大语言模型 PaLM API；FireFox 111 发布|极客头条

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

文心一言来了！李彦宏：百度是全球大厂中第一个做出来的！

您可能也对以下帖子感兴趣

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

生成图片，分享到微信朋友圈

文心一言来了！李彦宏：百度是全球大厂中第一个做出来的！

您可能也对以下帖子感兴趣