查看原文
其他

“混元”加持,腾讯云要讲ToB新故事

邵延港 猎云精选 2023-09-17



在这场ToB业务角逐中,腾讯先推出大模型服务,而后才亮相大模型产品。

文丨猎云精选 ID:lieyunjingxuan

作者丨邵延港

混元大模型“千呼万唤始出来”,腾讯也宣告全面拥抱大模型。
9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。
国内厂商在大模型上卷出了新高度,不过“百模大战”算不上时代红利。华为盘古大模型“不作诗,只做事”,李彦宏也认为“卷大模型没有意义,卷应用机会更大。”
在今年6月份,腾讯云跨越大模型产品的发布,直接对外输出MaaS能力来布局大模型的行业应用。混元大模型亮相后,将作为腾讯云MaaS服务的底座,供客户直接通过API调用,也可以将混元作为基底模型,为不同产业场景构建专属应用。
与腾讯的一贯的思路一样,大模型业务也需要务实。腾讯高级执行副总裁、云与智慧产业事业群(CSIG)CEO汤道生认为:大模型只是开端,行业应用才是未来。

来源:腾讯云 图:汤道生

大模型带来了一场变革,腾讯也裹挟在这场潮流中。腾讯全面布局To B业务走过5年时间,如今腾讯To B业务的角色变成企业客户的“后勤”。抽象的人工智能,无法应用更没有意义。大模型开启强人工智能时代,开创下一代的云,也将重塑腾讯To B业务。

腾讯全面拥抱大模型

当前的大模型竞争态势已经逐步上升到新的高度,各行各业陆续拥抱大模型。文心一言、星火等已对外开放,教育、通信、金融等行业企业纷纷拿出了大模型成果。
腾讯内部很早之前就在做大模型,据悉,从2021年开始,腾讯先后推出千亿和万亿参数的NLP稀疏大模型,打破CLUE三大榜单记录。不过,在国内大模型密集发布时,腾讯一直按兵不动,直到现在混元大模型才正式现身。
出于谨慎态度,在投入大模型时,腾讯在期待什么?腾讯的答案是更可靠、更成熟。通用大模型需要从休闲、工作场景中的高容错简单任务,向专业、严肃场景的低容错复杂任务进发。
腾讯集团副总裁蒋杰表示,腾讯混元大模型从第一个token开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,并且用于混元大模型训练的数据是截至今年7月份的。

来源:腾讯云
作为通用大模型,混元大模型具备中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。它能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话,它还能进行文学创作、文本摘要、角色扮演等内容创作。
据介绍,针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文本的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。
此外,腾讯还自研了机器学习框架Angel,使训练速度相比业界主流框架提升1 倍,推理速度比业界主流框架提升1.3倍。
在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中,混元大模型共测评66个能力项,在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上,混元大模型均有优异的表现,特别是在中文的理科、高考题和数学等子项上表现突出。
不过蒋杰表示:“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中”。在AI时代,大模型掀起一场产业变革浪潮,但大模型同样需要落地应用,才有价值。这是数实融合最直接的意义。
在腾讯内部,混元大模型目前已经接入包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等在内的50多个业务和产品,进行测试并取得初步效果。自此,腾讯将全面拥抱大模型。

大模型时代,腾讯ToB更务实

在这场ToB业务角逐中,腾讯先推出大模型服务,而后才亮相大模型产品。
腾讯的企业风格向来低调、务实,到了大模型时代,AI同样需要深入行业与企业。自2019年腾讯CSIG第一次全球数字经济大会至今,腾讯一直相信产业互联网将成为行业数字化转型升级的重要载体,数实融合能够为行业发展注入强大能量。
汤道生作为腾讯CSIG负责人,五年前从ToC产品转而去做ToB产品,若还是套用ToC产品的逻辑,就会像他说的“会完蛋的”。因此,每遇到新题,他都会回归事情的本源:回到最根本的问题,去思考业务,客户需求点在哪,价值点在哪,如何聚拢相关的资源,找到最合适的解题方法。
若从ToC的角度去关注和使用通用大模型,关注点可能会有些走偏。比如,很多人花很大精力去测试,让一些通用大模型去乱说话,而不是解决产业实际问题和痛点。汤道生表示,对于大模型最务实的应用还是基于行业痛点,用行业大模型去解决问题,“可能刚开始使用的版本,只能解决问题的80%,但因为你有一个很清晰的使用场景,用户的反馈能够形成反哺,让你不断打磨你的行业大模型,让解题的准确率,一步一步提高。”
汤道生此前说,腾讯的通用大模型底座只有一个团队在集中资源做,而具体的每个应用场景都会进行相应的探索。腾讯董事会主席马化腾曾说,“人工智能技术的不断增强,让企业获得一种越来越重要的生产工具,将数据中潜藏的‘信息能源’,源源不断地转化为实体经济高质量发展的新动能。” 除了腾讯,其他厂商也意识到,都去做通用大模型,只是在重复造轮子,真正的机会在实际的应用当中。
中国拥有智能化落地的丰沃土壤和场景,我国的制造业规模已经连续13年居世界首位。中国信通院预测,到2030年,中国产业智能化的规模会超过10万亿元,智能化还将推动劳动生产率提升20%。
腾讯集团副总裁、政企业务总裁李强认为,比起聊天、答题、内容生产等,大模型在产业的具体场景应用,对实体经济将带来更大价值。
无论是新产品的研发还是新材料还是新药的研发,还是产线的工艺、质量的检测,或是库存的管理、供应链的协同,以及营销智能、服务智能、管理智能等等方面,大模型都可以提供助力。
在混元大模型的加持下,腾讯旗下产品也在大模型变革中收益。比如,腾讯会议基于腾讯混元打造的AI小助手,只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要;在文档处理方面,腾讯混元大模型支持数十种文本创作场景。
此外,混元大模型作为腾讯自研的一款实用级通用大模型,将作为腾讯推出的MaaS服务底座,供客户调用,也可作为基底模型来开发产业场景的应用。
李强表示,无论是答题、写作文等内容生成,还是各行各业的产业实践,大模型应该要走到产业的实践中,走到实体经济中。从田间到产线,从实验室到便利店,让大模型无所不在,帮助中国的实体经济应对全球化的挑战,达到高质量增长。

大模型催生下一代的“云”

毫无疑问,在大模型带来的行业机遇中,历经五年的腾讯CSIG也来到一个新的转折点,对腾讯ToB业务是这样,对于大模型背后的“云”也是如此。
汤道生也认为:“就模型而言,比起通用大模型,企业更需要针对具体行业的大模型,并结合企业自身的数据进行训练和精调,以打造出更实用的智能服务。”在混元大模型亮相前的百模大战期间,腾讯于今年6月依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS一站式服务,助力客户构建专属大模型及智能应用。
而大模型的训练需要大量的算力,训练混元大模型的Token数据量达到2万亿,不仅需要大量的GPU,也需要较高的稳定性,否则每次GPU发生故障时,对于整个训练中断的影响、回滚的要求以及工程化的要求都非常高。
因此,腾讯云在大模型训练之后,对云的基础设施,从存储、网络到计算进行了全面升级。基于星海服务器,腾讯云把GPU的服务器故障率降低了超过50%,通过星脉网络的支持,腾讯云已经可以支持超过10万张卡并行计算的大规模训练集群。
正是通过这样存储、计算、网络整体的升级,腾讯云如今可以做到在万亿参数的时候,一轮的训练在4天之内完成,让训练效率得到大幅提升,训练时间得到保障,训练成本可以明显下降。
如今,腾讯云已经建立起围绕大模型的全套能力,包括高性能算力集群、云原生数据湖仓和向量数据库等数据处理引擎,以及模型安全、支持模型训练和精调的工具链等,企业、开发者可以根据各自需求,灵活选择产品,降低大模型的训练成本。据悉,百川智能、智谱科技、MiniMax等知名创业企业的大模型中均有腾讯云的助力。
更重要的是,在这场大模型浪潮中,腾讯云通过MaaS模式,开创了新业务增长点。
大模型带来的高水平智能,也将重新定义云上工具和应用。比如,腾讯安全风控大模型、腾讯云AI代码助手、腾讯会议AI小助手等产品,都因为大模型能力的加持,为用户带来了更好的体验。
面对全新的发展机遇,汤道生表示:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点,带来了全新的思路。腾讯产业互联网将通过智能增强、数据增强、连接增强,持续助力产业增强。”
腾讯云总裁邱跃鹏表示:“云是大模型的最佳载体,大模型也将开创下一代云服务的全新形态。”高效能的云产品、高水平的AGI能力,将加速企业在云上创新创造,AI native的应用、全新的交互方式将持续涌现。
(首图来源:腾讯云)
- END -

“在看”我了吗?

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存