查看原文
其他

海外人形机器人巨头深度剖析

(报告出品:华西证券)

1.特斯拉:由人类打造、为人类服务的机器人

1.1.后人工智能时代机器人将取代人类进行重复性劳动

Optimus 定位为解放劳动力,可替代 4 亿岗位。特斯拉的人形机器人项目 Optimus(擎天柱)最早于 2021 年 AI Day 上公布(早期名称为 Tesla Bot),定位为 解放劳动力的通用型机器人。人形机器人作为模仿人类的拟态物,相比机械臂等传统 机器人,能无缝在众多场景替代人类工作。马斯克表示,在后人工智能时代机器人将 取代人类进行重复性劳动,生产力充足的前景下可行的经济模式是政府实行全民补贴, 而体力劳动将成为个人的选择。根据世界银行数据,2022 年全球劳动人口约 34.3 亿 人,劳动力人口已呈现下降趋势,据麦肯锡报告预测,到 2030 年全球约 4 亿人的岗 位将会被自动化机器人替代,即 11.7%的劳动者会被机器人所取代。以 Optimus 单价 2 万美元计算,长期全球人形机器人市场天花板达 8 万亿美元,是一个庞大的蓝海市 场。

高自由度结构与精细控制初步具备实用性。目前 Optimus 原型机身高约 172cm, 体重约 57kg,力量能单手举起一架钢琴。其身体共有 28 个自由度(下一代预计超过 200 个自由度),采用了更加灵活的弹簧负载设计与 6 种类型执行器,关节采用仿生 学关节设计,模拟人类关节与肌腱形态,手部是 Optimus 最大亮点,采用人体工程学 设计,拥有 11 个自由度(下一代预期 27 个),相比之下工业机器人全身一般仅有 4 到 6 个自由度。特斯拉已于演示视频中展示了精细手部动作,在 Dojo 超算的支持下 Optimus 利用动作捕捉对人类活动方式进行学习,可抓取杂物,力道控制精细,甚至 不会打碎鸡蛋。根据特斯拉介绍,Optimus 已经在特斯拉弗里蒙特工厂试验简单工作, 如移动零件或用扳手将螺栓固定在汽车上。

1.2.自动驾驶的终极形态,FSD 自动驾驶-超算-机器人三位一 体

人形机器人是自动驾驶技术的终极形态。自动驾驶的本质就是有轮子的机器人, 特斯拉已经打通了 FSD 软件(完全自动驾驶)和机器人的底层模块,特斯拉在 FSD 上 的积累将使得人形机器人全面受益。特斯拉将 FSD 从其汽车转移到了机器人,并经过 调整以适应机器人的身体和不同的工作环境。特斯拉主要通过对人进行真实世界任务 的运动捕捉,如提起物体、行走等,然后使用反向运动学技术让 Optimus 重复这些动 作,同时应用了在线动作适应技术,使这些任务更加灵活,并能根据环境进行调整。同时由于采用了相同的 FSD 系统,机器人可直接复用电动车成熟的视觉系统,由于特 斯拉决定采用同样的摄像头方案,而不是 LIDAR 传感器,因此可直接移植到人形机器 人上。

自动驾驶为机器人搭建技术框架。机器人的反馈机制本质上是与自动驾驶相同 的架构,即感知层-决策层-执行层。特斯拉在汽车上使用自研的 HW 硬件与 FSD 软件, 而机器人的感知层和决策层可直接复用自动驾驶技术,特斯拉基于 Transformer 的 BEV 方案结合时序队列与 Occupancy Network,实现包含空间和时间的 4D 感知,即使 在纯视觉方案下仍能实现高效的环境感知。在决策层上,模型训练阶段的数据标注和 模拟环境同样可复用于机器人上,因此 Optimus 能在立项仅一年就拿出展示机型,远 快于其他人形机器人厂商,软件层面上只需要更多优质的训练数据积累就能快速提高 运动能力。

Dojo 超算——云端训练 AI 的基石。超级计算机 Dojo 基于特斯拉自研的 7nm D1 芯片,具备采集、训练和进化的能力,能够更理想的采集道路交通标识、生物形象、 路面情况等信息。该芯片将 354 个独立处理器封装在一起,产生 362 TFLOPS 的计算 和 440MB 的内部静态随机存取存储器存储。在保持完全可编程性的同时,DOJO 强调 资源分配和极高带宽的互连,使其能够从小型系统一直扩展到 exaFLOP 超级计算机。在产品形态上,Dojo 的最终落地单位是名为 ExaPOD 的超级计算集群,它集成了 3000 颗 D1 芯片,包含 120 个训练瓦片,最终能够实现高达 1.1 EFlops 的 BF16/CFP8 峰值算力。2023 年 7 月特斯拉 Dojo 正式投产,预期到 2024 年 2 月, 特斯拉算力规模将进入全球前五,2024 年 10 月总规模将达到 100 Exa-Flops,相当 于 30 万块英伟达 A100 显卡的算力总和。

Dojo 超算为机器人提供最强 AI 大脑。超级计算机 Dojo 被特斯拉称为 Pure Learning Machine(纯学习机器),特斯拉 FSD 芯片最大的优势就是只有一个客户, 而 Dojo 也是同样的设计思路,它是一种专为深度神经网络训练而生的可拓展系统。传统 CPU 和 GPU 都不是为机器学习而设计的,在 Dojo 之前的超级计算机主要由专业 的计算机设备制造商研发、集中在国家级实验室,主要用途在中长期天气预报、油气 勘探、物理模拟、量子力学等超大型计算应用场景;相比之下,Dojo 的应用场景主 要是以视频和图像数据训练 AI,专为自动驾驶和机器人训练使用。原本在 A100 阵 列上需要进行一周的自动驾驶学习任务,在 Dojo 上可能只需要 2 至 3 天就能完成, 而人形机器人由于高自由度以及四肢协作,训练数据体量远大于自动驾驶,根据特斯拉数据显示,在同样的成本之下, Dojo 超级计算机相比英伟达 A100 能够实现 4 倍 的性能、能耗比提升 1.3 倍。

技术整合带来人形机器人奇点。Optimus 采用了与 Tesla 车辆相同的芯片,支持 Wi-Fi、LTE 链接和音频交流,其系统软硬件的安全性保障也正在不断提升,通过量 产与技术发展控制制造成本,而软件复用汽车 FSD 系统、算力调用 Dojo 超算,在规 模化生产后预计远期成本远低于一辆汽车。Optimus 的版本迭代十分之快,会远超汽 车等产品,自 2021 年 AI Day 公布一年后已改进到第二代,在 2023 年 5 月的股东大 会演示视频上第二代人形 Optimus 已能流畅行走。据证券时报,马斯克在 2022 AI Day 上透露,Optimus 有望在 3-5 年间量产上市,预期产量可以达到数百万台,预估 Optimus 机器人稳定生产后的价格将达到 2 万美元以下。

1.3.未来展望:仍在等待 GPT 时刻的到来

机器人领域仍在等待着“大脑”的进化。GPT 模型的自然语言处理已经汇聚了自 回归变换器+下一个词预测+强化学习高级特征的“配方”。然而,对于人形机器人的技术而言,还没有算法能够达到同样的效果。目前 Optimus 可期待的应用场景还是重 复性的小场景工作,因为 FSD 模型无法对未知信息进行预测,近日特斯拉 Optimus 的官方推特账号上传了新的演示视频,Optimus 能够仅依靠视觉来对物体进行分类, 还能完成难度更大的瑜伽动作,采用了类似于特斯拉自动驾驶技术 FSD 12 的端到端 神经网络控制:视频输入,控制输出,并由此来控制各个部件和关节的移动。谷歌 Deepmind 已在测试多模态模型 RT-2 控制机器人,内嵌 120 亿参数 PaLM-E 模型以及 550 亿参数 PaLI-X 模型的 RT-2 在陌生任务中的平均准确率相比 RT-1 翻倍,达到 62%。如果行业能打造出“RobotGPT”的基座模型,实现零样本或少样本学习,则能在更复 杂乃至陌生的环境中执行任务,实现人形机器人的智能涌现。

Optimus 初步落地可期,应用想象力扩大。根据马斯克发言,Optimus 预计将于 今年 11 月进行行走测试,之后在生产稳定后开始加速,明年进入工厂测试实际工作。此外,Optimus 的核心硬件模块化同样有巨大的应用潜力,透过将 Neuralink 脑机接 口植入物与机器人手臂或腿结合,可构成优秀的假肢,为被截肢的人提供一个优秀的 机器人身体,可能只需要 6 万美元。

2.波士顿动力:机器人领域的顶尖实验室

2.1.最强动态性能的跑酷机器人Atlas

机器人领域三十年积累,造就最灵活人形机器人。波士顿动力(Boston Dynamics)由麻省理工学院副教授马克·雷波特于 1992 年创立,最初的机器人是为 美军研制的大狗(Big Dog)机器人,可在废墟、泥地、雪地、水中行走,奠定了 Atlas 运动能力的基础。波士顿动力目前最先进的机器人 Atlas 身高 1.5 米,体重 80kg,速度 1.5m/s,依靠 28 个液压执行器实现各种高难度运动,足部踝关节由两个 直线执行器并联驱动,髋关节和手臂多是伺服摆动缸。Atlas 不仅拥有卓越的物理机 动性,更因其高级的控制系统和算法而独立于众,多次在演示中展现出近乎超乎人类 的运动与平衡能力。

2.2.创新硬件与算法沉淀,Atlas 实现卓越运动性能

Atlas 以高性能电液驱动系统、复杂的 AI 算法和多模态视觉感知实现优异运动 性能:强大运动性能得益于独特液压驱动。不同于多数机器人采用电驱,Atlas 为了获 得最强的机动性采用液压伺服驱动,具有高负载驱动特性,即使是高难度动作如后空 翻等依然能平稳落地。Atlas 机器人全身有 28 个自由度,在多个液压关节与算法的 协调配合下, Atlas 已经可以熟练的完成垂直起跳、跨越障碍、后空翻,甚至完成 整套的舞蹈以及手脚都参与的跑酷功能。

离线模板与在线精细控制构成独特运动算法。Atlas 的离线轨迹库模板包含了众 多预设的最优运动方案,会向决策层 MPC(模型预测控制)提示最佳的解决方案选择, 此后 MPC 利用机器人的动力学模型来预测其未来的动作。这种控制器的核心工作机制 是优化计算,确定机器人当前应该进行的最优动作,从而随着时间的推移产生最佳行 为。当遇到如环境改变、脚滑等实时因素时,MPC 会调整机器人的发力、姿势和动作 的发生时机来适应。此外,MPC 还能跨行为边界预测下一步的行动,例如知悉跳跃后 要进行后空翻,它便会自动创建行为之间的过渡,确保动作连贯。在 MPC 3.0 版本中, Atlas 已能主动使用参数已知的工具,在官方演示视频中 Atlas 用木板搭了一座桥通 过障碍。

TOF+预设地图构成 Atlas 的“眼睛”。在感知层,Atlas 使用 TOF 深度相机每秒 生成 15 帧的环境点云,这些点云基于大规模的测距集合。它的感知软件采用多平面 分割算法从点云中提取平面,并将此信息输入到映射系统中,为 Atlas 构建通过相机 看到的各种对象的模型。当 Atlas 执行扩展的跑酷行为时,波士顿动力的研发团队为 其提供了一张高级地图,指明了它应该前往的地方和沿途应该执行的动作。尽管这张 地图并不完全与真实路线的几何形状匹配,但它提供了障碍模板和注释动作的近似描 述,Atlas 则利用这些稀疏信息进行导航,并用实时感知数据来填补细节。

2.3.从机械狗 Spot 开始,商业化前路漫长

机械狗 Spot 率先开启商业化之路。Spot 是波士顿动力 2015 年 2 月发布的四足 机器人,身高仅一米有余。SpotMini 是 Spot 机器人的更加小型且防水的版本,加上 机器臂重量 29.5 kg,一次充电可以跑 90 分钟,相比波士顿动力其他液压结构驱动 的机器人,SpotMini 是纯电动的,因此是波士顿动力最安静的机器人之一,搭配多种传感器,可以完成各项复杂的动作以及巡航,如无人区巡逻、寻找气体泄露、公园 安保等。SpotMini 是公司商业化探索的第一步,于 2020 年 6 月开始公开发售,每只 定价 74,500 美元,折合人民币超过 50 万元。Spotmini 整体的设计以高集成度、高 任务作业能力为主,继承了波士顿动力其他机器人的高运动能力,最优异的性能就是 楼梯攀爬,其采用全视觉方案构建全局地图,进一步选择合适的落足点避开台阶边缘 以及不安全的落足区域。

难以降本量产约束商业化落地。波士顿动力从学术领域实验室诞生,因此机器 人的设计多是不计成本以性能为导向,早期为美国国防高级研究计划局承包项目,由 于商业化进程不及预期,被谷歌收购后又经历两度易主,2017 年 6 月软银接手、 2021 年 6 月由现代汽车接管。根据 Analytics India 杂志,专家估计 Atlas 单台成 本至少为 15 万美元(折合人民币 109 万元),即使是更有“性价比”的 Spot 机械狗, 公司表示截至 2023 年 6 月售出超过 1,000 台。尽管 Spot 在市场中获得了一定的反响, 但相较于 Atlas 等高端产品的技术潜力,其商业化进程仍显缓慢,多次易主的波士顿 动力,在向商业市场推出产品的道路上还有很长的路。

3.1X Technologies:开启 AI 具身智能革命

3.1.OpenAI 领投,机器人使命是与人类并肩工作

(本文仅供参考,不代表我们的任何投资建议)

文琳编辑

免责声明:转载内容仅供读者参考,观点仅代表作者本人,不构成投资意见,也不代表本平台立场。若文章涉及版权问题,敬请原作者添加 wenlin-swl  微信联系删除。

为便于研究人员查找相关行业研究报告,特将2018年以来各期文章汇总。欢迎点击下面红色字体查阅!

文琳行业研究 2018年—2023年10月文章汇总

▼长按2秒识别二维码关注我们

今日导读:点击下面链接可查阅

公众号 :文琳行业研究

  1. 2023中国社交媒体指标详解

  2. 2023年百度营销策略深度研究报告

  3. 2023音频产品使用现状调研报告

  4. 2023年中国消费者兴趣圈层白皮书3.0

  5. 2024年全球媒介趋势报告-变革中的媒介

  6. 2023年传媒行业深度研究报告

  7. 2023年手机即时零售行业研究报告


《文琳资讯》

提供每日最新财经资讯,判断经济形势,做有价值的传播者。欢迎关注

▼长按2秒识别二维码关注我们

今日导读:点击下面链接可查阅

  1. 证监会"三定"方案出炉!国务院直属机构,系正部级!内设19个正司局级机构

  2. "一行一局一会"最新发声!

  3. 证监会最新发布!事关IPO企业现场检查

  4. 楼市又要放大招了?!

  5. 田惠宇案,细节公开

  6. 减肥神药大变局


公众号 :就业与创业
点击下方可看
  1. 不要透支自己!

  2. 月薪3万的白领,怎么都在练“中产杂技”?

  3. 姚振华“下落不明”,或被拘留?宝能回应!

  4. 国内唯一满级滑雪女教练在滑雪场身亡,是“跟拍”的锅吗?

  5. 2023年跨境电商职场现状调研报告



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存