机器人大脑是中长期投资赛道,拥有万亿级市场
来自:MACD论坛(bbs.shudaoyoufang.com)
作者:术道研究员
浏览:77
回复:0
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
人形机器人正从科幻走入现实,而其最关键的核心——"大脑",正经历着前所未有的突破性发展。2025年9月,在北京首钢园举办的"具身无界:智能机器人创新发展论坛"上,一款名为"莫斯"(MOS)的机器人大脑系统正式发布。它独创性地融合符号主义与连接主义技术路线,解决了纯AI大模型存在的"黑盒决策、幻觉、高算力成本"等行业痛点。
这仅仅是当前机器人大脑行业飞速发展的一个缩影。据预测,2025年中国具身智能市场规模将达到52.95亿元,占全球约27%;人形机器人市场规模预计达82.39亿元,占全球约50%。机器人大脑正引领着机器人技术从"机械执行者"向"自主智能体"的跨越。
一、什么是机器人大脑?
具身智能机器人的核心在于“大脑”、“小脑”与“肢体”的协同。其中,“大脑”对应决策交互模块,负责环境感知、行为控制与人机交互等高层级任务。
“小脑”是运动控制模块,基于自动控制与机器人操作系统(ROS)实现复杂环境下的高精度运动。“肢体”则是执行模块,集成仿人机械臂、灵巧手等部件,完成具体动作。
机器人的“大脑”的核心支撑,正是具身智能大模型——通过多模态建模、强化学习与数据训练,它能像人类大脑一样管理机器人的各项功能,甚至理解需求、分解任务,减少对人类操作的依赖。
二、大脑进化:多模态大模型的核心突破
多模态大模型的出现,为机器人“大脑”突破高层级控制难题提供了关键技术支撑。传统单一模态模型存在明显局限:大语言模型(LLM)仅能理解文本,无法处理视觉等物理信息;视觉模型虽擅长感知,却缺乏推理能力。
而多模态大模型(MLLM)融合了文本、图像、视频等多种信息,既保留LLM的常识与推理能力,又具备视觉感知能力,更贴合人类“多感官认知世界”的方式。
例如,它能直接通过图像识别环境中的物体,结合自然语言指令生成控制代码,让机器人完成“从抽屉取薯片”这类需要多步骤规划的任务——先移动到抽屉旁、打开抽屉、取出薯片,再送到用户手中,整个过程无需人类拆解动作。
三、行业竞逐:全球科技巨头的布局
国内外科技巨头与科研团队已纷纷入局具身大模型研发,成果不断涌现。谷歌是该领域的重要推动者,先后推出SayCan、RT-1、PaLM-E、RT-2、RT-X等系列模型。
其中,RT-2成为首个“视觉-语言-动作(VLA)模型”,可直接通过复杂文本操控机械臂;最新的RT-X系列通过整合22种机器人、527项技能的数据集,将任务成功率提升至此前模型的三倍。
特斯拉则凭借“端到端算法”路线展现独特优势。其自动驾驶系统FSDV12采用纯神经网络控制,取代了30万行以上的传统代码。特斯拉正将这套技术迁移至人形机器人Optimus——早期Optimus甚至使用与汽车相同的计算机和摄像头。
国内团队同样表现亮眼,字节跳动推出的GR-2模型在3800万个互联网视频片段上完成预训练,学习人类在家庭、办公室等场景的行为模式,不仅能处理105项桌面任务且平均成功率达97.7%,还能端到端完成货箱间的物体拣选。
四、机器人大脑的三大挑战
尽管发展迅猛,具身大模型仍面临三大关键挑战。
一是泛化性弱。目前模型在特定场景表现优异(如RT-2在谷歌办公室厨房任务成功率近98%),但切换到施工工地、嘈杂后厨等复杂场景,成功率便骤降至30%左右。核心原因在于机器人操作数据量不足、对错误容忍度低。
二是实时性差。谷歌RT-2的推理频率仅1-5Hz,输出运动频率1-3Hz,导致机器人“反射弧”长达0.3-1秒,远低于人类与实际应用需求。Figure机器人的延迟甚至达到2-3秒,严重影响任务效率。
三是数据采集难题。真实数据收集成本高、难度大,而合成数据若生成不当,易出现与真实数据差距大或样式单一的问题,难以支撑模型训练。
五、基础设施:云计算与边缘计算的支撑
为保障“大脑”高效运转,云计算与边缘计算构成了重要外延支撑。云计算凭借强大的算力与存储能力,为大模型训练提供保障。例如谷歌PaLM-E模型融合220亿视觉参数与5400亿语言参数,其训练需依赖云计算的分布式处理能力。
同时,云计算还能让机器人随时随地获取算法支持,提升灵活性。而边缘计算则弥补了云计算的短板,它将计算能力靠近机器人终端,降低数据传输时延与安全风险,尤其适合工业场景。
目前,德州仪器TDA4x处理器、特斯拉DOJOD1芯片等边缘算力模组,已开始应用于协作机器人与Optimus,推动“云-边”协同成为主流架构。
六、未来前景:万亿级市场即将开启
随着2025年人形机器人进入小批量量产阶段,全球数千台机器人将进入工厂场景训练,这无疑会加速“大脑”的迭代进化。行业普遍预期,人形机器人将成为继智能手机、电动车后的万亿级市场。2025年将开启Optimus试产,目标5000台。
成本控制方面,特斯拉通过自研行星滚柱丝杠替代进口减速器,单价从2800美元降至600美元;复用ModelY电池,进一步压低成本。目前10台OptimusV3已在弗里蒙特工厂执行电池分拣任务,成功率95.7%,验证了“用机器人造机器人”的规模化生态可行性。
未来三到五年时间,人形机器人有望进入更多工业和家用场景。当前行业需要加快突破缺乏大规模、高质量数据等问题,使人形机器人能够在更多场景提供功能性价值。
七、中国机器人大脑的发展机遇
在中国,完整的工业体系、丰富的应用场景和庞大的市场规模,是人形机器人快速迭代的催化剂。自2023年10月工业和信息化部印发《人形机器人创新发展指导意见》以来,北京、上海、广东等多地出台专项行动方案,在技术创新、产业集聚、应用示范等方面加快布局。
北京人形机器人创新中心、上海和深圳的“机器人谷”得益于成熟的供应链和完整的产业生态,国内人形机器人产业已形成“集群效应”。在深圳,生产人形机器人所需要的传感器、控制器等关键组件都能迅速匹配到,大幅降低了研发和生产成本。
工业和信息化部部长李乐成表示,我国人形机器人已具备从关键芯片、部组件到整机的全产业链制造能力。目前10台OptimusV3已在特斯拉弗里蒙特工厂执行电池分拣任务,成功率95.7%,验证了“用机器人造机器人”的规模化生态可行性。
全球数千台人形机器人正进入工厂场景训练,加速“大脑”的迭代进化。未来三到五年,人形机器人有望进入更多工业和家用场景。
就像计算机和互联网一样,机器人大脑技术正重塑我们的生产和生活方式。它不仅代表技术进步,更预示着一个人与机器和谐共处的新时代即将到来。
所以我们需要重点关注机器人、人形机器人、具身智能带来的投资机会。在A股市场上,这样的公司并不多,梳理下来也就四五家而已。值得重点关注。术道相关报告即将出炉。
|