模型不成熟就落地等于“打童工”,今年是争“上桌”的关键期⋯⋯多位明星具身智能企业CEO同台对谈

wap (2) 2026-06-14 17:48:45

每经记者|杨卉    每经编辑|张益铭    

6月12日至13日,“第八届北京智源大会”在京举办。13日,具身智能CEO(首席执行官)论坛举行。

圆桌对话环节,五位估值超百亿元的具身智能企业的CEO同台对谈,聊起了具身智能产业的核心问题。

在CEO们看来,当前融资主要是“储备弹药”。随着具身智能进入大规模预训练阶段,烧钱也会加速,今年将是“抢身位”、争几个头部“上桌”机会的关键时期。

不过,几位CEO也指出,当前机器人的各部件发展水平差异很大。工业机械臂、手术机器人相对成熟;双足机器人、灵巧手、配套的AI(人工智能)能力距离成熟还有很大差距。未来一年,数据采集模式会逐步从操控机器人采数转向以人为中心的采集方案,模型范式也基本全面转向具身世界模型。明年将是机器人规模化部署落地的元年。

2026年:积粮草、抢身位、争几个头部“上桌”的机会

论坛刚开始,主持人就特意强调,这场对谈是有“准入门槛”的——公司估值要超过百亿元。在此背景下,共有5位CEO登台:千寻智能创始人、CEO韩峰涛;蚂蚁灵波科技CEO朱兴;破壳机器人创始人许华哲;灵心巧手创始人、CEO周永;星源智创始人、CEO刘东。

谈话首先聚焦在了当前具身智能产业的融资热潮上,分为两派“阵营”:已经找到了商业化模式,还是储备粮草准备打持久战?

韩峰涛率先发言。在他看来,目前大家融资首先还是做“储备弹药”,商业模式还要后延。虽然具身智能即将进入大规模预训练阶段,但大模型“烧钱”是业内共识,大家都在“抢身位”和储备弹药,争几个头部“上桌”的机会。“如果今年你还没有搞到行业头部的资金量和估值,可能明年就很难了。所以至少在第一波具身智能创业的浪潮里面,应该没有再做foundation model(基础大模型)的机会了。”韩峰涛称。

刘东则认为,储备资金与商业化落地的比例应是七三开,其中70%用作储备资金,30%用于一些商业化落地,尤其在工业自动化设备领域。

在朱兴看来,商业落地也有机会,只是与自动驾驶一样,需要穿越一个漫长周期,当前还处于非常初期的阶段。今年开始,特定场景以及非常小规模的商业试点应该可以模糊地看见,明年会有加速。

周永的观点有所不同。在他看来,当前的融资还不算热潮,而是序章,估值建立在头部厂商出货量一万台的基础上。未来若有厂商出货量到十万台,每年资金体量应该是当前的十倍。目前仅处在起点阶段,还有更大的发展空间。

本体成熟的1.0阶段是机器人可以造机器人

谈及机器人本体产业链,韩峰涛给当前的各类机器人“打了分”。假设完美形态的人形机器人综合能力为100分,各部件发展水平差异很大。其中,工业机械臂、手术机器人相对成熟,能拿到50分;轮式底盘约40分;四足机器人30分;双足机器人15分;灵巧手仅5分;配套的AI能力分数更低,大概只有3分。

不过他也提出,大模型带来了技术变革,原本3分的AI能力,如今有机会提升到30分甚至50分,差距可以非常快地弥补上来。当AI能力跃升后,就能反向赋能灵巧手、双足机器人、机械臂等各类硬件。这意味着现有硬件已经具备落地条件,背后蕴藏着巨大的市场潜力。

朱兴则持中立态度。他认为,未来主脉络是AI重新定义硬件。“过去两年,我们看到围绕小脑、运控、硬件都取得了非常关键的进展。但我还是说,这是一个阶段。我们下个阶段干嘛?其实硬件本身不仅要配合小脑,还要配合大脑。当大脑的智能提升时,它肯定会对硬件提出很多要求。”朱兴称。

周永的观点更直接:硬件还不够成熟。他进一步解释称,成熟是一个相对概念,可分成三个阶段。第一阶段是机器人能够造机器人(本体),从而大幅降低成本,但当前本体还是“手搓”,一致性并不稳定。做到这一点可进入1.0阶段,成熟度可达到60分。

到了2.0阶段,就是机器人自行设计机器人。Agent(智能体)触达用户需求后,由AI自行设计,再由机器人生产制造,全程没有人类参与。“做到这一点,我认为成熟度可以到80分。”至于下一阶段,周永认为是机器人可以实现模块化,如能自行更换皮肤、电机等,也能快速响应,届时成熟度可以达到95分。

数据采集方式已改变

谈到数据话题,各位CEO的观点开始趋向统一。

韩峰涛称,业内常说的模型三大核心要素是数据、参数、算力。其中,算力并不稀缺,各类模型架构、世界模型相关技术也层出不穷。但若数据供给跟不上,再优秀的架构也难以发挥其价值。因此数据才是真正的核心瓶颈。朱兴也认为,目前整个行业普遍存在真机数据大量重复的问题,具身智能的能力上限受数据制约。

许华哲进一步指出,过去两三年,业内一直受限于数据采集方式。传统人工操控真机采集难点有三:一是早年机器人量产能力不足,无法大批量部署;二是硬件成本高昂,每台采集机器人造价都不低;三是设备体量笨重,如入户采集,还需专门运输搬运,流程十分繁琐。“现在,我们更看好新型数据形态,以及穿戴式采集方案。只需为人员配备数据采集手套,或在头部加装小型摄像头就能完成数据收集。这种模式解决了过往难题,甚至可以招募参与者,每月提供补贴,邀请大家参与采集。”许华哲称。

模型不成熟就落地等于“打童工”

谈到较为敏感的落地话题,CEO之间的博弈要更多。

作为唯一持反对意见的人,韩峰涛认为现阶段不必急于大规模落地场景,可以先开展场景探索,和客户共同梳理需求、加深场景理解,以此反哺硬件迭代与数据链路建设,但切忌全面铺开。

“举个例子,如今主流都是通用基础大模型,而非过去的细分垂类小模型。大语言模型的能力已经发展到类似‘研究生’水准,能够实现低成本落地,部署成本是机器人规模化落地的核心阻碍。”韩峰涛强调,目前基于现有模型制作演示方案,还需额外做后训练与微调,往往耗时一两个月,成本根本撑不起规模化应用。反观当下的具身模型,能力还十分稚嫩,大概只相当于一两岁儿童的认知水平。

韩峰涛强调,即便达不到“研究生”水准,至少也要成长到“初高中”阶段,才有条件实现低成本批量落地。现阶段更应专注预训练打磨模型,让“孩子”安心学习成长,而不是“打童工”。“保守判断,行业真正迎来规模化落地,大概还要等待两年时间。”韩峰涛称。

刘东的观点则不同,他认为在训练基座模型的同时,必须同步挖掘可落地场景。模型从实验室走向真实应用,通常需要一到两年的磨合周期。提早开展实景试点,既能优化训练思路,也能规避技术路线走偏。

至于模型的发展现状,朱兴认为,未来一年内,行业有望催生出物理原生基础模型,期待在今年年底就能落地。“我们目前也在开展相关训练工作,目标节点定为今年年底,最晚不迟于明年六月。”朱兴称。周永则认为,未来一到两年,具身智能领域会诞生对标GPT-3、GPT-3.5级别的模型,风格上会更贴近DeepSeek-R1。

刘东总结称,在他看来,未来一年行业会迎来三大变化。第一是数据采集模式,行业会逐步从操控机器人采集数据转向以人为中心的采集方案。第二是模型范式迭代,今年基本全面转向具身世界模型。第三,明年将成为机器人规模化部署落地的元年。

封面图片来源:每经媒资库

THE END