每经记者|可杨 每经编辑|杜宇
6月12日至13日,第八届北京智源大会在中关村国际创新中心举行。
这场被业界称为“AI界春晚”的盛会,是一张AI产业情绪与技术路线的“晴雨表”,2026年,人们讨论的关键词已经变成AI自进化、世界模型、下一物理状态预测。
回望近年行业发展轨迹:从ChatGPT引爆全球大模型浪潮,到国产模型创业公司站上舞台中央,再到机器人、世界模型和智能体接棒成为焦点,这场被称为“AI春晚”的盛会,也记录着过去几年人工智能产业关注重心不断迁移的轨迹。
只是与过去三年相比,今年会场里的情绪似乎平静了许多,新的热点已经出现,但新的超级明星公司尚未诞生,在技术“狂飙”三年之后,AI产业似乎正在进入一个新的过渡阶段。
2026年6月12日,第八届“北京智源大会”在中关村国际创新中心开幕。 (图片来源:主办方供图)
拉长时间维度来看,历届智源大会的嘉宾主角变迁,就是一部浓缩的AI产业演进史。
2023年,ChatGPT问世刚满半年,国内“百模大战”蓄势待发。本届大会的高光时刻,属于OpenAI代表人物山姆・奥特曼与深度学习之父杰弗里・辛顿。彼时国内大模型仍处于追赶阶段,主论坛嘉宾以海外学者、国内顶尖科研人员为主,议题也多聚焦于AI基础技术探索。
2024年,行业格局迎来明显变化。月之暗面、百度、智谱AI、零一万物、面壁智能等一众国产大模型企业的创始人、CTO成为大会主角,“百模大战”进入白热化阶段。其中,月之暗面创始人杨植麟人气居高不下,圆桌对话结束后,他多次被现场观众围堵,最终在工作人员协助下才得以离场,这一幕也成为当年大会的标志性画面。
2025年,主角再次“易位”。第七届智源大会上,宇树科技创始人王兴兴成为新的焦点人物,结束开幕式圆桌对话后在安保引导下离场,具身智能取代大语言模型,成为当年大会的关键词,机器人格斗、舞蹈表演登上主论坛舞台。
针对行业趋势,李大海当时向《每日经济新闻》记者(下称“每经记者”)表示,技术发展是非线性的,大模型作为底层基础设施逐步成熟后,产业关注的重心自然会从底层模型向具体应用迁移,这种迁移是合理且必然的。
2026年,每经记者在第八届北京智源大会现场注意到,会场的气氛又发生了变化,本届大会汇聚了2位图灵奖得主、8位院士、30余位30岁以下青年科学家、40余位AI企业CEO与创始人,以及200余场演讲和分享,线下报名人数已突破1万人,智源研究院院长王仲远透露,本次报名人数已经超过去年。不过,现场并未看到此前两年那种因明星嘉宾而出现的拥堵场面。
谈及大会主角的逐年更迭,王仲远在接受每经记者采访时坦言,过去几年智源大会的开幕式主角一直在变化,从大模型、具身智能,到今年的世界模型,每一次主角的变化,背后其实是产业关注重心的迁移,“更像一个平台和载体,反映了时代的变迁”。
第八届北京智源大会一个引人注目的变化,是更多年轻面孔走上了主舞台。
在开幕式圆桌环节,小米集团MiMo大模型团队负责人罗福莉与清华大学人工智能研究院副院长、生数科技创始人朱军;清华大学计算机系教授、面壁智能联合创始人、首席科学家刘知远;南洋理工大学讲座教授、人工智能交叉研究院院长安波同台对话。
AI自进化也成为本届大会讨论最密集的词汇之一。
罗福莉的判断是,上一代模型的能力上限更多体现在执行层面,指令清晰时执行效果接近完美,但顶尖模型如今已经开始向设计验证指标、规划实验流程等更抽象的能力外延。
她认为,目前模型与顶尖研究员之间的差距,主要还在于提出有价值的问题这一环节,但这一差距正在被更强的模型叠加更好的智能体系统不断缩小。
刘知远则从更宏观的视角作出类比:工业革命的核心是用机器替代人的重复体力劳动,发展到极致便是用机器制造机器;而正在发生的智能革命,本质上是用AI替代人的重复脑力劳动,用AI制造AI,是技术发展到高级阶段的必然标志。他同时强调,“AI create AI”这件事的最外层驱动力,仍然应当是人类自身的主体性。
安波则持相对审慎的态度。他表示自己相信AI自演化的方向,但强调这套机制在AI能力较弱时很难在封闭环境中自行运转,更多还是依赖外部用户使用产生的真实反馈数据,“完全封闭地去搞数据飞轮,这条路并不可行”。
图片来源:每经媒资库 (图文无关)
如果说2025年的关键词是具身智能,那么2026年智源大会真正想要推到台前的,或许就是世界模型。
王仲远在大会前的采访中系统阐述了智源对世界模型的判断:人工智能正在经历一场范式变革,从“预测下一个词元”(Next-Token Prediction)演进到“预测下一个物理状态”(Next Physical State Prediction),这正是世界模型的核心本质。
智源将现有世界模型相关技术路线划分为四类:第一类是以语言为中心的世界模型,包括VLM、VLA;第二类是以像素为中心的世界模型,如Sora、Seedance等视频生成模型;第三类是以三维结构为中心,包括3D重建以及李飞飞团队的World Labs Marble模型;第四类是以视觉表征为中心的世界模型,如杨立昆的JEPA系列模型,预测的是视觉表征的压缩,但视觉嵌入演化不等于物理规律演化。
在王仲远看来,这四类模型距离真正面向物理世界的基座模型都还有很大距离,“现在仍处于世界模型的早期,依然需要开展大量的科研探索工作”。
基于这一判断,智源在本届大会上发布了通用世界基座模型悟界Physis-v0.1,以统一的物理状态学习实现物理正确、动作因果可溯、长程一致与通用泛化。但王仲远也表示,这只是0.1版本,“很明显只是非常初步的、正在训练的模型”,智源“并没有重磅发布任何世界模型”,更多是分享研发进展和初步观察。
值得一提的是,智源研究院行为世界模型创新中心负责人是一位22岁的青年学者陈博远。王仲远表示,智源历来秉持“青年挑大梁”的理念,当年悟界系列的多位负责人也是30岁左右走上岗位。
在大模型产业论坛的圆桌讨论中,关于大模型公司是否拥有长期“护城河”的争论依然激烈。有声音认为,顶级模型能力正在快速趋同,开源与闭源的差距已缩小到3至6个月,大模型公司未来可能像卖水卖电的一样,有量无价。
对此,王仲远认为,目前大模型整体性能的迭代还远未到瓶颈期,行业格局可能走向一超多强,也可能是多个巨头并存,现阶段各类评测榜单本身也并不完全可信。他特别提到,开幕式上提到的最新Claude模型发布,证明即便互联网文本数据接近用尽,AI能力依然能够持续提升,而且不仅是模型本身,整个系统的生产能力,以及从聊天工具到执行工具的转变,都在同步发生。
银河通用CTO王鹤提到WAM(World Action Model,世界动作模型)的概念,将其与泛泛而谈的世界模型区分开来。王鹤介绍,银河通用此前用10亿帧仿真数据,已经在抓取任务上验证了零样本端到端能力,但更多任务的Scaling仍依赖真实世界的遥操数据。在他看来,WAM以"动作"为核心,可以借助大量人类第一视角视频学习动作模式,而不需要动作标签,这条路径有望让具身智能在未来两年内达到“GPT3.5级别”的预训练里程碑。
面壁智能联合创始人兼首席科学家刘知远则在开幕式圆桌中提到,Anthropic之所以能够在估值上超过OpenAI,关键在于其找到了“代码”这样一个能够形成数据闭环的垂直方向,2024年、2025年强化学习上的成功,叠加Claude Code等产品从全球用户那里持续收集代码反馈数据,构成了一个可持续的数据飞轮。刘知远认为,这一模式具有借鉴意义:任何领域若能快速搭建同类数据闭环,都有望加速AI落地与技术突破。
而在王仲远看来,未来两到三年内,AI Coding对各行各业的冲击可能比世界模型等更直接、更快。他在采访中提到,腾讯方面近期透露,今年以来公司新增代码大部分已由AI生成,意味着人类数字世界会被现代AI重构。
与前两年相比,一个明显的变化是:技术热点的迭代速度并未减缓,但“造星效应”有所减弱。
无论是世界模型还是AI Coding,目前都还没有出现一家能够像去年的宇树科技、前年的月之暗面那样,一露面就引爆全场关注的明星公司。
某科技公司一名报名前来参会的人士在接受每经记者采访时分享了自己的参会感受,他表示,无论是否有技术明星,智源大会的谈论主题始终处于技术前沿,对于从业者而言,听会以及前来与参展商的交流都很有价值。
王仲远在回应每经记者关于主角变迁的提问时表示,每年大会能让全行业看到AI最新发展趋势和方向,这也是今年报名人数再创新高的原因之一。他同时坦言,世界模型这一概念本身在过去半年非常火热的同时,也伴随着大量的概念误用,“我们期望大家逐步形成一些共识,避免世界模型名词的滥用”。
在开幕式的对话环节,阿里云创始人王坚与智源研究院理事长黄铁军,围绕“总有人比时代早十年”展开了一场更具哲学意味的讨论。
王坚提到,从飞机首飞到航空系成立用了三十多年的时间,“假定我们今天讲的人工智能是一个大的变革,我们可能真的还远没有到能够成立真正意义上的'人工智能系'的时候”。
这句话或许也可以用来理解本届大会的整体氛围,当具身智能的机器人格斗赛逐渐褪去新鲜感,当大模型的能力迭代变成日常,当自进化、世界模型这些更抽象的概念尚未找到一个具象的明星载体,整个行业似乎正处在一个新旧叙事交替的换挡期。
正如刘知远在圆桌上对年轻人提出的建议,“真正的创新往往是反共识的,如果全世界都在做的事情,它就不见得是创新;所有人都认为该做的事情,不见得是创新”。下一个能让全场为之围堵的明星,也许正诞生在那些此刻还少人关注的角落里。
封面图片来源:每经媒资库