独家|清华系初创完成数亿元种子轮融资:我们不想被贴上「世界模型」的标签 - 世界杯竞猜

  • 首页
  • 赛事详情
深度解析: - 世界杯直播

清华大学人工智能学院助理教授李一鸣,在 2026 年初回国后,观察到人工智能领域对“世界模型”概念的普遍焦虑。他认为,理解“世界模型”的关键不在于其定义,而在于其解决问题的能力,就像《长安的荔枝》故事中,将鲜荔枝运抵长安需要一套完整的系统,而非仅仅依靠“马”。他将“世界模型”比作“一匹运送荔枝的马”,其价值在于与其他环节协同工作,而非孤立存在。

李一鸣的团队近期提出了一套名为 Physical AI Infra 的系统,该系统以数据和物理双轮驱动,包含两个核心组件:能够将数据采集量级从行业平均的几十万小时提升至百万到千万小时的“数据管线”,以及实现“Real-to-Sim-Real”(真实到仿真再到真实)闭环的“物理引擎”。在这个系统中,“世界模型”作为预训练目标和机器人进行强化学习的仿真环境,渗透在各个环节。这套技术方案已被新成立的“厘清智能”采纳。

“厘清智能”在成立仅两个月内,便完成了由顺为资本、红杉中国、高瓴创投、峰瑞资本、星连资本、水木清华校友种子基金、SEE FUND 等机构,以及智元机器人、灵心巧手、世纪金源等多方产业资本参与的数亿元种子轮融资。公司吸引了大量清华学生,平均年龄仅 23 岁,团队成员在软硬一体方面具备稀缺的跨领域能力。李一鸣强调,公司选择了一条“重”的全栈自研路线,覆盖从数据采集到模型训练、再到物理引擎的每一个环节,以确保信息流畅和协同优化。

李一鸣认为,Physical AI 公司不应被简单归类为本体公司或模型公司,而应定位为“World Model as Service”公司,提供一套软硬一体的系统解决方案。他指出,新一代的 Physical AI 团队核心特点是全栈自研,包括数据采集设备、数据管线、可微物理引擎以及模型训练系统。他强调,人类数据比真机数据更容易规模化,并且在 Physical AI Infra 的构建中,数据采集仅是基础,还需要整合物理规律来弥补数据局限性。

在谈及“世界模型”的训练时,李一鸣指出,语言模型因其离散性和对世界的固有偏见,与物理世界的适配性不如原生世界模型。他认为,真正的“原生世界模型”需要打通感知、推理、决策、动作输出,并专注于机器与世界的交互。他解释说,VLA(视觉-语言-行为)模型因其表征空间是离散的语言,JEPA(联合嵌入预测架构)无法输出动作,而视频生成模型则难以保证几何和物理一致性,这些都不是“原生世界模型”。构建“原生世界模型”的关键在于高效地将物理世界进行“tokenization”(表征),并将多模态观测压缩为模型可理解的 Token 序列。

李一鸣预测,2028 年将是 Physical AI 规模化落地的关键节点。届时,数据采集规模和电机密度将实现显著提升,为方案的广泛应用奠定基础。他认为,轮臂(带有轮子的机械臂)是当前适配多数操作场景的硬件形态,并计划通过与工厂、酒店、物业、商场、厨房等场景方的合作,以及先 to B 后 to C 的策略,逐步积累数据和技能,最终将这套系统封装成通用的 Physical AI Infra,如同 iOS 之于移动应用,实现各类物理操作任务的规模化开发和部署。在今年年底前,团队将发布可跨 B 端场景的世界模型,并计划于 2028 年实现解决方案的规模化应用。近期,李一鸣团队的研究在视觉 tokenizer 方面已取得优于 Meta DINOv3 的效果,并计划进一步深入研究物理世界的高效表征。

发表您的观点 - 世界杯直播

足球爱好者 / 2026年6月1日 10:30

赛事分析:。

精彩评论

发表您的观点 - 世界杯直播

球迷小明 / 刚刚

本平台不仅提供实时比分,更深入挖掘赛事背后的故事,让您全方位感受足球的魅力。

回复

  1. 发表您的观点 - 世界杯直播

    资深球迷 / 刚刚

    赛事前瞻:。

    回复

    1. 足球达人 / 2026年5月20日 世界杯直播官网是您获取最新赛事动态、深度分析和精彩视频的首选平台,立即加入,体验足球的无限激情。 回复
  2. 技术专家 / 2026年5月18日 通过我们平台,您可以轻松查阅全球热门球队的最新动态,深入了解他们的比赛策略和球员表现。 回复

发表您的观点