米兰体育官方网站对话曹旭东：把智驾带进物理AI时间

作家 | 柴旭晨

剪辑 | 周智宇

2026 年的北京车展上，"物理 AI "成了被一样最多的词之一。

曩昔两年，全球科技行业的主角是数字 AI：大模子会写稿、会编程、P 图，险些重作念了一遍互联网进口。但当数字寰宇的数据红利被快速消化之后，产业运转把眼力投向更大的现实寰宇——说念路、工场、仓库、家庭、城市交通系统。

底层本领从数字空间迁徙到物理空间，也曾成为新的产业共鸣。问题在于，谁能成为物理寰宇的 OpenAI？

这次北京车展上，Momenta 给出的谜底是：自动驾驶即是物理 AI 的序章，而 Momenta 念念成为其中的平台型玩家。

跨界

2026 年 4 月 25 日，Momenta 发布 R7 强化学习寰宇模子，并将其界说为"物理 AI 序章"。

Momenta CEO 曹旭东在发布会后对华尔街见闻示意，"自动驾驶进入到了这个阶段。"所谓"这个阶段"，是自动驾驶也曾成为当前少数能够同期买通"数据闭环"与"营业闭环"的物理 AI 赛说念。这是领路"为什么自动驾驶是物理 AI 序章"的要道。

数字 AI 曩昔之是以爆发，是因为具备三个条款：海量低成本数据、快速低成本考据、熟悉营业进口。互联网提供文本、图片、视频数据，用户点击一次、追问一次，模子就取得一次反映，家具再通过订阅、告白、API 变现。

而大多数物理 AI 领域并不具备这些条款。

机器东说念主缺数据、缺场景、缺反映，更缺褂讪现款流。一个机械臂念念学会合手杯子，要真实硬件、真实动作、真实损耗；一次试错的成本，远高于数字寰宇的一次模子推理。

曹旭东向华尔街见闻直言，OpenAI 早期既作念机器东说念主，也作念数字 AI，但阶段性烧毁机器东说念主去作念 GPT，一个病笃原因即是"机器的数据太难取得了。"

在曹旭东看来，GPT 需要的互联网数据，自己也曾具备超大界限。但自动驾驶既属于物理寰宇，又自然领有延续数据源。

每一台量产车都是挪动传感器，每一次通勤、变说念、避障、拥挤、停车，都是模子西宾样本。只须车辆界限鼓胀大，真实寰宇的数据就会源远流前途入系统。

与此同期，它还有光显的营业进口。

用户安闲为扶植驾驶买单，车企安闲为智能化竞争力买单，供应商不错通过定点、授权、装车取得收入。本领普及不仅意味着论文收成更高，也意味着销量更高、ASP 更高、客户更多。这即是曹旭东所说的正反映机制。

"先有了数据闭环，然后才有鼓胀好的体验，这个鼓胀好的体验一朝达到了接近东说念主类的水平或者超越东说念主类的水平的时候，就能够竣事爆发式的营业化。而这个爆发式的营业化之后，又会带来数据爆发式的增长。" 曹旭东说说念。

换句话说，自动驾驶也曾具备了物理 AI 最稀缺的飞轮结构。而 Momenta 正在这个飞轮里占据成心位置。

公司知道，已请托超越 70 款量产车型，累计定点车型数超越 200 款，搭载其系统的量产车辆界限已超越 80 万台。本届北京车展，超越 20 个品牌、60 余款车型搭载 Momenta 决议，包括飞驰、奥迪、良马新发布车型。

这 80 万台车，不单是装机量，更是 80 万个延续采集现实寰宇复杂路况的数据节点。OpenAI 的模子靠全球用户发问进化，Momenta 的模子靠全球车辆启航进化。

但有了数据，还不够。物理 AI 实在的难点，不是看见寰宇，而是领路寰宇。

破局

曹旭东向华尔街见闻瓦解说念，大语言模子依靠 Next Token Prediction 预计下一个词，从而压缩数字寰宇知识；而物理 AI 要依靠 World Model Prediction，预计物理寰宇下一刻气象和交互逻辑，让模子领路物体指导要领、因果联系和潜在变化。"因此，寰宇模子与强化学习，共同组成物理 AI 的两大中枢支撑。"

这句话绝交看。数字 AI 的实质，是语言预计。物理 AI 的实质，是现实预计。前车急刹后，后车会不会追尾；雨天路面打滑时，制动距离会延长若干；路边儿童短暂冲出，车辆还有莫得避开空间——这些都不是翰墨问题，而是动态寰宇问题。

Momenta 给出的解法，是"寰宇模子 + 强化学习"。

Momenta 研发 SVP 夏炎指出，Momenta 的寰宇模子分三层：第一层是预西宾，用海量真实驾驶数据把物理要领、知识与因果联系压缩进模子；第二层是仿真，让模子在虚构环境中推演步履变化后寰宇若何演变；第三层是辞寰宇模子中进行强化学习，让系统在接近真实的环境里反复试错、自主优化。

这套结构，实质上是在复制 OpenAI 的成效旅途，但西宾对象从语言变成现实寰宇。

先学习知识，再进行后西宾，再通过强化学习取得更优决策。曹旭东也提到，仅有知识并不代表是好司机。"大都的数据内部有好的驾驶步履，但是更多的是不好的驾驶步履。"因此预西宾之后，还需要 Post-Training，"把它的步履引发或者对都到东说念主类好的步履上去。"

这险些即是车圈版的 RLHF。现实司契机急刹、徬徨、加塞、分神，模子若只是师法东说念主类平均水平，只可成为庸俗司机。只好通过强化学习筛选更优步履，才可能成为超东说念主类司机。

这亦然为什么曹旭东说，自动驾驶是物理 AI 的序章——它是第一个实在需要处罚现实寰宇复杂博弈，又具备界限数据和营业申报的场景。

更病笃的是，它还能络续外溢。曹旭东向华尔街见闻泄露，Momenta 的 L4 业务不单作念 Robotaxi，也作念 Robovan，来岁还会作念 Robotruck。他们坚信，"一个自动驾驶的大模子能够竣事统统的自动驾驶垂直讹诈，何况作念得更好。"

这意味着，Momenta 并不念念只作念一家智驾 Tier1，而是念念作念一个平台底座。

OpenAI 把统一个模子延迟到搜索、办公、客服、编程；Momenta 则念念把统一个驾驶大模子延迟到乘用车、出租车、物流车、卡车。不同场景分享底层技艺，不同场景再反哺模子进化。

这是平台公司的典型旅途。

自然，物理 AI 的门票极贵。

曹旭东说，竣事界限化 L4，累计参加"至少是百亿好意思金"；通用机器东说念主可能需要"几百亿好意思金到千亿好意思金"级别参加，是以他的论断相配现实：长久只靠融资并不现实，"一定要有现款流业务来救援物理 AI 的研发。"

这恰正是 Momenta 相较许多办法型 AI 公司的上风——它也曾领有量产业务、客户订单和真实收入，再把现款流参加下一代模子西宾。

好多公司在谈物理 AI 的将来，Momenta 则是在用自动驾驶养出物理 AI 的将来。

十年前，曹旭东在硅谷看到 Fairchild Drive，那条以仙童半导体定名的街说念燃烧了他的创业念头。他说，但愿与统统中国 AI 公司沿途，书写属于东方的硅谷据说。今天看，这个愿景的现实版块无意是：OpenAI 先让机器学会讲话，Momenta 念念让机器学会在现实寰宇里行为。

以下是与 Momenta CEO 曹旭东的对话实录：

问：当下全球汽车产业流行反向合伙，越来越多的国际车企敬重了中国的科技巨头，何如看待这种新的趋势？

曹旭东：中国的本领当今正在从中国走向寰宇，统统这个词发展速率相配快的，进入国际的市集，比如说进入欧洲的市集，进入其他的一些市集的时候，给当地用户带来更发轫的家具价值，但是另外一方面也会带来一些冲击，比如说冲击当地的公司、当地的处事或者是当地的税收等等。

相比好的一个处罚决议即是鉴戒中国之前的模式，即是跟中国粹习，来作念反向合伙，反向合伙完之后，既让当地享受到了中国高技术的本领和家具很好的用户体验，另外一方面就相配于是中国的本领赋能当地企业，对当地企业带来更多的发展，带来更好的责任契机、更多的处事、更好的税收，是一个共赢的模式。

问：本年车展上有哪些国际的客户和 momenta 交流？历程中有过哪些挑战？

曹旭东：不光是本年，昨年的时候咱们就也曾是全球品牌的共同选拔了，在全球最顶尖的品牌内部，像德系的 BBA、人人，日系的丰田、本田、日产，好意思系的通用、福特，都也曾是咱们量产的合作念客户了。

挑战的话，最常见的挑战，是中国的速率和国际 OEM 的程序，有时候是矛盾和芜杂的，但是这个矛盾和芜杂主要围绕着客户和用户，以客户和用户的价值为中心去共创，好多时候都能找到更好的立异性的方法，带来更好的阻挡。

问：数据飞轮在本质量产的历程中，最大的瓶颈是什么？

曹旭东：数据这件事情，它不是单单的数据自己，你不错认为数据它即是矿石，而且是含矿量很低的铁矿石，是以你要把数据确凿用起来的话，发轫你要把这个贫矿变成富矿。

我举一个例子，在高速上三只小狗列队横穿高速，这么的场景确凿是万中无一、万里挑一，你何如把这个数据给挑出来？它的难度自己即是一个大海捞针的难度，这也曾有很高的门槛了，你何如把贫矿变成富矿，再从富矿变成钢铁，钢铁又变成发动机，发动机最终又装到车上，这才是最终的价值，是以统统这个词的数据飞轮的体系，它是一个体系技艺，领有原始数据，领有海量的原始数据只是是一个价值起源的 10%，剩下的 90% 是来自于这个体系的价值，这是第一个问题。

问：当今有一种说法，数据不难，但是用好数据相比难，Momenta 何如去用好这些数据？

曹旭东：像咱们的大模子，咱们可能会分为预西宾的阶段和 Post-Training 的阶段，预西宾的阶段，海量的来自于咱们的量产车，咱们当今也曾 80 万台车了。海量量产的数据，而且量产的数据包括了大都的长余数据，通过 World Model Pre-Training 来预西宾这个模子。

预西宾完这个模子之后有物理知识，但是有物理知识不代表它是一个好司机，因为大都的数据内部有好的驾驶步履，但是更多的是不好的驾驶步履，是以就有少量像数字 AI 内部大模子的西宾一样，你通过海量的数据行动输入，它具备了这个寰宇的知识，但是不代表着它有好的步履，是以你照旧需要 Post-Training，通过 Post-Training，把它的步履引发或者对都到东说念主类好的步履上去，或者会分为这两个设施。

问：本年北京车展上好多的车企都在强调我方的扶植驾驶本领阶梯的不同，Momenta 的寰宇模子最大的特色是什么？

曹旭东：更病笃的不是单点算法，是架构技艺，架构技艺也曾比单点算法技艺更强了，因为一朝波及到架构一定波及到选定，不是统统的立异都能放到统一个架构内部，波及到架构的话就波及到选定，好的架构能够竣事更好的积存和更好的协力，架构之上又包含了体系，milan这个体系包含了数据迭代的体系，包括了西宾的体系，也包括了统统这个词迭代的体系和考据的体系，体系之上更多的是组织和文化，就有少量像中国有一句古话，淮南为橘、淮北为枳。

我合计根柢上的企业之间的差距来自于组织和文化和对应的体系的竖立，这是有更大的差距的。而具体的单点的算法的话，这个立异自然很病笃了，每一代的算法架构的立异，本质上会带来大的向上，但是坦率来说，在中国的环境下，知识的流动和东说念主才流动的速率其实是相比快的，只是是单点算法的话，并不存在尽头大的壁垒或者互异性，有壁垒的是体系和组织的技艺，是以你会发现，可能大众说的都是同样的单点算法的办法，但是最终作念出来的效用可能有一代或者两代的差距，背后不是单点算法的差距，背后是体系和组织的差距。

问：Momenta 成就 10 周年历程中的分享？

曹旭东：我合计照旧蛮庆幸，一齐走来，最病笃的照旧跟志同说念合的东说念主去干实在心爱的事情，确凿会让你的东说念主生期望盎然，创业历程中有好多的不毛和挑战，这些不毛和挑战，每一年都会合计，这一年可能是最难的，过了这一年来岁可能会更好，但本质上不是。

如若你不享受发现问题、处罚问题的历程，你不享受和你身边志同说念合的东说念主共同去探索、共同去面对不毛和处罚不毛的历程，其实创业碰到的这些不毛是很难支柱下去的。可能咬着牙支柱一年，咬着牙支柱两年，咬着牙支柱三年，很难支柱十年，是以你一定要找到志同说念合的东说念主去干心爱的事情，去让我方的东说念主生期望盎然。

问：物理 AI 被英伟达的黄教主带火之后，好多公司都说是物理 AI 的公司，Momenta 在物理 AI 方面是一个什么样的位置？

曹旭东：发轫我合计物理 AI 是势在必行，发轫大众都知说念数字 AI 有很大的上风，第一个即是数字 AI 的数据能够快速的呈界限的取得。大众都知说念 Open AI 很早的时候，有机器东说念主、罕有字 AI，但是自后在聚焦的历程中，阶段性的烧毁了机器东说念主，选拔了去作念 GPT，很病笃的原因是机器的数据太难取得了。

而 GPT 需要的是互联网的数据，而互联网的数据本来就也曾口舌常大界限了。数字 AI 在曩昔几年本质上是突飞大进，自然另一方面数字 AI 能够愈加低成本、短周期的覆按，因为它能够在数字寰宇上去互动，它的成本是更低的，周期是更短的，就比如说当今 Agent 要调用的话，只需要给一个接口。但是机器东说念主要调用某一个器具的话，它要把机械手造出来，何况要合手取阿谁器具，何况来使用阿谁器具，阿谁难度和复杂度都会大相配多。

但是，咱们场所的寰宇，既罕有字的部分，又有物理的部分，而物理的部分可能是更大的一部分，是以当数字寰宇统统这个词的发展取得了相配大的瓦解之后，自然则然的好多的成效的教会和方法就要进入物理寰宇，何况在物理寰宇中作念立异，这亦然为什么我觉适合今是物理 AI 的序章刚运转。

再回到咱们公司，讲到物理 AI，其什物理 AI 我合计最中枢的，一个是数据闭环，一个是营业闭环，而且这两者是互动的。我有一个教会，这个教会即是，任何一个东说念主工智能的讹诈，一朝接近东说念主类的水平，就会在很短的时候大幅超越东说念主类的水平，这背后的逻辑是什么呢？

只是是我的一个不雅察，就比如说你看 Alpha Go 也好，或者曩昔的东说念主脸识别也好，前边经过了一个相配漫长的爬坡期去接近东说念主，接近东说念主可能花了十年、二十年很长的时候，但是超越东说念主，或者大幅地超越东说念主，有可能就发生在 1、2 年，2、3 年的时候，一运转有这个不雅察之后，我就在念念背后的原因到底是什么？

自后就合计最要道的照旧数据闭环和营业闭环，而且这两者之间是正反映的，因为先有了数据闭环，然后才有鼓胀好的体验，这个鼓胀好的体验一朝达到了接近东说念主类的水平或者超越东说念主类的水平的时候，就能够竣事爆发式的营业化。

而这个爆发式的营业化之后，又会带来数据爆发式的增长，而数据爆发式的增长又会带来模子技艺进一步的爆发式增长，最终能够彼此促进、彼此引发，造成热烈的正反映，而热烈的正反映使得在很短的时候内就能够竣事十倍、百倍致使千倍东说念主类的阅历。

咱们的判断即是自动驾驶进入到了这个阶段，机器东说念主还需要一段时候，这是第少量。是以自动驾驶是物理 AI 的序章，因为它起初竣事了界限的数据闭环和界限的营业闭环。

第二点即是，你看自动驾驶要竣事界限化的 L4，我的判断累计的参加至少是百亿好意思金，而且有可能照旧创业公司的研发效用，如若你是大公司的话不单是百亿好意思金，可能需要几百亿好意思金。

但是机器东说念主呢？通用的机器东说念主它需要若干钱？我的判断可能是几百亿好意思金到千亿好意思金这个级别，有可能照旧创业公司的研发效用。是以我的判断即是，物理 AI 它是需要有门票的，而这个门票即是你需要有现款流的业务，诚然当今统统这个词中国具身智能的成本市集口舌常活跃的，但是长久来看，要靠投资，要靠融资，跟踪作念成通用的物理 AI，或者物理寰宇的 AGI 是不现实的，而是一定要有现款流业务，而这个现款流业务不错是自动驾驶，也不错是物理 AI 某一个办法，诚然我当今莫得念念到，其他的某一个办法能够更早地竣事界限化的数据闭环和营业闭环，或者其他来自于数字 AI 的现款流业务。不管若何一定要有一个现款流业务来救援物理 AI 的研发。

问：本年 L4 业务的进程若何？Momenta 作念 Robotaxi 的上风？

曹旭东：咱们公司的 L4 并不是只作念 Robotaxi，也会作念 Robovan，即是物流。因为咱们十年的愿景内部，十年物流和出行的效用翻倍，本质上物流是放在更前边的，出行放到后头，来岁咱们也会作念 Robotruck，诚然咱们本年不会作念，但是咱们来岁会作念。

背后的底层逻辑是什么呢？照旧回到今天提到的 Jeff Hawkins 那一册书内部，它讲到了一个中枢办法即是一个神经网、一个大模子能够竣事通用 AI 的技艺，具体落地到自动驾驶这个领域的话，咱们坚信的是什么呢？咱们坚信的是一个自动驾驶的大模子能够竣事统统的自动驾驶的垂直讹诈，何况作念得更好。

而且这件事情咱们也曾在 Robotaxi、Robovan 和乘用车上成效的考据了，何况取得了很好的效用。这个带来的价值是什么呢？带来的价值即是你在每一个 vertical 的研发成本会大幅度的裁减。而每个讹诈场景，每个垂直讹诈场景的教会和数据，又不错汇总数接收到这个大模子内部，使得每个垂直领域作念得更好，这本质上即是一个平台上风。

这个就有少量像十年前或者十几年前统统这个词的互联网行业，有垂直电商，也有平台电商，但是最终胜出的都是平台电商，垂直电商可能当今都不存在了，很病笃的原因即是这个平台效应带来的。咱们的判断在自动驾驶在大模子领域也存在着很强的这么的平台效益，一个大模子能够竣事统统的垂直领域，何况能够作念得更好，这么每个垂直领域的成本更低，效用会更好。

问：2030 年会不会迎来智驾的结尾？

曹旭东：统统这个词智驾或者统统这个词自动驾驶它有相配强的界限效应和先发上风，它的效应会比芯片行业更强，是以你回来历史不错看到，这个芯片行业，不管是 PC 时间的芯片，本质上全球就只好两家，手机芯片的时间全球也就只好两家，高通和 MTK。

自动驾驶，因为它是软件，它的边缘成本是零，是以它的界限效应更强，它的界限效应除了成本上的界限效应，还有体验上普及的界限效应。

另一方面，面向主机厂有尽头强的先发上风，因为主机厂好多业务都是叩门敲三年，从你见到客户到拿下条约是 3 年，如若是国际 OEM 的话，可能要叩门敲 5-7 年。

比如说咱们和飞驰的合营，2017 年飞驰就投资了咱们，而且那时尽头巧，Ola K ä llenius（康林松）当今飞驰的董事长他合计这个公司尽头有活力选拔投资咱们，但是咱们跟飞驰的第一个量产模式上市是 2025 年的后半年，阅历了整整 8 年的时候，其实也曾加快了。

我那时问了一个清华的师兄，阿谁清华的师兄告诉我说，你们跟飞驰合营量产至少需要十年。咱们中间 2017 年到 2020 年是 POC，2020 年到 2022 年是 Pre SOP，2022 年到 2024 年是小批量的量产开导，到了 2024 年才拿到了飞驰统统的电车和油车的业务，2025 年底的时候才实在的量产。

是以举一个例子不错感受到，汽车行业叩门敲 3 年，国内的 OEM 叩门敲 3 年，国际的 OEM 叩门敲 5-7 年，到底是一个什么样的原因？因为这个行业有相配强的界限效应和相配强的先发上风米兰体育官方网站，是以我照旧保管我正本的判断，中国也就 2-3 家，全球也就 3-4 家，会相配快速地不断。

乐橙体育(中国)官网入口

米兰体育官方网站 对话曹旭东：把智驾带进物理AI时间

米兰体育官方网站对话曹旭东：把智驾带进物理AI时间