首页 科技快讯 小鹏拆掉过去的自己,再战 “物理 AI”

小鹏拆掉过去的自己,再战 “物理 AI”

来源:晰数塔互联网快讯 时间:2025年11月26日 17:08



随着经营压力缓解,何小鹏与团队对前沿技术冒险的渴望重新显露。

文丨孟驰

新技术的冒险,有时要与悬而未决长时间相伴;但技术交锋剧烈时,一些技术流派的优势可能无法维持半年。置身其中的企业不得不保持高度敏捷的应对姿势。

这大概也是为什么今年以来,车企们的智能驾驶部门架构普遍多次调整,要么换人,要么换 “脑子”。而小鹏汽车的结论是:革掉过去的成功经验。因为他们现在想把虚拟的 AI 规模化、可靠地部署在真实世界的智能汽车、机器人、飞行汽车 —— 即他们所说的 “物理 AI ”。

今年 4 月,小鹏对外发布自动驾驶模型技术路线 VLA(视觉-语言-动作)。它本是机器人领域的主流技术框架,近年扩散到智驾领域。相隔仅半年多,小鹏就在今年的科技日上发布第二代 VLA 产品,相比前代最大的变化是新一代 VLA 方案更 “拟人”,在一些场景会有意想不到的智能涌现:读懂随机路人的手势、在红绿灯路口前蠕行等。

小鹏机器人团队也有类似的 “涌现” 时刻。去年发布首款人形机器人后,今年初小鹏对机器人重新做了设计:做了专门的脊椎设计、做了能收肩和耸肩的肩膀、重新研发前脚掌的关节,新型机器人更因为在今年科技日活动上的行走体态高度拟人而出圈。

近期,我们与小鹏新任自动驾驶负责人刘先明交流,试图理解他们如何在 “物理 AI” 上拆掉过往的路径。他加入小鹏一年半,今年 10 月正式接手小鹏智驾团队。在此之前,他在 Facebook 和通用旗下 Cruise 从事机器学习与计算机视觉方面的研究,长期面对前沿技术的演进和反复。

克里斯滕森在《创新者的窘境》中指出,在一些具备破坏性的创新技术到来时,成熟的大公司会对新技术有天然的排斥心理。即便管理者希望企业朝着完全不同的方向展开冒险,但绩效主义者和严格高效的流程管理,往往会干扰这种改变的发生。

小鹏希望对抗这种企业惯性。“你得拆掉过去的成功经验,如果我们做完这一代就停下,也许明后年,我们很快就被追上。一个团队要永远看边界在哪,你根本不知道还存在哪些你不知道的问题。拆掉自己赖以成名的经验,才可以往下走。” 刘先明对《晚点 LatePost》 说。

“所有好的东西都是简单的”,AI 也是

“机器人真这么走路,会把自己绊倒。” 一位机器人从业者看完小鹏科技日发布会后对我们说。“小鹏机器人里藏着真人” 的质疑也迅速在社交平台上传播开来。

当夜,小鹏汽车 CEO 何小鹏没能睡着,团队连夜组织了 “危机” 预案会议。有员工提议学《让子弹飞》里的小六子,剪开胸腔证明没藏人。最终这个提议没有被采用。次日,何小鹏在观众面前、直播中剪开了机器人的小腿,行走姿态与前一日无异。



小鹏第七代人形机器人 IRON 。图中小鹏工作人员正在剪开机器人小腿皮肤组织。来源:小鹏汽车

这是小鹏机器人第七代产品,也是其首次令人产生 “恐怖谷” 联想的产品。 2019 年小鹏推出四足机器狗,直到去年才推出略显生硬的首代人形机器人。而今年机器人能走猫步、打太极、跳舞,小鹏围绕机器人的终极思考是什么?

“如果未来地球有 10 亿甚至更多机器人,它大概会是什么形态?” 小鹏汽车机器人副总裁米良川在媒体沟通会上说。他和团队的答案是:人形。因为人类所有的房子、桌子、设施、工具环境都是围绕人而设计。未来的机器人扩张中,人形将是与人类兼容、共享周围环境的最低阻力方式。

米良川有超过 20 年的机器人创业与从业经验,深谙机器人核心技术。他意识到,过往技术不成熟时,总要为特定问题设计特定的机器硬件——结果技术一迭代,整台机器就得推倒重来,硬件迭代时间起码半年以上。

小鹏押注的路线是:先做一个能力 60 分的通用型人形机器人,再通过软件快速迭代场景功能。需要拖地?更新模型。要做饭?再更新一版。走猫步,只是为了验证软硬件设计是否做到极致,检验技术路线是否可行。

回归第一性原理,是小鹏 AI 体系的核心逻辑。自动驾驶负责人刘先明也站在同一条逻辑线上,他认为,所有好的东西都是简单的。

今年,智能驾驶行业有个火热的技术方向:在 “图像输入、控制输出” 的端到端架构中,融入大语言模型。举个例子,通过大语言模型的转译,智驾系统能看懂路上的深坑、复杂路牌等,而市面上也有 DeepSeek、通义千问等开源大语言模型供车企选用。小鹏初代 VLA 产品正是基于这种路线。

但刘先明告诉我们:语言是结构化的、离散的、可预测的,而现实世界是连续的、非结构化的、不可预测的。0.1 秒到 0.2 秒之间,就可能有行人冲出马路或者车辆碰撞。

换句话说,大语言模型的思考与描述需要时间,而驾驶博弈却发生在电光火石间。语言能描述世界,但无法瞬间穷尽驾驶的所有可能。

于是小鹏的第二代 VLA 产品思路变得极致与简单:尽量使用视频,而不是大量文本;输入真实世界物理的信号,输出行为。用大算力、大数据、大模型驱动智驾。“越简单的系统搭建起来越容易维护。” 刘先明说。

“拿掉 ‘语言’ 的思路很符合第一性原理,它简单、直接,是更极致的端到端,也很像人类开车和日常生活中的很多无需语言而暗含智能的 ‘直觉行为’。” 刘先明说。

“视觉是智能的基石。” 全球人工智能科学家李飞飞也曾在 2015 年的 TED 演讲中提到这个观点。她提到,寒武纪生命大爆发前,地球生物在水中被动漂浮,直到三叶虫演化出感光细胞,生命才成为环境的主动参与者,渴望生存、适应和改变。视觉的出现才驱动了智能的演化。

这种 “去语言化” 的反思也出现在机器人行业,这就像人类理解世界并不依赖把视觉内容先翻译成语言,再去推理;我们看到桌面上有杯子、书本或键盘,是直接从视觉经验中获得的判断。

刘先明告诉我们,这种集体反思可能是同时发生的。自动驾驶和机器人都属于物理 AI,本质是尝试理解、建模、推演世界发生什么,然后再做出最安全、最符合人类意识的选择。

无论是人形机器人对通用性的坚持,还是智驾对 “去语言化” 极简架构的追求,两个看似不同的物理 AI 战场,小鹏都是摒弃了对已有的、成熟但短期技术捷径的追求,转向一条更直接、更艰难但也上限更高的路径。

拆掉过去的成功经验

刘先明于 2024 年 3 月加入小鹏。彼时小鹏与整个智驾行业都处于转折:虽然抛弃了高精地图,但智驾开启的范围无法覆盖全国所有城市。50 城、100 城 .... 行业里当时交锋不断。

他与何小鹏最初见面只聊了一个问题:如何突破智驾现有瓶颈,下一代技术架构怎么做?刘先明清楚感知到何小鹏对技术变革的渴望,而他本人也需要一个敢于支持新路线的 “一号位”。那次对话后,双方一拍即合。

此后一年半,小鹏智驾路径从传统模块化方案,转到端到端、VLA ,再到下一代 VLA 四次变化。刘先明清晰地看到了问题:过往,为了让智驾模型更好用,行业会习惯叠加很多复杂的东西,虽然小模型、小数据量也有不错效果,但能力上限无法突破。

“解决复杂问题的方式,往往是让它变得简单。” 刘先明说,“比如拆掉 Language,做最极致的端到端架构,通过模型参数规模与数据量的扩展,让模型真正变强。”



何小鹏在科技日发布会上介绍下一代 VLA 模型。来源:小鹏汽车

新一代 VLA 架构的 “大模型、大数据、大算力” 特性,意味着大量视频数据会瞬时涌入系统。如果要快速消化这些数据,需要更强大的 Infra 架构作为支撑,这相当于重建系统地基。模型也必须做到大尺寸、低延时、高效率、本地化,才能灵活驾驶博弈。

刘先明告诉我们,这半年里,团队目标一直围绕着自建 AI Infra 和数据 Infra 等基建工作。等打好基础之后,才开始模型训练和模型上车。

模型如果表现不好,就得投喂同类型数据,然后等待训练结果、轮回,这个过程被工程师们称之为 “炼丹”。训练芯片就是 “炼丹” 的鼎,小鹏在新 VLA 训练中投入了 3 万张 AI 训练卡、20 亿元费用、近 1 亿段驾驶数据。同时,得益于过去 3-4 年积累,小鹏已经建立起了数据回传、模型训练、仿真测试的量产系统闭环。

为了保证用户体验与技术创新,何小鹏透露,去年二代 VLA 方案立项时,团队信心也不足,于是决定 “双线作战”:一组团队迭代现有产品,另一组攻坚新技术,直到今年 6 月模型能力有了巨大跃升。

小鹏机器人也有类似故事。今年 3 月前机器人团队非常煎熬,采用 AI 驱动的生成式运控路线后,机器人的走路抬腿姿势还是不像人。“人走路是腰和胯联动,带动大腿往前迈。”

直到有一天,团队深夜看监控回放时,发现机器人走路 “有点那个意思了”。他们说不上来哪个优化引发了技术跃迁,最大可能是重新设计后的 “腰”——他们给机器人加了脊椎、肌肉群、腹腔、皮肤等。

小鹏也在研发灵巧手,但目前主要挑战仍在稳定性和耐用性上。自研的第四代运动控制关节已经具备更高的自由度,机器人可以在猫步和正常步态之间切换。“只要输入的轨迹和姿态不违背物理规律,基本都能实现。”



小鹏机器人从发布会离场,后因猫步走姿高度拟人引发讨论。来源:小鹏汽车

所有这些调整、试错,核心都是不被过去的经验束缚,并在真实环境中检验其有效性。这种做法会带来一些挑战 —— 持续的调整也相当于令团队持续面对新的不确定 —— 但也可能为下一阶段打开空间。很多企业在关键阶段都会面对这种重新选择路径的时刻。

1995 年,仍是初创公司的英伟达,推出了首款芯片产品 NV1,试图集成图形、音频、手柄接口等所有功能,但技术路线与微软 DirectX 标准冲突而被市场 “厌弃”,公司资金仅剩 300 万美元、仅够维持 30 天,“距离破产只有 30 天” 后来成为英伟达的非官方座右铭。

黄仁勋不得不裁掉一半员工,将公司的命运押注在一款尚未问世的芯片—— NV3,也就是 RIVA 128。这款芯片放弃了 “大而全”,专注于图形性能,也拥抱当时的行业标准 DirectX,1997 年上市 4 个月销量突破百万。英伟达得以 “咸鱼翻身”,逐渐开创一个芯片生态帝国。

不同于 30 年前,AI 可能是一个更大的时代浪潮,不只改变单一产业,而是有机会重新塑造人类的生产力与生产关系。在这样的历史节点,企业需要比以往更强的战略耐性与冒险勇气。小鹏智驾与机器人对技术的重新思考与实践,都是在以长期主义在应对 AI 这一场更大的技术变革。

人与 AI 的关系也需要重新思考。《The Most Human Human》作者 Brian Christian 曾参加过图灵测试,目标是打败其他人类和聊天机器人,拿到 “最像人类的人类” 称号。他认为,人的人味来自缺陷、冲动、犹豫、跳跃的联想,在 AI 时代,人类最宝贵的是那些不完美却真实的特质,比如偶尔讲废话,会跑题,但试错也教会了人从更多角度去理解同一件事。这些让人类不可替代,也不是算法能轻易复刻的。

或许,真正的 AI 也是在一次次试错、迭代与自我拆解中,走向那条更简单、也更接近本质的路径。

经营回到正轨,小鹏重新冒险

造车、卖车依然是小鹏的重心。11 月 20 日小鹏发布了超级增程首款车型 X9,售价 30.98 万元起。2026 年小鹏将形成纯电、增程两大阵营的局面,明年将推出 7 款具备超级增程配置的 “一车双能” 车型,涵盖 4 款全新车型。同时小鹏还将向海外推出 3 款新车型。



小鹏 X9 增程版。来源:小鹏汽车

企业经营也重回增长阶段。今年 1-10 月小鹏累计交付 35 万辆车,近期迎来第 100 万辆整车下线。三季度财务已发出积极信号:综合毛利率突破 20%,亏损进一步收窄。

随着经营压力缓解,何小鹏与团队对前沿技术冒险的渴望重新显露出来。小鹏为公司设立了新目标:成为面向全球的具身智能公司。小鹏第二代 VLA,这套全新的物理模型范式,除了 AI 汽车,还将用于 Robotaxi、机器人、飞行汽车。

小鹏相信,沿着 L2 能走到更高级的 L4 自动驾驶,AI 大模型和规模法则(Scaling Law)已经让这条路变得更清晰。“我们的第二代 VLA 架构就是为了 L4 终极目标而生。” 小鹏计划,明年推出的三款 Robotaxi 车型将有全球最⾼⻋端算⼒ 3000 Tops,整车有 6 套硬件备份冗余,未来可在全球运营。

人形机器人方面,虽然何小鹏说第六、七代机器人 BOM 成本还很高。但到 2026 年底,小鹏将规模量产自研人形机器人,搭载 3 颗图灵 AI 芯⽚,有效算⼒ 2250 Tops,届时真正量产的第八代人形机器人成本最终会与汽车 BOM 成本接近。目前,小鹏选择让机器人优先进入商业场景提供服务,承担导览、导购和前台导询的工作。

在飞行汽车领域,小鹏与生态公司汇天的进度也快于特斯拉。面向个人短途飞行的 “陆地航母” 已进入量产前的最后阶段,预计 2026 年规模化交付;在近期的科技日上,小鹏还发布了高航速、长航程的垂直起降电动飞机 A868。



小鹏汇天 A868 发布会现场。来源:小鹏汽车

在这些业务全面铺开的过程中,何小鹏作为物理 AI 战略一号位的角色是一大关键。据小鹏员工透露,何小鹏与刘先明一直保持着高频次的交流。在预算审批时,何小鹏最常问刘先明的是 “预算够不够”。

“很多事情是一号位工程。” 刘先明强调:“每年烧掉的训练预算很大,这么冒险的事情,如果没有一号位的支持是做不了的。” 公司一号位的支持、过往经验的铺垫、新技术投入力度,都为小鹏下一代 VLA 的演进提供了 “燃料”。

刘先明告诉我们,何小鹏给他定下的目标是:把服务于物理 AI 的下一代技术架构做好,先从自动驾驶落地,再泛化到机器人等领域。何小鹏预计到 2030 年实现 100 万台机器人量产,这一目标与马斯克的规划规模相当。

小鹏汽车也在招募更多 AI 人才。此前,大语言模型创业公司阶跃星辰的创始团队成员周舒畅就加盟了小鹏,向刘先明汇报。何小鹏透露,今年的 AI 人才绝大部分来自于毕业生,同时也在招揽成熟 AI 大牛,最近有多位高级别 AI 人才加入自动驾驶和机器人团队。

从机器人到智驾 Robotaxi 与飞行汽车,小鹏对 AI 的理解,正在形成技术、组织到商业的闭环。AI 时代的挑战在于,让机器学会应对现实世界无穷的不确定,中国科技公司必须在快速迭代的路线交锋中,精准识别那条最具希望的技术路径,并将资源投入其中。

当然,历史也无数次证明了最终能走到下一阶段的,是那些愿意在旧经验之外,以更直接的方式去理解新世界的人。

相关推荐

小鹏和特斯拉,谁是“物理AI”的未来?
小鹏为什么选择物理AI这条路
小鹏Robotaxi和IRON发布:物理AI“安全大考”才刚刚开始
支付宝“拆掉”自己的一年
晚点对话何小鹏:为做一个真正的 CEO,我付出了怎样的代价
小鹏发布多项AI新成果,将与高德合作Robotaxi
百度拆掉玻璃墙
小鹏进化史:过去一年究竟发生了什么?
现在,应该没人质疑小鹏的AI智驾了吧
再融3亿美元,小鹏汽车IPO只差“临门一脚”?

网址: 小鹏拆掉过去的自己,再战 “物理 AI” http://www.xishuta.com/newsview144675.html

所属分类:人工智能

推荐科技快讯