【文/观察者网专栏作者 心智观察所】
2 月 25 日,特斯拉宣布推出城市道路 Autopilot 自动辅助驾驶功能。此举意义重大,标志着备受期待的全自动驾驶 FSD 功能正式进入中国市场。特斯拉为中国客户分批次更新软件。本次特斯拉 FSD 在中国的版本具备多种功能,其中包括交通信号识别、导航辅助以及智能变道等。同时,摄像头能够识别驾驶员的注意力情况。
驾驶辅助技术在中国日益普及,特斯拉 FSD 正式进入中国,这为中国的智驾竞赛增添了一份力量。
比亚迪推出了“天神之眼”等高阶智驾系统,小鹏也推出了各自的高阶智驾系统,如计划推出的 L3 级自动驾驶。特斯拉的加入会刺激技术创新,促使整个行业朝着更高级别的自动驾驶发展。
心智观察所将在本文里,带你回顾并总结那些影响中美自动驾驶竞争的关键技术以及政策因素。
为什么自动驾驶难如登天?
想象这样一个场景:有一群人,他们由工程师、业余爱好者和发明家构成,宛如一支“杂牌军”。这些人带着自己亲手制作的自动驾驶机器,一同来到了美国南加州那干旱的莫哈韦沙漠。他们的目标是让这些“钢铁司机”成功完成 150 英里(约 241 公里)的赛道,从而赢取 100 万美元的奖金。最终无人获得成功。其中表现最为出色的是卡内基梅隆大学团队,然而他们的机器仅仅跑了 7.4 英里就败下阵了。
2004 年美国国防部高级研究计划局(DARPA)发起了自动驾驶挑战赛。当时的技术还比较稚嫩,但 DARPA 的尝试并非没有意义。当年卡内基梅隆团队有两名成员,他们后来成为了谷歌旗下 Waymo 的创始人,如今 Waymo 在自动驾驶领域处于领先地位。
过去 20 年,自动驾驶一直没有迎来像 GPT 那样的“开窍时刻”。在很多时候,它更像是一张尚未兑现的支票。然而,这两种技术路线之间的激烈竞争,给这个领域注入了新的活力。
将 AI 植入聊天机器人可视为技术革命,而自动驾驶将会是改变人类生活方式的“工业革命”。从技术层面来讲,它是开启机器人时代的关键;从经济角度而言,它能够使人类从方向盘前获得解放。
以美国作为例子,自动驾驶每年能够为美国的劳动者节省 240 亿小时。这相当于每人都能多出整整 12 天的假期。这些节省下来的时间可以转变为亲子之间的陪伴,也可以转化为工作上的产出,还可以变成单纯的放松和休息。
为什么自动驾驶难如登天?
真正的完全自动驾驶意味着车辆能够在各种路况下自主行驶。这需要同时攻克两大难题,一是造出如同人眼般的“视觉系统”,通过摄像头和传感器来实现;二是复刻人类大脑的“驾驶本能”,依靠深度神经网络来达成。
想象日常的驾驶场景:需要瞬间去判断侧方卡车的行驶轨迹,需要识别暴雨中突然窜出的孩童,需要在 0.3 秒内完成刹车反应。这些对于人类来说近乎是本能的判断,然而对于机器却是需要进行精密计算的系统工程。更让人感到棘手的是,自动驾驶必须要建立起绝对安全的社会信任:它是否能够在机场的车流中行动自如?它是否能够应对街头混乱的交通生态?
这项技术尽管面临诸多困难,但其商业前景依然具有吸引力。美国智库的一项研究表明:在 2035 年时,仅在客运领域就能够创造 4000 亿美元的收入,并且还将释放出数万亿美元的社会效益。如果美国能够使 25%的车辆实现自动驾驶普及,那么预计可以避免 144 万起事故,同时也能够节省数十亿美元的医疗开支。
双雄争霸:模块化VS端到端
未来似乎还较为遥远?然而无人驾驶这件事实际上已经快要接近门槛了!当下存在两个门派在相互较量:其中一个是 Waymo 的“像搭积木建造房子一样”,也就是采用模块化的路线;另一个是特斯拉的“一下子全部完成”的方法,专业表述为端到端——这两者都依靠最近迅速走红的变形金刚,哦不对,是依靠 Transformer 模型来支撑。
先说“积木派”,其工作方式如同流水线工人分工干活一般。例如使用三个 Transformer:其中一个充当眼睛来观察路况,一个充当大脑去规划路线,第三个充当手脚来控制油门和刹车。每个机器人都有各自的职责,工程师们能够依次对它们进行调教和优化,哪里出现问题就修理哪里。然而,有趣的是,原本是想简化问题,然而却弄出了一堆流程,这反而使得事情变得更加麻烦了。
再看特斯拉的“一口闷”一派,直接让一个名为 Transformer 的大胃王把所有数据都吃下。摄像头拍摄的内容它都会看,方向盘、油门、刹车它全部包揽,就如同人类开车那样边开边学习。这种方式更接近我们学车的过程,即多开几次就能够学会。
这两个门派所使用的 Transformer 模型,与你们日常聊天的 GPT、DeepSeek 实际上是有亲属关系的。然而,它们并非处理文字,而是专门用以处理视觉信息的超级视觉专家!它们比传统的图像处理技术更擅长对摄像头画面、激光雷达等这些复杂数据进行分析,就如同给车安装了 24K 钛合金般的狗眼。
现在整个行业都处于疯狂的状态:只要向这些视觉模型提供足够多的数据和计算能力,自动驾驶就能够快速地发展进步。然而这里存在一个非常关键的问题——车载电脑必须要有足够强大的性能!手机上的聊天 AI 能够依靠云端服务器来运行,但自动驾驶必须在自己的车上就能够实时进行处理,因为生死往往就在 0.5 秒这么短的时间内。
举个吓人的例子:8 个高清摄像头拍摄 30 帧的视频,持续一小时的话能够存满 4000 张 DVD!如果 Waymo 派出 40 辆车在路上行驶,那么一天所产生的数据量就能够把整个美国国会图书馆填满。车载电脑需要使用特制的芯片才能够承受这种数据洪流,并且不能出现半秒的卡顿——因为刹车晚 0.1 秒很可能就会关乎到人命。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275319.html