最 Sexy 的事，終于發(fā)生在了自動駕駛

第一電動大牛作者汽車之心 2024-04-29 11:40

闊別 4 年，再次站在北京車展巨大的人潮中，往往不知所措——時不時傳出「雷總在那里」、「教主去了蔚來」，人群便像螞蟻炸開了鍋。人還沒過來，冒出來的手機(jī)就啪一下伸到了臉旁。

這場被流量裹挾的車展，是「糖衣炮彈」。外層的流量只是淺嘗輒止，炮彈攻擊力本源是技術(shù)。

有媒體調(diào)侃，如果雷軍是「流量扶貧」，那么出現(xiàn)在北京車展上，以華為為代表的 Tier1 就算是技術(shù)扶貧了。

前段時間，「華元魔」的「無圖」智駕格局在業(yè)界廣為流傳。需要強(qiáng)調(diào)，這里的無圖指去高精地圖，而非去掉所有地圖。

隨著華為高階智駕破圈，元戎啟行拿下三家主機(jī)廠項(xiàng)目、Momenta 悶聲趕路，華元魔坐穩(wěn)「無圖」智駕前三把交椅。

對應(yīng)的，華元魔在北京車展上，圍繞著智駕「如何更像人」，也有大動作。

華為車 BU 發(fā)布智駕新品牌「乾崑」，ADS2.0 升級為乾崑 3.0，技術(shù)轉(zhuǎn)向 GOD/PDP 網(wǎng)絡(luò)全新架構(gòu)。相當(dāng)于，讓系統(tǒng)的規(guī)劃和決策更像人。

元戎更直接，推出了首個使用端到端模型的量產(chǎn)智駕方案 DeepRoute IO，真「無圖」，能夠使得高快、城區(qū)全覆蓋，同時端到端模型使得整體駕駛風(fēng)格人性化。據(jù)可靠消息，元戎的這套方案已經(jīng)在長城某高端車型量產(chǎn)上車。

Momenta 則在車展前夕推出了基于 OrinX 的「無圖」高階智駕解決方案，官宣方案搭載了融合感知和規(guī)劃的端到端智駕大模型。

以北京車展分界線，華元魔正式打響了端到端自動駕駛第一槍。

01、「無圖」智駕，華元魔格局已定？

「無圖」，是智駕公認(rèn)的技術(shù)趨勢。

2023 年，多家智駕公司都陸續(xù)表達(dá)過一個觀點(diǎn)：感謝華為和小鵬。

尤其是華為不僅讓消費(fèi)者認(rèn)識到了智駕價值，也讓「無圖」城區(qū)智駕徹底出圈。

當(dāng)智駕走向城區(qū)，車企以新勢力為代表，方案商以華元魔為代表，清一色選擇了去高精地圖。

去年 3 月，元戎啟行也推出了不依賴高精度地圖的智能駕駛解決方案 DeepRoute-Driver 3.0，當(dāng)時元戎拿著這套方案與深圳某「大廠」曾交流過技術(shù)細(xì)節(jié)。

去年 10 月，華為發(fā)布了「不依賴于高精地圖的高階城區(qū)智駕」，并喊出全國都能開。憑借驚人的號召力與領(lǐng)先的技術(shù)水平，華為徹底讓「無圖」城區(qū)智駕破圈。

類似的，Momenta 在 CVPR 2023 年自動駕駛研討會上也提出了量產(chǎn)的「無圖」智駕解決方案，在激烈的定點(diǎn)競爭中脫穎而出。

「無圖」，是智駕共識，但真·「無圖」，不一定是。

想要去高精地圖，就得另起爐灶，重新搭建一套新技術(shù)框架，這往往意味著丟棄過往的沉沒成本。

因此，有一種玩小聰明的營銷方式——只要不全用高精地圖，就被稱為「無圖」，但這并不是真「無圖」。

常見的有兩種方法，一種是在復(fù)雜路口打補(bǔ)丁。

比如在城區(qū)內(nèi)遇到一個復(fù)雜路口，可以提前在系統(tǒng)中預(yù)埋小范圍高精地圖，到路口通過關(guān)鍵點(diǎn)匹配，可以讓系統(tǒng)跟著路口拓補(bǔ)結(jié)構(gòu)行駛，但明顯行駛起來會有頓挫感、機(jī)械感。

另外一種是定制化地圖，采用動態(tài)圖層。

也就是說先通過多次采集車流數(shù)據(jù)，把軌跡、車流數(shù)據(jù)背下來輸送進(jìn)系統(tǒng)，從而在大腦里生成一張隱形的地圖。這也是一種「去圖」的方法，但如果要采集出車流概率，意味著要采多遍才能統(tǒng)計準(zhǔn)確，采集成本不亞于高精地圖。

真「無圖」，準(zhǔn)確的概念是僅依靠標(biāo)準(zhǔn)的導(dǎo)航地圖（SD Map）的輸入來實(shí)現(xiàn)高階智駕。

一個認(rèn)定的方法是，高精地圖接口。元戎的 IO 方案在上量產(chǎn)時，沒有為高精地圖預(yù)留接口。

「無圖」對自動駕駛解決方案商要求極高，現(xiàn)在跑出來的華元魔三家其實(shí)都有著各自特點(diǎn)：

（1）華為車 BU：強(qiáng)聲量與強(qiáng)研發(fā)節(jié)奏。

此前，華為車 BU 也在用高精地圖，而后依靠著強(qiáng)研發(fā)投入去高精地圖，在 ADS2.0 時初有成效。目前，華為車 BU 累計投入超過 300 億元，研發(fā)規(guī)模 7000 人。還有一個問題是，華為的「無圖」智駕并不便宜，據(jù)可靠消息，華為智駕系統(tǒng)成本近 2 萬元。

余承東在問界新 M5 發(fā)布會上說過，售價低于 30 萬的車型，華為高階智駕都是虧本銷售。

無疑，憑借著過往積累的 TO C 經(jīng)驗(yàn)與品牌聲量，華為帶領(lǐng)智駕破圈。也是從問界開始，車企們有了對外公布智駕版本銷量占比數(shù)據(jù)的習(xí)慣。

（2）Momenta：強(qiáng)量產(chǎn)節(jié)奏。

在被傳出與華為、豐田合作之前，Momenta 沉默了很久，一直在悶聲干量產(chǎn)，看起來其服務(wù)的量產(chǎn)項(xiàng)目主要是上汽智己，但其實(shí)其不同程度參與或交流的車企數(shù)量眾多，比如比亞迪、廣汽、長城、豐田、奔馳、通用等。

因此 Momenta 的「無圖」智駕優(yōu)勢，在于其豐富的量產(chǎn)經(jīng)驗(yàn)以及車企對其的信任。

（3）元戎：強(qiáng)技術(shù)驅(qū)動。

相比其他兩家，元戎少了一些量產(chǎn)經(jīng)驗(yàn)。

據(jù)可靠消息，今年元戎在極短時間內(nèi)就拿到了三家車企的定點(diǎn)項(xiàng)目。業(yè)內(nèi)有一種說法是，如果車企想要快速晉升自動駕駛第一梯隊(duì)，就找元戎。

元戎可能是國內(nèi)最早把端到端模型測試車跑在城市公開道路一家公司。

2023 年年初元戎開始著手端到端，到現(xiàn)在，元戎推出的 IO 方案實(shí)際上將在長城的車型上應(yīng)用。

一個有意思的細(xì)節(jié)是，前不久長城 CEO 魏建軍親自上陣直播智駕，或許就是從端到端架構(gòu)上車獲得了技術(shù)自信。

02、向端到端開炮

不去高精地圖，談何到端到端？

華元魔進(jìn)軍「無圖」智駕的底層邏輯，不止是為了降本增效，而是為了全面進(jìn)軍端到端模型。

高精地圖與端到端是兩套完全不同的邏輯。

前者就是一堆精確的三維表征，密密麻麻堆起的結(jié)構(gòu)化數(shù)據(jù)。

后者則是神經(jīng)網(wǎng)絡(luò)。兩者最大的區(qū)別是，高精地圖是給計算機(jī)輸入的信息，而端到端則是一套類人腦的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。

想象一下，靠圖像理解道路與提前輸入一堆三維坐標(biāo)，神經(jīng)網(wǎng)絡(luò)顯然更擅長記住非結(jié)構(gòu)化數(shù)據(jù)。這就更像一個小朋友更容易記住音樂、圖片，而不是無規(guī)律的數(shù)字。

因此，真「無圖」是端到端模型的前提。

尤其是在看到特斯拉 FSD V12 端到端大規(guī)模應(yīng)用效果后，在國內(nèi)引發(fā)了多米諾骨牌式的熱潮，相比于以前受人工規(guī)則驅(qū)動的傳統(tǒng)自動駕駛系統(tǒng)，端到端用數(shù)據(jù)驅(qū)動邏輯證明了智駕可以真·類人。

本質(zhì)上，行業(yè)對端到端的投入并不是單純對特斯拉的技術(shù)崇拜，而是自動駕解決方案商和車企紛紛意識到了進(jìn)入復(fù)雜城區(qū)，再依靠傳統(tǒng)自動駕駛系統(tǒng)，是行不通的。

傳統(tǒng)自動駕駛是感知、預(yù)測、規(guī)劃三個模塊獨(dú)立開發(fā)訓(xùn)練。

在這種分裂的模塊化架構(gòu)下，信息傳遞會出現(xiàn)減損，而且人為定義規(guī)則，僅能通過有限的規(guī)則處理有限場景。

端到端自動駕駛，是將感知、規(guī)劃、決策、控制等多個環(huán)節(jié)融合成神經(jīng)網(wǎng)絡(luò)模型, 從而實(shí)現(xiàn)一端輸入感知數(shù)據(jù)、一端輸出決策的效果，由于采用了人腦決策方式，使得駕駛更具有整體化思維，更類人。

目前，端到端模型主要指感知規(guī)劃一體化，像自動泊車這種涉及到控制模塊的功能，就沒有必要使用端到端來處理。

有行業(yè)人士解釋，泊車是一件純控制行為，這件事機(jī)器做會比「人」做得更好。

這是因?yàn)樯窠?jīng)網(wǎng)絡(luò)不擅長做精細(xì)化處理，在確定性的環(huán)境中就越不需要端到端，尤其是車輛控制的精準(zhǔn)程度利用規(guī)則算法可以控制到厘米級，所以相比于費(fèi)時費(fèi)力用端到端做控制環(huán)節(jié)、做泊車，直接用記憶泊車背路線、SLAM 建圖的效果會更好。

總結(jié)來看，越是復(fù)雜的地方就越需要端到端，尤其是城區(qū)。

除了真的「無圖」，還要達(dá)到真正好開的無人駕駛。端到端自動駕駛，已經(jīng)正式進(jìn)入城區(qū)大考。

特斯拉無疑是進(jìn)展最快的，這個月特斯拉正在大規(guī)模向北美用戶推動 FSD V12.3.3 版本，且去掉了「Beta」標(biāo)識。

這意味著特斯拉先一步來到全民大考時刻，實(shí)踐下來效果不錯。

一位北美車主測試視頻顯示，即便在駕駛的鄉(xiāng)村道路上遇到 4 只鵝「橫穿馬路」，系統(tǒng)也能在大約 5m 外的位置剎停。

在國內(nèi)，華元魔端到端節(jié)奏也非常快，三家都采用了不同程度端到端架構(gòu)：

華為 ADS3.0 將預(yù)決策、規(guī)劃模塊融合至 PDP 網(wǎng)絡(luò)。

Momenta 官宣自己為端到端智駕大模型，融合了感知和規(guī)劃，但進(jìn)一步技術(shù)細(xì)節(jié)沒有再公開透露。

元戎啟行 IO 方案應(yīng)該是其中上車最快的，據(jù)汽車之心了解，前段時間長城汽車魏建軍直播全場景 NOA 用的應(yīng)該就是 IO 方案，一個小時在保定市區(qū)內(nèi)跑了 17 公里，在保定這種極為復(fù)雜的三線城市中，IO 的端到端智駕能力確實(shí)有驚喜。

看完整場智駕直播，場景可歸為三個難度層級，從考驗(yàn)系統(tǒng)基礎(chǔ)的腦補(bǔ)能力再到泛化能力，再到理解能力，難度層層疊加。

第一層級挑戰(zhàn)，車輛遇到車道線，系統(tǒng)腦補(bǔ)車道線穩(wěn)穩(wěn)開過路口。
第二層級挑戰(zhàn)，面對靜態(tài)環(huán)衛(wèi)車這種異形障礙物，系統(tǒng)更加具備泛化識別能力，提前避讓；
第三層級挑戰(zhàn)，地獄難度的六岔路口，路口到對面路口距離超過 200 米，要理解道路結(jié)構(gòu)并且與復(fù)雜車流博弈是非常大的挑戰(zhàn)，但 IO 端到端智駕系統(tǒng)順利通過路口。據(jù)悉，IO 智駕路口通行成功率近 98%，特殊路口轉(zhuǎn)向成功率近 90%。

甚至，端到端還會展現(xiàn)出一些讓人驚喜的推理能力。

在一個分岔路口，車輛為了跟前車保持距離，留出了安全空間，但系統(tǒng)察覺到后車有過閘道的動作后，系統(tǒng)為后車讓出了閘道口。區(qū)別于過去傳統(tǒng)駕駛的「利己」動作，這完全是一個「利他」的行為。

這種「驚喜」展現(xiàn)的是端到端神經(jīng)網(wǎng)絡(luò)中的黑盒能力，但黑盒的不可解釋性也會存在危險。

安全必須有保障，因此，端到端自動駕駛都要有對應(yīng)的兜底系統(tǒng)。

像特斯拉的 FSD V12 和 FSD V11，兩套不同規(guī)則驅(qū)動的系統(tǒng)同時存在，即便端到端遇到不可控情況，也能夠激活人工規(guī)則來兜底。

據(jù)業(yè)內(nèi)人士介紹，一個用 CPU、一個用 GPU，并不沖突，類似的元戎也是將基于規(guī)則的兜底安全策略和 IO 整合在同一個系統(tǒng)中，為系統(tǒng)「約法三章」。

另外還有感知兜底。目前，華元魔三家的量產(chǎn)上車方案都用了激光雷達(dá)，有行業(yè)人士解釋道：「純視覺和激光雷達(dá)做端到端都可以，但激光雷達(dá)現(xiàn)階段仍然是安全底線?！?/span>

03、端到端，通往 AGI 的唯一路徑

馬斯克說過：「與其說特斯拉是一家車企，倒不如說是一家人工智能/機(jī)器人公司?！?/span>

目前國內(nèi)也有人提過類似說法，元戎啟行 CEO 周光認(rèn)為，端到端自動駕駛大規(guī)模上車，是通向 AGI 的唯一路徑。

周光認(rèn)為，AI 邁向 AGI 可以分為三個階段：

AI 1.0 時代：以人工規(guī)則為內(nèi)核的簡單智能駕駛系統(tǒng)。
AI 2.0 時代：大語言模型、視覺語言模型爆發(fā)，同時在端到端模型的撬動下，將會打開 2.0 新世界大門。
AI 3.0 時代：誕生 AGI 通用人工智能，AI 不僅僅應(yīng)用在汽車上，還可以用到更多智能機(jī)器上，讓機(jī)器成為人類的伙伴與助手。也可能有馬斯克所描述的「類人甚至超人智能」的存在。

汽車之所以會成為通往 AGI 的唯一路徑，是因?yàn)槎说蕉藢?shù)據(jù)需求是海量的。今天除了車之外，沒有任何機(jī)器人可以提供如此海量的數(shù)據(jù)。

比如，特斯拉 FSD V12 每天獲取 1600 億幀視頻訓(xùn)練，去年年初就完成了 1000 萬個視頻分析。

汽車所帶來的數(shù)據(jù)量，是機(jī)器人應(yīng)用場景無法比擬的。

大語言模型、生成式 AI、端到端模型分別代表著AI 的語言能力、與物理世界交互能力、創(chuàng)造性能力，三者融為一體就是打開 AI 3.0 的開始。

這也意味著端到端不是一蹴而就，而是通過還原世界、理解世界、操作動作來完成的。自動駕駛解決方案商想要踩中節(jié)點(diǎn)就需要按這種技術(shù)節(jié)奏來。

華為和 Momenta 目前沒有提出 AGI 路徑，但大致經(jīng)歷了高精地圖智駕、去圖、再到端到端的轉(zhuǎn)向。

元戎明確提出了依靠技術(shù)嗅覺踩準(zhǔn)發(fā)展節(jié)奏的 AGI 發(fā)展路徑。

2016 年元戎提出前融合，將感知模塊中的點(diǎn)云與圖像融合，元戎啟行 CEO 周光原話是「當(dāng)時做只是覺得后融合安全兜底并不完全成立。」

2022 年元戎開始投入去圖，投入「無圖」后，可以加強(qiáng)了系統(tǒng)全場景理解能力，讓系統(tǒng)看到道路元素、懂得識別道路拓?fù)浣Y(jié)構(gòu)，人車博弈等。

所以，類似于馬斯克第一原理，元戎自然而然地把預(yù)測和決策放到了一起?！溉绻话杨A(yù)測決策放一起，拆東墻補(bǔ)西墻的操作是搞不完的」。

因此 2023 年時，元戎干脆把感知和規(guī)劃這兩個模塊打通，2023 年 8 月，搭載端到端自動駕駛系統(tǒng)的測試車就跑在深圳。

從端到端開始，另外一個以數(shù)據(jù)驅(qū)動的技術(shù)時代誕生了。

猶如楚門的世界中，楚門終于意識到此前的世界一直是按著劇本與預(yù)演好的軌道行駛，大門后才是按照自我意志生活的世界。

對于用戶來說也是如此。

端到端是一場真正的智駕科技變革。過去，在車展聽到智駕詞匯最多的是「安全」，但就是「不像人」，也沒有人開得好，智駕機(jī)器味道太濃。

這會讓消費(fèi)者對智駕的信任度逐漸透支，就像「妝后」與「素顏」一樣，有著體驗(yàn)鴻溝。

隨著華元魔端到端大規(guī)模量產(chǎn)上車，「安全能用」大概率將變成「安全過癮」，這種對智駕體驗(yàn)質(zhì)變的提升，無疑是自動駕駛界最「Sexy」的事。

所以今年，智駕付費(fèi)訂閱率是否能大規(guī)模提升，就看華元魔上車量產(chǎn)的情況如何了。

來源：第一電動網(wǎng)

作者：汽車之心

本文地址：http://autopag.com/kol/229086

返回第一電動網(wǎng)首頁 >

文中圖片源自互聯(lián)網(wǎng)，如有侵權(quán)請聯(lián)系admin#d1ev.com（#替換成@）刪除。

贊15

分享到：

發(fā)表評論

新聞推薦

大牛作者

汽車之心

微信公號Auto-Bit。汽車之心是一家專注智能汽車與自動駕駛的媒體和知識服務(wù)平臺，定位于推動汽車與科技的融合。我們的團(tuán)隊(duì)由一群熱愛汽車與新技術(shù)的資深媒體人、產(chǎn)品人與自動駕駛行業(yè)從業(yè)者組成。歡迎添加微信號autobitxyz給我們提意見。