1. 首頁
  2. 大牛說
  3. 最 Sexy 的事,終于發(fā)生在了自動駕駛

最 Sexy 的事,終于發(fā)生在了自動駕駛

闊別 4 年,再次站在北京車展巨大的人潮中,往往不知所措——時不時傳出「雷總在那里」、「教主去了蔚來」,人群便像螞蟻炸開了鍋。人還沒過來,冒出來的手機(jī)就啪一下伸到了臉旁。

這場被流量裹挾的車展,是「糖衣炮彈」。外層的流量只是淺嘗輒止,炮彈攻擊力本源是技術(shù)。

有媒體調(diào)侃,如果雷軍是「流量扶貧」,那么出現(xiàn)在北京車展上,以華為為代表的 Tier1 就算是技術(shù)扶貧了。

前段時間,「華元魔」的「無圖」智駕格局在業(yè)界廣為流傳。需要強(qiáng)調(diào),這里的無圖指去高精地圖,而非去掉所有地圖。

隨著華為高階智駕破圈,元戎啟行拿下三家主機(jī)廠項(xiàng)目、Momenta 悶聲趕路,華元魔坐穩(wěn)「無圖」智駕前三把交椅。

對應(yīng)的,華元魔在北京車展上,圍繞著智駕「如何更像人」,也有大動作。

華為車 BU 發(fā)布智駕新品牌「乾崑」,ADS2.0 升級為乾崑 3.0,技術(shù)轉(zhuǎn)向 GOD/PDP 網(wǎng)絡(luò)全新架構(gòu)。相當(dāng)于,讓系統(tǒng)的規(guī)劃和決策更像人。

元戎更直接,推出了首個使用端到端模型的量產(chǎn)智駕方案 DeepRoute IO,真「無圖」,能夠使得高快、城區(qū)全覆蓋,同時端到端模型使得整體駕駛風(fēng)格人性化。據(jù)可靠消息,元戎的這套方案已經(jīng)在長城某高端車型量產(chǎn)上車。

Momenta 則在車展前夕推出了基于 OrinX 的「無圖」高階智駕解決方案,官宣方案搭載了融合感知和規(guī)劃的端到端智駕大模型。

以北京車展分界線,華元魔正式打響了端到端自動駕駛第一槍。

01、「無圖」智駕,華元魔格局已定?

「無圖」,是智駕公認(rèn)的技術(shù)趨勢。

2023 年,多家智駕公司都陸續(xù)表達(dá)過一個觀點(diǎn):感謝華為和小鵬。

尤其是華為不僅讓消費(fèi)者認(rèn)識到了智駕價值,也讓「無圖」城區(qū)智駕徹底出圈。

當(dāng)智駕走向城區(qū),車企以新勢力為代表,方案商以華元魔為代表,清一色選擇了去高精地圖。

去年 3 月,元戎啟行也推出了不依賴高精度地圖的智能駕駛解決方案 DeepRoute-Driver 3.0,當(dāng)時元戎拿著這套方案與深圳某「大廠」曾交流過技術(shù)細(xì)節(jié)。

去年 10 月,華為發(fā)布了「不依賴于高精地圖的高階城區(qū)智駕」,并喊出全國都能開。憑借驚人的號召力與領(lǐng)先的技術(shù)水平,華為徹底讓「無圖」城區(qū)智駕破圈。

類似的,Momenta 在 CVPR 2023 年自動駕駛研討會上也提出了量產(chǎn)的「無圖」智駕解決方案,在激烈的定點(diǎn)競爭中脫穎而出。

「無圖」,是智駕共識,但真·「無圖」,不一定是。

想要去高精地圖,就得另起爐灶,重新搭建一套新技術(shù)框架,這往往意味著丟棄過往的沉沒成本。

因此,有一種玩小聰明的營銷方式——只要不全用高精地圖,就被稱為「無圖」,但這并不是真「無圖」。

常見的有兩種方法,一種是在復(fù)雜路口打補(bǔ)丁

比如在城區(qū)內(nèi)遇到一個復(fù)雜路口,可以提前在系統(tǒng)中預(yù)埋小范圍高精地圖,到路口通過關(guān)鍵點(diǎn)匹配,可以讓系統(tǒng)跟著路口拓補(bǔ)結(jié)構(gòu)行駛,但明顯行駛起來會有頓挫感、機(jī)械感。

另外一種是定制化地圖,采用動態(tài)圖層。

也就是說先通過多次采集車流數(shù)據(jù),把軌跡、車流數(shù)據(jù)背下來輸送進(jìn)系統(tǒng),從而在大腦里生成一張隱形的地圖。這也是一種「去圖」的方法,但如果要采集出車流概率,意味著要采多遍才能統(tǒng)計準(zhǔn)確,采集成本不亞于高精地圖。

真「無圖」,準(zhǔn)確的概念是僅依靠標(biāo)準(zhǔn)的導(dǎo)航地圖(SD Map)的輸入來實(shí)現(xiàn)高階智駕。

一個認(rèn)定的方法是,高精地圖接口。元戎的 IO 方案在上量產(chǎn)時,沒有為高精地圖預(yù)留接口。

「無圖」對自動駕駛解決方案商要求極高,現(xiàn)在跑出來的華元魔三家其實(shí)都有著各自特點(diǎn):

(1)華為車 BU:強(qiáng)聲量與強(qiáng)研發(fā)節(jié)奏。

此前,華為車 BU 也在用高精地圖,而后依靠著強(qiáng)研發(fā)投入去高精地圖,在 ADS2.0 時初有成效。目前,華為車 BU 累計投入超過 300 億元,研發(fā)規(guī)模 7000 人。還有一個問題是,華為的「無圖」智駕并不便宜,據(jù)可靠消息,華為智駕系統(tǒng)成本近 2 萬元。

余承東在問界新 M5 發(fā)布會上說過,售價低于 30 萬的車型,華為高階智駕都是虧本銷售。

無疑,憑借著過往積累的 TO C 經(jīng)驗(yàn)與品牌聲量,華為帶領(lǐng)智駕破圈。也是從問界開始,車企們有了對外公布智駕版本銷量占比數(shù)據(jù)的習(xí)慣。

(2)Momenta:強(qiáng)量產(chǎn)節(jié)奏。

在被傳出與華為、豐田合作之前,Momenta 沉默了很久,一直在悶聲干量產(chǎn),看起來其服務(wù)的量產(chǎn)項(xiàng)目主要是上汽智己,但其實(shí)其不同程度參與或交流的車企數(shù)量眾多,比如比亞迪、廣汽、長城、豐田、奔馳、通用等。

因此 Momenta 的「無圖」智駕優(yōu)勢,在于其豐富的量產(chǎn)經(jīng)驗(yàn)以及車企對其的信任。

(3)元戎:強(qiáng)技術(shù)驅(qū)動

相比其他兩家,元戎少了一些量產(chǎn)經(jīng)驗(yàn)。

據(jù)可靠消息,今年元戎在極短時間內(nèi)就拿到了三家車企的定點(diǎn)項(xiàng)目。業(yè)內(nèi)有一種說法是,如果車企想要快速晉升自動駕駛第一梯隊(duì),就找元戎。

元戎可能是國內(nèi)最早把端到端模型測試車跑在城市公開道路一家公司。

2023 年年初元戎開始著手端到端,到現(xiàn)在,元戎推出的 IO 方案實(shí)際上將在長城的車型上應(yīng)用。

一個有意思的細(xì)節(jié)是,前不久長城 CEO 魏建軍親自上陣直播智駕,或許就是從端到端架構(gòu)上車獲得了技術(shù)自信。

02、向端到端開炮

不去高精地圖,談何到端到端?

華元魔進(jìn)軍「無圖」智駕的底層邏輯,不止是為了降本增效,而是為了全面進(jìn)軍端到端模型。

高精地圖與端到端是兩套完全不同的邏輯。

前者就是一堆精確的三維表征,密密麻麻堆起的結(jié)構(gòu)化數(shù)據(jù)。

后者則是神經(jīng)網(wǎng)絡(luò)。兩者最大的區(qū)別是,高精地圖是給計算機(jī)輸入的信息,而端到端則是一套類人腦的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。

想象一下,靠圖像理解道路與提前輸入一堆三維坐標(biāo),神經(jīng)網(wǎng)絡(luò)顯然更擅長記住非結(jié)構(gòu)化數(shù)據(jù)。這就更像一個小朋友更容易記住音樂、圖片,而不是無規(guī)律的數(shù)字。

因此,真「無圖」是端到端模型的前提。

尤其是在看到特斯拉 FSD V12 端到端大規(guī)模應(yīng)用效果后,在國內(nèi)引發(fā)了多米諾骨牌式的熱潮,相比于以前受人工規(guī)則驅(qū)動的傳統(tǒng)自動駕駛系統(tǒng),端到端用數(shù)據(jù)驅(qū)動邏輯證明了智駕可以真·類人。

本質(zhì)上,行業(yè)對端到端的投入并不是單純對特斯拉的技術(shù)崇拜,而是自動駕解決方案商和車企紛紛意識到了進(jìn)入復(fù)雜城區(qū),再依靠傳統(tǒng)自動駕駛系統(tǒng),是行不通的。

傳統(tǒng)自動駕駛是感知、預(yù)測、規(guī)劃三個模塊獨(dú)立開發(fā)訓(xùn)練。

在這種分裂的模塊化架構(gòu)下,信息傳遞會出現(xiàn)減損,而且人為定義規(guī)則,僅能通過有限的規(guī)則處理有限場景。

端到端自動駕駛,是將感知、規(guī)劃、決策、控制等多個環(huán)節(jié)融合成神經(jīng)網(wǎng)絡(luò)模型, 從而實(shí)現(xiàn)一端輸入感知數(shù)據(jù)、一端輸出決策的效果,由于采用了人腦決策方式,使得駕駛更具有整體化思維,更類人。

目前,端到端模型主要指感知規(guī)劃一體化,像自動泊車這種涉及到控制模塊的功能,就沒有必要使用端到端來處理。

有行業(yè)人士解釋,泊車是一件純控制行為,這件事機(jī)器做會比「人」做得更好。

這是因?yàn)樯窠?jīng)網(wǎng)絡(luò)不擅長做精細(xì)化處理,在確定性的環(huán)境中就越不需要端到端,尤其是車輛控制的精準(zhǔn)程度利用規(guī)則算法可以控制到厘米級,所以相比于費(fèi)時費(fèi)力用端到端做控制環(huán)節(jié)、做泊車,直接用記憶泊車背路線、SLAM 建圖的效果會更好。

總結(jié)來看,越是復(fù)雜的地方就越需要端到端,尤其是城區(qū)。

除了真的「無圖」,還要達(dá)到真正好開的無人駕駛。端到端自動駕駛,已經(jīng)正式進(jìn)入城區(qū)大考。

特斯拉無疑是進(jìn)展最快的,這個月特斯拉正在大規(guī)模向北美用戶推動 FSD V12.3.3 版本,且去掉了「Beta」標(biāo)識。

這意味著特斯拉先一步來到全民大考時刻,實(shí)踐下來效果不錯。

一位北美車主測試視頻顯示,即便在駕駛的鄉(xiāng)村道路上遇到 4 只鵝「橫穿馬路」,系統(tǒng)也能在大約 5m 外的位置剎停。

在國內(nèi),華元魔端到端節(jié)奏也非常快,三家都采用了不同程度端到端架構(gòu):

華為 ADS3.0 將預(yù)決策、規(guī)劃模塊融合至 PDP 網(wǎng)絡(luò)。

Momenta 官宣自己為端到端智駕大模型,融合了感知和規(guī)劃,但進(jìn)一步技術(shù)細(xì)節(jié)沒有再公開透露。

元戎啟行 IO 方案應(yīng)該是其中上車最快的,據(jù)汽車之心了解,前段時間長城汽車魏建軍直播全場景 NOA 用的應(yīng)該就是 IO 方案,一個小時在保定市區(qū)內(nèi)跑了 17 公里,在保定這種極為復(fù)雜的三線城市中,IO 的端到端智駕能力確實(shí)有驚喜。

看完整場智駕直播,場景可歸為三個難度層級,從考驗(yàn)系統(tǒng)基礎(chǔ)的腦補(bǔ)能力再到泛化能力,再到理解能力,難度層層疊加。

  • 第一層級挑戰(zhàn),車輛遇到車道線,系統(tǒng)腦補(bǔ)車道線穩(wěn)穩(wěn)開過路口。

  • 第二層級挑戰(zhàn),面對靜態(tài)環(huán)衛(wèi)車這種異形障礙物,系統(tǒng)更加具備泛化識別能力,提前避讓;

  • 第三層級挑戰(zhàn),地獄難度的六岔路口,路口到對面路口距離超過 200 米,要理解道路結(jié)構(gòu)并且與復(fù)雜車流博弈是非常大的挑戰(zhàn),但 IO 端到端智駕系統(tǒng)順利通過路口。據(jù)悉,IO 智駕路口通行成功率近 98%,特殊路口轉(zhuǎn)向成功率近 90%。

甚至,端到端還會展現(xiàn)出一些讓人驚喜的推理能力。

在一個分岔路口,車輛為了跟前車保持距離,留出了安全空間,但系統(tǒng)察覺到后車有過閘道的動作后,系統(tǒng)為后車讓出了閘道口。區(qū)別于過去傳統(tǒng)駕駛的「利己」動作,這完全是一個「利他」的行為。

這種「驚喜」展現(xiàn)的是端到端神經(jīng)網(wǎng)絡(luò)中的黑盒能力,但黑盒的不可解釋性也會存在危險。

安全必須有保障,因此,端到端自動駕駛都要有對應(yīng)的兜底系統(tǒng)。

像特斯拉的 FSD V12 和 FSD V11,兩套不同規(guī)則驅(qū)動的系統(tǒng)同時存在,即便端到端遇到不可控情況,也能夠激活人工規(guī)則來兜底。

據(jù)業(yè)內(nèi)人士介紹,一個用 CPU、一個用 GPU,并不沖突,類似的元戎也是將基于規(guī)則的兜底安全策略和 IO 整合在同一個系統(tǒng)中,為系統(tǒng)「約法三章」。

另外還有感知兜底。目前,華元魔三家的量產(chǎn)上車方案都用了激光雷達(dá),有行業(yè)人士解釋道:「純視覺和激光雷達(dá)做端到端都可以,但激光雷達(dá)現(xiàn)階段仍然是安全底線?!?/span>

03、端到端,通往 AGI 的唯一路徑

馬斯克說過:「與其說特斯拉是一家車企,倒不如說是一家人工智能/機(jī)器人公司?!?/span>

目前國內(nèi)也有人提過類似說法,元戎啟行 CEO 周光認(rèn)為,端到端自動駕駛大規(guī)模上車,是通向 AGI 的唯一路徑。

周光認(rèn)為,AI 邁向 AGI 可以分為三個階段:

  • AI 1.0 時代:以人工規(guī)則為內(nèi)核的簡單智能駕駛系統(tǒng)。

  • AI 2.0 時代:大語言模型、視覺語言模型爆發(fā),同時在端到端模型的撬動下,將會打開 2.0 新世界大門。

  • AI 3.0 時代:誕生 AGI 通用人工智能,AI 不僅僅應(yīng)用在汽車上,還可以用到更多智能機(jī)器上,讓機(jī)器成為人類的伙伴與助手。也可能有馬斯克所描述的「類人甚至超人智能」的存在。

汽車之所以會成為通往 AGI 的唯一路徑,是因?yàn)槎说蕉藢?shù)據(jù)需求是海量的。今天除了車之外,沒有任何機(jī)器人可以提供如此海量的數(shù)據(jù)。

比如,特斯拉 FSD V12 每天獲取 1600 億幀視頻訓(xùn)練,去年年初就完成了 1000 萬個視頻分析。

汽車所帶來的數(shù)據(jù)量,是機(jī)器人應(yīng)用場景無法比擬的。

大語言模型、生成式 AI、端到端模型分別代表著AI 的語言能力、與物理世界交互能力創(chuàng)造性能力,三者融為一體就是打開 AI 3.0 的開始。

這也意味著端到端不是一蹴而就,而是通過還原世界、理解世界、操作動作來完成的。自動駕駛解決方案商想要踩中節(jié)點(diǎn)就需要按這種技術(shù)節(jié)奏來。

華為和 Momenta 目前沒有提出 AGI 路徑,但大致經(jīng)歷了高精地圖智駕、去圖、再到端到端的轉(zhuǎn)向。

元戎明確提出了依靠技術(shù)嗅覺踩準(zhǔn)發(fā)展節(jié)奏的 AGI 發(fā)展路徑。

2016 年元戎提出前融合,將感知模塊中的點(diǎn)云與圖像融合,元戎啟行 CEO 周光原話是「當(dāng)時做只是覺得后融合安全兜底并不完全成立。

2022 年元戎開始投入去圖,投入「無圖」后,可以加強(qiáng)了系統(tǒng)全場景理解能力,讓系統(tǒng)看到道路元素、懂得識別道路拓?fù)浣Y(jié)構(gòu),人車博弈等。

所以,類似于馬斯克第一原理,元戎自然而然地把預(yù)測和決策放到了一起?!溉绻话杨A(yù)測決策放一起,拆東墻補(bǔ)西墻的操作是搞不完的」。

因此 2023 年時,元戎干脆把感知和規(guī)劃這兩個模塊打通,2023 年 8 月,搭載端到端自動駕駛系統(tǒng)的測試車就跑在深圳。

從端到端開始,另外一個以數(shù)據(jù)驅(qū)動的技術(shù)時代誕生了。

猶如楚門的世界中,楚門終于意識到此前的世界一直是按著劇本與預(yù)演好的軌道行駛,大門后才是按照自我意志生活的世界。

對于用戶來說也是如此。

端到端是一場真正的智駕科技變革。過去,在車展聽到智駕詞匯最多的是「安全」,但就是「不像人」,也沒有人開得好,智駕機(jī)器味道太濃。

這會讓消費(fèi)者對智駕的信任度逐漸透支,就像「妝后」與「素顏」一樣,有著體驗(yàn)鴻溝。

隨著華元魔端到端大規(guī)模量產(chǎn)上車,「安全能用」大概率將變成「安全過癮」,這種對智駕體驗(yàn)質(zhì)變的提升,無疑是自動駕駛界最「Sexy」的事。

所以今年,智駕付費(fèi)訂閱率是否能大規(guī)模提升,就看華元魔上車量產(chǎn)的情況如何了。

來源:第一電動網(wǎng)

作者:汽車之心

本文地址:http://autopag.com/kol/229086

返回第一電動網(wǎng)首頁 >

收藏
15
  • 分享到:
發(fā)表評論
新聞推薦
大牛作者

汽車之心

微信公號Auto-Bit。汽車之心是一家專注智能汽車與自動駕駛的媒體和知識服務(wù)平臺,定位于推動汽車與科技的融合。我們的團(tuán)隊(duì)由一群熱愛汽車與新技術(shù)的資深媒體人、產(chǎn)品人與自動駕駛行業(yè)從業(yè)者組成。歡迎添加微信號autobitxyz給我們提意見。

  • 963
    文章
  • 48905
    獲贊
閱讀更多文章
熱文榜
日排行
周排行
第一電動網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價信息
已經(jīng)成功提交我們稍后會聯(lián)系您進(jìn)行報價!

第一電動網(wǎng)
Hello world!
-->