繼「全國都能開」后,「車位到車位」成為智駕最新的評價標準。
具體分兩個維度,「有沒有」以及「強不強」,就此區(qū)隔強者與恒強者的身份。
放眼全球范圍內(nèi),特斯拉、華為、理想、小鵬、小米、極氪六名智駕玩家,都進入了「車位到車位」的競爭場域。
一場更嚴苛的像素級競爭開啟后,新舊勢力們追趕第一梯隊的弦崩得更緊了。
優(yōu)勝劣汰下,有人離終點更近一步,就意味著有人離淘汰也更近一步。
01、當智駕談?wù)摗杠囄坏杰囄弧箷r,到底在談?wù)撌裁?/strong>
端到端落地后,比拼關(guān)鍵在于用戶體驗。
從營銷視角著眼,用戶體驗是一個很籠統(tǒng)的詞,車企/供應(yīng)商需要借助一個強有力的論據(jù),讓用戶看到擊穿痛點的價值。
由此,各玩家盯上了「車位到車位」。
華為率先提出了這個概念,按照字面含義,它指向了從任意車位出發(fā)到目的地車位的全程智駕。
如果說此前「全國都能開」是從面上證明開城規(guī)模廣,現(xiàn)在的「車位到車位」就是從點上明確使用價值強,把「從 A 點開到 B 點」的底層邏輯映射到現(xiàn)實層面。
在華為打出樣本之后,小鵬、理想、極氪、小米都心照不宣地將「車位到車位」提上日程。
大洋彼岸的特斯拉,最近也將「車位到車位」功能更新到智駕最新版本 FSD V13.2 中。
我們試圖從六名玩家對于這一功能的敘事中,解讀其背后的隱含意義,主要有三點。
一是全場景覆蓋。
「車位到車位」打通了停車場到公開道路、公開道路到園區(qū)、園區(qū)地面到地下車庫等多種場景,其中,「過閘機」能力成為了表述關(guān)鍵詞。
理想強調(diào)在端到端大模型應(yīng)用下,系統(tǒng)可以自主通行 ETC,且不限范圍、無需學習,全國超 1 萬個收費站均可識別通行。
極氪則表示該功能具備行業(yè)首個「四抬杠」能力,能夠毫秒級精準捕捉抬杠狀態(tài),自動識別并通過地庫閘機、高速 ETC 閘機、園區(qū)閘機等。
二是應(yīng)對復雜路況。
此前車企在闡述智駕能力時,往往把應(yīng)對多個極端場景作為重點論據(jù)。但極端場景多樣化無法窮盡。
而在「車位到車位」的語境下,則強調(diào)了智駕應(yīng)對復雜路況的連貫性與完整性。
小鵬就強調(diào)了車輛在「車位到車位」整個過程中,能夠應(yīng)對復雜路口、匯流變道、識別并避讓特種車輛,實現(xiàn) U 型掉頭等特殊操作,做到全程無接管。
三是連接泊車功能。
車企在自動泊車能力上已經(jīng)卷到了厘米、分秒級別。
這邊小鵬表示,系統(tǒng)可以泊入比車身寬僅 30cm 的極窄車位,號稱側(cè)方位、斷頭位、刁鉆車位「一把到位」;
那邊極氪跟上,聲稱其泊車功能支持車寬+左右 20cm 的窄車位泊入,平均泊車時長 36 秒,在壓線情況下能實現(xiàn)智能偏移。
現(xiàn)在,在「車位到車位」的應(yīng)用場景中,這種出色的泊車能力與車輛行駛之間沒有斷點。用戶坐進車內(nèi),就可以啟動智駕,系統(tǒng)可以在自動駕駛與泊車無縫協(xié)作下,到達下一個車位。
由此,跨過「車位到車位」這道大坎的玩家們,正在新的度量衡中開啟競速。
目前,理想已經(jīng)在 11 月底全量推送了「車位到車位」功能,華為、小米、小鵬、特斯拉都開啟了不同程度的內(nèi)測,都預(yù)計明年開啟全量推送,極氪則預(yù)計明年一季度分批推送,二季度全量推送。
02、「車位到車位」水面之下,暗流交相涌動
當各家都亮出「車位到車位」大招時,如何評判功能優(yōu)劣的問題接踵而至。
理想汽車技術(shù)專家文治宇曾一針見血指出,車位到車位做的好不好,主要看兩個核心要素。
一是體驗連貫性,即在啟動這個功能前是否需要多次學習,學習完成后能否立即開啟使用;
二是產(chǎn)品完整性,即對于一些復雜起步場景,如多層車庫能,是否也能夠駕馭,做到全程無斷點。
圍繞這兩點,把目前這些玩家的「車位到車位」功能放進審視場域中,可以明顯看到共性與差異。
共性在于,無論內(nèi)測還是全量推送,目前國內(nèi)玩家在地庫、封閉停車場場景時由于沒有導航信息,需要先由用戶跑「圖」。
具體建圖方式還不一致,有玩家要求車企把地庫所有路線全部跑一遍,相當于給地庫建一次全面、清晰的地圖后,方可使用「車位到車位」;
另一種思路是,用戶僅需按照系統(tǒng)要求,完成起點、目的地的車位駛?cè)脒M口、駛出出口的路線學習,即可啟動該功能。
當然,系統(tǒng)也會結(jié)合用戶常駕駛路線數(shù)據(jù),通過靜默學習,自動生成通勤路線的「車位到車位」。
所以,唯一區(qū)分點在于,「車位到車位」功能能否適用于初次行駛場景,即用戶在陌生路段不建圖,也能全程使用智駕。
目前似乎只有特斯拉做到了。
在國外用戶實測 FSD V13.2 版本的視頻中,用戶把車輛開進多樓層、甚至標識不清晰的停車場頂樓后,還故意繞了很多圈迷惑 FSD,但開啟智駕后,系統(tǒng)在未提前學習路線的情況下,沒有出現(xiàn)無目的繞圈、跟車行為,而是很快找到正確路線,并從出口處駛離停車場。
如果說國內(nèi)玩家「車位到車位」功能需要學習路線后才能開啟,就意味著它目前適用于固定、高頻率的出行路線,而特斯拉把這一先驗條件摘除后,用戶則可以通過從車位開啟智駕,去往任何「無圖」區(qū)域。
另一差異點在于,玩家們的對于「車位到車位」的具體解題思路還不一致:
一派以理想為代表,遵循「VPA+NOA+VPA」的技術(shù)路徑。
即在停車場路段,驅(qū)動系統(tǒng)行駛的是記憶泊車/代客泊車模式,而駛?cè)牍_道路后,則立刻轉(zhuǎn)變?yōu)橹邱{領(lǐng)航模式。從 SR 畫面可以直觀看出,當系統(tǒng)進入停車場景時,從泊車界面會絲滑切入智駕界面。
這一路徑,也成為了目前多數(shù)玩家的選擇。
另一派以特斯拉、小鵬為代表,用一套模式打通全場景。
即無論是在園區(qū)封閉路段、地下停車場區(qū)域還是在公開路段,SR 界面一直保持智駕 NOA 畫面,不會隨場景變化切換軟件系統(tǒng)。
小鵬自動駕駛產(chǎn)品高級總監(jiān)袁婷婷表示,這種方式的優(yōu)點在于,當行駛到停車場與公開道路的交匯點時,系統(tǒng)不會因切換軟件導致卡殼現(xiàn)象,相當于從汽車起步時,就切換到 NGP 系統(tǒng)上,保證體驗一致性。
行泊一體的邏輯,還使得 XNGP 大模型在封閉場景及停車場區(qū)域,可以更好應(yīng)對繞柱、避障、極窄通道會車、連續(xù)急彎等場景。并且,相比兩套模型,一套模型的更新、維護在成本、效率上似乎是更優(yōu)解。
總之,盡管目前特斯拉 FSD V13.2 內(nèi)測版本看似領(lǐng)先一步,但距離其入華還有一段時間。
在此期間,國內(nèi)玩家的技術(shù)飛輪正瘋狂轉(zhuǎn)動,不斷優(yōu)化「車位到車位」功能,更新到最終全量推送的版本上。
在真正同臺競技的時刻之前,勝負依然未定。
03、端到端進化到 2.0 時代
「車位到車位」,可以看作各玩家對于「端到端」方法論的具體演繹。
「端到端」上車,本就指向了 AI 系統(tǒng)擁有類人駕駛的能力,一張神經(jīng)大網(wǎng)囊括了從感知到規(guī)控所有模塊,從而在應(yīng)對極端場景時,不再被生硬的規(guī)則控制,而是像人類司機一樣觀察、思考、決策、執(zhí)行。
這反映到「車位到車位」的實際場景中,系統(tǒng)可以應(yīng)對各類極端情況,駕駛水平愈發(fā)出色,由此構(gòu)成了技術(shù)-應(yīng)用的完整閉環(huán)。
在數(shù)據(jù)閉環(huán)迭代過程中,「端到端」技術(shù)也演化到了 2.0 階段。
這時,投身于端到端浪潮的頭部玩家們,從路徑收斂走到了路徑分野的十字路口。
一邊從感知規(guī)控模塊劃分,「兩段式端到端」向「一段式端到端」奔涌。
前者將感知模塊視為一段,預(yù)測到?jīng)Q策模塊視為另一段;后者則是將感知與規(guī)控端到端模塊全部打通。
「兩段式端到端」典型代表為華為乾崑 ADS3.0,由 GOD+PDP 網(wǎng)絡(luò)組成,GOD 網(wǎng)絡(luò)負責感知、識別障礙物,PDP 網(wǎng)絡(luò)則根據(jù)感知信息迅速做出決策。
而「一段式端到端」主要玩家有 Momenta、商湯科技等,將感知端到端與規(guī)控端到端都集成到一個大模型中,使系統(tǒng)能夠更直接、高效地處理信息并作出反應(yīng)。
一段式端到端是兩段式端到端的進化形態(tài),由于其打通感知、規(guī)控端到端環(huán)節(jié),使得模型感知信息更準確,規(guī)控反應(yīng)可以更為順暢,靈活,智駕水平更強。
Momenta 已經(jīng)踐行了這一演進路徑,在 2023 年量產(chǎn)兩段式端到端后,在今年上半年又實現(xiàn)了一段式端到端落地。
據(jù)媒體報道,華為車 BU 也在攻入一段式端到端方案,這或?qū)⒊蔀?ADS 4.0 版本的重要能力。
另一邊從技術(shù)路線思考,「端到端+VLM」朝「VLA」路徑開始迭代。
理想以「快慢系統(tǒng)」理論為基礎(chǔ),先設(shè)計出一套「端到端+VLM(視覺語言大模型)」系統(tǒng)。
兩個模型分工協(xié)作,端到端模型基于快思考,負責處理常規(guī)的駕駛行為,VLM 模型通過慢思考,應(yīng)對高難度的極端場景。
而 VLA 模型是近期走上技術(shù)神壇的關(guān)鍵詞,由元戎啟行率先提出。
VLA 即視覺-語言-動作模型,顯然,從名稱中可以發(fā)現(xiàn),它是「端到端+VLM」系統(tǒng)的一整個融合體。
這種一體化方式,使系統(tǒng)接受到數(shù)據(jù)后,不再由「快慢」系統(tǒng)進行多次交互與調(diào)整,而是一次性生成最終駕駛指令,提高信息處理、決策的效率,并能夠應(yīng)對一些更具挑戰(zhàn)性的長尾場景,如幾十秒路況的長時序推理等。
最近理想發(fā)布的高級工程師招聘細則中,清晰提到的一條「負責研發(fā)和落實理想汽車下一代自動駕駛端到端 VLA 大模型算法」,再次證實了 VLA 模型將成為未來方案。
事實上,無論是「一段式端到端」還是「VLA」模型的新型進化,背后都是對 AI 資源的進一步消耗。
模型參數(shù)越大,對硬件算力、數(shù)據(jù)閉環(huán)的迭代能力要求越高。
據(jù)悉,部署 VLA 模型,對芯片算力等級直接來到了 NVIDA DRIVE Thor,算力高達 1000+TOPS。
資源戰(zhàn)打響后,智駕第一梯隊與其它玩家的分水嶺變得更大了。
在端到端 2.0 時代,性能體驗與成本都在朝不同方向無限延伸:
性能走向高處,「車位到車位」成為衡量智駕水平的核心維度;
成本走向低處,高階智駕正快速落地 20 萬元以內(nèi)的新車。
其它智駕玩家們在前后夾擊下,「性價比」的擔子更重了。
這也意味著,智駕「第一梯隊」走的越來越快,掌握了更多資源,一場馬太效應(yīng)正在行業(yè)默默蓄勢。
市場很現(xiàn)實,如果不想被規(guī)則淘汰,那就只能改寫規(guī)則。
來源:第一電動網(wǎng)
作者:汽車之心
本文地址:http://autopag.com/kol/256892
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。