1. 首頁
  2. 資訊
  3. 企業(yè)
  4. 特斯拉AI DAY:一場大型“招聘會”

特斯拉AI DAY:一場大型“招聘會”

汽車公社

看完特斯拉的AI DAY發(fā)布會,忽然反應(yīng)過來,這這這,不是個大型招聘會么!

之前業(yè)內(nèi)猜測的AI神經(jīng)網(wǎng)絡(luò)、FSD、自研超算Dojo,以及突如其來的人形機器人……果然放了不少“大招”。這些用來烘托下半場馬斯克支支吾吾、有點不好意思的推介,“歡迎大家來特斯拉工作”的“司馬昭之心”很明顯?。?/p>


要知道,2021年才半年,特斯拉就失去了4位直接向馬斯克匯報的資深高管。最近的一位,是負(fù)責(zé)卡車業(yè)務(wù)的CEO杰羅姆·吉倫(Jerome Guillen)。而且,吉倫是目前馬斯克最重要的副手,也是特斯拉最頂級的四大高管之一,3月才被任命。所以,特斯拉有多缺人,我們可以理解了。

不過,讓記者感到好奇的是,在最后的回答提問環(huán)節(jié),馬斯克的眼神是有點飄忽的,有點心神不寧的樣子??磥恚幻绹鴩夜方煌ò踩芾砭郑∟HTSA)調(diào)查還是有很大影響。

就在前幾天,業(yè)內(nèi)還對特斯拉的“純視覺”路線熱烈討論,再加上被調(diào)查,特斯拉的AI DAY應(yīng)時而至,卻也有難以言說的尷尬。而且,有意思的是,因為技術(shù)故障,發(fā)布會整整推遲了40分鐘,馬斯克一上來就不得不道歉。


當(dāng)然,AI DAY算是特斯拉今年最重大的事件,也是繼2019年4月23日的Autonomous Day、2020年9月23日的Battery Day之后,第三個以“Day”命名的技術(shù)發(fā)布會。說起來,技術(shù)含量也是最高的。

我們來看看這次的AI DAY發(fā)布了哪些新“黑科技”。

自動駕駛和“純視覺”

發(fā)布會一開始,就是一段FSD(Fully Self Driving,全自動輔助駕駛系統(tǒng))的VCR短視頻,展示了V9.0最新的開放道路自動駕駛情形。不過,我們可以看到,全程駕駛員的手都是托著方向盤,保持著隨時觸碰的狀態(tài)。

這也說明,特斯拉在發(fā)布FSD BETA V9.0之后,不敢玩得太嗨了。就像記者在《特斯拉純視覺路線,能不能走通?|C次元》對其“純視覺”路線做的質(zhì)疑,這種夸大傳播的惡果就是,最后引起全面的質(zhì)疑和被調(diào)查。而在8月16日,特斯拉又推送了FSD Beta V9.2版本。


回過來看發(fā)布會,AI總監(jiān)恩喬·卡帕西Andrej Karpathy博士首先上臺,討論了特斯拉AI 的多攝像頭的自動駕駛系統(tǒng)。它通過八個攝像頭的數(shù)據(jù)輸入(1280×960 12-Bit HDR 36Hz)進(jìn)單個神經(jīng)網(wǎng)絡(luò)中,整合成 3D 環(huán)境的感知,這被稱為Vector Space(矢量空間)。

Karpath指出,AI可以被視為一種生物,可以從頭開始構(gòu)建,包括其合成視覺皮層。當(dāng)特斯拉在其汽車中設(shè)計視覺皮層時,將其建模為“眼睛如何感知生物視覺”。他還回溯了特斯拉的視覺處理策略多年來是如何演變的,以及特斯拉具備多任務(wù)學(xué)習(xí)能力的“HydraNets”(神盾局的“九頭蛇網(wǎng)絡(luò)”都出來了?)。

特斯拉的自動駕駛算法是從識別單張圖片的普通視覺算法開始,雖然單個攝像頭的單獨檢測效果很棒,但這顯然不夠?,F(xiàn)在的純視覺算法“HydraNets”基于不同攝像頭的視覺內(nèi)容進(jìn)行識別,而且訓(xùn)練和推斷是端到端的。


在展示了一段關(guān)于特斯拉過去如何處理其圖像數(shù)據(jù),以及共享的FSD流行視頻后,Karpathy指出,事實證明過去FSD的系統(tǒng)不夠完善,這是特斯拉在推出Smart Summon時學(xué)到的東西。

Karpathy闡述了特斯拉如何從頭開始重新設(shè)計他們的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),并利用多攝像頭路線,“每輛車上的八個攝像頭都被輸入到一個3維‘矢量空間’中?!逼渲邪ㄏ鄼C的校準(zhǔn)、緩存、隊列和優(yōu)化以簡化所有任務(wù)。這也是迄今為止最簡化的迭代方式。

Karpathy還不忘Diss了一下Super Cruise和Waymo,“今天,特斯拉的FSD戰(zhàn)略更具凝聚力,車輛可以在行駛時有效地實時繪制地圖,”他說與這些競爭對手采用的預(yù)先繪制地圖的策略相比,是一個巨大的差異。


但是,就像記者在文章中批判的,沒有激光雷達(dá)的加入,就像瘸了一條腿的人,特斯拉在“純視覺”路線上是走不遠(yuǎn)的。雖然在馬斯克看來,特斯拉的深度學(xué)習(xí)系統(tǒng)已經(jīng)比毫米波雷達(dá)強100倍,現(xiàn)在的毫米波雷達(dá)已經(jīng)開始拖后腿。

就像一位業(yè)內(nèi)專家所說,“不用毫米波雷達(dá),那也別用超聲波雷達(dá)????。?!純視覺,暴雨怎么辦?大霧怎么辦?”我們知道,特斯拉依靠的最先進(jìn)的機器學(xué)習(xí)只是識別模式,這意味著它會在新情況下掙扎。一掙扎,就會產(chǎn)生誤判。


與人類司機不同的是,如果系統(tǒng)沒有遇到場景,它就無法推理該做什么。“任何AI系統(tǒng)都不了解實際發(fā)生的事情,”這是研究自動駕駛汽車計算機視覺的康奈爾大學(xué)副教授克里安·溫伯格(Kilian Weinberger)下的斷言。

混合規(guī)劃系統(tǒng)

我們再來看看,自動駕駛軟件總監(jiān)Ashok Elluswamy介紹的混合規(guī)劃系統(tǒng)。他通過展示 Autopilot如何執(zhí)行車道變換來證明這套解決方案的先進(jìn)。

具體來說,當(dāng)特斯拉的車與其他汽車并排行駛時,Autopilot 不僅要考慮它們的駕駛方式,還必須考慮其他汽車的運行方式。他展示了一段特斯拉的車在道路上行駛并與多輛車打交道的視頻,來證明這一點。

而這時候,Karpathy回來討論數(shù)據(jù)標(biāo)注的問題。他指出,外包給第三方公司的手動標(biāo)簽并不是最佳選擇。因此,特斯拉選擇建立自己的標(biāo)簽團隊。Karpathy指出,最初特斯拉使用的是 2D 圖像標(biāo)記。最終,特斯拉過渡到4D標(biāo)簽,也就是可以在“矢量空間”中進(jìn)行標(biāo)簽。


特斯拉全自動駕駛最終架構(gòu)

但這還不夠,因此特斯拉開發(fā)了自動標(biāo)簽。Ashok表示,因為有太多的標(biāo)簽需要完成,手動完成是不可能的。他展示了“重建”的過程:道路和道路上的其他物品如何從一輛正在行駛的汽車中“重建”出來。

這讓特斯拉能夠有效、更快地標(biāo)記數(shù)據(jù),同時,車輛即使在存在遮擋的情況下也能安全準(zhǔn)確地導(dǎo)航。Ashok表示,這些策略最終幫助特斯拉從其FSD和Autopilot套件中淘汰了雷達(dá),并采用了純視覺模型。雷達(dá)+攝像頭系統(tǒng)與純視覺之間的比較,顯示了公司當(dāng)前的戰(zhàn)略有多精細(xì)。

這位高管還談到了“仿真”是如何幫助特斯拉開發(fā)其自動駕駛系統(tǒng)的。例如,它幫助公司識別行人、自行車和車輛檢測和運動學(xué)。他指出,當(dāng)數(shù)據(jù)難以獲取、難以標(biāo)記或處于閉環(huán)狀態(tài)時,“仿真”會有所幫助。這些,都基于3.71 億張模擬圖像和4.8億個長方體“標(biāo)簽”。


Ashok說,“仿真”已經(jīng)對特斯拉產(chǎn)生很大幫助??吹竭@里,我只能說,對于越走越偏的特斯拉來說,真的是“謎之自信”。

“算力再高,也怕菜刀”

DOJO(日文“道場”的英文)應(yīng)該算是這次特斯拉AI DAY的最大看點。

2020年8月,馬斯克表示,該公司正在研發(fā)一款名為“Dojo”的神經(jīng)網(wǎng)絡(luò)訓(xùn)練超級計算機,目的是用來訓(xùn)練包括Autopilot在內(nèi)的整個自動駕駛系統(tǒng)。當(dāng)時,馬斯克發(fā)推稱,估計還需要一年時間。不僅僅是芯片本身的研發(fā)難度,還有能效和冷卻問題。

當(dāng)時,馬斯克首次披露了特斯拉Dojo超算計劃的目標(biāo)——FP32精度的1EFLOPS(10的18次方)的算力,也就是1024 PFLOPS,這將是已投入使用的超級計算機中排在第一的日本富岳的2.5倍。

我們可以看看當(dāng)時的宣傳圖,芯片用了非常規(guī)的封裝形式,第一層和第五層銅質(zhì)結(jié)構(gòu)是水冷散熱模塊;紅色圈的第二層結(jié)構(gòu)由5*5陣列共25個芯片組成;第三層為25個陣列核心的BGA封裝基板;第四層和第七層是物理承載結(jié)構(gòu)附帶一些導(dǎo)熱屬性;藍(lán)色圈的第六層是功率模塊。而Dojo系統(tǒng)的算力,相當(dāng)于近3萬輛特斯拉HARDWARE 3.0車型算力之和。


時間到了今年6月,在CVPR 2021工坊活動上,卡帕西Andrej Karpathy還介紹了這款超級計算機的最新情況:擁有10 petabytes(10的15次方)NVME存儲,運行速度為每秒1.6 TBps(10的12次方),總算力為1.8 EFLOPS(10的18次方),一度被認(rèn)為超越全球排名第一的超算富岳。

而今天,特斯拉終于揭開了 Dojo 計算機芯片的神秘面紗。由于采用了創(chuàng)新的架構(gòu),將算力分布在復(fù)雜的網(wǎng)絡(luò)構(gòu)造中,實現(xiàn)了極高的算力、高帶寬、低延遲的網(wǎng)絡(luò)吞吐量。

具體來說,Dojo 的D1芯片(屬于ASIC芯片,用于AI訓(xùn)練),采用7納米制程,單片BF16算力達(dá)到362 TFLOPs。

此外,D1芯片還具備團隊作戰(zhàn)能力,可以無縫融合,變成超大規(guī)模計算陣列。比如,這次發(fā)布的集合25塊D1芯片的首個訓(xùn)練模塊。算下來,超過50萬個訓(xùn)練節(jié)點。每個模塊算力為9 PFLOPS(10的15次方),帶寬為36TB/s。


特斯拉官方還透露:這不是終點,下一代Dojo還會有10倍性能的提升。

當(dāng)然,最有意思的信息是,特斯拉發(fā)布了下一階段的集成120個訓(xùn)練模塊、包含3000個D1芯片、超過1百萬個訓(xùn)練節(jié)點、算力達(dá)到1.1EFLOPS的ExaPOD。不過,“我們很快就會組裝我們的第一個機柜,”曾在AMD工作過的Venkataramanan說。嗯,這個ExaPOD機柜離落地還有距離啊。

當(dāng)然,如果說Dojo是自動駕駛的“大腦”,那么HARDWARE 4.0就是“神經(jīng)末梢”。不過,整場發(fā)布會,都沒提HARDWARE4.0。

說起來,特斯拉是“拳打英偉達(dá)GPU,腳踢谷歌TPU?!钡牵覀円f一句,“算力再高,也怕菜刀”的事還是會出現(xiàn)的。就像記者在《過度宣傳“自動駕駛“的罪與罰》里面講的,千萬不要迷信科技!

準(zhǔn)備打敗波士頓動力?

最后說說,發(fā)布會上,在一段人類演員模擬機器人的“尬舞”(這次不是馬斯克自己跳了)之后,埃隆·馬斯克上前表示,可能會在明年推出人形機器人Tesla Bot的原型。


這款機器人高1.72米,重56.6千克,機器人的臉實際上是一個顯示信息的屏幕。此外,機器人的雙手動作能力接近人類水平,四肢使用40個機電推桿進(jìn)行操作,兩只腳有力反饋感應(yīng),以實現(xiàn)平衡和敏捷的動作。

據(jù)悉,它能夠完成的一些任務(wù),包括跑雜貨店、撿拾家庭物品和其他日常指令。而這款機器人帶給人的驚艷感,有微信群里的媒體老師講到,讓人想到威爾·史密斯多年前的名片《機械公敵》里面的SONNY。它的外形也比本田現(xiàn)代的機器人更接近人類。

不過,機器人這個“大招”在汽車公社&C次元看來,花里胡哨的意味更濃厚點。畢竟,就像談到機器人必談的波士頓動力公司,也是命運多舛,被賣來賣去的。所以,機器人“尬舞”更多像是增加招聘幾率的“光環(huán)效應(yīng)”。


整場AI DAY,特斯拉講的內(nèi)容,其實并沒有太出乎意外,是向著“更高、更快、更強”的方向前進(jìn),不過,就像《機械公敵》最后站在沙堆上的SONNY一樣,特斯拉一些原生性的BUG,讓它會不斷遭遇到被調(diào)查這樣的困境,馬斯克需要好好反思一下這種極致的發(fā)展思路。


來源:汽車公社

本文地址:http://autopag.com/news/qiye/154351

返回第一電動網(wǎng)首頁 >

收藏
62
  • 分享到:
發(fā)表評論
新聞推薦
熱文榜
日排行
周排行
第一電動網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價信息
已經(jīng)成功提交我們稍后會聯(lián)系您進(jìn)行報價!

第一電動網(wǎng)
Hello world!
-->