作者 | 洪澤鑫編輯 | 德新
很多人肯定都看過上面這個對比視頻。
不少吃瓜群眾感慨,小米比特斯拉領(lǐng)先整整60年。
左邊的特斯拉機(jī)器人像20歲,右邊的小米機(jī)器人看起來像80歲。
但事實上,特斯拉的這個機(jī)器人是人扮的。
而在中國國慶假期的第一天,我們終于看到了特斯拉人形機(jī)器人Optimus的原型機(jī)。
這...我硬生生把到嘴邊的歡呼聲吞了回去。
看起來頂多比小米機(jī)器人年輕個兩歲,不能再多了!
這機(jī)器人老態(tài)龍鐘到上下臺都需要三四個大漢抬著。
一下子仿佛看到了老齡化社會。
除了機(jī)器人,這場長達(dá)三個小時的直播還講了些什么?
馬斯克一開始就預(yù)警了這次AI day有大量專業(yè)名詞,主要是給技術(shù)人才看的。
今天簡單總結(jié)點普通人能看懂的。
首先,特斯拉強(qiáng)調(diào)機(jī)器人Optimus從初代開發(fā)平臺到現(xiàn)在只過去了6個月,潛臺詞是:
做成這樣已經(jīng)很可以了。
特斯拉選擇做“人形”機(jī)器人的出發(fā)點是:人體是最靈活的架構(gòu)。
在理解人形機(jī)器人的優(yōu)勢之前,需要先弄懂“自由度”這個概念。
大學(xué)學(xué)過機(jī)械原理應(yīng)該不陌生,通俗來說,自由度(Degree of Freedom)是指機(jī)器人身上能夠運動的關(guān)節(jié)方向的數(shù)目,自由度越多,活動越靈活。
舉個例子,下圖的這類機(jī)械臂只有6個自由度,這意味著,在A點和B點被固定住的前提下,它無法從左邊直接變換為右邊狀態(tài)。
而換做7個自由度的機(jī)械臂,就跟人類手臂類似了,把肩膀A點和手指尖B點固定住,也能變換很多種狀態(tài)。
Optimus的全身自由度數(shù)量是28個,分布如下圖所示。
以下則是波士頓動力的機(jī)器人Atlas的自由度分布,基本是一致的。
而Optimus的手部自由度有11個,6個驅(qū)動器(Actuator),號稱可以提20磅的袋子(9.07公斤),既有足夠的抓取力,又能抓取又細(xì)又薄的東西。
此外,本次的原型機(jī)并沒有公布身高體重,但特斯拉此前曾說過高1.72米,重56.6千克。
造價方面,預(yù)估量產(chǎn)價格不超過2萬美元——前提是產(chǎn)量達(dá)數(shù)百萬臺。
相比人類,人形機(jī)器人確實可以“取其精華去其糟粕”,做到比人體更高效——人類就算坐著不動也在消耗能量。
但自由度越多,結(jié)構(gòu)就會越復(fù)雜,難度越大。
自由度的設(shè)計是要貼合落地場景的,否則很容易閉門造車——換句話說,精準(zhǔn)的場景定位是人形機(jī)器人商業(yè)化的基礎(chǔ)。
特斯拉的官方說法是:Optimus短期應(yīng)用于個人/家庭場景,中期有望進(jìn)入商業(yè)服務(wù)場景和非結(jié)構(gòu)化&輕量化工業(yè)場景,長期待交互技術(shù)進(jìn)一步突破后有望滿足情感、陪伴等需求...造福人類...替代人類從事危險、重復(fù)、無聊的工作。
問答環(huán)節(jié),馬斯克被問到Optimus有什么使命、未來會不會跟人對話,他反復(fù)在說:
“我也不知道Optimus最終會是什么樣子的...但肯定很有意思...肯定不會是終結(jié)者那樣...肯定不會無聊。”
就是沒想好到底能用在哪里唄?
也是,這老態(tài)龍鐘的機(jī)器人,是還不太用得上。
在人形機(jī)器人的研發(fā)上,特斯拉在四個輪子的汽車上抄了不少作業(yè)。
第一,上圖的橙色部位是Optimus的驅(qū)動器(Actuator),簡單理解就是讓機(jī)器人發(fā)出動作的動力機(jī)構(gòu),可以比作汽車的電機(jī);藍(lán)色部位是電氣系統(tǒng)(Electrical System),可以比作汽車的電子電氣架構(gòu)。
2.3 kWh、52V的電池包是在胸口的位置,保證電池高效和安全方面用的是電動汽車的技術(shù)。
第二,計算機(jī)跟電池包是放在一起的,計算單元跟的車載計算單元是一致的。
此外還有無線通訊模塊、語音模塊和安全保護(hù)模塊,充電管理、傳感器和冷卻系統(tǒng)高度集成。為了最大化地降低汽車碰撞帶來的損傷,車企一般會通過仿真來優(yōu)化和改進(jìn)車輛潰縮、保護(hù)電池,同樣的方法也被特斯拉用在防止機(jī)器人摔倒上——摔跤時優(yōu)先保障“大腦”以及軀干電池組的安全。
試著在腦海里把Optimus放倒,再看它的這些電池包位置、電氣架構(gòu),是不是有點眼熟?
這樣的架構(gòu)也并不新穎,之前日本的HRP-5p建筑機(jī)器人以及慕尼黑工業(yè)大學(xué)的LOLA機(jī)器人都是把電池包和集成電路背在身后。
很多人拿波士頓動力Atlas來比較,但Atlas更偏向腿足式機(jī)器人,采用液壓驅(qū)動控制,單臺造價差不多200萬美金。
你看小米的腿足式機(jī)器人CyberDog走得也挺溜的。
第三,Optimus的行走模塊算法也跟自動駕駛汽車的規(guī)控模塊類似,不是簡單制定規(guī)則,而是設(shè)定目標(biāo),通過獎勵函數(shù),讓Optimus自行適應(yīng)動態(tài)的環(huán)境變化。
第四,在Optimus執(zhí)行器的配合上,也像汽車一樣,考慮到了能量成本。因為電動車有前后兩套電驅(qū),當(dāng)車輛加速時,需要考慮前后電機(jī)如何配合才能達(dá)到效能最大化。Optimus在執(zhí)行各種動作時,也需要有多個執(zhí)行器配合,特斯拉會通過仿真優(yōu)化,來保證工作執(zhí)行時達(dá)到最低能耗。
第五,Optimus的視覺感知也可以看成是一輛裝上腳立起來的汽車,用的也是FSD的Occupancy Network,需要做的就是再收集更多數(shù)據(jù)。室內(nèi)GPS信號比較差,所以視覺導(dǎo)航定位也需要像汽車進(jìn)入地下停車場般精準(zhǔn)。
最后,在運動規(guī)劃上,特斯拉先是表示:很難。
擁有四肢的機(jī)器人要想動起來,比四個輪子的汽車確實復(fù)雜多了。
因為汽車的行動路徑只有橫線和縱向兩個方向,而人形機(jī)器人的運動除了前進(jìn)后退、左轉(zhuǎn)右轉(zhuǎn),還需要考慮平衡、彎腰、踩踏、下坡等等情況。
現(xiàn)在特斯拉的做法是通過捕捉現(xiàn)實生活里人類的動作,把這些動作簡化成軌跡,借助運動學(xué)來實現(xiàn)機(jī)器人的軌跡優(yōu)化。
綜上所述,造車的公司造機(jī)器人確實有很多優(yōu)勢,但也不完全相通。
很多自動駕駛公司一開始都是基于ROS做的自動駕駛系統(tǒng)——ROS是一個用于開發(fā)機(jī)器人應(yīng)用程序的、類似操作系統(tǒng)的機(jī)器人軟件平臺。
可以說自動駕駛源于機(jī)器人,很多自動駕駛做決策規(guī)劃的工程師都是從機(jī)器人賽道出來的,只是ROS無法滿足大數(shù)據(jù)量傳輸、實時及穩(wěn)定的需求,所以自動駕駛公司逐漸遷移或自研其他架構(gòu)。
目前,特斯拉FSD的用戶已經(jīng)從2021年的2000人增長到16萬人。
期間,F(xiàn)SD版本更新了35次,訓(xùn)練了75778個模型,共收集了有480萬個Clip(場景數(shù)據(jù)),現(xiàn)在已經(jīng)實現(xiàn)從一個停車場自動駕駛到另一個停車場。
馬斯克還說FSD早就可以在很多國家推出了,沒有推出是因為很多國家法規(guī)不讓。
特斯拉用下面這個圖概括了FSD的核心技術(shù)棧,并且分別介紹了各個模塊的最新技術(shù)進(jìn)展,技術(shù)門檻挺高,沒法一一介紹,只列我看到的幾個亮點:
感知方面,基于attention的transformer做前融合,去年特斯拉AI Day 之后,transformer就在業(yè)內(nèi)火了起來,國內(nèi)的毫末和輕舟也一直在提。
仿真方面,不用NeRF方案,從地圖上的線到網(wǎng),從網(wǎng)到面,就能生成基于真實數(shù)據(jù)構(gòu)建的虛擬城市。生成整個舊金山地區(qū)的仿真環(huán)境,只需要一個人兩周時間就能搞定。
自動標(biāo)注方面,特斯拉將訓(xùn)練場景的標(biāo)注速度提升了1000倍,在人工操作的情況下這些或許需要一兩周甚至幾個月時間。
要想得到更好的神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果,就離不開高效率的芯片。
Dojo超級計算機(jī)已經(jīng)給特斯拉在代碼、設(shè)計方面實現(xiàn)了30%的訓(xùn)練速度提升。
比如,Dojo運行“Stable Diffusion”模型生成火星上的Cybertruck,只需要幾分鐘。
比如,只使用一個由25個D1芯片組成的訓(xùn)練塊,就能實現(xiàn)6個GPU機(jī)箱的性能,且成本低于一個GPU機(jī)箱。
再比如,只需要4個Dojo超級計算機(jī)機(jī)柜的算力,就能實現(xiàn)72個GPU機(jī)柜的自動標(biāo)注性能。
特斯拉會在2023年第一季度布置第一批10個Dojo超級計算機(jī)機(jī)柜,即算力超過1.1EFLOPS的ExaPOD,將自動標(biāo)注能力提升2.5倍。
將來,特斯拉要在帕羅奧圖布置7個這樣的集群。
馬斯克還提到,Dojo超級計算機(jī)未來也有可能跟亞馬遜AWS一樣,作為一個基礎(chǔ)服務(wù)設(shè)施來賣錢。
因為Optimus機(jī)器人一年來的成績單交得過于老實,這個AI Day的開頭很讓人失望。
但整場AI Day確實很有“招聘會”的氛圍,是由不同模塊工程師的內(nèi)容無縫串講起來的,分享的內(nèi)容很硬核。而且員工群體十分具備多樣性,里頭還有好幾位讓人印象深刻的華人。
活動展現(xiàn)出來的這種自由和平等,確實是工程師所向往的企業(yè)文化。
至于對Optimus的評價,馬斯克自己說出了大家的聲音:
我們希望不僅僅有好的想法,還要有好的結(jié)果。
參考資料:
DARPA'S ATLAS Robot Needs A Brain
https://www.i-programmer.info/news/169-robotics/6095-darpas-atlas-robot-needs-a-brain.html
Development of a Humanoid Robot Prototype, HRP-5P, Capable of Heavy Labor
https://www.aist.go.jp/aist_e/list/latest_research/2018/20181116/en20181116.html
Making Atlas Dance, Run, and Jump
https://www.youtube.com/watch?v=yagQG_b_hfs
來源:第一電動網(wǎng)
作者:HiEV
本文地址:http://autopag.com/kol/186243
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。