雖然對(duì)端到端成為今年霸榜營(yíng)銷熱詞有強(qiáng)烈的預(yù)感,但還是沒有料到各大廠家會(huì)在宣傳上加那么大杠桿。
說(shuō)起來(lái),端到端絕對(duì)不是上下嘴皮子一翻就能實(shí)現(xiàn)的,而是需要滿足很多前置條件。
01
胖子不是一天吃成的,端到端也不是一天實(shí)現(xiàn)的。
要實(shí)現(xiàn)終極的一段式端到端,需要經(jīng)歷四大階段。
對(duì)這四個(gè)階段的闡述,根據(jù)自家算法的發(fā)展史,不同的玩家會(huì)有不同的觀點(diǎn)。
從地平線的自動(dòng)駕駛算法架構(gòu)迭代歷程來(lái)看:
第一階段,實(shí)現(xiàn)感知層神經(jīng)網(wǎng)絡(luò)化,決策規(guī)劃層基于規(guī)則+算法實(shí)現(xiàn)。
第二階段,實(shí)現(xiàn)決策規(guī)劃層神經(jīng)網(wǎng)絡(luò)化,將決策規(guī)劃的規(guī)則驅(qū)動(dòng)進(jìn)化為數(shù)據(jù)驅(qū)動(dòng)。
第三階段,以基于Transformer的BEV大模型替代神經(jīng)網(wǎng)絡(luò)化感知層中的多個(gè)小模型,實(shí)現(xiàn)感知的端到端。
同樣基于Transformer將神經(jīng)網(wǎng)絡(luò)化的決策規(guī)劃層進(jìn)化為端到端規(guī)劃,端到端感知和端到端規(guī)劃之間傳遞特征級(jí)信息,實(shí)現(xiàn)分段式端到端。
在這里有必要提一點(diǎn),神經(jīng)網(wǎng)絡(luò)化并不等同于端到端,它是端到端的必要條件而非充分條件。
第四階段,消除端到端感知和端到端決策規(guī)劃的界限,實(shí)現(xiàn)全程可導(dǎo),進(jìn)化為一段式端到端。
雖然各家的劃分方式有些微的不同,但萬(wàn)變不離其宗。
相較傳統(tǒng)的分模塊方案,端到端的核心改變?cè)谟跊Q策規(guī)劃層面。
——即原來(lái)基于人工編碼實(shí)現(xiàn)、規(guī)則驅(qū)動(dòng)的決策規(guī)劃轉(zhuǎn)向了基于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)實(shí)現(xiàn)、數(shù)據(jù)驅(qū)動(dòng)的決策規(guī)劃。
特斯拉能夠在2022年底一下子轉(zhuǎn)向端到端,就是因?yàn)樗氏葘?shí)現(xiàn)了決策規(guī)劃層的神經(jīng)網(wǎng)絡(luò)化,做足了轉(zhuǎn)型的預(yù)熱。
彼時(shí),國(guó)內(nèi)智駕頭部玩家依然對(duì)將神經(jīng)網(wǎng)絡(luò)全面用于安全要求極高的決策規(guī)則持懷疑態(tài)度。
雖然也在探索在規(guī)劃層使用深度學(xué)習(xí)算法,但轉(zhuǎn)型并不堅(jiān)決,依然以規(guī)則為主。
由規(guī)則編碼轉(zhuǎn)向神經(jīng)網(wǎng)絡(luò)是一個(gè)頗為浩大的工程,需要消耗一定的時(shí)間。
基于此,奇瑞自動(dòng)駕駛負(fù)責(zé)人谷俊麗才說(shuō)國(guó)內(nèi)廠商落后特斯拉1.5-2年。
看到這里,大家就不會(huì)再噴谷俊麗了吧?
02
國(guó)外的月亮不一定比國(guó)內(nèi)圓,但是外來(lái)的和尚有時(shí)候就是會(huì)念經(jīng)。
由于引領(lǐng)自動(dòng)駕駛技術(shù)路線向端到端范式轉(zhuǎn)變,特斯拉在自動(dòng)駕駛領(lǐng)域的聲望達(dá)到了頂峰。
特斯拉和端到端范式之所以被大家夸成了一朵花,主要是因?yàn)橐?guī)則驅(qū)動(dòng)的分模塊方案無(wú)法高效地收斂層出不窮的長(zhǎng)尾場(chǎng)景。
——在基于規(guī)則實(shí)現(xiàn)的系統(tǒng)中,要解決的場(chǎng)景越多,要編寫的代碼就越多,就越難以開發(fā)、測(cè)試和維護(hù)。
而且,自動(dòng)駕駛系統(tǒng)性能迭代的進(jìn)程是不斷覆蓋各種長(zhǎng)尾場(chǎng)景的過(guò)程,在規(guī)則驅(qū)動(dòng)的范式下,解決了新的長(zhǎng)尾,又有可能會(huì)激活老的長(zhǎng)尾。
系統(tǒng)進(jìn)三步,退兩步,還怎么邁向全無(wú)人駕駛的珠穆朗瑪呢?
端到端范式依靠數(shù)據(jù)驅(qū)動(dòng)解決了“吾生也有涯,而長(zhǎng)尾場(chǎng)景無(wú)涯”的問(wèn)題。
依靠深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的記憶能力解決了“按下葫蘆浮起瓢”的問(wèn)題。
無(wú)論是海量數(shù)據(jù)驅(qū)動(dòng)還是具備長(zhǎng)期記憶能力的深度學(xué)習(xí),背后都特別考驗(yàn)數(shù)據(jù)采集、處理、標(biāo)注、模型訓(xùn)練、模型驗(yàn)證評(píng)估、OTA部署這一條數(shù)據(jù)閉環(huán)。
這也意味著,只有那些早早布局?jǐn)?shù)據(jù)閉環(huán)建設(shè)的智駕廠商才能在當(dāng)下的端到端初期階段吃到最大紅利。
在這波端到端范式火起來(lái)之前,華為、特斯拉、小鵬、蔚來(lái)、Momenta這些頭部智駕廠商的感知層大都實(shí)現(xiàn)了端到端,即實(shí)現(xiàn)了動(dòng)態(tài)BEV網(wǎng)絡(luò)、靜態(tài)BEV網(wǎng)絡(luò)和占用網(wǎng)絡(luò)的三網(wǎng)合一。
所缺者,唯規(guī)劃層的神經(jīng)網(wǎng)絡(luò)化,實(shí)現(xiàn)端到端感知的過(guò)程離不開自動(dòng)化程度不斷提升的數(shù)據(jù)閉環(huán)。
所以,這些頭部智駕廠商的端到端宣傳還是比較靠譜的。
至于某些兩年前才開始布局自動(dòng)駕駛業(yè)務(wù)的新勢(shì)力車企,無(wú)論是智駕數(shù)據(jù)的積累還是數(shù)據(jù)閉環(huán)的建設(shè)都處于初期階段,其自動(dòng)駕駛第一陣營(yíng)的宣傳和端到端大模型的宣傳都頗為存疑。
03
或許是因?yàn)楦?jìng)爭(zhēng)太激烈的緣故,國(guó)內(nèi)車企在自動(dòng)駕駛領(lǐng)域的宣傳特別離譜,個(gè)個(gè)都要在年內(nèi)實(shí)現(xiàn)全國(guó)都能開,家家都是第一梯隊(duì)。
具體到端到端上面,盡管需要那么多的前提條件,各家還是不甘落后地紛紛“推出”了真假難辨的端到端方案。
不過(guò),在這些挑撥人們的神經(jīng)的宣傳面前,大家一定要擦亮眼,冷靜地意識(shí)到,絕大部分廠商的端到端方案尚處于初級(jí)階段,還需要經(jīng)過(guò)較長(zhǎng)一段時(shí)間的雕琢。
小鵬汽車8月底小鵬Mona 03上市發(fā)布會(huì)上提出了端到端四部曲:
第一步,實(shí)現(xiàn)三網(wǎng)合一,端到端量產(chǎn);
第二步,車端大模型參數(shù)量翻倍;
第三步,云端大模型參數(shù)量提升5倍;
第四步,解決99%極端問(wèn)題。
第一步里的三網(wǎng)合一不同于端到端感知中的動(dòng)態(tài)BEV網(wǎng)絡(luò)、靜態(tài)BEV網(wǎng)絡(luò)、占用網(wǎng)絡(luò)的三網(wǎng)合一。
是特指將分段式端到端方案中的大語(yǔ)言模型XBrain、端到端感知大模型XNet、端到端規(guī)劃大模型XPlanner合并成一張大網(wǎng),實(shí)現(xiàn)一段式端到端方案。
從時(shí)間線上來(lái)看,小鵬5月20號(hào)AI Day上宣布量產(chǎn)上車的端到端方案并非OneModel端到端。
第二步里的車端大模型參數(shù)量翻倍,是指將一段式端到端方案中的許多小模型合并成少數(shù)幾個(gè)大模型,通過(guò)計(jì)算資源的集約,在硬件算力、存儲(chǔ)資源都不變的情況下提升大模型的參數(shù)規(guī)模。
換句話說(shuō),從24年Q3到24年底之間,小鵬汽車的一段式端到端大模型中依然存在不少小模型和中模型。
小模型的說(shuō)法來(lái)自小鵬自動(dòng)駕駛負(fù)責(zé)人李力耘,他的表態(tài)一方面揭露了半年前的小鵬端到端大模型“即非端到端,是名端到端”的實(shí)際。
一方面也表明,很多車企只不過(guò)是在車端把各種小模型堆疊在了一起,揉成了一個(gè)四不像的“端到端”。
在2024年的電動(dòng)汽車百人會(huì)上,長(zhǎng)城汽車旗下自動(dòng)駕駛算法公司毫末智行CEO顧維灝發(fā)表了一個(gè)觀點(diǎn):國(guó)內(nèi)車企向端到端范式的轉(zhuǎn)變需要經(jīng)歷幾年的時(shí)間。
顧維灝說(shuō)的端范式應(yīng)該指的是技術(shù)成熟階段,現(xiàn)在端到端還處在初級(jí)階段,乾坤未定,你我皆黑馬。
這也是傳統(tǒng)大廠難得的智駕窗口期,快人一小步,就能領(lǐng)先一大截。
是新勢(shì)力更快,還是老法師更快,讓子彈飛一會(huì),我們一定會(huì)有答案。