于騫:城市NOA是輔助駕駛的天花板,也是無(wú)人駕駛的入門(mén)檻 消息

時(shí)間: 2023-06-28 20:26:39 來(lái)源: 汽車(chē)商業(yè)評論
撰文 / 周 洲
編輯 / 張 南
設計 / 師 超

“現在行業(yè)上對自動(dòng)駕駛尤其是無(wú)人駕駛非常悲觀(guān),但熟悉輕舟的朋友們都知道,‘將無(wú)人駕駛帶進(jìn)現實(shí)’ 是我們輕舟的愿景,也是我們奮斗的方向。今年藍皮書(shū)論壇的主題是‘不負’,那么我們也希望不辜負當下最好也是最壞的時(shí)代,最終將實(shí)現無(wú)人駕駛帶入到千家萬(wàn)戶(hù)?!?月16日,輕舟智航聯(lián)合創(chuàng )始人、CEO于騫在第十五屆中國汽車(chē)藍皮書(shū)論壇上發(fā)表了主題為“不負韶華,將無(wú)人駕駛帶進(jìn)現實(shí)”的演講。

于騫指出,無(wú)人駕駛的目標一定是前途光明的,但是道阻且長(cháng)、行則將至。


(資料圖)

他從三個(gè)方面進(jìn)行了闡述:算法、數據和量產(chǎn)交付。

于騫在演講中提出,在城市NOA大范圍普及之后,完全的無(wú)人駕駛才會(huì )出現?!暗紫?,需要當城市NOA最終得以達到一定的滲透率之后,無(wú)人駕駛的大幕才會(huì )拉開(kāi),城市NOA是輔助駕駛的天花板,也是無(wú)人駕駛的入門(mén)門(mén)檻。這里需要大量數據的積累?!?/p>

輕舟智航認為,城市NOA需要大量數據的積累才能最終將完全的無(wú)人駕駛帶到現實(shí)中來(lái)。良好的感知、規控的能力都離不開(kāi)數據方面的積累和使用能力。

在量產(chǎn)交付中,基于自身經(jīng)驗,于騫總結了三大挑戰:

第一,極致體驗和成本的挑戰。目前智能駕駛的體驗尚未達到消費者愿意為其付費的水平,只有通過(guò)將體驗提升到極致水平,才能形成正向循環(huán)。而要實(shí)現正向循環(huán),體驗必須達到一定效果,并且在成本方面,需要避免過(guò)度堆砌材料以實(shí)現更好的客戶(hù)價(jià)值。

第二,一次性交付和持續OTA的挑戰。因為智駕的方案不是簡(jiǎn)單一手交錢(qián)一手交貨,更需要OTA不斷升級,使得它越用越好,常用常新。輕舟可以為主機廠(chǎng)客戶(hù)提供一整套的工具鏈產(chǎn)品,大幅度降低開(kāi)發(fā)的成本。

第三,全棧自研和自主可控的挑戰。相對而言,如果主機廠(chǎng)采用“全??煽亍钡哪J?,性?xún)r(jià)比將更高,供應商的分工也可以更加靈活。然而,管理供應商需要投入成本,并且在與多個(gè)供應商合作時(shí)需要解決上下游的沖突問(wèn)題。

輕舟智航認為,在確保全??煽氐幕A上,讓專(zhuān)業(yè)的人做專(zhuān)業(yè)的事,一方面專(zhuān)業(yè)的供應商可以幫助主機廠(chǎng)更快地完善產(chǎn)品并交付,另一方面還可以提供技術(shù)服務(wù),幫助主機廠(chǎng)更快地建立自主研發(fā)的能力。

輕舟智航在成立之初,就應用類(lèi)似ChatGPT大模型的方法,采用BEV top-down的模型,實(shí)現非常復雜的感知能力,通過(guò)在一個(gè)車(chē)載模型上跑數十個(gè)不同的任務(wù)來(lái)實(shí)現效率的提升。

輕舟智航也是比較早的運用前、中、后融合的技術(shù),包括將時(shí)序融合用在車(chē)規級量產(chǎn)芯片的公司。其擁有非常靈活的框架,可以同時(shí)支持不同傳感器的信息,適配不同車(chē)型的傳感器要求,使其在不同的車(chē)型配置上能夠采用同樣的模型來(lái)實(shí)現完全視覺(jué)感知能力,例如在城市道路,過(guò)高架、城區包括擁擠路段、快速路段還有隧道等多任務(wù),還包括一般障礙物和語(yǔ)義的信息等。

在只基于SD MAP的情況下,輕舟智航通過(guò)Transformer架構的感知地圖的QmapNet來(lái)實(shí)現道路幾何的感知和SD MAP融合,具備通過(guò)復雜路口以及精確的拓撲的建圖能力,從而將其感知能力和標精地圖實(shí)時(shí)匹配起來(lái),達到在城市內部實(shí)現比較復雜的駕駛能力。

此外,輕舟智航最早在行業(yè)中最早推出時(shí)空聯(lián)合規劃的方法,并實(shí)現在實(shí)車(chē)車(chē)規量產(chǎn)芯片上跑起來(lái)。

良好的感知、規控的能力都離不開(kāi)在數據方面的積累和使用能力。輕舟智航是在行業(yè)里很早就將基于純視覺(jué)的NeRF的建圖方式和三維重建的真值標注系統結合在一起,實(shí)現大規模的非監督形式標注,來(lái)提高整體標注效率的公司。

無(wú)人駕駛的落地是一個(gè)漸進(jìn)的過(guò)程,還需要政策法規、保險、運維等各方配套。

于騫在現場(chǎng)倡議如下:一是在安全使用數據、共享數據方面,需要各行業(yè)協(xié)會(huì )、政府、上下游企業(yè)群策群力,共同制定并推動(dòng)相應法律法規的出臺和落地,規范數據的使用;二是建立數據共享和應用聯(lián)盟,在保障數據安全的前提下,構建汽車(chē)數據共享機制及平臺,實(shí)現數據的共享和高效流通,提高數據利用和閉環(huán)水平。

以下是于騫演講實(shí)錄。

無(wú)人駕駛到底是不是忽悠?最近這段時(shí)間大家對整個(gè)無(wú)人駕駛行業(yè)進(jìn)展都非常悲觀(guān),我們與業(yè)內人員也討論過(guò)這件事,那么,我今天為什么還要講主題叫“將無(wú)人駕駛帶進(jìn)現實(shí)”?

將無(wú)人駕駛帶進(jìn)現實(shí)就是輕舟智航奮斗的方向,地平線(xiàn)的余凱總也跟我講過(guò)很多次,別講無(wú)人駕駛帶進(jìn)現實(shí)了,無(wú)人駕駛到底行不行???我們認為,將無(wú)人駕駛帶進(jìn)現實(shí)的這個(gè)事兒要干二十年,在二十年里無(wú)人駕駛是可以實(shí)現的。

今天藍皮書(shū)主題是“不負”,我也想表達一下“不負”,是不負我們的初心,我們認為這件事兒是能夠實(shí)現的。當然實(shí)現無(wú)人駕駛的道路是非常曲折的,有很多不同的路線(xiàn),其中有一條路線(xiàn)大家都非常清楚,就是Waymo的路線(xiàn)。

Waymo從2009年開(kāi)始在X實(shí)驗室就開(kāi)始做無(wú)人駕駛的項目,即便到今天也沒(méi)有完全將無(wú)人駕駛大范圍的落地。它其實(shí)走了一條非常痛苦的一條路,非常難的一條路,當然也取得好的進(jìn)展。最近大家可以看到完全無(wú)人化的車(chē)隊已經(jīng)成規模的運營(yíng),這是很挑戰的路。

另外一條路是特斯拉,特斯拉走了非常巧妙的路。它通過(guò)以智能電動(dòng)車(chē)的方式在不斷地推進(jìn),特斯拉走的路非常符合用戶(hù)價(jià)值。雖然它們現在講的都是輔助駕駛比較多,但它們給自己的最終目標還是要實(shí)現完全的無(wú)人駕駛??梢钥吹剿鼘SD的命名Full Self-Driving,包括它最終給大家描繪的圖景也是無(wú)人駕駛的方式。所以我認為這兩條路都可以通過(guò)不同的努力路徑來(lái)實(shí)現最終的無(wú)人駕駛。

從整個(gè)無(wú)人駕駛的發(fā)展來(lái)看,我覺(jué)得前途是光明的,只不過(guò)這個(gè)道路很長(cháng),行之將至。在這條道路上我覺(jué)得最核心的還是要始終圍繞用戶(hù)價(jià)值,不管是供應商來(lái)講還是車(chē)廠(chǎng),大家都希望將無(wú)人駕駛帶到現實(shí)中來(lái),因為無(wú)人駕駛很大程度上能夠讓我們整個(gè)出行和交通更加安全,更加舒適,更加便捷,這都是我們希望無(wú)人駕駛能夠帶來(lái)的,但這條路會(huì )非常長(cháng)。

從早期做ADAS產(chǎn)品開(kāi)始,就是一步一步這么走過(guò)來(lái)的,我覺(jué)得這條路是非?,F實(shí)的路。包括特斯拉也在這條路上一直在狂奔,從最早的基礎ADAS功能,到L2+的功能,再到現在做到的高速NOA和城市NOA,最終將無(wú)人駕駛帶進(jìn)現實(shí)的目標。最早特斯拉產(chǎn)品的定義名字叫Autosteer就是基礎的L2的功能,它的Autopilot高速NOA到FSD進(jìn)入到城市NOA的階段,在這條路上來(lái)講,最終是有機會(huì )走到完全無(wú)人駕駛的。

什么時(shí)間完全無(wú)人駕駛才會(huì )出現呢?很大程度上,我覺(jué)得應該在城市NOA大范圍普及之后,完全的無(wú)人駕駛才會(huì )出現。如果現在公開(kāi)道路上的車(chē)有十分之一或者是五分之一的車(chē)能夠在公開(kāi)道路上使用城市NOA的功能,能夠打開(kāi)的話(huà),我覺(jué)得這個(gè)離我們最終將無(wú)人駕駛的普及就不遠了。

我們可以參考ChatGPT的發(fā)展,它基本上把地球上有價(jià)值的語(yǔ)言文字信號都利用起來(lái)以后,就可以打開(kāi)從量變到質(zhì)變的過(guò)程。類(lèi)比自動(dòng)駕駛的行業(yè),當我們在整個(gè)地球上所有有價(jià)值的街景的數據都能為我們所利用的時(shí)候,我們模型能力也能把他們用好的情況下,這時(shí)候我覺(jué)得完全的無(wú)人駕駛就會(huì )到來(lái)。

但我覺(jué)得像高速NOA和城市NOA這樣的階段是必不可少的,一定會(huì )度過(guò)的,怎么去驗證完全的無(wú)人駕駛能夠到來(lái)?它一定是通過(guò)大量的統計數據。比如說(shuō)機器駕駛的安全程度比人安全十倍,這個(gè)時(shí)間點(diǎn)是不是就可以真正的完全去實(shí)現了?但這個(gè)一定要通過(guò)更加廣泛的驗證才能得到。也有其他的觀(guān)點(diǎn)提到可能不需要十倍,可能五倍搞定了,剩下的那兩倍靠保險或者其他的方式也能夠稿定,但是需要通過(guò)大范圍的驗證來(lái)實(shí)現完全的商業(yè)可行,所以我覺(jué)得現在我們所處的這條道路是可以走向完全的無(wú)人駕駛,只不過(guò)這個(gè)道路會(huì )比較長(cháng)。

我們提過(guò),在通向無(wú)人駕駛的道路上,有一個(gè)非常重要的節點(diǎn)就是城市NOA,它是輔助駕駛的天花板也是無(wú)人駕駛的入門(mén)門(mén)檻。這里需要大量數據的積累。

從自動(dòng)駕駛的分水嶺來(lái)講,早期的ADAS方案是沒(méi)有辦法進(jìn)化到完全的自動(dòng)駕駛的。因為基本都是采用一手交錢(qián)一手交貨這樣的交付方式,沒(méi)有辦法觸及到數據。

大家知道自動(dòng)駕駛三個(gè)主要要素:算法、算力和數據,這個(gè)數據是非常關(guān)鍵的,需要不斷OTA升級有數據的觸及才可以最終實(shí)現。所以,我們認為城市NOA需要大量數據的積累才能最終將完全的無(wú)人駕駛帶到我們的現實(shí)中來(lái)。

當然做到很好的城市NOA體驗,其實(shí)挑戰很大。我們現在看到的城市NOA的產(chǎn)品價(jià)值還沒(méi)有完全體現,大部分做的還是非?;A的功能,我也非常贊同目前的高速NOA還沒(méi)有做好,很多地方的用戶(hù)體驗并不好,更別提城市NOA了,很多城市的NOA體驗還是屬于戰戰兢兢的狀態(tài)。

當然我也看到一些產(chǎn)品的體驗在逐漸地變好,有一些泊車(chē)的場(chǎng)景已經(jīng)能做到非常好的體驗了。有一些泊車(chē)的測試工程師跟我反饋說(shuō),測試完泊車(chē)的體驗以后,他自己的泊車(chē)能力都下降了,發(fā)現自己都不想泊了。從高速NOA到城市NOA的過(guò)程中一定會(huì )有這樣的過(guò)程,使得大家真正愿意為智能駕駛的體驗買(mǎi)單,我覺(jué)得這才是我們最終將城市NOA帶到現實(shí),將無(wú)人駕駛帶到現實(shí)的必經(jīng)之路,要圍繞著(zhù)用戶(hù)價(jià)值去打造。

在準備材料之前,我們同事問(wèn),到底要不要講技術(shù)內容?我說(shuō)一定要講技術(shù)內容,因為自動(dòng)駕駛的背后需要大量的技術(shù)創(chuàng )新,我們不想跟行業(yè)講我們只是拿了哪些認證,我們更希望在技術(shù)創(chuàng )新上給大家多分享,在現階段到底怎樣才能真正的把這些非常有挑戰的任務(wù)完成好。我盡量會(huì )把技術(shù)背后的用戶(hù)價(jià)值和客戶(hù)價(jià)值講清楚。

大家看到最近的ChatGPT的發(fā)展有兩方面的層次:一方面很重要的是多模態(tài)、多任務(wù)的學(xué)習,這個(gè)在我們自動(dòng)駕駛是非常關(guān)鍵的一步。因為車(chē)載的算力是非常有限的,如果我們把這么復雜的自動(dòng)駕駛的功能,感知的能力切分成很多非常小的模塊的話(huà),我們是沒(méi)有辦法在這么有限的資源下實(shí)現這樣的能力的。

輕舟智航在成立之初,因為人很少,無(wú)法把團隊切分成很多小模塊進(jìn)行開(kāi)發(fā),所以我們很早就采用這種大模型的方法,采用BEV top-down的模型去實(shí)現非常復雜的感知能力。我們可以通過(guò)在一個(gè)車(chē)載模型上跑數十個(gè)不同的任務(wù)來(lái)實(shí)現效率的提升,當然也非常感謝地平線(xiàn)的支持,我們很早就在地平線(xiàn)的征程5芯片上實(shí)現了BEV,包括時(shí)序的BEV模型部署,達到了量產(chǎn)的狀態(tài)。

大家經(jīng)常講的融合是前融合用的比較多,我們在行業(yè)內比較早的運用了前、中、后融合的技術(shù),包括將時(shí)序融合用在車(chē)規級量產(chǎn)芯片的公司。我們還有非常靈活的框架,可以同時(shí)支持不同傳感器的信息,包括在底層的,像視覺(jué)傳感器、毫米波、激光雷達,這樣可以更加方便地適配不同車(chē)型的傳感器要求,使得我們在不同的車(chē)型配置上能夠采用同樣的模型來(lái)實(shí)現這樣的能力。這是完全視覺(jué)感知能力,例如在城市道路,過(guò)高架、城區,包括擁擠路段、快速路段還有隧道等多任務(wù),這里我們只列了一部分,還包括一般障礙物和語(yǔ)義的信息。

我們在越來(lái)越復雜的感知能力上的體現,確實(shí)需要多種傳感器的融合,同時(shí)需要多任務(wù)的網(wǎng)絡(luò )來(lái)進(jìn)行。

另外,關(guān)于大家提到的行泊一體,我這里舉的例子并不是我們完全要做泊車(chē)的任務(wù)。為什么很多泊車(chē)體驗之前做得不好?一方面是算力有限,另外是資源沒(méi)有把算力資源充分利用起來(lái),大部分采用的是拼接或者分時(shí)方案把行泊做在一起,我認為真正的行泊體驗一定是與用戶(hù)側體驗一致,不需要手動(dòng)切換,能夠實(shí)現真正的完整體驗。

我們把整個(gè)泊車(chē)感知的能力通過(guò)BEV網(wǎng)絡(luò )重新體現了出來(lái),包括在泊車(chē)的傳感器,我們也可以更多的把它在行車(chē)過(guò)程中利用起來(lái),實(shí)現真正的行泊一體的完整方案。

左圖是我們在行車(chē)過(guò)程中使用魚(yú)眼攝像頭的體驗,包括我們在泊車(chē)上利用一些BEV、占據網(wǎng)格等實(shí)現的功能,可以把傳統的技術(shù)點(diǎn)在更強算力、更好方法的計算框架下實(shí)現能力,所以我們認為新的用戶(hù)體驗一定要有新的方法才能真正達到更好。

剛才也提到無(wú)圖,在城市NOA里面我認為無(wú)圖或者輕地圖的方式是非常必要的。從高速的地圖上來(lái)講,通過(guò)一定程度更新的采圖,還是比較容易實(shí)現的,但是一旦進(jìn)入到城市的范圍內,地圖的普及擴大會(huì )非常有挑戰。

這里為大家介紹我們的感知能力,在只基于SD MAP的情況下,我們通過(guò)Transformer架構的感知地圖的QmapNet來(lái)實(shí)現道路幾何的感知和SD MAP融合,具備通過(guò)復雜路口以及精確的拓撲的建圖能力,從而把我們感知能力和標精地圖實(shí)時(shí)匹配起來(lái),達到在城市內部實(shí)現比較復雜的駕駛能力。

除了感知和地圖能力以外,規控也是在城市導航里面非常具有挑戰的一部分。尤其在中國的道路情況下,有各種各樣的情況,比如匝道、無(wú)保護左轉以及窄路的通行,都是具有非常挑戰的,但在城市環(huán)境下,這些情況卻又是不可避免的。

很早以前,輕舟智航對駕駛行為方面做了大量的工作,能夠比較好的應對城市內部的駕駛體驗。同時(shí),在高速上也是很需要這方面的能力,尤其像智慧躲閃的情況,以及對動(dòng)態(tài)障礙物更好的博弈的策略。我們在行業(yè)中最早推出時(shí)空聯(lián)合規劃的方法,并實(shí)現在實(shí)車(chē)車(chē)規量產(chǎn)芯片上跑起來(lái),目前這種方法也是大家普遍認可了的。傳統的方法大部分通過(guò)時(shí)空解耦的方法,首先在空間中選擇一條軌跡再去優(yōu)化速度,這樣的方法對于城市內部的道路是基本上不可能的,會(huì )造成很多手寫(xiě)規則、很多邏輯的問(wèn)題。所以我們通過(guò)一個(gè)更好的時(shí)空聯(lián)合規劃的優(yōu)化器大量減少人工參與。

當然良好的感知、規控的能力都離不開(kāi)我們在數據方面的積累和使用能力,我們在行業(yè)里,也是很早就將基于純視覺(jué)的NeRF的建圖方式和三維重建的真值標注系統結合在一起,實(shí)現了大規模的非監督形式的標注,使得整體的標注效率非常高。這也可以看到,我們絕大部分的任務(wù)都是靠非監督學(xué)習來(lái)實(shí)現的。在所謂大模型里另外一個(gè)非常重要的基石就是能夠很好的使用非監督學(xué)習。

在成立四年的時(shí)間里,我們也得到了很多認可,包括一些論文。今天我們有三篇入選CVPR頂會(huì )的論文,此前也有ICCV、CVPR的論文、期刊的論文,以及一些軟著(zhù)和專(zhuān)利的申請。我們還在國內外各類(lèi)重量級的賽事中嶄露頭角,在WAIC世界人工智能大會(huì )多任務(wù)網(wǎng)絡(luò )學(xué)習里獲得第一名;在深度估計KITTI也是排名第一;在A(yíng)rgroverse中,2021、2022年,這兩次我們都是前三名,2021年是冠軍。

在這里,我有一個(gè)倡導,在城市范圍大規模的導航能力出現的時(shí)候,我們特別需要數據方面的積累。尤其在數據使用和共享上還有欠缺很多機制,以及規范的標準,需要全行業(yè)的聯(lián)動(dòng)和推動(dòng),讓我們把數據的能力能夠充分建立起來(lái),需要行業(yè)協(xié)會(huì )、企業(yè),還有上下游的合作伙伴群策群力,我覺(jué)得地平線(xiàn)和賈可老師推出的“公約數”服務(wù)平臺的方式非常好,能夠讓我們把很多重復的工作在“公約數”的倡導下建立起來(lái)。

我們在量產(chǎn)交付中還遇到了很多挑戰和困難,比如極致體驗和成本的區分。大部分來(lái)講,我們現在智駕的體驗還達不到消費者愿意為它買(mǎi)單的程度,所以只停留在3%-5%的成本,我也非常贊同現在的整個(gè)智駕在消費者面前還不是非常必要的選項。

只有把體驗做到非常極致了,讓消費者愿意買(mǎi)單,這件事情才能形成正向循環(huán),否則大家只能是比成本來(lái)殺價(jià)格。我覺(jué)得正向循環(huán)一定要讓體驗達到一定效果才可以實(shí)現。

另外在成本方面,我們一定要避免堆料來(lái)實(shí)現更好的客戶(hù)的價(jià)值。這里還涉及到一次性交付和持續OTA的挑戰,因為智駕的方案不是簡(jiǎn)單的一手交錢(qián)一手交貨的問(wèn)題,更多需要不斷OTA升級,使得它越用越好,常用常新,輕舟愿意為主機廠(chǎng)客戶(hù)提供一整套的工具鏈產(chǎn)品,可大幅度降低開(kāi)發(fā)的成本。最后,關(guān)于全棧自研和自主可控的討論,這里涉及的行業(yè)比較多,我就不多講了。

現在的行業(yè)發(fā)展屬于非常早期,但在今年車(chē)展上,我們看到了基本上有L2及輔助駕駛功能以上的車(chē)款已經(jīng)超過(guò)77%,所以已處在了行業(yè)非??斓谋l(fā)期。包括高速NOA滲透率,從行業(yè)的估計來(lái)講,也會(huì )從個(gè)位數預計到2025年達到25%。

當然,我們希望在2030年可以看到更多具備非常高級的輔助駕駛功能能夠出現在我們的車(chē)上,包括L3甚至L4的功能。從整個(gè)人工智能發(fā)展過(guò)程看,通用人工智能可能離我們不會(huì )太遠。如果從未來(lái)回看現在的話(huà),很有可能自動(dòng)駕駛只是很簡(jiǎn)單的問(wèn)題,其他很多問(wèn)題要比這個(gè)更復雜,等我們真正走到那一步的時(shí)候,可能會(huì )有很多不一樣的感受。這就像剛才吳聲老師講到的,偉大很多情況下是沒(méi)辦法設計出來(lái)的,說(shuō)不定某天某家公司就提出非常好的方法或技術(shù)能夠將我們整個(gè)技術(shù)大范圍提升,就像OpenAI在自然語(yǔ)言理解里面實(shí)現的東西一樣。

道阻且長(cháng),不負韶華,我們非常期待將無(wú)人駕駛帶進(jìn)現實(shí)。

關(guān)鍵詞:

責任編輯:QL0009

為你推薦

關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

版權所有 © 2020 跑酷財經(jīng)網(wǎng)

所載文章、數據僅供參考,使用前務(wù)請仔細閱讀網(wǎng)站聲明。本站不作任何非法律允許范圍內服務(wù)!

聯(lián)系我們:315 541 185@qq.com