汽車輔助駕駛已經(jīng)逐漸成為現(xiàn)代汽車的重要組成部分。它不僅能夠提升駕駛的安全性,還能為駕駛員提供更加人性化的駕駛體驗。而這一切都離不開感知技術的支持。那么,汽車輔助駕駛究竟是如何通過感知技術來實現(xiàn)其功能的呢?
感知方案都有哪些?
蝙蝠通過超聲波聽聲點位,人類通過眼睛和耳朵來感知空間,而在汽車上,則通過各種傳感器進行感知。目前市場主流的組合輔助駕駛主要是V+R+L+U的感知組合,其中R代表毫米波雷達,V代表攝像頭,L代表激光雷達,U代表超聲波雷達,此外,車內(nèi)的車載駕駛員監(jiān)控(DMS)也算作一個攝像頭。
舉例來說,以比亞迪的天神之眼C為例,其配備了5個毫米波雷達與12個攝像頭,包括3顆800萬前視攝像頭、4顆300萬環(huán)視攝像頭、4顆300萬側視攝像頭、1顆300萬后視攝像頭,也就是5R12V感知方案。
V+R+L+U們看到的世界是什么樣的?
以奔馳為例,其前視采用雙目攝像頭。雙目攝像頭通過兩個攝像頭同時感知前方物體,并利用視差算法計算物體距離,從而實現(xiàn)較為精準的測距功能。
視差算法有一個特點,就是左右兩個攝像頭的距離越遠,測距能力越遠。但由于汽車內(nèi)部空間有限,攝像頭普遍集成在風擋玻璃后視鏡的位置,2個攝像頭之間的距離一般為十幾厘米,導致其探測距離略顯不足。
而比亞迪、小鵬等公司,則在雙目的基礎上,又加上了一個長焦,有了三目攝像頭。以比亞迪代表性的三目前視攝像頭為例,其三目攝像頭包括兩個用于視差算法的雙目攝像頭和一個長焦鏡頭。其中2個廣角攝像頭探測角度為120度,800萬像素,1個長焦攝像頭探測角度為30度,800萬像素。其中,長焦鏡頭主要用于識別遠處的小物體,如紅綠燈等;雙目攝像頭通過視差算法測距,系統(tǒng)可以精確計算前方物體的距離。通過雙目視差算法可以獲得稠密點云,可以清晰地感知到路面的起伏和坑洼,如主動懸架的預瞄等。
根據(jù)比亞迪提供的資料,在三目方案下最高探測距離達到350米,實現(xiàn)1cm的物體探測精度,甚至可以對路面進行預瞄,識別路面上的減速帶、凹陷等,提前讓車輛減速通過。
同時在現(xiàn)有技術的支撐下,多個攝像頭的設計也能支持系統(tǒng)同時運行多種算法。如其中一個攝像頭運行AI算法,識別特定類型的障礙物,如車輛、行人和自行車、車道線等。長焦鏡頭用于遠距離物體識別,如AEB、ACC、紅綠燈,從而提高系統(tǒng)的識別范圍和準確性,滿足當下城市輔助駕駛的要求。
說到算法,不得不提到BEV和Occupancy。BEV是Bird’s Eye View的縮寫,即鳥瞰視角技術。BEV將多個攝像頭拍攝的圖像拼接成一個全景圖像的技術。根據(jù)傳感器不同,可以分為BEV LiDAR點云類,還有BEV Camera圖像類,還有BEV Fusion融合類。
BEV鳥瞰圖
舉例來說,通過多個攝像頭采集圖像后融合,系統(tǒng)將采集圖像通過矯正后,統(tǒng)一輸入到神經(jīng)網(wǎng)絡來提取特征,然后通過注意力機制的神經(jīng)網(wǎng)絡模型transformer將這些特征進行關聯(lián),之后再投影到一個向量空間之中,最終拿到一張反映周圍環(huán)境的鳥瞰圖。這種算法可以幫助系統(tǒng)識別障礙物并確定可行駛區(qū)域,但BEV感知無法預測懸垂的障礙物,如開啟的車門,限高的欄桿等,這個時候就要請出Occupancy占用網(wǎng)絡了。
Occupancy占用網(wǎng)絡圖
BEV算法所采集的圖像輸出為2D,而Occupancy占用網(wǎng)絡將其升維為3D,這有點像俄羅斯方塊,占用網(wǎng)絡就是將世界網(wǎng)格化,定義哪個單元被占用,哪個單元是空閑的。
占據(jù)網(wǎng)絡算法通過分析前方物體的形狀和位置,判斷哪些區(qū)域是可以安全行駛的,哪些區(qū)域存在潛在的障礙物。只要空閑的單位格沒被占用,那么就可以通行,汽車識別能力大幅提升。這種功能對于城市駕駛尤為重要,因為在城市環(huán)境中,車輛需要頻繁應對復雜的道路狀況和多變的障礙物。
但中國道路環(huán)境和路況更加復雜,單純依靠視覺感知,還存在一些不足。于是,激光雷達就成了當前行業(yè)較為主流的感知方案。
激光雷達通過激光束掃描構建環(huán)境點云圖,線數(shù)越多,垂直分辨率越高。以目前主流的192線雷達為例,其點云圖可清晰分辨200米外車輛輪廓,但對體積更小的異物,如倒伏在道路中央的輪胎、錐桶等,在200米遠時僅能模糊識別為異物,需要在100米,乃至50米時才能較為清楚地分辨出其輪廓。
雖然ADAS攝像頭能夠提供更豐富的視覺信息,但在不同光照條件和物體材質(zhì)的情況下,攝像頭的測距精度和識別能力明顯不如激光雷達。測距不準,意味著下降較低。
而激光雷達能夠實時獲取三維點云數(shù)據(jù),并快速構建出環(huán)境的三維模型。讓車輛能夠快速全面了解周圍的道路、障礙物和其他車輛的位置和運動狀態(tài),為決策系統(tǒng)提供豐富的信息。簡單來說,激光雷達不會被表面圖案欺騙,它只關心是否存在障礙物。(朋月)