
KITTI數(shù)據(jù)集是全球最權(quán)威的自動(dòng)駕駛計(jì)算機(jī)算法評(píng)測數(shù)據(jù)集,為促進(jìn)基于激光的語義分割研究,KITTI推出了細(xì)分?jǐn)?shù)據(jù)集Semantic KITTI,通過全類別分割平均交并比(mIOU)和整體準(zhǔn)確率(accuracy)兩大指標(biāo),考察參賽者的技術(shù)能力。達(dá)摩院團(tuán)隊(duì)在兩項(xiàng)指標(biāo)的評(píng)比中均拿下第一。
點(diǎn)云(Point Cloud)是擁有三維坐標(biāo)、強(qiáng)度等信息的激光點(diǎn)的集合,是計(jì)算機(jī)視覺領(lǐng)域常用的三維數(shù)據(jù)表示方式。自動(dòng)駕駛車輛通常借助激光雷達(dá)、攝像頭、毫米波雷達(dá)等傳感器識(shí)別環(huán)境信息。對(duì)于激光雷達(dá)獲取的周圍環(huán)境的3D點(diǎn)云,識(shí)別每個(gè)點(diǎn)的語義標(biāo)簽,就是“3D點(diǎn)云語義分割”。
除了行人、車輛等常規(guī)檢測目標(biāo),道路周圍的建筑、綠化、不明障礙物也會(huì)影響自動(dòng)駕駛車輛的駕駛行為,3D點(diǎn)云語義分割技術(shù)的目標(biāo),便是幫助車輛更精細(xì)地理解道路環(huán)境。
達(dá)摩院自動(dòng)駕駛實(shí)驗(yàn)室資深算法專家卿泉介紹,業(yè)界通用的點(diǎn)云局部上下文特征建模方法難以滿足自動(dòng)駕駛實(shí)時(shí)、精準(zhǔn)的感知需求。達(dá)摩院提出的新算法以激光點(diǎn)為載體,結(jié)合每個(gè)3D點(diǎn)在鳥瞰、前視等視角下的鄰域特征,通過多層級(jí)聯(lián)編碼進(jìn)行特征學(xué)習(xí),大大增強(qiáng)3D點(diǎn)的特征表示能力,由此提高了語義識(shí)別的準(zhǔn)確性。
該算法應(yīng)用于達(dá)摩院的無人物流車后,車輛對(duì)障礙物的精細(xì)化識(shí)別水平大幅提升。比如在行駛途中遇到臨時(shí)拉起的警戒線,即便線寬僅有3厘米,物流車也能輕松識(shí)別并繞道而行。