本發(fā)明屬于自動(dòng)駕駛,涉及一種基于動(dòng)態(tài)安全拓?fù)浣Y(jié)構(gòu)的自動(dòng)駕駛局部運(yùn)動(dòng)規(guī)劃方法。
背景技術(shù):
1、局部運(yùn)動(dòng)規(guī)劃通常包括創(chuàng)建一個(gè)決策模塊,使主車輛(host-vehicle,hv)能夠根據(jù)道路狀況和其他車輛(other?vehicles,ovs)的行為自適應(yīng)地做出局部運(yùn)動(dòng)決策,這些決策主要分為基于規(guī)則的方法和基于學(xué)習(xí)的方法。
2、基于規(guī)則的方法具有邏輯清晰、模型可解釋性強(qiáng)以及可擴(kuò)展性好的特點(diǎn),然而它們依賴于有限的規(guī)則參數(shù)在動(dòng)態(tài)環(huán)境中做出決策,因此對復(fù)雜駕駛場景的適應(yīng)性有限?;谝?guī)則的方法通常通過采用預(yù)先定義的規(guī)則將連續(xù)的決策行為劃分為離散的駕駛行為。然后根據(jù)車輛狀態(tài)和環(huán)境特征與這些規(guī)則進(jìn)行評估,得出最終的駕駛決策。有限狀態(tài)機(jī)(fsm)是最具代表性的基于規(guī)則的決策方法之一,有限狀態(tài)機(jī)的關(guān)鍵組成部分包括狀態(tài)、事件、轉(zhuǎn)換和動(dòng)作,每個(gè)狀態(tài)對特定事件做出響應(yīng),執(zhí)行相應(yīng)動(dòng)作,并轉(zhuǎn)換到新的狀態(tài)。miller等人開發(fā)了skynet無人駕駛車輛,該車輛在一個(gè)包含駕駛行為、規(guī)劃策略和低級(jí)操作控制的三層規(guī)劃系統(tǒng)中整合了交通規(guī)則和環(huán)境數(shù)據(jù)。patz等人開發(fā)了the?knight?rider無人駕駛車輛,該車輛采用了分層駕駛員模型,將駕駛?cè)蝿?wù)分為戰(zhàn)略、戰(zhàn)術(shù)和操作三個(gè)層次。戰(zhàn)略層設(shè)定子目標(biāo),戰(zhàn)術(shù)層生成連續(xù)的最優(yōu)策略,操作層輸出控制信號(hào)。ziegler等人提出了一種并行決策系統(tǒng),該系統(tǒng)包含四個(gè)獨(dú)立且并行的模塊:路線規(guī)劃、目標(biāo)分析、交通燈管理和接管管理。這種并行結(jié)構(gòu)通過將每個(gè)任務(wù)隔離到單獨(dú)的模塊中,確保了快速靈活的響應(yīng)。盡管取得了這些進(jìn)展,基于規(guī)則的方法在復(fù)雜駕駛條件下仍面臨挑戰(zhàn)。遍歷大量狀態(tài)可能會(huì)導(dǎo)致顯著的計(jì)算開銷,此外,狀態(tài)劃分以及解決狀態(tài)之間的沖突仍是提高這些方法效率和可靠性的關(guān)鍵障礙。
3、基于學(xué)習(xí)的決策方法以其自學(xué)習(xí)能力、高決策靈活性以及在特定場景中的深度探索能力而著稱。與基于規(guī)則的方法相比,基于學(xué)習(xí)的方法還能通過利用網(wǎng)絡(luò)結(jié)構(gòu)來簡化決策模塊的規(guī)模。目前,基于學(xué)習(xí)的決策方法主要基于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)(rl)。例如,wang等人提出了一種用于混合交通環(huán)境中變道速度控制的深度rl方法。該研究利用自然駕駛軌跡數(shù)據(jù)來模擬其他車輛的行為,并設(shè)計(jì)了獎(jiǎng)勵(lì)函數(shù)和避碰策略來訓(xùn)練自動(dòng)駕駛車輛進(jìn)行安全高效的變道。同樣,alagumuthukrishnan等人開發(fā)了一種深度rl方法,該方法結(jié)合了v2v(車對車)通信和傳感器數(shù)據(jù),以優(yōu)化聯(lián)網(wǎng)自動(dòng)駕駛車輛在高速公路上的變道行為,從而提高其安全性和效率。
4、然而,基于學(xué)習(xí)的方法在訓(xùn)練數(shù)據(jù)之外的場景中行動(dòng)時(shí)面臨挑戰(zhàn),這限制了其在各種場景中的安全性。為了解決這個(gè)問題,研究人員探索了將基于規(guī)則的方法和基于學(xué)習(xí)的方法相結(jié)合的混合方法,通過風(fēng)險(xiǎn)約束和接管機(jī)制來增強(qiáng)決策的安全性。yang等人提出了一種基于博弈論的安全強(qiáng)化學(xué)習(xí)框架。該框架結(jié)合了強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)和安全約束模塊。安全模塊確保在訓(xùn)練期間和訓(xùn)練之后進(jìn)行風(fēng)險(xiǎn)評估和駕駛安全。當(dāng)強(qiáng)化學(xué)習(xí)帶來駕駛風(fēng)險(xiǎn)時(shí),它還會(huì)接管決策。同樣,xu等人提出了一種用于高速公路自動(dòng)化的綜合決策框架。該框架將強(qiáng)化學(xué)習(xí)與模仿學(xué)習(xí)相結(jié)合,同時(shí)利用基于規(guī)則的修正來解決那些有缺陷的決策并提高安全性。盡管取得了這些進(jìn)展,基于學(xué)習(xí)的方法仍然存在可解釋性差的問題。即使結(jié)合了基于規(guī)則的輔助手段,基于學(xué)習(xí)的算法的決策過程往往仍然不透明,這給在安全關(guān)鍵場景中的驗(yàn)證和部署帶來了挑戰(zhàn)。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種基于動(dòng)態(tài)安全拓?fù)浣Y(jié)構(gòu)(dynamic?safetopological?structure,dsts)的自動(dòng)駕駛局部運(yùn)動(dòng)規(guī)劃方法,dsts采用分層拓?fù)浣Y(jié)構(gòu)建立基本決策框架。
2、為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種基于動(dòng)態(tài)安全拓?fù)浣Y(jié)構(gòu)的自動(dòng)駕駛局部運(yùn)動(dòng)規(guī)劃方法,包括以下步驟:
4、s1:定義主車輛hv的可檢測范圍;
5、s2:檢測、定位和確定主車輛hv周圍障礙物的狀態(tài),并獲取車道標(biāo)線的信息;
6、s3:依照行為決策原則,對局部運(yùn)動(dòng)行為進(jìn)行規(guī)劃,包括跟隨、變道和超車任務(wù);
7、s4:設(shè)置最大安全范圍,對可能出現(xiàn)的危險(xiǎn)情況進(jìn)行運(yùn)動(dòng)規(guī)劃。
8、進(jìn)一步,步驟s1中,根據(jù)以下因素,以主車輛hv為圓心,dmax為檢測半徑,設(shè)定主車輛的可檢測范圍:
9、實(shí)際應(yīng)用中車載傳感器的最大有效檢測范圍;
10、為提高計(jì)算效率而對周圍環(huán)境計(jì)算量的限制需求。
11、進(jìn)一步,步驟s2具體包括以下步驟:
12、以主車輛hv中心建立一個(gè)拓?fù)浞秶x范圍參數(shù)dlane-obs如下:
13、
14、β1·dsafe≤dlane-obs≤β2·dmax
15、s.t.ttct=ttct(hv,ovt)if?ovtelse?ttcsafe
16、ttct≤ttcsafe
17、其中,ttct表示主車輛hv與hv意向車道內(nèi)最近的車輛ovt之間的碰撞時(shí)間ttc;對于在范圍dmax內(nèi)的n個(gè)其他車輛ov,ovt|1≤t≤n表示hv意向車道內(nèi)距離hv最近的車輛;dsafe表示注意力區(qū)域的半徑,其取決于所選的駕駛風(fēng)格;vhv是hv的速度,wpthv是hv的路線規(guī)劃點(diǎn),β1和β2是超參數(shù);
18、參數(shù)dlane-obs用于平衡以下因素:(1)當(dāng)n個(gè)ovi|1≤i≤n共存時(shí),準(zhǔn)確計(jì)算ttci;(2)隨著vhv的增加,擴(kuò)大決策范圍;(3)當(dāng)主車輛hv的規(guī)劃路線曲率高時(shí)降低變道決策的可能性;
19、對于dlane-obs范圍內(nèi)的道路環(huán)境,以hv的縱向軸線為分界線分為兩部分:前計(jì)算層和后計(jì)算層;
20、所述前計(jì)算層負(fù)責(zé)計(jì)算主車輛前方的交通信息,包括前方、左前方和右前方;所述后計(jì)算層負(fù)責(zé)計(jì)算主車輛后方的交通信息,包括后方、左后方和右后方;
21、對于前方檢測,首先收集在車道集合中同向行駛的車輛的速度數(shù)據(jù)vov和距離數(shù)據(jù)dobs,將收集到的數(shù)據(jù)表示為一個(gè)組合數(shù)組:
22、
23、其中,xlane-marking表示hv與車道標(biāo)線之間的橫向距離;ovstate表示車輛的存在,當(dāng)有車輛存在時(shí)為真;當(dāng)ovstate為假時(shí),dobs用于計(jì)算空間占用情況,以確保hv周圍的整體安全拓?fù)淇臻g保持完整且不坍塌。
24、進(jìn)一步,在步驟s2中,針對車道標(biāo)線重疊且多個(gè)idslane相互混淆的駕駛場景,提出一種正六邊形檢測結(jié)構(gòu),與dlane-obs范圍互補(bǔ);
25、對于該互補(bǔ)結(jié)構(gòu),以緯度軸作為固定分界線,并采用固定角度將hv周圍區(qū)域劃分為六個(gè)部分:前方、左前方、右前方、后方、左后方和右后方;然后根據(jù)定義的區(qū)域?qū)χ車囕v進(jìn)行分區(qū)定位計(jì)算。
26、進(jìn)一步,對于基于局部路徑的變道和超車操作,需同時(shí)滿足以下條件:
27、(1)若已有全局規(guī)劃路徑,基于全局路徑規(guī)劃的變道操作eventglobal的優(yōu)先級(jí)必須高于基于局部路徑規(guī)劃的變道操作eventlocal;如果局部變道操作與全局路徑規(guī)劃發(fā)生沖突,車輛將放棄變道并切換至安全跟隨模式,具體操作如下所示:
28、
29、(2)兩次連續(xù)變道操作之間需間隔一段時(shí)間,變道間隔時(shí)間tgap根據(jù)vhv自適應(yīng)調(diào)整,設(shè)定如下:
30、
31、其中vmax是主車輛hv的最大速度,t為一個(gè)預(yù)先定義的常數(shù)且t屬于正整數(shù);
32、(3)在縱向定位方面,同一車道內(nèi)hv與前車之間的距離dlongitude必須低于閾值dturn,如下所示:
33、(dlongitude<dturn)∧(ttc(hv,ovlongitude)<ttcth)
34、∧(ovlongitudeis?true)
35、其中,ttcth的設(shè)定受駕駛風(fēng)格選擇的影響,駕駛風(fēng)格越激進(jìn),ttcth的值越??;dturn是一個(gè)可調(diào)閾值,用于確定是否應(yīng)執(zhí)行變道操作;dturn的值定義為
36、dturn=(w1-w2curvature(wpthv))·dlane-obs
37、其中0<w1<1,curvature({wpthv})表示基于hv附近多個(gè)規(guī)劃路徑點(diǎn){wpthv}通過二次多項(xiàng)式估計(jì)出的路線曲率;
38、(4)在橫向定位方面,對目標(biāo)車道內(nèi)的前車和后車的距離獲取和碰撞時(shí)間ttc進(jìn)行估計(jì);橫向距離dlatitude和ttc值必須符合預(yù)設(shè)的閾值范圍;如果車輛的ovstate為false,則距離和條件自動(dòng)視為滿足,具體說明如下:
39、
40、其中bj∈{front,rear},dsafe是安全變道距離,其定義如下:
41、
42、其中0<β3<β1,β3>1,vdesired是主車輛hv的期望速度,是最短制動(dòng)距離。
43、進(jìn)一步,對于基于局部運(yùn)動(dòng)的變道操作,要滿足
44、(dlongitude<dturn)∧(ttc(hv,ovlongitude)<ttcth)
45、∧(ovlongitudeis?true)
46、對于基于全局路徑的變道操作,除了滿足上式,還滿足針對前方車輛的安全條件,該條件描述為:
47、(ttc(hv,ovlongitude)<ttcth)∨(ovlongitudeis?false)
48、當(dāng)執(zhí)行變道操作時(shí),主車輛hv的期望變道速度vlc設(shè)定如下:
49、
50、s.t.vlc=max(vlc,vmin)
51、其中0<σ1<σ2,vmin是主車輛的最低限速;
52、當(dāng)主車輛hv的變道條件未滿足時(shí),主車輛執(zhí)行車道保持或跟隨操作;變道的頻率取決于hv的駕駛風(fēng)格,駕駛風(fēng)格越激進(jìn),變道的頻率越高;當(dāng)確定主車輛hv需要保持在當(dāng)前車道時(shí),其行駛速度根據(jù)周圍環(huán)境條件自動(dòng)調(diào)整。
53、進(jìn)一步,所述環(huán)境條件分為三類:(i)結(jié)構(gòu)化道路,即直道和彎道,(ii)非結(jié)構(gòu)化道路,即交叉路口,(iii)保持車道并等待變道以滿足全局路徑規(guī)劃;其中(iii)的優(yōu)先級(jí)高于(i)和(ii);
54、條件(i):針對無需考慮變道情況的場景,使用分段動(dòng)態(tài)速度規(guī)劃方法;將動(dòng)態(tài)安全約束作為速度調(diào)節(jié)的信任范圍,在此范圍內(nèi)執(zhí)行速度控制策略,使主車輛hv能夠適應(yīng)周圍環(huán)境,同時(shí)通過動(dòng)態(tài)分段約束確保安全,hv的速度設(shè)置如下:
55、
56、其中0<μ1<1<μ2,0<γ1<1,γ2>1,γ3vmax>vdesired,η≥1,η∝μ2,ttct表示主車輛hv與目標(biāo)車道中的其他車輛ov發(fā)生碰撞所需的時(shí)間;
57、條件(ii):在交叉路口場景,主車輛hv的速度根據(jù)周圍車輛的速度進(jìn)行調(diào)整,主車輛hv的速度設(shè)定如下:
58、
59、其中0<γ4<1,0<γ5<1;
60、條件(iii):如果基于全局路徑規(guī)劃,主車輛hv需要變更車道,則在等待滿足變道條件的時(shí)間段內(nèi),hv的速度會(huì)降低,hv的速度設(shè)定如下:
61、
62、其中0<μ3<1,0<μ4<1,0<γ6<1,0<γ7<1。
63、進(jìn)一步,步驟s4中,設(shè)置最大安全范圍,即關(guān)注區(qū)域的半徑dsafe;
64、對于hv的目標(biāo)車道,如果目標(biāo)車道相鄰,當(dāng)d(hv,ovfront)<dsafe時(shí),hv啟動(dòng)制動(dòng)動(dòng)作;如果目標(biāo)車道是hv自身所在車道,當(dāng)d(hv,ovfront)<dsafe且d(hv,ovfront)<dbrake時(shí),hv將啟動(dòng)制動(dòng)動(dòng)作;
65、引入動(dòng)態(tài)參數(shù)dbrake,調(diào)整安全駕駛行為的邊界,從而在保持安全的同時(shí)擴(kuò)大操作范圍;
66、如果后方ov過于靠近hv可能導(dǎo)致追尾碰撞,hv將啟動(dòng)變道動(dòng)作,為避免追尾碰撞而進(jìn)行變道,必須滿足縱向定位條件:
67、(dlongitude<dturn)∧(ttc(hv,ovlongitude)<ttcth)
68、∧(ovlongitudeis?true)
69、還必須滿足對于后方車輛對hv的潛在危險(xiǎn)判斷標(biāo)準(zhǔn):
70、(ttc(hv,ovrear)<ttcth)
71、
72、其中dbrake定義為:
73、
74、其中為制動(dòng)距離閾值,根據(jù)主車輛hv駕駛風(fēng)格設(shè)定;根據(jù)周圍其他車輛ov的狀態(tài)設(shè)定,當(dāng)其他車輛靜止時(shí),分配一個(gè)極小值。
75、本發(fā)明的有益效果在于:本發(fā)明的dsts通過納入動(dòng)態(tài)環(huán)境參數(shù),dsts的每一層都能動(dòng)態(tài)適應(yīng)周圍駕駛環(huán)境和不同自動(dòng)駕駛車輛的駕駛風(fēng)格,這種結(jié)構(gòu)能夠分解駕駛決策任務(wù)并動(dòng)態(tài)解決,確保安全、穩(wěn)定且適應(yīng)性強(qiáng)的駕駛決策,從而有效處理動(dòng)態(tài)、多類駕駛場景。
76、本發(fā)明的其他優(yōu)點(diǎn)、目標(biāo)和特征在某種程度上將在隨后的說明書中進(jìn)行闡述,并且在某種程度上,基于對下文的考察研究對本領(lǐng)域技術(shù)人員而言將是顯而易見的,或者可以從本發(fā)明的實(shí)踐中得到教導(dǎo)。本發(fā)明的目標(biāo)和其他優(yōu)點(diǎn)可以通過下面的說明書來實(shí)現(xiàn)和獲得。