本發(fā)明涉及計算機視覺與三維目標識別,具體而言,涉及一種基于三維點云的建筑物識別方法及系統(tǒng)。
背景技術(shù):
1、近年來,三維點云處理技術(shù)在城市規(guī)劃、自動駕駛及清潔能源領(lǐng)域快速發(fā)展,尤其是激光雷達的普及推動了對建筑物屋頂?shù)雀呔茸R別需求。然而,建筑物屋頂識別面臨點云數(shù)據(jù)稀疏性、幾何變換敏感性(如旋轉(zhuǎn)/平移)及局部特征易丟失等難題,導(dǎo)致傳統(tǒng)方法依賴人工設(shè)計描述符(如fpfh、shot)時計算效率低下,且深度學(xué)習(xí)模型(如pointnet、pct)在復(fù)雜場景下識別精度不足,嚴重制約了三維重建、光伏安裝評估等應(yīng)用落地。
2、現(xiàn)有技術(shù)通過多頭注意力機制、層次化特征聚合(如pointnet++)或曲率特征增強(如curvenet)提升點云識別能力,但仍存在顯著局限:
3、1.幾何魯棒性差:傳統(tǒng)自注意力機制對旋轉(zhuǎn)/平移后的點云特征一致性低,導(dǎo)致數(shù)據(jù)增強后模型性能下降;
4、2.局部信息丟失:稀疏點云的關(guān)鍵幾何細節(jié)(如屋頂坡度、邊緣)在特征提取中易被忽略,單頭注意力難以全面捕捉多維度空間關(guān)系;
5、3.數(shù)據(jù)偏差放大:常規(guī)數(shù)據(jù)增強(如隨機旋轉(zhuǎn))會破壞原始點云分布,加劇類別不平衡問題。
6、綜上所述,如何在提升三維點云建筑物識別的精度與魯棒性的同時,克服幾何變換敏感性與局部特征丟失的技術(shù)問題是急需解決的問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明的主要目的在于提供一種基于三維點云的建筑物識別方法及系統(tǒng),以至少解決如何在提升三維點云建筑物識別的精度與魯棒性的同時,克服幾何變換敏感性與局部特征丟失的技術(shù)問題,從而克服了傳統(tǒng)方法中因旋轉(zhuǎn)平移敏感、局部信息丟失和樣本偏差導(dǎo)致的識別性能瓶頸,有效提升三維點云建筑物識別的精度與魯棒性。
2、為了實現(xiàn)上述目的,本發(fā)明提供了一種基于三維點云的建筑物識別方法及系統(tǒng)。
3、第一方面,本發(fā)明提供一種基于三維點云的建筑物識別方法,所述方法包括:
4、步驟1、對輸入的建筑物屋頂點云數(shù)據(jù)通過欠采樣、過采樣、數(shù)據(jù)增強以獲得預(yù)處理后屋頂點云數(shù)據(jù);
5、步驟2、將所述預(yù)處理后屋頂點云數(shù)據(jù)通過t-net網(wǎng)絡(luò)進行空間對齊,并輸出對齊后的屋頂點云數(shù)據(jù)p'=p·t,其中p為原始點云數(shù)據(jù),t為t-net網(wǎng)絡(luò)生成的3×3變換矩陣;
6、步驟3、改進pct模型以獲取new_pct模型;
7、步驟4、將所述對齊后的屋頂點云數(shù)據(jù)輸入所述new_pct模型,通過所述new_pct模型中的多頭偏置注意力機制提取全局特征向量,具體包括以下子步驟:
8、步驟4.1、將所述對齊后的點云數(shù)據(jù)通過所述new_pct模型的線性編碼層生成點云特征矩陣x∈,其中n為點云數(shù)量,d為特征維度;
9、步驟4.2、對所述點云特征矩陣x進行線性變換生成查詢矩陣q、鍵矩陣k、值矩陣v,并引入可學(xué)習(xí)的偏置矩陣b∈,通過以下公式計算多個注意力頭的輸出:
10、;
11、其中,為鍵矩陣的維度,為鍵矩陣的轉(zhuǎn)置矩陣;
12、步驟4.3、將所述多個注意力頭的輸出進行拼接,并通過線性變換融合得到中間關(guān)聯(lián)特征;
13、步驟4.4、對所述中間關(guān)聯(lián)特征進行全局最大池化,生成所述全局特征向量,全局最大池化公式為:
14、;
15、其中,表示所述全局特征向量,表示所述中間關(guān)聯(lián)特征中第i個點的特征向量,max表示對每個特征通道獨立計算最大值;
16、步驟5、將所述全局特征向量輸入所述new_pct模型的分類器,輸出建筑物屋頂類型。
17、具體地,所述對輸入的建筑物屋頂點云數(shù)據(jù)通過欠采樣、過采樣、數(shù)據(jù)增強以獲得預(yù)處理后屋頂點云數(shù)據(jù),包括:
18、步驟一、對輸入的建筑物屋頂點云數(shù)據(jù)進行欠采樣處理:
19、采用最遠點采樣算法,從所述輸入的建筑物屋頂點云數(shù)據(jù)中迭代選取距離已采樣點集最遠的點,直至所述輸入的建筑物屋頂點云數(shù)據(jù)中的點云數(shù)量降至第一預(yù)設(shè)閾值,生成降采樣點云;
20、步驟二、對所述降采樣點云進行過采樣處理:
21、識別所述降采樣點云中密度低于第二預(yù)設(shè)閾值的稀疏區(qū)域,對所述稀疏區(qū)域的每個目標點計算其k個最近鄰點的三維坐標均值生成插值點,將所述插值點補充至所述降采樣點云中,使總點數(shù)達到第三預(yù)設(shè)閾值,形成過采樣增強點云;
22、步驟三、對所述過采樣增強點云執(zhí)行數(shù)據(jù)增強處理以生成數(shù)據(jù)增強后的點云:
23、對所述過采樣增強點云施加隨機旋轉(zhuǎn)變換,旋轉(zhuǎn)角度范圍為±15度,并沿三維坐標軸隨機平移±0.1米距離,同時按0.8至1.2倍比例縮放點云坐標,生成數(shù)據(jù)增強后的點云;
24、步驟四、標注并平衡樣本以獲取標注且均衡后的點云數(shù)據(jù):
25、為所述數(shù)據(jù)增強后的點云標注17種屋頂類型標簽;統(tǒng)計各類型樣本數(shù)量,刪除同類型中與所述k個最近鄰點在增強后坐標空間中的平均距離低于第四預(yù)設(shè)閾值的冗余樣本,并通過k近鄰插值補充不足類型的樣本,直至所有類型的樣本數(shù)量均衡至6460個;
26、步驟五、生成預(yù)處理后屋頂點云數(shù)據(jù):
27、將所述標注且均衡后的點云數(shù)據(jù)作為所述預(yù)處理后屋頂點云數(shù)據(jù)輸出。
28、具體地,所述將所述預(yù)處理后屋頂點云數(shù)據(jù)通過t-net網(wǎng)絡(luò)進行空間對齊,并輸出對齊后的屋頂點云數(shù)據(jù)p'=p·t,其中p為所述預(yù)處理后屋頂點云數(shù)據(jù),t為t-net生成的3×3變換矩陣,包括:
29、將所述預(yù)處理后屋頂點云數(shù)據(jù)輸入所述t-net網(wǎng)絡(luò),依次執(zhí)行第一層1×1卷積、第二層1×1卷積、第三層1×1卷積、全局平均池化,輸出全局平均池化后特征向量;
30、將所述全局平均池化后特征向量輸入所述t-net網(wǎng)絡(luò)的全連接層,進行非線性映射獲取變換矩陣;
31、將所述預(yù)處理后屋頂點云數(shù)據(jù)與所述變換矩陣相乘,計算所述對齊后的屋頂點云數(shù)據(jù)p'=p·t,其中p為所述預(yù)處理后屋頂點云數(shù)據(jù),t為t-net生成的3×3變換矩陣。
32、具體地,所述改進pct模型以獲取new_pct模型,包括:
33、將所述pct模型中的自注意力模塊替換為多頭偏置注意力模塊,每個頭的注意力計算均引入可學(xué)習(xí)的偏置矩陣b∈。
34、具體地,所述多頭偏置注意力模塊的結(jié)構(gòu)包括:
35、多頭并行計算單元:所述多頭并行計算單元用于將所述對齊后的屋頂點云數(shù)據(jù)的輸入特征拆分為8個獨立計算分支,每個所述計算分支通過線性變換生成查詢、鍵、值參數(shù),并附帶一個可學(xué)習(xí)的偏置矩陣,所述可學(xué)習(xí)的偏置矩陣用于動態(tài)強化所述對齊后的屋頂點云數(shù)據(jù)中局部區(qū)域的注意力權(quán)重;
36、偏置增強的注意力權(quán)重計算單元:在每個所述計算分支中,通過疊加偏置矩陣調(diào)整點之間的關(guān)聯(lián)強度,使所述pct模型自動聚焦建筑物屋頂?shù)奈菁咕€或坡面邊緣以抑制噪聲與冗余點干擾;
37、多尺度特征融合單元:將8個獨立計算分支的輸出按特征維度拼接,通過線性變換融合為統(tǒng)一特征,并結(jié)合殘差連接與歸一化操作以保留原始輸入信息。
38、具體地,所述將所述多個注意力頭的輸出進行拼接,并通過線性變換融合得到中間關(guān)聯(lián)特征,包括:
39、將所述多個注意力頭的輸出按特征通道維度直接拼接,形成合并后的特征矩陣;
40、使用可學(xué)習(xí)的權(quán)重參數(shù)對所述合并后的特征矩陣進行線性轉(zhuǎn)換,壓縮至目標特征維度,生成融合后的統(tǒng)一特征表示;
41、對所述融合后的統(tǒng)一特征表示施加relu激活函數(shù)以增強非線性表達能力,輸出所述中間關(guān)聯(lián)特征。
42、具體地,所述將所述全局特征向量輸入所述new_pct模型的分類器,輸出建筑物屋頂類型,包括:
43、將所述全局特征向量依次通過兩層全連接層進行非線性映射,每層后接歸一化與激活函數(shù)處理,以逐步將所述全局特征向量的特征維度從1024維壓縮至256維,生成壓縮后的256維特征;
44、將所述壓縮后的256維特征輸入所述new_pct模型的全連接層,映射至17維輸出向量,以對應(yīng)17種屋頂類型標簽,并通過概率歸一化計算預(yù)測屋頂類型概率;
45、根據(jù)所述預(yù)測屋頂類型概率與所述屋頂類型標簽的差異,采用交叉熵損失函數(shù)反向優(yōu)化所述new_pct模型的分類器的參數(shù)。
46、第二方面,本發(fā)明提供一種基于三維點云的建筑物識別系統(tǒng),所述識別系統(tǒng)應(yīng)用于第一方面所述的識別方法,所述識別系統(tǒng)包括:
47、數(shù)據(jù)預(yù)處理模塊,所述數(shù)據(jù)預(yù)處理模塊用于對輸入的建筑物屋頂點云數(shù)據(jù)通過欠采樣、過采樣、數(shù)據(jù)增強以獲得預(yù)處理后屋頂點云數(shù)據(jù);
48、空間對齊模塊,所述空間對齊模塊與所述數(shù)據(jù)預(yù)處理模塊連接,所述空間對齊模塊用于將所述預(yù)處理后屋頂點云數(shù)據(jù)通過t-net網(wǎng)絡(luò)進行空間對齊,并輸出對齊后的屋頂點云數(shù)據(jù)p'=p·t,其中p為原始點云數(shù)據(jù),t為t-net生成的3×3變換矩陣;
49、全局特征向量提取模塊,所述全局特征向量提取模塊與所述空間對齊模塊連接,所述全局特征向量提取模塊用于將所述對齊后的屋頂點云數(shù)據(jù)輸入所述new_pct模型,通過所述new_pct模型中的多頭偏置注意力機制提取全局特征向量;
50、建筑物屋頂類型輸出模塊,所述建筑物屋頂類型輸出模塊與所述全局特征向量提取模塊連接,所述建筑物屋頂類型輸出模塊用于將所述全局特征向量輸入所述new_pct模型的分類器,輸出建筑物屋頂類型。
51、具體地,所述數(shù)據(jù)預(yù)處理模塊包括:
52、欠采樣子模塊,所述欠采樣子模塊用于對輸入的建筑物屋頂點云數(shù)據(jù)進行欠采樣處理:采用最遠點采樣算法,從所述輸入的建筑物屋頂點云數(shù)據(jù)中迭代選取距離已采樣點集最遠的點,直至所述輸入的建筑物屋頂點云數(shù)據(jù)中的點云數(shù)量降至第一預(yù)設(shè)閾值,生成降采樣點云;
53、過采樣子模塊,所述過采樣子模塊與所述欠采樣子模塊連接,所述過采樣子模塊用于對所述降采樣點云進行過采樣處理:識別所述降采樣點云中密度低于第二預(yù)設(shè)閾值的稀疏區(qū)域,對所述稀疏區(qū)域的每個目標點計算其k個最近鄰點的三維坐標均值生成插值點,將所述插值點補充至所述降采樣點云中,使總點數(shù)達到第三預(yù)設(shè)閾值,形成過采樣增強點云;
54、數(shù)據(jù)增強子模塊,所述數(shù)據(jù)增強子模塊與所述過采樣子模塊連接,所述數(shù)據(jù)增強子模塊用于對所述過采樣增強點云執(zhí)行數(shù)據(jù)增強處理以生成數(shù)據(jù)增強后的點云:對所述過采樣增強點云施加隨機旋轉(zhuǎn)變換,旋轉(zhuǎn)角度范圍為±15度,并沿三維坐標軸隨機平移±0.1米距離,同時按0.8至1.2倍比例縮放點云坐標,生成數(shù)據(jù)增強后的點云。
55、具體地,所述數(shù)據(jù)預(yù)處理模塊還包括:
56、標注與均衡子模塊,所述標注與均衡子模塊與所述數(shù)據(jù)增強子模塊連接,所述標注與均衡子模塊用于標注并平衡樣本以獲取標注且均衡后的點云數(shù)據(jù):為所述數(shù)據(jù)增強后的點云標注17種屋頂類型標簽;統(tǒng)計各類型樣本數(shù)量,刪除同類型中與所述k個最近鄰點在增強后坐標空間中的平均距離低于第四預(yù)設(shè)閾值的冗余樣本,并通過k近鄰插值補充不足類型的樣本,直至所有類型的樣本數(shù)量均衡至6460個;
57、預(yù)處理后屋頂點云數(shù)據(jù)輸出子模塊,所述預(yù)處理后屋頂點云數(shù)據(jù)輸出子模塊與所述標注與均衡子模塊連接,所述預(yù)處理后屋頂點云數(shù)據(jù)輸出子模塊用于將所述標注且均衡后的點云數(shù)據(jù)作為所述預(yù)處理后屋頂點云數(shù)據(jù)輸出。
58、本技術(shù)提供的基于三維點云的建筑物識別方法及系統(tǒng),該方法先對建筑物屋頂點云數(shù)據(jù)實施欠采樣、過采樣及數(shù)據(jù)增強預(yù)處理,再利用t-net網(wǎng)絡(luò)對預(yù)處理后數(shù)據(jù)進行空間對齊,生成對齊后的點云數(shù)據(jù)。接著改進pct模型得到new_pct模型,將對齊數(shù)據(jù)輸入該模型,通過其線性編碼層生成點云特征矩陣,線性變換后得到查詢、鍵、值矩陣,并引入偏置矩陣計算多頭注意力輸出,拼接融合得中間關(guān)聯(lián)特征,經(jīng)全局最大池化生成全局特征向量。最終將該向量輸入分類器,輸出建筑物屋頂類型。此方法有效克服傳統(tǒng)方法中旋轉(zhuǎn)平移敏感、局部信息丟失及樣本偏差導(dǎo)致的識別性能瓶頸,提升三維點云建筑物識別的精度與魯棒性。