本發(fā)明涉及一種實時帶鋼表面缺陷檢測方法。
背景技術(shù):
1、在現(xiàn)代制造業(yè)體系中,帶鋼作為金屬工業(yè)的重要核心產(chǎn)品,廣泛應(yīng)用于建筑、汽車、高端機械制造、航空航天及電子封裝等多個領(lǐng)域,構(gòu)成了工業(yè)生產(chǎn)與國防建設(shè)的關(guān)鍵基礎(chǔ)。伴隨精密制造、智能化生產(chǎn)以及高端裝備制造業(yè)的快速發(fā)展,市場對帶鋼產(chǎn)品的表面質(zhì)量、安全穩(wěn)定性和一致性提出了更高要求。生產(chǎn)過程中,原料金相組織、軋制參數(shù)及在線環(huán)境光照等多因素耦合作用,常導(dǎo)致裂紋、剝離、劃痕與凹坑等表面缺陷,這不僅增加后續(xù)熱處理與涂層工藝成本,也嚴重威脅終端產(chǎn)品的可靠性。因此,帶鋼缺陷檢測技術(shù)對于提高產(chǎn)品質(zhì)量和制造效率具有重要意義。
2、自20世紀(jì)末以來,學(xué)界與產(chǎn)業(yè)界先后提出了多種帶鋼缺陷檢測技術(shù),涵蓋渦流檢測、紅外成像、漏磁法及人工目視檢查等傳統(tǒng)手段,然而這些方法往往存在檢測成本高、覆蓋范圍受限及實時性能不足等問題。隨著計算機視覺、深度學(xué)習(xí)與邊緣計算技術(shù)的快速推進,基于目標(biāo)檢測的實時視覺檢測系統(tǒng)已成為研究與應(yīng)用的主流。
3、目標(biāo)檢測(object?detection)作為計算機視覺領(lǐng)域的重要研究方向,起源較早。在深度學(xué)習(xí)廣泛應(yīng)用之前,該領(lǐng)域主要依賴于基于圖像處理與傳統(tǒng)機器學(xué)習(xí)方法構(gòu)建的檢測框架。相關(guān)研究大致可分為三類:其一,基于人工設(shè)計特征的圖像處理方法,如局部二值模式(local?binary?pattern,?lbp)、方向梯度直方圖(histogram?of?orientedgradient,?hog)、灰度共生矩陣(gray-level?co-occurrence?matrix,?glcm)等,用于提取圖像中表面缺陷的低層次特征;其二,基于頻域與統(tǒng)計特征提取的傳統(tǒng)信號處理方法,包括傅里葉變換、小波變換及gabor濾波器等;其三,采用經(jīng)典機器學(xué)習(xí)模型進行缺陷判別的算法,如決策樹、自回歸模型等。上述方法雖在金屬表面缺陷檢測中取得了一定進展,但由于傳統(tǒng)圖像特征對光照條件、背景噪聲等因素敏感,且淺層特征在復(fù)雜場景下表征能力有限,導(dǎo)致檢測性能存在明顯瓶頸。因此,盡管諸多學(xué)者提出了各類基于傳統(tǒng)機器學(xué)習(xí)的檢測模型,其在實際工業(yè)環(huán)境中的推廣應(yīng)用仍受較大限制。
4、近年來,隨著人工智能技術(shù)的快速發(fā)展及圖形處理器(gpu)計算能力的顯著提升,深度學(xué)習(xí)技術(shù)在金屬表面缺陷檢測領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。卷積神經(jīng)網(wǎng)絡(luò)(convolutional?neural?network,?cnn)憑借其端到端的特征自動提取能力,在目標(biāo)檢測與圖像分類任務(wù)中表現(xiàn)出優(yōu)異性能,受到廣泛關(guān)注。目前,已有大量研究嘗試將深度學(xué)習(xí)方法引入金屬表面缺陷檢測任務(wù)中。lin等人提出了一種基于mobilenet的多模型級聯(lián)cnn結(jié)構(gòu),旨在提高工業(yè)光學(xué)缺陷檢測中的精度表現(xiàn),盡管未考慮實時性問題;li等人構(gòu)建了一個參數(shù)復(fù)雜的集成模型,用于提升工業(yè)鐵路缺陷的檢測能力;zhou等人將注意力機制引入yolov5s網(wǎng)絡(luò)結(jié)構(gòu),有效提升了模型在復(fù)雜場景下的檢測精度;zhang等人將輕量化卷積層gsconv融合至yolov5s中,以犧牲部分精度為代價提升了帶鋼缺陷的檢測速度;lv等人基于yolov7設(shè)計了高精度的帶鋼表面缺陷檢測模型;li等人進一步在yolov7的基礎(chǔ)上精簡模型復(fù)雜度,同時保持較強的檢測能力;wu等人通過引入輕量化卷積與注意力機制,對yolov5n進行了結(jié)構(gòu)優(yōu)化,構(gòu)建了高效輕量的鋼材表面缺陷檢測框架,但判別準(zhǔn)確率低。
5、盡管上述研究在提升模型性能方面取得了一定進展,但現(xiàn)有方法在檢測精度與檢測效率之間尚未實現(xiàn)理想平衡。此外,這些模型多基于理想實驗環(huán)境下構(gòu)建的數(shù)據(jù)集進行訓(xùn)練與評估,難以應(yīng)對實際應(yīng)用中諸如過度曝光、亮度不均等干擾因素的挑戰(zhàn)。尤其在帶鋼表面缺陷檢測等典型工業(yè)場景中,檢測系統(tǒng)面臨極高的魯棒性與實時性要求,現(xiàn)有深度學(xué)習(xí)模型尚難以在復(fù)雜工況下同時滿足檢測精度與速度的雙重需求,亟需進一步優(yōu)化與突破。
6、因此,提供一種實時帶鋼表面缺陷檢測方法。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種實時帶鋼表面缺陷檢測方法,在保持卓越檢測性能與高速推理能力的同時,顯著降低了模型參數(shù)量與計算復(fù)雜度,能夠滿足金屬鍛造工業(yè)對在線檢測系統(tǒng)的嚴苛需求。
2、實現(xiàn)上述目的的技術(shù)方案是:
3、一種實時帶鋼表面缺陷檢測方法,包括:
4、步驟s1,選擇neu-det作為表面缺陷檢測數(shù)據(jù)集,并將數(shù)據(jù)集按照8:2的比例隨機劃分出訓(xùn)練集和測試集;
5、步驟s2,對表面缺陷檢測數(shù)據(jù)集進行預(yù)處理;
6、步驟s3,以yolov8n為基礎(chǔ),構(gòu)建缺陷檢測模型steelguard-yolo;
7、步驟s4,通過訓(xùn)練集對缺陷檢測模型steelguard-yolo進行訓(xùn)練,并利用訓(xùn)練后的缺陷檢測模型steelguard-yolo對測試集進行檢測,輸出檢測結(jié)果;
8、所述步驟s3中,構(gòu)建缺陷檢測模型steelguard-yolo,包括:
9、在yolov8n框架的骨干網(wǎng)絡(luò)中,引入gsconv(輕量級的卷積技術(shù))代替?zhèn)鹘y(tǒng)卷積層conv,且gsconv融合標(biāo)準(zhǔn)卷積與深度可分離卷積結(jié)構(gòu);
10、gsconv?在保持與標(biāo)準(zhǔn)卷積相當(dāng)?shù)奶卣鲗W(xué)習(xí)能力的同時,引入分組位移操作與點卷積融合,進而得到?gsresbottleneck(結(jié)合了網(wǎng)格采樣技術(shù)和殘差瓶頸結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模塊)結(jié)構(gòu);
11、在gsresbottleneck結(jié)構(gòu)的基礎(chǔ)上,結(jié)合廣義深度學(xué)習(xí)優(yōu)化策略及?one-shot聚合思想,設(shè)計resgscsp模塊;
12、在yolov8n框架的neck(頸部)結(jié)構(gòu)中引入多尺度協(xié)同注意力機制msca,置于sppf(空間金字塔池化快速)模塊之前,并采用輕量化dysample上采樣方法替代原有的最近鄰插值方式;
13、最后,在損失函數(shù)設(shè)計方面,引入focal?loss(深度學(xué)習(xí)損失函數(shù)),對易分類樣本與難分類樣本動態(tài)賦予不同權(quán)重。
14、優(yōu)選的,所述步驟s1中,neu-det(東北大學(xué)表面缺陷檢測數(shù)據(jù)集)包括裂紋、夾雜物、補丁、凹凸表面、卷曲氧化物和劃痕六類典型缺陷,每類均收錄300幅分辨率為200×200像素的灰度圖像。
15、優(yōu)選的,所述步驟s2中,預(yù)處理操作包括但不限于數(shù)據(jù)增強處理。
16、優(yōu)選的,所述步驟s3中,gsresbottleneck結(jié)構(gòu)和resgscsp模塊均引入了殘差連接,計算表達式為:
17、;
18、式中,和分別為殘差塊的輸入與輸出,為一系列g(shù)sconv、激活函數(shù)與歸一化操作。
19、優(yōu)選的,所述步驟s3中,引入多尺度協(xié)同注意力機制msca,設(shè)輸入特征圖張量為:
20、;
21、式中,為通道數(shù)與空間尺寸,和分別為輸入特征圖的空間維度,即特征圖的高度和寬度,多尺度注意力機制msca首先在通道維度上將劃分為組子特征,即:
22、;
23、對每組特征分別執(zhí)行一維水平與垂直方向的自適應(yīng)平均池化以獲取空間上下文:
24、;
25、;
26、式中,為第組在水平第行的平均特征值,為第行第列的位置索引,為第組在垂直第列的平均特征值;
27、再分別加入可學(xué)習(xí)的位置編碼向量,構(gòu)建位置信息增強特征:
28、;
29、;
30、式中,為注入水平位置編碼后的池化特征,為原始水平池化結(jié)果,為可學(xué)習(xí)的水平位置編碼向量,為注入垂直位置編碼后的池化特征,為原始垂直池化結(jié)果,為可學(xué)習(xí)的垂直位置編碼向量;
31、上述兩個方向的特征拼接為二維表征:
32、;
33、式中,為特征拼接操作;
34、依次施加深度可分離卷積以捕捉長短距離聯(lián)合空間依賴:
35、;
36、;
37、式中,為經(jīng)dwconv后的特征響應(yīng),為經(jīng)pwconv后的特征響應(yīng),為對做深度可分離卷積,為對做逐點卷積;
38、再通過?sigmoid?激活生成空間注意力權(quán)重:
39、;
40、;
41、式中,為水平空間注意力權(quán)重,為對前行特征做sigmoid激活后的結(jié)果,為垂直空間注意力權(quán)重,為對后行特征做sigmoid并轉(zhuǎn)置后的結(jié)果,為轉(zhuǎn)置操作;
42、得到空間加權(quán)輸出:
43、;
44、對進行通道壓縮以提取全局通道語義:
45、;
46、式中,為通道壓縮操作;
47、輸入兩層逐點卷積網(wǎng)絡(luò)進行門控變換:
48、;
49、式中,為通道門控系數(shù)向量;
50、其中權(quán)重維度為:
51、;
52、;
53、激活函數(shù)為:
54、;
55、;
56、最終通道加權(quán)特征表示為:
57、;
58、對應(yīng)用卷積整合空間-通道特征,并與原始特征相加,實現(xiàn)高效融合:
59、;
60、為增強信息流的有效傳遞,進一步通過殘差注意力機制對融合后的特征進行自適應(yīng)加權(quán):
61、;
62、式中,為自適應(yīng)加權(quán)函數(shù),能夠動態(tài)地根據(jù)輸入特征的重要性分配不同的權(quán)重。
63、最終輸出特征為:
64、。
65、優(yōu)選的,所述步驟s3中,采用輕量化dysample上采樣方法替代原有的最近鄰插值方式,包括:
66、采用grid_sample函數(shù),以采樣集提供的坐標(biāo)對輸入特征圖進行重采樣,該過程基于雙線性插值方法,實現(xiàn)特征映射,生成新特征圖,具體定義如下:
67、;
68、設(shè)上采樣比例因子為,通過一層線性變換將通道數(shù)由映射至,生成偏移量張量:
69、;
70、隨后,借助pixel?shuffle操作將偏移量張量重排為尺寸為的坐標(biāo)偏移場,并與原始規(guī)則采樣網(wǎng)格相加,得到動態(tài)采樣集:
71、;
72、;
73、最后,利用基于的雙線性插值函數(shù)對進行重采樣,直接生成高分辨率特征圖。
74、優(yōu)選的,所述步驟s3中,在損失函數(shù)設(shè)計方面,引入focal?loss,對易分類樣本與難分類樣本動態(tài)賦予不同權(quán)重,包括:
75、設(shè)標(biāo)準(zhǔn)的多類別交叉熵損失函數(shù)定義為:
76、;
77、式中,為模型輸出的第類的預(yù)測概率,為實際標(biāo)簽;
78、在損失函數(shù)基礎(chǔ)上,通過引入調(diào)制系數(shù),使網(wǎng)絡(luò)在訓(xùn)練過程中更加側(cè)重于預(yù)測置信度低、難分樣本的梯度反饋,其形式表示為:
79、;
80、式中,為可調(diào)超參數(shù);
81、當(dāng)某樣本被錯誤分類時,值較小,此時調(diào)制系數(shù)接近?1,與標(biāo)準(zhǔn)交叉熵損失保持一致;
82、對于易分樣本,值較大,調(diào)制系數(shù)趨近于0,從而顯著降低其對總損失的貢獻。
83、與現(xiàn)有技術(shù)對比,本發(fā)明具備以下有益效果:
84、本發(fā)明基于gsconv提出了gsresbottleneck,并結(jié)合one-shot聚合策略設(shè)計了一種高效的跨階段部分網(wǎng)絡(luò)(csp)模塊resgscsp,在提高檢測精度的同時,降低了計算復(fù)雜度與推理時間;
85、本發(fā)明在spff層之前引入多尺度協(xié)同注意力機制msca,以強化模型對關(guān)鍵特征的聚焦能力,提升特征表達與魯棒性,并進一步增強跨尺度目標(biāo)的泛化性能;
86、本發(fā)明在頸部網(wǎng)絡(luò)中,采用dysample上采樣替代傳統(tǒng)最近鄰上采樣,以生成更高質(zhì)量的特征圖,增強了模型的深度特征融合能力;
87、本發(fā)明引入focal?loss作為損失函數(shù),通過對易分類樣本與困難樣本動態(tài)分配不同權(quán)重,顯著提升了難分缺陷樣本的識別精度與整體模型的魯棒性;
88、綜上,本發(fā)明考慮了帶鋼生產(chǎn)中的干擾因素,對原始數(shù)據(jù)使用對比度擾動、亮度擾動及高斯噪聲等5種數(shù)據(jù)干擾方法,以測試?steelguard-yolo?方法的魯棒性,結(jié)果表明,steelguard-yolo?具有先進的泛化性能,使其適用于真實的生產(chǎn)環(huán)境,有效提高了帶鋼生產(chǎn)的質(zhì)量和效率。