本發(fā)明涉及生物醫(yī)學(xué)圖像處理和深度學(xué)習(xí),具體而言,尤其涉及一種雙階段深度學(xué)習(xí)的高內(nèi)涵圖像雙核細胞自動識別方法。
背景技術(shù):
1、隨著數(shù)字化高內(nèi)涵成像技術(shù)的不斷發(fā)展,自動化的生物醫(yī)學(xué)圖像分析技術(shù)在醫(yī)學(xué)研究、毒理學(xué)研究及臨床診斷中都發(fā)揮了重要作用。傳統(tǒng)的細胞核分割與分類方法通常依賴于特定任務(wù)的參數(shù)手動設(shè)置,難以廣泛適用于各種高內(nèi)涵圖像分析任務(wù)。隨著深度學(xué)習(xí)技術(shù)的進步,許多新的方法得以應(yīng)用于生物醫(yī)學(xué)圖像分割領(lǐng)域,但在細胞核聚集和重疊等復(fù)雜場景下,現(xiàn)有技術(shù)仍面臨諸多挑戰(zhàn)。本技術(shù)能夠有效地對高內(nèi)涵圖像中的細胞核進行精確的分割和分類,為生物醫(yī)學(xué)和毒理學(xué)研究人員提供準確的細胞核輪廓和類別信息。這對于提高圖像分析的精度具有重要意義,能夠輔助研究人員進行更精準的分析和數(shù)據(jù)解讀,減輕人工分析的工作負擔(dān),確保分析結(jié)果的準確性和一致性,并為個性化醫(yī)療、藥物篩選及毒理學(xué)研究提供基礎(chǔ)數(shù)據(jù)支持,幫助醫(yī)生和研究人員根據(jù)患者或?qū)嶒災(zāi)P偷木唧w生物醫(yī)學(xué)特征制定個性化治療方案或評估毒性效應(yīng),提高研究和診斷的效果。
2、高內(nèi)涵成像技術(shù)能夠獲取高分辨率的圖像和同時獲取多個參數(shù)的圖像信息,顯示細胞和細胞器的微觀結(jié)構(gòu)和細節(jié)。這種高質(zhì)量的圖像對于研究細胞的形態(tài)、結(jié)構(gòu)和功能具有重要意義,有助于科學(xué)家深入理解細胞的生理和病理狀態(tài)。將高內(nèi)涵成像技術(shù)與深度學(xué)習(xí)相結(jié)合快速準確的雙核細胞檢測,對同時獲取多種毒性指標,用于高通量化合物毒性篩選具有重要價值。為實現(xiàn)大規(guī)模的細胞實驗,能夠快速識別和分類雙核細胞,為藥物篩選和毒性評估提供可靠的數(shù)據(jù)支持。
3、在毒理學(xué)研究過程中,基于細胞水平的體外篩選是快速篩查新污染物、化學(xué)品、藥品等物質(zhì)對生物造成異常影響過程或探究毒理學(xué)機理的重要分析手段。不同類型細胞亞型的變化尤其是雙核細胞的出現(xiàn)頻率與潛在毒性反應(yīng)的早期預(yù)警密切。傳統(tǒng)的雙核細胞檢測主要依賴于手動顯微鏡檢查,不僅耗時,而且缺乏客觀一致性。此外,在顯微鏡全切片圖像中,細胞亞型繁多,由于染色質(zhì)量低、細胞核重疊廣泛、類型內(nèi)與類型間形態(tài)差異輕微等各種因素,檢測這些細胞一直面臨挑戰(zhàn)性。近年來,基于圖像的高通量和高內(nèi)涵細胞成像技術(shù)為各種生命科學(xué)學(xué)科提供了新的發(fā)展機遇。利用高內(nèi)涵成像技術(shù)能快速、批量、自動地捕獲細胞、亞細胞或組織圖像,這些圖像具有高分辨率和高通量特點,可以捕捉到細胞的精細結(jié)構(gòu)和動態(tài)變化。
4、現(xiàn)有分析方法通常只能單一地滿足高通量或者高內(nèi)涵影像。一方面,超分辨成像保證了高內(nèi)涵,但其時間成本極大地限制了分析通量;另一方面,若想實現(xiàn)高通量分析,則只能通過降低分辨率節(jié)約時間成本,這將導(dǎo)致很多亞細胞結(jié)構(gòu)無法被有效分辨,限制了毒理學(xué)研究發(fā)展。盡管已有商業(yè)軟件,例如harmony和metaxpress等,可對高內(nèi)涵成像的細胞表型進行量化處理,批量實現(xiàn)圖片信息到數(shù)值信息的轉(zhuǎn)換,但由于顯微鏡中雙核細胞圖像特征復(fù)雜多樣,實現(xiàn)精確、高效的通用雙核細胞檢測仍具有挑戰(zhàn)性。因此,需要更穩(wěn)健、更通用的自動化處理方法來完善高內(nèi)涵成像分析技術(shù)。
5、傳統(tǒng)的圖像處理算法已被用于雙核細胞檢測。這些方法使用改進的分水嶺算法、種子區(qū)域增長、基于細胞大小、形狀(長寬比、相對凹凸深度等)和顏色特征規(guī)則的迭代閾值分割等來提取感興趣區(qū)域。但這些傳統(tǒng)的圖像處理方法通常受限于微核外圍小細胞核尺寸、細胞核與細胞質(zhì)對比度差、微核聚集、染色雜質(zhì)等因素。目前,已有一些基于深度學(xué)習(xí)的雙核細胞檢測工作,但這些方法主要為單細胞類型檢測,或僅能進行粗略進行雙核細胞分類(正常/異常),且識別準確率低。實際應(yīng)用場景中,復(fù)雜的顯微鏡環(huán)境使設(shè)計魯棒算法變得十分困難,需要進一步加速檢測,以滿足大樣本組學(xué)數(shù)據(jù)快速檢測的需求。
6、近年來,深度學(xué)習(xí)被應(yīng)用于雙核細胞的檢測。將空間變換網(wǎng)絡(luò)與通用卷積神經(jīng)網(wǎng)絡(luò)(cnn)相結(jié)合來輔助識別,其可校正圖像以填滿整個視野,為異常雙核細胞的圖像識別創(chuàng)造更好的環(huán)境。此外,異常雙核細胞數(shù)量相對較少、數(shù)據(jù)人工標注成本高導(dǎo)致雙核細胞的分類更適合于遷移學(xué)習(xí)技術(shù)。比較在imagenet上通過遷移學(xué)習(xí)初始化的各種深度cnn,以對異常雙核細胞圖像和正常雙核細胞圖像進行分類。上述工作僅側(cè)重于粗粒度檢測。在異常雙核細胞檢測中,很少有工作涉及雙核細胞進一步分型的精細檢測,大部分工作集中在正常雙核細胞或微核的檢測,不夠全面。因此,現(xiàn)有深度學(xué)習(xí)的相關(guān)工作在雙核細胞檢測和分類方面的表現(xiàn)仍受到限制。
7、當前,深度學(xué)習(xí)存在多種經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),其中深度殘差網(wǎng)絡(luò)(resnet)在圖像分類任務(wù)中表現(xiàn)突出。例如,resnet50是基于vgg19網(wǎng)絡(luò)優(yōu)化而來,通過引入短路連接機制實現(xiàn)殘差學(xué)習(xí),其關(guān)鍵改進包括直接使用步長為2的卷積進行下采樣,并用全局池化層代替?zhèn)鹘y(tǒng)的全連接層。這種設(shè)計在保持網(wǎng)絡(luò)復(fù)雜度的同時,顯著提高了模型性能。resnet50模型的一大特點是:當特征圖尺寸縮小一半時,特征通道數(shù)會相應(yīng)翻倍,從而有效提升特征表達能力。此外,憑借短路機制的引入,resnet50顯著降低了梯度消失問題,在imagenet測試集上的分類錯誤率僅為3.6%。
8、yolov8是yolo系列中一個重要版本,具有多個創(chuàng)新和顯著優(yōu)點。相較于早期版本,yolov8在目標檢測精度、速度和魯棒性上均有顯著提升,其目標檢測性能進一步優(yōu)化,延續(xù)了端到端設(shè)計的優(yōu)勢,集成了更加靈活高效的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)。與其他yolo模型類似,yolov8通過將輸入圖像劃分為網(wǎng)格,由網(wǎng)格單元負責(zé)檢測其范圍內(nèi)目標的中心點位置。同時,yolov8使用更輕量化的模型架構(gòu)和動態(tài)任務(wù)分配策略,以提高檢測速度和精度。yolov8的卷積神經(jīng)網(wǎng)絡(luò)可以高效提取圖像特征,結(jié)合分類任務(wù)輸出預(yù)測結(jié)果,從而實現(xiàn)快速且精準的目標檢測。yolov8的主要優(yōu)勢還體現(xiàn)在以下三個方面:(1)采用端到端設(shè)計,模型更加簡潔高效,顯著提升了推理速度;(2)通過對整張圖像進行卷積操作,檢測時感受野更大,能夠有效減少背景干擾所導(dǎo)致的誤判;(3)yolov8在遷移學(xué)習(xí)任務(wù)中展現(xiàn)出優(yōu)異的魯棒性,適用于多種目標檢測場景。
技術(shù)實現(xiàn)思路
1、根據(jù)上述提出現(xiàn)有技術(shù)中存在的手動計數(shù)耗時、主觀性強以及商用軟件檢測精度不足的技術(shù)問題,提供一種雙階段深度學(xué)習(xí)的高內(nèi)涵圖像雙核細胞自動識別方法,用于高內(nèi)涵成像技術(shù)的雙核細胞自動檢測識別,不僅克服了傳統(tǒng)方法中因低分辨率圖像帶來的誤差、顯著提升了細胞核分割和分類的效率和準確性,還在生物醫(yī)學(xué)顯微圖像分析、高通量毒性篩選、環(huán)境毒理學(xué)研究等領(lǐng)域具有廣泛的應(yīng)用前景。該技術(shù)為自動化高內(nèi)涵圖像細胞核識別提供了一種高效、可靠的解決方案,推動了計算毒理學(xué)的進一步發(fā)展。
2、本發(fā)明采用的技術(shù)手段如下:
3、一種雙階段深度學(xué)習(xí)的高內(nèi)涵圖像雙核細胞自動識別方法,包括:
4、s1、采用高內(nèi)涵成像技術(shù)采集細胞圖像,獲取細胞圖像數(shù)據(jù)集,并對細胞圖像數(shù)據(jù)集進行預(yù)處理;
5、s2、基于yolov8深度學(xué)習(xí)網(wǎng)絡(luò),構(gòu)建yolov8雙核細胞粗檢測模型,并使用訓(xùn)練集和驗證集對雙核細胞粗檢測模型進行訓(xùn)練;
6、s3、將需要檢測的細胞圖像送入訓(xùn)練后的yolov8雙核細胞粗檢測模型中,優(yōu)化訓(xùn)練后的yolov8雙核細胞粗檢測模型,得到預(yù)測結(jié)果;
7、s4、將步驟s2得到的預(yù)測結(jié)果進行處理,得到粗檢測階段的雙核細胞圖像塊;
8、s5、基于雙核細胞圖像塊,將標簽中的雙核細胞感興趣區(qū)域進行裁剪和歸一化處理;
9、s6、基于擴散模型,對步驟s5處理后的數(shù)據(jù)進行數(shù)據(jù)增強,生成雙核細胞roi圖像數(shù)據(jù)集;
10、s7、基于resnet50網(wǎng)絡(luò),構(gòu)建resnet50雙核細胞細檢測模型,將雙核細胞roi圖像送入雙核細胞細檢測模型進行訓(xùn)練,得到預(yù)測結(jié)果;
11、s8、將步驟s7得到的預(yù)測結(jié)果與步驟s4粗檢測階段的細胞核分類結(jié)果進行整合,輸出最終分類結(jié)果。
12、進一步地,步驟s1,具體包括:
13、s11、通過高通量細胞核、細胞組學(xué)試驗獲取高內(nèi)涵圖像數(shù)據(jù);
14、s12、對高內(nèi)涵成像獲取的高內(nèi)涵圖像數(shù)據(jù)進行歸一化校正,包括圖像大小和像素大小歸一化、圖像亮度歸一化;
15、s13、將歸一化校正后的數(shù)據(jù)集劃分為訓(xùn)練集、驗證集和測試集,并人工標注每張圖像中的雙核細胞位置和類別。
16、進一步地,步驟s2,具體包括:
17、基于形態(tài)學(xué)參數(shù)對不同表型的細胞進行分群、分類,使用高內(nèi)涵圖像中提取的細胞核形態(tài)學(xué)參數(shù)和熒光表達強度,結(jié)合yolov8深度學(xué)習(xí)網(wǎng)絡(luò)進行分類預(yù)測。
18、進一步地,在步驟s2中,所述yolov8雙核細胞粗檢測模型通過骨干網(wǎng)絡(luò)、頸部以及檢測頭協(xié)同工作,實現(xiàn)高效的目標檢測,具體如下:
19、所述骨干網(wǎng)絡(luò)通過下采樣、c2f模塊、sppf模塊和卷積層進行初步的特征提取;
20、所述頸部通過上采樣、特征拼接和c2f模塊進行特征融合和增強;
21、所述檢測頭利用多層卷積堆疊,結(jié)合box和cls損失函數(shù),精確預(yù)測目標的位置和類別。
22、進一步地,步驟s3,具體包括:
23、將測試集圖像輸入步驟s2訓(xùn)練好的yolov8雙核細胞粗檢測模型,yolov8雙核細胞粗檢測模型輸出的預(yù)測結(jié)果分別為不同表型細胞亞群預(yù)測邊界框、類別概率、置信度分數(shù),其中:
24、預(yù)測邊界框包括每類細胞核邊界框的位置和尺寸信息,表示為[x_min,y_min,x_max,y_max]或中心點格式[x_center,y_center,width,height];邊界框的信息以浮點型數(shù)組的形式存儲;
25、類別概率為每個邊界框所屬細胞核類別的概率分布,概率分布以浮點型數(shù)組形式表示,輸出為一個向量,包含每個類別的概率值;
26、置信度分數(shù)為每個預(yù)測邊界框的置信度分數(shù),置信度分數(shù)以浮點型值形式表示預(yù)測的邊界框包含目標的概率。
27、進一步地,步驟s4,具體包括:
28、步驟s41、根據(jù)驗證集的評估結(jié)果,對yolov8雙核細胞粗檢測模型的參數(shù)進行調(diào)優(yōu),提升檢測性能;
29、步驟s42、在測試集上進行實驗評估,計算yolov8雙核細胞粗檢測模型的召回率、精度、f1分數(shù)和map@0.5值,最后將結(jié)果進行可視化。
30、進一步地,步驟s5,具體包括:
31、s51、從粗檢測階段提取的雙核細胞圖像塊中篩選出正常和異常細胞,包括微核、核芽、核質(zhì)橋的雙核細胞,并對篩選出的圖像進行歸一化處理;
32、s52、將步驟s51結(jié)果中雙核細胞標簽的圖像塊進行裁剪,剪切成統(tǒng)一大小1280×1280像素,并使裁剪后的圖像塊處于圖像正中間。
33、進一步地,步驟s6,具體包括:
34、s61、利用現(xiàn)有標注數(shù)據(jù)訓(xùn)練擴散模型,通過噪聲添加與去噪的逐步學(xué)習(xí)過程,讓擴散模型生成符合細胞形態(tài)分布的新樣本;
35、s62、使用訓(xùn)練好的擴散模型從隨機噪聲或部分噪聲圖像中生成具有多樣化特征的雙核細胞圖像,生成的雙核細胞圖像在細胞核大小、形狀及異常特征上表現(xiàn)出廣泛的變異性;
36、s63、通過人工篩查或自動質(zhì)量評估工具剔除低質(zhì)量樣本,僅保留高質(zhì)量數(shù)據(jù),并將高質(zhì)量數(shù)據(jù)與原始數(shù)據(jù)結(jié)合,生成雙核細胞roi圖像數(shù)據(jù)集。
37、進一步地,步驟s7中,resnet50網(wǎng)絡(luò)的主要結(jié)構(gòu)為殘差單元,包括卷積層、池化層、歸一化層。
38、較現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點:
39、1、本發(fā)明提供的一種雙階段深度學(xué)習(xí)的高內(nèi)涵圖像雙核細胞自動識別方法,能夠?qū)崿F(xiàn)對高內(nèi)涵成像細胞核的精準檢測與分類,顯著提升檢測效率和可靠性。高內(nèi)涵成像技術(shù)具備高分辨率和高通量優(yōu)勢,能夠捕捉細胞的精細結(jié)構(gòu)及其動態(tài)變化。
40、2、本發(fā)明提供的一種雙階段深度學(xué)習(xí)的高內(nèi)涵圖像雙核細胞自動識別方法,通過結(jié)合yolov8深度學(xué)習(xí)模型和resnet50模型,設(shè)計了一種雙階段雙核細胞自動檢測與分類方法;在粗檢測階段,yolov8模型以高效的檢測能力對雙核細胞進行初步定位和粗分類,其改進的特征提取模塊,如c2f和sppf,增強了對細胞核特征的表達能力,大幅提高了檢測速度和精度。在細檢測階段,利用resnet50模型進行深層特征提取,進一步實現(xiàn)正常雙核細胞與異常雙核細胞,包括微核、核芽、核質(zhì)橋的精確分類。與此同時,數(shù)據(jù)增強技術(shù)(擴散模型)的引入,通過生成具有多樣化特征的雙核細胞圖像,擴展了訓(xùn)練數(shù)據(jù)集,有效提升了模型的魯棒性和適應(yīng)性。
41、3、本發(fā)明提供的一種雙階段深度學(xué)習(xí)的高內(nèi)涵圖像雙核細胞自動識別方法,不僅適用于多種復(fù)雜細胞圖像場景,還能在高通量毒性篩選中展現(xiàn)卓越表現(xiàn),為生物醫(yī)學(xué)研究提供了一種快速、精準且高度自動化的解決方案。通過整合高內(nèi)涵成像技術(shù)和雙階段深度學(xué)習(xí)模型,本發(fā)明在提高數(shù)據(jù)處理效率的同時,確保了檢測結(jié)果的可靠性,為大規(guī)模細胞研究、藥物篩選及環(huán)境毒性評估提供了重要支持。
42、基于上述理由本發(fā)明可在生物醫(yī)學(xué)圖像處理和深度學(xué)習(xí)等領(lǐng)域廣泛推廣。