99久久精品国产一区二区狐狸,99福利在线观看,国产精品毛片在线,成人影院亚洲,日韩精品第一,天天躁日日躁性色aⅴ电影,午夜毛片网

圖像檢測模型的訓練方法、圖像檢測方法及裝置與流程

文檔序號:41980653發(fā)布日期:2025-05-23 16:30閱讀:7來源:國知局

本技術實施例涉及人工智能,特別涉及一種圖像檢測模型的訓練方法、圖像檢測方法及裝置。


背景技術:

1、隨著人工智能技術的不斷發(fā)展,圖像檢測技術被應用在自動駕駛、醫(yī)學、工業(yè)等多個行業(yè)中。圖像檢測技術是一種對給定圖像進行檢測,以確定圖像中是否存在特定對象的技術。

2、相關技術中,可以通過圖像檢測模型來實現圖像檢測。一般情況下,可以先通過圖像檢測模型對給定圖像進行框定,得到多個圖像區(qū)域。接著,通過圖像檢測模型對各個圖像區(qū)域進行分類,得到各個圖像區(qū)域屬于多個候選對象類別的概率。之后,對于任一個圖像區(qū)域,將最大的概率對應的候選對象類別作為該圖像區(qū)域所屬的對象類別。如果存在特定對象類別的圖像區(qū)域,則確定圖像中存在特定對象。

3、然而,當需要新增候選對象類別時,上述技術需要重新構造神經網絡模型,并對神經網絡模型進行訓練得到圖像檢測模型。由于模型訓練需要一定的迭代時間,影響了圖像的檢測效率。


技術實現思路

1、本技術提供了一種圖像檢測模型的訓練方法、圖像檢測方法及裝置,可以訓練得到對任意類別的對象進行圖像檢測的圖像檢測模型,提高圖像檢測效率,所述技術方案包括如下內容。

2、第一方面,提供了一種圖像檢測模型的訓練方法,所述方法包括:

3、獲取樣本圖像和樣本類別文本,所述樣本圖像包括至少一個樣本對象,所述樣本類別文本是有關所述至少一個樣本對象中的指定對象所屬的類別的文本;

4、通過神經網絡模型基于所述樣本圖像,確定至少一個樣本子圖像的參數,所述樣本子圖像是所述樣本圖像中包含所述樣本對象的圖像區(qū)域;

5、對于任一個樣本子圖像,通過所述神經網絡模型基于所述樣本類別文本和所述任一個樣本子圖像的參數,確定所述任一個樣本子圖像的預測相似信息,所述預測相似信息用于表征所述任一個樣本子圖像包含的樣本對象所屬類別與所述指定對象所屬類別之間的相似程度;

6、基于各個樣本子圖像的預測相似信息,對所述神經網絡模型進行訓練,得到圖像檢測模型,所述圖像檢測模型用于檢測參考圖像中是否存在目標類別的對象。

7、第二方面,提供了一種圖像檢測方法,所述方法包括:

8、獲取參考圖像和目標類別文本,所述參考圖像包括至少一個參考對象;

9、通過圖像檢測模型基于所述參考圖像,確定至少一個參考子圖像的參數,所述參考子圖像是所述參考圖像中包含所述參考對象的圖像區(qū)域,所述圖像檢測模型是按照第一方面所示的方法訓練得到的;

10、對于任一個參考子圖像,通過所述圖像檢測模型基于所述目標類別文本和所述任一個參考子圖像的參數,確定所述任一個參考子圖像的目標相似信息,所述目標相似信息用于表征所述任一個參考子圖像包括的參考對象所屬類別與所述目標類別文本涉及的目標類別之間的相似程度;

11、如果存在滿足相似信息條件的目標相似信息,確定所述參考圖像中存在所述目標類別的對象。

12、第三方面,提供了一種圖像檢測模型的訓練裝置,所述裝置包括:

13、獲取模塊,用于獲取樣本圖像和樣本類別文本,所述樣本圖像包括至少一個樣本對象,所述樣本類別文本是有關所述至少一個樣本對象中的指定對象所屬的類別的文本;

14、確定模塊,用于通過神經網絡模型基于所述樣本圖像,確定至少一個樣本子圖像的參數,所述樣本子圖像是所述樣本圖像中包含所述樣本對象的圖像區(qū)域;

15、所述確定模塊,還用于對于任一個樣本子圖像,通過所述神經網絡模型基于所述樣本類別文本和所述任一個樣本子圖像的參數,確定所述任一個樣本子圖像的預測相似信息,所述預測相似信息用于表征所述任一個樣本子圖像包含的樣本對象所屬類別與所述指定對象所屬類別之間的相似程度;

16、訓練模塊,用于基于各個樣本子圖像的預測相似信息,對所述神經網絡模型進行訓練,得到圖像檢測模型,所述圖像檢測模型用于檢測參考圖像中是否存在目標類別的對象。

17、在一種可能的實現方式中,所述確定模塊,用于通過所述神經網絡模型對所述樣本圖像進行特征提取,得到所述樣本圖像的特征;基于所述樣本圖像的特征,確定多個樣本候選框的參數和指標,所述樣本候選框的指標用于表征所述樣本圖像中所述樣本候選框的框選區(qū)域內包括所述樣本對象的可能性;對于任一個樣本候選框,如果所述任一個樣本候選框的指標滿足指標條件,將所述任一個樣本候選框的參數確定為一個樣本子圖像的參數。

18、在一種可能的實現方式中,所述確定模塊,用于通過所述神經網絡模型基于所述任一個樣本子圖像的參數對所述樣本圖像進行裁剪,得到所述任一個樣本子圖像;通過所述神經網絡模型基于所述樣本類別文本和所述任一個樣本子圖像,確定所述預測相似信息。

19、在一種可能的實現方式中,所述確定模塊,用于通過所述神經網絡模型對所述樣本類別文本進行特征提取,得到樣本類別特征;通過所述神經網絡模型對所述任一個樣本子圖像進行特征提取,得到所述任一個樣本子圖像的第一特征;基于所述樣本類別特征和所述任一個樣本子圖像的第一特征,確定所述預測相似信息。

20、在一種可能的實現方式中,所述確定模塊,用于通過所述神經網絡模型基于所述任一個樣本子圖像的參數對所述樣本圖像的特征進行裁剪,得到所述任一個樣本子圖像的第二特征;通過所述神經網絡模型基于所述樣本類別特征和所述任一個樣本子圖像的第二特征,確定所述預測相似信息。

21、在一種可能的實現方式中,所述訓練模塊,用于獲取各個樣本子圖像對應的標注類別信息,所述樣本子圖像對應的標注類別信息用于表征所述樣本子圖像包含的樣本對象與所述指定對象是否屬于同一類別;確定所述各個樣本子圖像對應的預測相似信息和標注類別信息之間的第一損失;基于所述第一損失,對所述神經網絡模型進行訓練,得到圖像檢測模型。

22、在一種可能的實現方式中,所述訓練模塊,用于獲取標注參數,所述標注參數用于表征所述樣本圖像中所述指定對象所在的圖像區(qū)域的尺寸和位置;對于任一個樣本子圖像,基于所述標注參數和所述任一個樣本子圖像的參數確定交并比,基于所述交并比確定所述任一個樣本子圖像的標注類別信息。

23、在一種可能的實現方式中,所述預測相似信息包括通過不同方式確定的第一相似信息和第二相似信息;

24、所述訓練模塊,用于基于第一子損失和第二子損失,確定第一損失;

25、其中,所述第一子損失是所述各個樣本子圖像對應的第一相似信息和標注類別信息之間的損失,所述第二子損失是所述各個樣本子圖像對應的第二相似信息和標注類別信息之間的損失。

26、在一種可能的實現方式中,所述訓練模塊,用于確定各個樣本子圖像的第一特征和第二特征之間的第二損失;基于所述第一損失和所述第二損失,對所述神經網絡模型進行訓練,得到圖像檢測模型。

27、在一種可能的實現方式中,所述訓練模塊,用于確定標注參數和各個樣本子圖像的參數之間的第三損失;基于所述第一損失和所述第三損失,對所述神經網絡模型進行訓練,得到圖像檢測模型。

28、第四方面,提供了一種圖像檢測裝置,所述裝置包括:

29、獲取模塊,用于獲取參考圖像和目標類別文本,所述參考圖像包括至少一個參考對象;

30、確定模塊,用于通過圖像檢測模型基于所述參考圖像,確定至少一個參考子圖像的參數,所述參考子圖像是所述參考圖像中包含所述參考對象的圖像區(qū)域,所述圖像檢測模型是按照第一方面所示的方法訓練得到的;

31、所述確定模塊,還用于對于任一個參考子圖像,通過所述圖像檢測模型基于所述目標類別文本和所述任一個參考子圖像的參數,確定所述任一個參考子圖像的目標相似信息,所述目標相似信息用于表征所述任一個參考子圖像包括的參考對象所屬類別與所述目標類別文本涉及的目標類別之間的相似程度;

32、所述確定模塊,還用于如果存在滿足相似信息條件的目標相似信息,確定所述參考圖像中存在所述目標類別的對象。

33、在一種可能的實現方式中,所述確定模塊,用于通過所述圖像檢測模型對所述參考圖像進行特征提取,得到所述參考圖像的特征;基于所述參考圖像的特征,確定多個參考候選框的參數和指標,所述參考候選框的指標用于表征所述參考圖像中所述參考候選框的框選區(qū)域內包括所述參考對象的可能性;對于任一個參考候選框,如果所述任一個參考候選框的指標滿足指標條件,將所述任一個參考候選框的參數確定為一個參考子圖像的參數。

34、在一種可能的實現方式中,所述確定模塊,用于通過所述圖像檢測模型基于所述任一個參考子圖像的參數對所述參考圖像進行裁剪,得到所述任一個參考子圖像;通過所述圖像檢測模型基于所述目標類別文本和所述任一個參考子圖像,確定所述目標相似信息。

35、在一種可能的實現方式中,所述確定模塊,用于通過所述圖像檢測模型基于所述任一個參考子圖像的參數對所述參考圖像的特征進行裁剪,得到所述任一個參考子圖像的第二特征;通過所述圖像檢測模型基于所述目標類別特征和所述任一個參考子圖像的第二特征,確定所述目標相似信息。

36、第五方面,提供了一種電子設備,所述電子設備包括處理器和存儲器,所述存儲器中存儲有至少一條計算機程序,所述至少一條計算機程序由所述處理器加載并執(zhí)行,以使所述電子設備實現上述第一方面或第二方面所示的方法。

37、第六方面,還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有至少一條計算機程序,所述至少一條計算機程序由處理器加載并執(zhí)行,以使電子設備實現上述第一方面或第二方面所示的方法。

38、第七方面,還提供了一種計算機程序,所述計算機程序為至少一條,至少一條計算機程序由處理器加載并執(zhí)行,以使電子設備實現上述第一方面或第二方面所示的方法。

39、第八方面,還提供了一種計算機程序產品,所述計算機程序產品中存儲有至少一條計算機程序,所述至少一條計算機程序由處理器加載并執(zhí)行,以使電子設備實現上述第一方面或第二方面所示的方法。

40、本技術提供的技術方案至少帶來如下有益效果:

41、本技術提供的技術方案中,通過神經網絡模型確定樣本子圖像的參數,并基于樣本類別文本和樣本子圖像的參數,確定預測相似信息,實現了確定樣本子圖像包含的樣本對象所屬類別與樣本類別文本對應的指定對象所屬類別之間的相似程度。在后續(xù)基于預測相似信息對神經網絡模型進行訓練得到圖像檢測模型時,圖像檢測模型和神經網絡模型的功能相同。也就是說,圖像檢測模型可以確定圖像包含的對象所屬類別與類別文本對應的對象所屬類別之間的相似程度,從而確定圖像是否包含類別文本對應的對象,實現對圖像進行任意類別的對象檢測。其中,樣本類別文本對應有限類別,而圖像檢測模型可以對圖像進行任意類別的對象檢測,擴大了應用場景,且,即使對圖像進行有限類別之外的其他類別的對象檢測,也無需進行模型迭代,節(jié)省了迭代時間,提高了圖像檢測效率。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1