一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法與流程

文檔序號(hào)：42592429發(fā)布日期：2025-07-29 17:45閱讀：20來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及自然語言處理，尤其涉及一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法。

背景技術(shù)：

1、在信息技術(shù)快速發(fā)展的背景下，企業(yè)與組織在日常運(yùn)營(yíng)中需要接收和處理大量結(jié)構(gòu)化或非結(jié)構(gòu)化的函件文本，如業(yè)務(wù)往來郵件、項(xiàng)目報(bào)告、審批記錄、投訴建議等。這些函件內(nèi)容來源廣泛、格式多樣，其語義層次復(fù)雜、結(jié)構(gòu)松散，往往包含多段、跨句甚至跨段落的信息關(guān)聯(lián)，且隨業(yè)務(wù)需求快速變化。

2、傳統(tǒng)的文本分析方法多依賴統(tǒng)計(jì)學(xué)習(xí)或基于規(guī)則的自然語言處理技術(shù)，通常采用關(guān)鍵詞匹配、主題模型或淺層情感分析等方式。這些方法在處理單一句子或標(biāo)準(zhǔn)格式文本時(shí)尚可適用，但在面對(duì)復(fù)雜語篇結(jié)構(gòu)、上下文依賴強(qiáng)、語言風(fēng)格不規(guī)范、表達(dá)方式靈活的實(shí)際函件時(shí)，往往難以準(zhǔn)確捕捉深層語義關(guān)系，尤其缺乏對(duì)上下文、時(shí)序、語境之間隱含關(guān)聯(lián)的建模能力，導(dǎo)致信息提取碎片化、響應(yīng)不連貫、擴(kuò)展能力差。

3、近年來，如bert、gpt等預(yù)訓(xùn)練大語言模型在自然語言處理任務(wù)中取得顯著進(jìn)展，具備強(qiáng)大的上下文理解能力和生成能力。但如何將其高效應(yīng)用于結(jié)構(gòu)松散、篇幅較長(zhǎng)的函件文本中，仍面臨以下關(guān)鍵挑戰(zhàn)：

4、1）文本結(jié)構(gòu)不清、信息密度不均，直接輸入大模型會(huì)造成“冗余+缺失”并存。

5、2）上下文之間存在語義橋接關(guān)系，但缺乏結(jié)構(gòu)化表達(dá)。

6、3）難以實(shí)現(xiàn)基于查詢的一次性檢索與集中響應(yīng)。

7、因此，提出一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法。

技術(shù)實(shí)現(xiàn)思路

1、鑒于上述現(xiàn)有技術(shù)狀況，提出了本申請(qǐng)。本申請(qǐng)的實(shí)施例提供了一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，具有高效捕捉復(fù)雜語義關(guān)聯(lián)、提升上下文理解連貫性、實(shí)現(xiàn)動(dòng)態(tài)信息聚合的優(yōu)點(diǎn)。

2、根據(jù)本申請(qǐng)的一個(gè)方面，提供了一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，包括：獲取多格式函件數(shù)據(jù)并轉(zhuǎn)換為帶時(shí)間戳的文本序列；對(duì)所述文本序列進(jìn)行語義分析和結(jié)構(gòu)處理，生成包含時(shí)序與上下文的文本塊集合；對(duì)所述文本塊進(jìn)行多任務(wù)訓(xùn)練與主題融合，生成綜合語義向量；基于所述綜合語義向量構(gòu)建動(dòng)態(tài)橋接圖，所述橋接圖通過語義與時(shí)序關(guān)聯(lián)性激活關(guān)聯(lián)文本塊；響應(yīng)用戶查詢，將激活的文本塊內(nèi)容拼接為上下文prompt并輸入大語言模型，獲取一次性生成的回答；接收新函件數(shù)據(jù)，根據(jù)所述新函件數(shù)據(jù)更新所述橋接圖。

3、與現(xiàn)有技術(shù)相比，采用根據(jù)本申請(qǐng)實(shí)施例的一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，可以通過動(dòng)態(tài)橋接圖關(guān)聯(lián)語義與時(shí)序信息，并基于上下文prompt實(shí)現(xiàn)大語言模型的精準(zhǔn)響應(yīng)，具有高效捕捉復(fù)雜語義關(guān)聯(lián)、提升上下文理解連貫性、實(shí)現(xiàn)動(dòng)態(tài)信息聚合的優(yōu)點(diǎn)。

技術(shù)特征：

1.一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，其特征在于，所述獲取多格式函件數(shù)據(jù)并轉(zhuǎn)換為帶時(shí)間戳的文本序列包括：

3.根據(jù)權(quán)利要求1所述的一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，其特征在于，所述對(duì)所述文本序列進(jìn)行語義分析和結(jié)構(gòu)處理，生成包含時(shí)序與上下文的文本塊集合包括：

4.根據(jù)權(quán)利要求3所述的一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，其特征在于，所述對(duì)所述候選句合并或拆分前還包括：

5.根據(jù)權(quán)利要求4所述的一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，其特征在于，所述語義增強(qiáng)處理包括：

6.根據(jù)權(quán)利要求5所述的一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，其特征在于，所述合并或拆分包括：

7.根據(jù)權(quán)利要求6所述的一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，其特征在于，所述多任務(wù)訓(xùn)練與主題融合包括：

8.根據(jù)權(quán)利要求1所述的一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，其特征在于，所述構(gòu)建動(dòng)態(tài)橋接圖包括：

9.根據(jù)權(quán)利要求1所述的一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，其特征在于，所述響應(yīng)用戶查詢，將激活的文本塊內(nèi)容拼接為上下文prompt輸入大語言模型，獲取一次性生成的回答包括：

10.根據(jù)權(quán)利要求1所述的一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，其特征在于，所述更新所述橋接圖包括：

技術(shù)總結(jié)
本發(fā)明公開了一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法，涉及自然語言處理技術(shù)領(lǐng)域，包括獲取多格式函件數(shù)據(jù)并轉(zhuǎn)換為帶時(shí)間戳的文本序列，對(duì)文本序列進(jìn)行語義分析和結(jié)構(gòu)處理，生成文本塊集合，對(duì)文本塊集合進(jìn)行多任務(wù)訓(xùn)練與主題融合，生成綜合語義向量，基于綜合語義向量構(gòu)建動(dòng)態(tài)橋接圖，橋接圖通過語義與時(shí)序關(guān)聯(lián)性激活關(guān)聯(lián)文本塊，響應(yīng)用戶查詢，將激活的文本塊內(nèi)容拼接為上下文Prompt并輸入大語言模型，獲取一次性生成的回答；其有益效果為：通過動(dòng)態(tài)橋接圖關(guān)聯(lián)語義與時(shí)序信息，并基于上下文Prompt實(shí)現(xiàn)大語言模型的精準(zhǔn)響應(yīng)，具有高效捕捉復(fù)雜語義關(guān)聯(lián)、提升上下文理解連貫性、實(shí)現(xiàn)動(dòng)態(tài)信息聚合的優(yōu)點(diǎn)。

技術(shù)研發(fā)人員：汪敏,朱傳瑞
受保護(hù)的技術(shù)使用者：安徽深核信息技術(shù)有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/7/28

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：汪敏,朱傳瑞
技術(shù)所有人：安徽深核信息技術(shù)有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

99久久精品国产一区二区狐狸,99福利在线观看,国产精品毛片在线,成人影院亚洲,日韩精品第一,天天躁日日躁性色aⅴ电影,午夜毛片网

一種多層動(dòng)態(tài)聚合的大語言模型驅(qū)動(dòng)的函件文本分析方法與流程