99久久精品国产一区二区狐狸,99福利在线观看,国产精品毛片在线,成人影院亚洲,日韩精品第一,天天躁日日躁性色aⅴ电影,午夜毛片网

一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng)的制作方法

文檔序號:41983965發(fā)布日期:2025-05-23 16:38閱讀:8來源:國知局

本發(fā)明涉及操作系統(tǒng)與人工智能融合,具體地說是一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng)。


背景技術(shù):

1、隨著智能體技術(shù)向桌面端加速滲透,現(xiàn)有技術(shù)體系在國產(chǎn)化適配、安全可信及生態(tài)協(xié)同等方面暴露的缺陷已嚴(yán)重制約我國信息技術(shù)自主化進(jìn)程,具體表現(xiàn)為三大核心瓶頸:

2、一、協(xié)議生態(tài)的割裂性:目前智能體工具普遍采用私有通信協(xié)議(如mcp的json-rpc與anp的語義網(wǎng)絡(luò)模型),導(dǎo)致數(shù)據(jù)孤島與開發(fā)成本激增。以企業(yè)erp系統(tǒng)集成為例,傳統(tǒng)方案需為每個工具開發(fā)獨(dú)立接口,導(dǎo)致集成周期延長3-8倍、維護(hù)成本增加4倍以上。這種分裂不僅體現(xiàn)在技術(shù)架構(gòu)上,更延伸至安全機(jī)制層面——mcp的acl白名單與anp的零知識證明難以協(xié)同,容易引發(fā)隱私泄露風(fēng)險。

3、二、行為感知的深度化重構(gòu):傳統(tǒng)系統(tǒng)僅能捕獲點擊、滾動等表層事件,對gui操作語義的理解準(zhǔn)確率不足。例如在wps辦公場景中,用戶頻繁切換“修訂模式”的協(xié)同編輯需求常被忽視,多窗口疊加操作(excel與ppt聯(lián)動)的關(guān)聯(lián)分析能力薄弱。

4、三、偏好變更響應(yīng)的滯后性:常規(guī)人類反饋強(qiáng)化學(xué)習(xí)(rlhf)周期過長,傳統(tǒng)思維鏈依賴人工標(biāo)注數(shù)據(jù),rlhf訓(xùn)練周期通常會超過72小時,無法實時響應(yīng)用戶偏好變更。當(dāng)用戶調(diào)整文檔格式標(biāo)準(zhǔn)時,靜態(tài)模型需全參數(shù)重訓(xùn)練,易引發(fā)災(zāi)難性遺忘。

5、故如何克服常規(guī)智能體系統(tǒng)在國產(chǎn)化生態(tài)中存在的行為感知敏感度差、偏好變更響應(yīng)滯后、決策可解釋性低等缺陷是目前亟待解決的技術(shù)問題。


技術(shù)實現(xiàn)思路

1、本發(fā)明的技術(shù)任務(wù)是提供一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng),來解決常規(guī)智能體系統(tǒng)在國產(chǎn)化生態(tài)中存在的行為感知敏感度差、偏好變更響應(yīng)滯后、決策可解釋性低的問題。

2、本發(fā)明的技術(shù)任務(wù)是按以下方式實現(xiàn)的,一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng),該系統(tǒng)是融合操作行為感知與強(qiáng)化學(xué)習(xí)技術(shù),通過操作感知引擎、人類反饋強(qiáng)化學(xué)習(xí)中樞、mcp協(xié)議適配器以及思維鏈可視化設(shè)計器形成感知-建模-優(yōu)化-解釋的完整技術(shù)閉環(huán),實現(xiàn)智能體從被動執(zhí)行向主動協(xié)同的范式躍遷;

3、其中,通過操作感知引擎實時捕獲并解析用戶行為數(shù)據(jù),獲取操作序列數(shù)據(jù),將操作序列數(shù)據(jù)作為特征輸入到強(qiáng)化學(xué)習(xí)中樞,強(qiáng)化學(xué)習(xí)中樞輸出操作指令,mcp協(xié)議適配器將強(qiáng)化學(xué)習(xí)中樞推薦的操作指令通過標(biāo)準(zhǔn)化的接口與不同的數(shù)據(jù)源和服務(wù)進(jìn)行交互,獲取操作指令對應(yīng)的結(jié)果,并將外部系統(tǒng)的反饋(如用戶評分、眼動追蹤數(shù)據(jù))傳遞回人類反饋強(qiáng)化學(xué)習(xí)中樞,不斷優(yōu)化人類反饋強(qiáng)化學(xué)習(xí)中樞的策略網(wǎng)絡(luò);思維鏈可視化設(shè)計器將人類反饋強(qiáng)化學(xué)習(xí)中樞復(fù)雜的決策過程和數(shù)據(jù)關(guān)系轉(zhuǎn)換為直觀的可視化視圖,幫助用戶理解智能行為分析裝置的決策邏輯和行為模式,提升系統(tǒng)的可解釋性和用戶信任度,并指導(dǎo)人類反饋強(qiáng)化學(xué)習(xí)中樞的調(diào)整和優(yōu)化,形成閉環(huán)優(yōu)化過程。

4、作為優(yōu)選,操作感知引擎包括:

5、操作序列數(shù)據(jù)獲取模塊,用于基于國產(chǎn)操作系統(tǒng)內(nèi)核級鉤子機(jī)制實時捕獲用戶操作行為,形成操作序列數(shù)據(jù);其中,用戶操作行為包括gui操作事件和文件系統(tǒng)訪問軌跡;gui操作事件包括窗口焦點切換、控件點擊及快捷鍵觸發(fā);文件系統(tǒng)訪問軌跡包括創(chuàng)建、讀寫及刪除操作;

6、用戶多維畫像構(gòu)建模塊,用于通過事件溯源技術(shù)構(gòu)建用戶多維行為畫像,實現(xiàn)操作語義的上下文關(guān)系解析。

7、更優(yōu)地,操作感知引擎還具有如下功能:

8、①支持多設(shè)備同步感知:移動端、桌面端、云端操作行為的統(tǒng)一捕獲;

9、②增加異常行為檢測功能:非典型操作模式的實時告警;

10、③提供行為數(shù)據(jù)的加密存儲與傳輸,確保數(shù)據(jù)安全;

11、④支持插件化擴(kuò)展,允許第三方開發(fā)者接入自定義行為感知規(guī)則。

12、作為優(yōu)選,強(qiáng)化學(xué)習(xí)中樞包括:

13、模型訓(xùn)練模塊,用于進(jìn)行行為-文件多模態(tài)聯(lián)合概率模型訓(xùn)練;其中,行為-文件多模態(tài)聯(lián)合概率模型是一種結(jié)合行為數(shù)據(jù)與文件數(shù)據(jù)(如文本、圖像等),通過概率框架建模多模態(tài)關(guān)聯(lián)的技術(shù);行為-文件多模態(tài)聯(lián)合概率模型通過概率圖模型(如貝葉斯網(wǎng)絡(luò)、馬爾可夫隨機(jī)場)或深度學(xué)習(xí)框架(如變分自編碼器、生成對抗網(wǎng)絡(luò)),實現(xiàn)多模態(tài)數(shù)據(jù)的聯(lián)合建模;

14、優(yōu)化引擎建立模塊,用于建立雙通道反饋驅(qū)動的策略優(yōu)化引擎,實現(xiàn)行為-文件多模態(tài)聯(lián)合概率模型的優(yōu)化;

15、隱私保護(hù)與安全模塊,用于利用隱私保護(hù)與安全機(jī)制實現(xiàn)強(qiáng)化學(xué)習(xí)中樞中的隱私保護(hù)。

16、更優(yōu)地,模型訓(xùn)練模塊工作過程具體如下:

17、(1)對每個操作行為分別計算相應(yīng)的操作頻率、持續(xù)時間和路徑復(fù)雜度三個維度的特征值;其中,操作頻率是指統(tǒng)計用戶在特定時間段內(nèi)對每個操作行為的執(zhí)行次數(shù),反映用戶對不同操作行為的使用頻率;持續(xù)時間是指記錄用戶在每個操作行為上花費(fèi)的時間,體現(xiàn)用戶對不同操作的關(guān)注程度和投入時間的多少;路徑復(fù)雜度是指分析用戶在執(zhí)行操作時的路徑復(fù)雜程度,例如訪問文件的目錄深度、跳轉(zhuǎn)次數(shù)等,衡量用戶操作路徑的復(fù)雜性;

18、(2)將用戶的不同操作行為視為詞匯,將用戶的一系列操作序列視為文檔,利用tf-idf算法量化用戶對不同類型操作行為的偏好權(quán)重w,具體公式如下;

19、;

20、其中,表示詞匯t在文檔di中出現(xiàn)次數(shù);表示文檔中所有詞匯的詞數(shù);n表示文檔總數(shù);表示文檔是否包含詞匯t,若包含為1,不包含為0;

21、其中,tf-idf(term?frequency-inverse?document?frequency,詞頻-逆文件頻率)是一種用于文本檢索與文本探勘的常用加權(quán)技術(shù);tf-idf是一種統(tǒng)計方法,用以評估一字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度;字詞的重要性隨著它在文件中出現(xiàn)的次數(shù)成正比增加,但同時會隨著它在語料庫中出現(xiàn)的頻率成反比下降,能有效避免常用詞對關(guān)鍵詞的影響,提高了關(guān)鍵詞與文章之間的相關(guān)性;

22、(3)利用用戶對不同類型操作行為的偏好權(quán)重和三維特征值,將所有操作序列數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的特征向量,作為行為-文件多模態(tài)聯(lián)合概率模型訓(xùn)練的輸入;

23、(4)通過動態(tài)貝葉斯網(wǎng)絡(luò)計算操作行為與文件訪問行為的聯(lián)合概率分布,將用戶在不同時間點的操作序列與文件訪問行為建模為條件概率分布,捕捉操作行為與文件訪問之間的因果關(guān)系;

24、(5)將結(jié)構(gòu)化的特征向量輸入多層神經(jīng)網(wǎng)絡(luò),多層神經(jīng)網(wǎng)絡(luò)輸出為操作建議的概率分布,采用監(jiān)督學(xué)習(xí)方法,通過歷史行為數(shù)據(jù)訓(xùn)練行為-文件聯(lián)合概率模型,構(gòu)建操作序列與文件訪問的時空關(guān)聯(lián),動態(tài)更新概率分布以反映用戶行為的時序性和上下文依賴性;

25、(6)通過交叉驗證和指標(biāo)評估(如準(zhǔn)確率、召回率、f1分?jǐn)?shù))驗證行為-文件多模態(tài)聯(lián)合概率模型性能,確保模型的泛化能力。

26、更優(yōu)地,優(yōu)化引擎建立模塊的工作過程具體如下:

27、(1)設(shè)計反饋通道,反饋通道包括顯式反饋通道和隱式反饋通道;其中,顯式通道通過用戶界面接收用戶對智能建議的星級評分,評分范圍為1-5級;隱式通道通過眼動追蹤記錄用戶在操作過程中的注視點、掃視路徑和瞳孔變化,并記錄用戶在特定操作或界面元素上的停留時間,通過眼動和停留時長數(shù)據(jù)計算認(rèn)知負(fù)荷指標(biāo),如注視次數(shù)、平均停留時間等;再將評分與認(rèn)知負(fù)荷指標(biāo)轉(zhuǎn)化為數(shù)值化的反饋信號,作為強(qiáng)化學(xué)習(xí)的獎勵函數(shù)輸入;

28、(2)結(jié)合顯式和隱式反饋信號設(shè)計獎勵函數(shù),顯式反饋直接作為獎勵值,隱式反饋通過認(rèn)知負(fù)荷指標(biāo)間接影響?yīng)剟睿?/p>

29、(3)采用ppo算法計算行為-文件多模態(tài)聯(lián)合概率模型策略網(wǎng)絡(luò)的梯度更新,通過截斷策略更新確保訓(xùn)練的穩(wěn)定性;其中,ppo算法采用多目標(biāo)優(yōu)化,通過最小化路徑熵優(yōu)化用戶操作路徑,提升操作效率,并通過最大化敏感操作混淆度,提高敏感操作的不可識別性,保護(hù)用戶隱私。

30、更優(yōu)地,隱私保護(hù)與安全模塊的工作過程具體如下:

31、(1)在反向傳播過程中,利用梯度掩碼技術(shù)對涉及敏感數(shù)據(jù)的梯度進(jìn)行掩碼處理,確保隱私數(shù)據(jù)不被泄露;

32、(2)?通過添加噪聲或變換特征向量,混淆敏感操作的行為特征,降低敏感操作的可識別性;

33、(3)定期評估系統(tǒng)的隱私保護(hù)效果,確保隱私保護(hù)機(jī)制的有效性。

34、作為優(yōu)選,mcp協(xié)議適配器包括協(xié)議網(wǎng)關(guān)部署模塊和動態(tài)服務(wù)發(fā)現(xiàn)模塊;

35、其中,協(xié)議網(wǎng)管部署模塊用于采用客戶端-服務(wù)器架構(gòu)部署mcp協(xié)議網(wǎng)關(guān);客戶端用于接收強(qiáng)化學(xué)習(xí)中樞生成的操作策略,服務(wù)器端為外部數(shù)據(jù)源和工具,客戶端和服務(wù)器之間進(jìn)行功能協(xié)商,確定客戶端與服務(wù)器相互提供功能和服務(wù);協(xié)議網(wǎng)管部署模塊集成json-rpc?2.0標(biāo)準(zhǔn)協(xié)議,并支持兩種通信模式,具體如下:

36、①本地管道(stdio)模式:實現(xiàn)<10ms低延遲響應(yīng),適合處理本地操作行為數(shù)據(jù);

37、②網(wǎng)絡(luò)流(sse)模式:支撐高并發(fā)調(diào)用,適合處理分布式系統(tǒng)中的行為數(shù)據(jù);

38、動態(tài)服務(wù)發(fā)現(xiàn)模塊用于通過自動掃描機(jī)制識別可用mcp服務(wù)器,可用mcp服務(wù)器包括本地ide插件、企業(yè)erp系統(tǒng)接口及云端ai服務(wù)(如claude推理引擎);客戶端根據(jù)用戶請求或ai模型的需要,向服務(wù)器發(fā)送請求,服務(wù)器處理用戶請求,并可能與本地或遠(yuǎn)程資源進(jìn)行交互;在操作執(zhí)行完成后,服務(wù)器將處理結(jié)果返回給客戶端,客戶端再將信息傳遞回主機(jī)應(yīng)用程序;再采用uri動態(tài)模板實現(xiàn)參數(shù)化資源定位,持json-rpc?2.0標(biāo)準(zhǔn)協(xié)議,確保服務(wù)發(fā)現(xiàn)的靈活性和動態(tài)性。

39、更優(yōu)地,mcp協(xié)議適配器具有如下功能:

40、①支持跨平臺兼容性:windows、linux、macos、移動端;

41、②支持協(xié)議版本管理功能,支持不同版本的mcp協(xié)議無縫切換;

42、③提供服務(wù)健康監(jiān)測功能,實時監(jiān)控mcp服務(wù)器的可用性;

43、④支持服務(wù)熔斷機(jī)制,避免因單點故障導(dǎo)致系統(tǒng)崩潰。

44、作為優(yōu)選,思維鏈可視化設(shè)計器包括:

45、決策溯源模型構(gòu)建模塊,用于基于多頭注意力機(jī)制構(gòu)建決策溯源模型,融合時序行為數(shù)據(jù)與系統(tǒng)狀態(tài)特征,追蹤并記錄強(qiáng)化學(xué)習(xí)中樞生成的每個決策的形成過程,構(gòu)建完整的決策鏈條;其中,強(qiáng)化學(xué)習(xí)中樞生成的每個決策的形成過程包括決策的關(guān)鍵影響因素及決策時的上下文信息;

46、決策路徑重構(gòu)模塊,用于采用時間衰減因子加權(quán)的lstm網(wǎng)絡(luò)重構(gòu)決策路徑,對決策過程中的時序數(shù)據(jù)進(jìn)行建模和分析,突出顯示隨時間變化的決策趨勢和模式,幫助理解決策的演變過程;

47、因果關(guān)聯(lián)分析模塊,用于結(jié)合知識圖譜技術(shù)生成具備因果關(guān)聯(lián)的可解釋視圖,將決策過程中的各個事件和操作與其產(chǎn)生的結(jié)果進(jìn)行關(guān)聯(lián),形成因果關(guān)系圖,揭示決策背后的邏輯和動機(jī);

48、可視化輸出模塊,用于獲取行為熱力圖、文件關(guān)系網(wǎng)絡(luò)及策略演變時間軸;其中,行為熱力圖用于呈現(xiàn)操作模式分布,展示用戶在不同時間、不同場景下的操作頻率和模式,幫助識別高頻操作區(qū)域和用戶行為習(xí)慣;文件關(guān)聯(lián)網(wǎng)絡(luò)用于揭示隱性知識結(jié)構(gòu),展示文件之間的直接引用、間接關(guān)聯(lián)、內(nèi)容相似性的關(guān)聯(lián)關(guān)系,幫助發(fā)現(xiàn)潛在的知識結(jié)構(gòu)和信息流動;策略演變時間軸用于展示學(xué)習(xí)進(jìn)程,呈現(xiàn)強(qiáng)化學(xué)習(xí)策略隨時間的演變和優(yōu)化過程,幫助評估學(xué)習(xí)效果和策略的收斂性;強(qiáng)化學(xué)習(xí)策略隨時間的演變和優(yōu)化過程包括策略調(diào)整的關(guān)鍵節(jié)點、性能指標(biāo)的變化趨勢;

49、反饋與優(yōu)化模塊,用于將可視化結(jié)果反饋到強(qiáng)化學(xué)習(xí)中樞,為強(qiáng)化學(xué)習(xí)策略的進(jìn)一步優(yōu)化提供參考;并通過分析可視化輸出,發(fā)現(xiàn)強(qiáng)化學(xué)習(xí)策略中的潛在問題和改進(jìn)空間,指導(dǎo)強(qiáng)化學(xué)習(xí)算法的調(diào)整和優(yōu)化,形成閉環(huán)優(yōu)化過程。

50、本發(fā)明的基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng)具有以下優(yōu)點:

51、(一)本發(fā)明通過多模態(tài)行為感知、行為-文件多模態(tài)強(qiáng)化學(xué)習(xí)優(yōu)化和輕量化思維鏈生成技術(shù),創(chuàng)新性地融合mcp協(xié)議接入、動態(tài)行為建模及人機(jī)協(xié)同進(jìn)化機(jī)制,解決了常規(guī)智能體系統(tǒng)在國產(chǎn)化生態(tài)中存在的行為感知敏感度差、偏好變更響應(yīng)滯后、決策可解釋性低等問題,實現(xiàn)了國產(chǎn)化環(huán)境下智能體服務(wù)的自主可控與高效推理;

52、(二)本發(fā)明通過上下文協(xié)議(mcp)實現(xiàn)跨平臺智能體工具的動態(tài)接入,結(jié)合操作行為感知、文件語義理解與人類反饋強(qiáng)化學(xué)習(xí)算法,構(gòu)建用戶個性化的思維鏈體系;

53、(三)本發(fā)明通過國產(chǎn)化適配、安全增強(qiáng)與生態(tài)協(xié)同三大技術(shù)路徑,突破智能體技術(shù)在國產(chǎn)化操作系統(tǒng)中應(yīng)用落地的核心瓶頸;

54、(四)本發(fā)明旨在構(gòu)建一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng)及裝置,通過構(gòu)建“操作-反饋-優(yōu)化”的技術(shù)閉環(huán),實現(xiàn)智能體從被動執(zhí)行向主動協(xié)同的范式躍遷;具體為:用mcp協(xié)議構(gòu)建統(tǒng)一工具接入框架,基于客戶端-服務(wù)器架構(gòu)實現(xiàn)異構(gòu)工具的無縫集成,通過json-rpc?2.0協(xié)議封裝工具調(diào)用請求,動態(tài)服務(wù)發(fā)現(xiàn)機(jī)制可自動匹配本地工具或服務(wù)端api,結(jié)合細(xì)粒度權(quán)限控制,確保只有經(jīng)過驗證的設(shè)備和用戶才能訪問系統(tǒng)資源;建立用戶操作-文件-反饋的三維行為建模體系,通過雙向lstm解析窗口焦點軌跡與手勢操作序列,設(shè)計多模態(tài)反饋界面將用戶評分轉(zhuǎn)化為強(qiáng)化學(xué)習(xí)的激勵信號;部署分層ppo算法驅(qū)動的思維鏈優(yōu)化引擎,其中,元策略網(wǎng)絡(luò)融合操作時序特征與文件tf-idf向量優(yōu)化長期目標(biāo),任務(wù)策略網(wǎng)絡(luò)通過實時數(shù)據(jù)管道實現(xiàn)快速決策更新;本發(fā)明通過協(xié)議生態(tài)標(biāo)準(zhǔn)化、行為建模深度化與思維鏈動態(tài)優(yōu)化,構(gòu)建了“操作即訓(xùn)練、反饋即進(jìn)化”的智能協(xié)同范式新方法,為ai技術(shù)融入人類工作提供了安全可靠的數(shù)字基座;

55、(五)本發(fā)明通過國產(chǎn)化內(nèi)核級監(jiān)控確保數(shù)據(jù)主權(quán),采用國密算法實現(xiàn)傳輸加密;并構(gòu)建行為-文件的動態(tài)關(guān)聯(lián)模型突破傳統(tǒng)日志分析的靜態(tài)局限;同時創(chuàng)新融合人類反饋機(jī)制與可解釋ai技術(shù),使智能體決策過程兼具進(jìn)化能力與透明性;實驗表明,本發(fā)明可使常用辦公場景操作效率提升37%,誤操作率下降62%,同時提供符合gb/t?35273標(biāo)準(zhǔn)的隱私保護(hù)能力。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1