本發(fā)明涉及精煤產(chǎn)率預(yù)測(cè),特別是一種精煤產(chǎn)率預(yù)測(cè)學(xué)習(xí)樹方法。
背景技術(shù):
1、精煤洗選是煤礦生產(chǎn)中的關(guān)鍵環(huán)節(jié),其核心目標(biāo)是通過高效分選工藝最大限度地提高精煤產(chǎn)率,同時(shí)降低原煤灰分和雜質(zhì)含量。近年來,隨著數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,基于數(shù)據(jù)驅(qū)動(dòng)的洗選結(jié)果預(yù)測(cè)模型逐漸成為研究熱點(diǎn)。
2、現(xiàn)有精煤預(yù)測(cè)方法主要采用時(shí)序算法預(yù)測(cè)產(chǎn)率與灰分,基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(lstm)、空洞因果卷積、lightgbm等進(jìn)行建模。然而,這些方法難以全面提取因果特征,例如原煤成分、入洗量以及洗選工況。此外,時(shí)序建模需要對(duì)各流程生成的數(shù)據(jù)時(shí)間進(jìn)行嚴(yán)格對(duì)齊,現(xiàn)場(chǎng)實(shí)施難度較大。另一部分方法依賴專家構(gòu)建多元特征,并結(jié)合bp神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。然而,無論是時(shí)序回歸模型還是bp回歸模型,都存在預(yù)測(cè)結(jié)果缺乏解釋能力的問題,難以滿足不同洗選工藝的需求。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述問題,本發(fā)明提出了一種精煤產(chǎn)率預(yù)測(cè)學(xué)習(xí)樹方法。
2、本發(fā)明實(shí)施例提供了一種精煤產(chǎn)率預(yù)測(cè)學(xué)習(xí)樹方法,所述精煤產(chǎn)率預(yù)測(cè)學(xué)習(xí)樹方法包括:
3、獲取歷史洗選樣本數(shù)據(jù);
4、利用所述歷史洗選樣本數(shù)據(jù)制作得到數(shù)據(jù)集;
5、基于所述數(shù)據(jù)集,按序依次訓(xùn)練得到煤質(zhì)聚類器、水分聚類器、灰分聚類器、入洗量聚類器、洗選工作參數(shù)聚類器;
6、以所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器、所述入洗量聚類器、所述洗選工作參數(shù)聚類器五者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為精煤產(chǎn)率預(yù)測(cè)器的輸入,訓(xùn)練得到精煤產(chǎn)率預(yù)測(cè)器;
7、利于所述精煤產(chǎn)率預(yù)測(cè)器實(shí)時(shí)預(yù)測(cè)精煤產(chǎn)率。
8、可選地,利用所述歷史洗選樣本數(shù)據(jù)制作得到數(shù)據(jù)集,包括:
9、從所述歷史洗選樣本數(shù)據(jù)中標(biāo)注出煤質(zhì)特性、原煤水分、原煤灰分、原煤入洗量、洗選工作參數(shù)以及精煤產(chǎn)率各自對(duì)應(yīng)的多個(gè)目標(biāo)數(shù)據(jù);
10、以所述煤質(zhì)特性、所述原煤水分、原煤灰分、所述原煤入洗量、所述洗選工作參數(shù)以及所述精煤產(chǎn)率各自對(duì)應(yīng)的目標(biāo)數(shù)據(jù)作為所述數(shù)據(jù)集的特征,以所述精煤產(chǎn)率對(duì)應(yīng)的目標(biāo)數(shù)據(jù)作為所述數(shù)據(jù)集的標(biāo)簽;
11、其中,所述煤質(zhì)特性包括:密度特性、粒度特性、易碎性;
12、所述洗選工作參數(shù)包括:合介入口壓力及流量、分選密度。
13、可選地,基于所述數(shù)據(jù)集,按序依次訓(xùn)練得到煤質(zhì)聚類器、水分聚類器、灰分聚類器、入洗量聚類器、洗選工作參數(shù)聚類器,包括:
14、基于所述數(shù)據(jù)集,先訓(xùn)練得到煤質(zhì)聚類器;
15、以所述煤質(zhì)聚類器的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述水分聚類器的輸入,訓(xùn)練得到所述水分聚類器;
16、以所述煤質(zhì)聚類器、所述水分聚類器兩者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述灰分聚類器的輸入,訓(xùn)練得到所述灰分聚類器;
17、以所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器三者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述入洗量聚類器的輸入,訓(xùn)練得到所述入洗量聚類器;
18、最終,以所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器、所述入洗量聚類器四者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述洗選工作參數(shù)聚類器的輸入,訓(xùn)練得到所述洗選工作參數(shù)聚類器。
19、可選地,基于所述數(shù)據(jù)集,先訓(xùn)練得到煤質(zhì)聚類器,包括:
20、使用綜合相似性度量公式計(jì)算所述數(shù)據(jù)集中樣本間的相似性;
21、基于樣本相似性計(jì)算結(jié)果,使用高斯混合模型對(duì)所述數(shù)據(jù)集的密度、粒度和易碎性特征進(jìn)行聚類,自動(dòng)識(shí)別所述煤質(zhì)類別;
22、通過擬合多高斯分布,捕捉特征間的非線性關(guān)系和潛在類別分布,提高所述煤質(zhì)類別的識(shí)別準(zhǔn)確性。
23、可選地,所述綜合相似性度量公式為:
24、
25、上式中,s(i,j)]表示樣本i和樣本j的相似度,s[i,j]∈[0,1],值越接近1表示樣本i和樣本j越相似;m表示特征維度數(shù);wm代表特征m的權(quán)重,表示其對(duì)相似性計(jì)算的貢獻(xiàn);xi,m和xj,m分別代表樣本i和樣本j在特征m上的取值;σm表示特征m的尺度因子,用于歸一化特征的差異。
26、可選地,使用高斯混合模型對(duì)所述數(shù)據(jù)集的密度、粒度和易碎性特征進(jìn)行聚類之前,還包括:
27、根據(jù)相似性矩陣的特性,初始化高斯混合模型的關(guān)鍵參數(shù);具體包括:
28、通過預(yù)定義值或基于譜分析確定聚類數(shù)k;
29、使用相似性矩陣的主成分方向初始化,提取前k個(gè)特征向量,作為聚類中心的初始位置;
30、構(gòu)建協(xié)方差矩陣,其初始化為對(duì)角矩陣,值由樣本的特征分布決定;
31、設(shè)定混合權(quán)重,其設(shè)定為均勻分布,即混合權(quán)重=1/k,表示各聚類成分的初始權(quán)重相等。
32、可選地,以所述煤質(zhì)聚類器的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述水分聚類器的輸入,訓(xùn)練得到所述水分聚類器,包括:
33、以所述煤質(zhì)聚類器的輸出結(jié)果:每種煤質(zhì)類別,結(jié)合所述數(shù)據(jù)集中的原煤水分作為所述水分聚類器的輸入,采用基于密度的聚類算法對(duì)水分特征進(jìn)行聚類,識(shí)別得到所述每種煤質(zhì)類別各自對(duì)應(yīng)的每種水分含量類別。
34、可選地,以所述煤質(zhì)聚類器、所述水分聚類器兩者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述灰分聚類器的輸入,訓(xùn)練得到所述灰分聚類器,包括:
35、以所述每種煤質(zhì)類別、所述每種水分含量類別,結(jié)合所述數(shù)據(jù)集中的原煤灰分作為所述灰分聚類器的輸入,采用層次聚類算法對(duì)灰分特征進(jìn)行聚類,識(shí)別得到所述每種水分含量各自對(duì)應(yīng)的每種灰分含量類別。
36、可選地,以所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器三者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述入洗量聚類器的輸入,訓(xùn)練得到所述入洗量聚類器,包括:
37、以所述每種煤質(zhì)類別、所述每種水分含量類別、所述每種灰分含量類別,結(jié)合所述數(shù)據(jù)集中的原煤入洗量作為所述入洗量聚類器的輸入,采用kmeans聚類算法對(duì)入洗量特征進(jìn)行聚類,識(shí)別得到所述每種灰分含量各自對(duì)應(yīng)的每種入洗量類別。
38、可選地,以所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器、所述入洗量聚類器四者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述洗選工作參數(shù)聚類器的輸入,訓(xùn)練得到所述洗選工作參數(shù)聚類器,包括:
39、以所述每種煤質(zhì)類別、所述每種水分含量類別、所述每種灰分含量類別、所述每種入洗量類別,結(jié)合所述數(shù)據(jù)集中的洗選工作參數(shù)作為所述入洗選工作參數(shù)聚類器的輸入,采用任一聚類算法對(duì)洗選工作參數(shù)特征進(jìn)行聚類,識(shí)別得到所述每種入洗量類別各自對(duì)應(yīng)的每種洗選參數(shù)類別。
40、可選地,以所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器、所述入洗量聚類器、所述洗選工作參數(shù)聚類器五者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為精煤產(chǎn)率預(yù)測(cè)器的輸入,訓(xùn)練得到精煤產(chǎn)率預(yù)測(cè)器,包括:
41、利用全連接神經(jīng)網(wǎng)絡(luò)算法對(duì)所述每種煤質(zhì)類別、所述每種水分含量類別、所述每種灰分含量類別、所述每種入洗量類別以及所述每種洗選參數(shù)類別進(jìn)行監(jiān)督學(xué)習(xí)和訓(xùn)練,得到所述精煤產(chǎn)率預(yù)測(cè)器。
42、可選地,利于所述精煤產(chǎn)率預(yù)測(cè)器實(shí)時(shí)預(yù)測(cè)精煤產(chǎn)率,包括:
43、獲取實(shí)時(shí)數(shù)據(jù);
44、按序加載訓(xùn)練好的煤質(zhì)聚類器、水分聚類器、灰分聚類器、洗量聚類器、洗選工作參數(shù)聚類器;
45、按序依次經(jīng)過所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器、所述洗量聚類器、所述洗選工作參數(shù)聚類器對(duì)所述實(shí)時(shí)數(shù)據(jù)進(jìn)行識(shí)別,依次得到所述實(shí)時(shí)數(shù)據(jù)對(duì)應(yīng)的結(jié)果:每種煤質(zhì)類別、每種煤質(zhì)類別各自對(duì)應(yīng)的每種水分含量類別、每種水分含量類別各自對(duì)應(yīng)的每種灰分含量類別、每種灰分含量類別各自對(duì)應(yīng)的每種入洗量類別、每種入洗量類別各自對(duì)應(yīng)的每種洗選參數(shù)類別;
46、加載訓(xùn)練好的精煤產(chǎn)率預(yù)測(cè)器,并將所述實(shí)時(shí)數(shù)據(jù)對(duì)應(yīng)的結(jié)果輸入其中,實(shí)時(shí)預(yù)測(cè)得到精煤產(chǎn)率。
47、本發(fā)明實(shí)施例提供了一種精煤產(chǎn)率預(yù)測(cè)學(xué)習(xí)樹系統(tǒng),所述精煤產(chǎn)率預(yù)測(cè)學(xué)習(xí)樹系統(tǒng)包括:
48、獲取數(shù)據(jù)模塊,用于獲取歷史洗選樣本數(shù)據(jù);
49、制作模塊,用于利用所述歷史洗選樣本數(shù)據(jù)制作得到數(shù)據(jù)集;
50、訓(xùn)練聚類器模塊,用于基于所述數(shù)據(jù)集,按序依次訓(xùn)練得到煤質(zhì)聚類器、水分聚類器、灰分聚類器、入洗量聚類器、洗選工作參數(shù)聚類器;
51、訓(xùn)練預(yù)測(cè)器模塊,用于以所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器、所述入洗量聚類器、所述洗選工作參數(shù)聚類器五者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為精煤產(chǎn)率預(yù)測(cè)器的輸入,訓(xùn)練得到精煤產(chǎn)率預(yù)測(cè)器;
52、實(shí)時(shí)預(yù)測(cè)模塊,用于利于所述精煤產(chǎn)率預(yù)測(cè)器實(shí)時(shí)預(yù)測(cè)精煤產(chǎn)率。
53、可選地,所述制作模塊具體用于:
54、從所述歷史洗選樣本數(shù)據(jù)中標(biāo)注出煤質(zhì)特性、原煤水分、原煤灰分、原煤入洗量、洗選工作參數(shù)以及精煤產(chǎn)率各自對(duì)應(yīng)的多個(gè)目標(biāo)數(shù)據(jù);
55、以所述煤質(zhì)特性、所述原煤水分、原煤灰分、所述原煤入洗量、所述洗選工作參數(shù)以及所述精煤產(chǎn)率各自對(duì)應(yīng)的目標(biāo)數(shù)據(jù)作為所述數(shù)據(jù)集的特征,以所述精煤產(chǎn)率對(duì)應(yīng)的目標(biāo)數(shù)據(jù)作為所述數(shù)據(jù)集的標(biāo)簽;
56、其中,所述煤質(zhì)特性包括:密度特性、粒度特性、易碎性;
57、所述洗選工作參數(shù)包括:合介入口壓力及流量、分選密度。
58、可選地,所述訓(xùn)練聚類器模塊包括:
59、訓(xùn)練煤質(zhì)聚類器子模塊,用于基于所述數(shù)據(jù)集,先訓(xùn)練得到煤質(zhì)聚類器;
60、訓(xùn)練水分聚類器子模塊,用于以所述煤質(zhì)聚類器的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述水分聚類器的輸入,訓(xùn)練得到所述水分聚類器;
61、訓(xùn)練灰分聚類器子模塊,用于以所述煤質(zhì)聚類器、所述水分聚類器兩者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述灰分聚類器的輸入,訓(xùn)練得到所述灰分聚類器;
62、訓(xùn)練入洗量聚類器子模塊,用于以所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器三者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述入洗量聚類器的輸入,訓(xùn)練得到所述入洗量聚類器;
63、訓(xùn)練洗選工作參數(shù)聚類器子模塊,用于以所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器、所述入洗量聚類器四者的輸出結(jié)果,結(jié)合所述數(shù)據(jù)集作為所述洗選工作參數(shù)聚類器的輸入,訓(xùn)練得到所述洗選工作參數(shù)聚類器。
64、可選地,所述訓(xùn)練煤質(zhì)聚類器子模塊具體用于:
65、使用綜合相似性度量公式計(jì)算所述數(shù)據(jù)集中樣本間的相似性;
66、基于樣本相似性計(jì)算結(jié)果,使用高斯混合模型對(duì)所述數(shù)據(jù)集的密度、粒度和易碎性特征進(jìn)行聚類,自動(dòng)識(shí)別所述煤質(zhì)類別;
67、通過擬合多高斯分布,捕捉特征間的非線性關(guān)系和潛在類別分布,提高所述煤質(zhì)類別的識(shí)別準(zhǔn)確性。
68、其中,所述綜合相似性度量公式為:
69、
70、上式中,s(i,j)]表示樣本i和樣本j的相似度,s[i,j]∈[0,1],值越接近1表示樣本i和樣本j越相似;m表示特征維度數(shù);wm代表特征m的權(quán)重,表示其對(duì)相似性計(jì)算的貢獻(xiàn);xi,m和xj,m分別代表樣本i和樣本j在特征m上的取值;σm表示特征m的尺度因子,用于歸一化特征的差異。
71、可選地,所述訓(xùn)練煤質(zhì)聚類器子模塊還用于:
72、根據(jù)相似性矩陣的特性,初始化高斯混合模型的關(guān)鍵參數(shù);具體包括:
73、通過預(yù)定義值或基于譜分析確定聚類數(shù)k;
74、使用相似性矩陣的主成分方向初始化,提取前k個(gè)特征向量,作為聚類中心的初始位置;
75、構(gòu)建協(xié)方差矩陣,其初始化為對(duì)角矩陣,值由樣本的特征分布決定;
76、設(shè)定混合權(quán)重,其設(shè)定為均勻分布,即混合權(quán)重=1/k,表示各聚類成分的初始權(quán)重相等。
77、可選地,所述訓(xùn)練水分聚類器子模塊具體用于:
78、以所述煤質(zhì)聚類器的輸出結(jié)果:每種煤質(zhì)類別,結(jié)合所述數(shù)據(jù)集中的原煤水分作為所述水分聚類器的輸入,采用基于密度的聚類算法對(duì)水分特征進(jìn)行聚類,識(shí)別得到所述每種煤質(zhì)類別各自對(duì)應(yīng)的每種水分含量類別。
79、可選地,所述訓(xùn)練灰分聚類器子模塊具體用于:
80、以所述每種煤質(zhì)類別、所述每種水分含量類別,結(jié)合所述數(shù)據(jù)集中的原煤灰分作為所述灰分聚類器的輸入,采用層次聚類算法對(duì)灰分特征進(jìn)行聚類,識(shí)別得到所述每種水分含量各自對(duì)應(yīng)的每種灰分含量類別。
81、可選地,所述訓(xùn)練入洗量聚類器子模塊具體用于:
82、以所述每種煤質(zhì)類別、所述每種水分含量類別、所述每種灰分含量類別,結(jié)合所述數(shù)據(jù)集中的原煤入洗量作為所述入洗量聚類器的輸入,采用kmeans聚類算法對(duì)入洗量特征進(jìn)行聚類,識(shí)別得到所述每種灰分含量各自對(duì)應(yīng)的每種入洗量類別。
83、可選地,所述訓(xùn)練洗選工作參數(shù)聚類器子模塊具體用于:
84、以所述每種煤質(zhì)類別、所述每種水分含量類別、所述每種灰分含量類別、所述每種入洗量類別,結(jié)合所述數(shù)據(jù)集中的洗選工作參數(shù)作為所述入洗選工作參數(shù)聚類器的輸入,采用任一聚類算法對(duì)洗選工作參數(shù)特征進(jìn)行聚類,識(shí)別得到所述每種入洗量類別各自對(duì)應(yīng)的每種洗選參數(shù)類別。
85、可選地,所述訓(xùn)練預(yù)測(cè)器模塊具體用于:
86、利用全連接神經(jīng)網(wǎng)絡(luò)算法對(duì)所述每種煤質(zhì)類別、所述每種水分含量類別、所述每種灰分含量類別、所述每種入洗量類別以及所述每種洗選參數(shù)類別進(jìn)行監(jiān)督學(xué)習(xí)和訓(xùn)練,得到所述精煤產(chǎn)率預(yù)測(cè)器。
87、可選地,所述實(shí)時(shí)預(yù)測(cè)模塊具體用于:
88、獲取實(shí)時(shí)數(shù)據(jù);
89、按序加載訓(xùn)練好的煤質(zhì)聚類器、水分聚類器、灰分聚類器、洗量聚類器、洗選工作參數(shù)聚類器;
90、按序依次經(jīng)過所述煤質(zhì)聚類器、所述水分聚類器、所述灰分聚類器、所述洗量聚類器、所述洗選工作參數(shù)聚類器對(duì)所述實(shí)時(shí)數(shù)據(jù)進(jìn)行識(shí)別,依次得到所述實(shí)時(shí)數(shù)據(jù)對(duì)應(yīng)的結(jié)果:每種煤質(zhì)類別、每種煤質(zhì)類別各自對(duì)應(yīng)的每種水分含量類別、每種水分含量類別各自對(duì)應(yīng)的每種灰分含量類別、每種灰分含量類別各自對(duì)應(yīng)的每種入洗量類別、每種入洗量類別各自對(duì)應(yīng)的每種洗選參數(shù)類別;
91、加載訓(xùn)練好的精煤產(chǎn)率預(yù)測(cè)器,并將所述實(shí)時(shí)數(shù)據(jù)對(duì)應(yīng)的結(jié)果輸入其中,實(shí)時(shí)預(yù)測(cè)得到精煤產(chǎn)率。
92、本發(fā)明提供的精煤產(chǎn)率預(yù)測(cè)學(xué)習(xí)樹方法包括:首先獲取歷史洗選樣本數(shù)據(jù);接著利用歷史洗選樣本數(shù)據(jù)制作得到數(shù)據(jù)集;隨之基于該數(shù)據(jù)集,按序依次訓(xùn)練得到煤質(zhì)聚類器、水分聚類器、灰分聚類器、入洗量聚類器、洗選工作參數(shù)聚類器。
93、之后以煤質(zhì)聚類器、水分聚類器、灰分聚類器、入洗量聚類器、洗選工作參數(shù)聚類器五者的輸出結(jié)果,結(jié)合數(shù)據(jù)集作為精煤產(chǎn)率預(yù)測(cè)器的輸入,訓(xùn)練得到精煤產(chǎn)率預(yù)測(cè)器;最后利于精煤產(chǎn)率預(yù)測(cè)器實(shí)時(shí)預(yù)測(cè)精煤產(chǎn)率。
94、本發(fā)明針對(duì)傳統(tǒng)精煤產(chǎn)率預(yù)測(cè)存在的問題,提出了一種非時(shí)序精煤產(chǎn)率預(yù)測(cè)方法,從入洗原煤、洗選工況到精煤產(chǎn)出的全流程進(jìn)行綜合考慮。通過多級(jí)分類器對(duì)各環(huán)節(jié)進(jìn)行細(xì)粒度統(tǒng)計(jì)識(shí)別,將識(shí)別結(jié)果作為精煤產(chǎn)率預(yù)測(cè)的中間過程。該方法兼具高預(yù)測(cè)性能與結(jié)果可解釋性,為不同洗選工藝的精煤預(yù)測(cè)提供了一種高遷移性的范式框架。本發(fā)明提出融合規(guī)則匹配與機(jī)器學(xué)習(xí)的精煤產(chǎn)率預(yù)測(cè)學(xué)習(xí)樹方法,通過多階段的聚類與監(jiān)督學(xué)習(xí)相結(jié)合,也即分層聚類與預(yù)測(cè)結(jié)合的方式,解決了傳統(tǒng)模型中難以處理煤質(zhì)、水分、灰分、入洗量等復(fù)雜特征交互的問題,提升了對(duì)復(fù)雜多樣煤質(zhì)特性的適應(yīng)性與預(yù)測(cè)精度,為煤炭洗選帶來重要的技術(shù)支持,具有較高的實(shí)用性。