本發(fā)明涉及生物信息學(xué),尤其涉及一種基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法。
背景技術(shù):
1、生物學(xué)年齡預(yù)測(cè)模型是通過分析個(gè)體的生物標(biāo)志物數(shù)據(jù)來預(yù)測(cè)其生物學(xué)年齡,從而評(píng)估其健康狀況和衰老程度的模型。傳統(tǒng)的年齡衡量方式主要依賴于按日歷計(jì)算的實(shí)際年齡(即出生日期),然而,實(shí)際年齡并不能準(zhǔn)確反映個(gè)體的生物學(xué)狀態(tài)和健康水平。例如,同齡人之間在身體功能、患病風(fēng)險(xiǎn)和壽命上可能存在顯著差異,這種差異主要源于不同個(gè)體的遺傳因素、生活方式、環(huán)境暴露等多種因素。因此,科學(xué)界迫切需要一種更為精準(zhǔn)的生物學(xué)年齡評(píng)估方法,以更好地反映個(gè)體的健康狀況和衰老速度。dna甲基化是一種表觀遺傳修飾,隨著年齡增長(zhǎng)而發(fā)生變化。horvath's?clock是一種經(jīng)典的dna甲基化年齡預(yù)測(cè)模型,通過分析特定cpg位點(diǎn)的甲基化水平來計(jì)算dna甲基化年齡。此外,dnam?phenoage也是一種常用的模型,它結(jié)合了多個(gè)與年齡相關(guān)的dna甲基化標(biāo)記和血液指標(biāo),能夠更準(zhǔn)確地反映生物學(xué)年齡。
2、但傳統(tǒng)的基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建往往存在以下問題:部分模型難以區(qū)分正常衰老和病理性衰老,如早衰癥、慢性疾病等狀態(tài)下的生物學(xué)年齡評(píng)估不夠準(zhǔn)確;dna甲基化數(shù)據(jù)維度高、噪聲大,如何從中篩選出與年齡最相關(guān)的甲基化位點(diǎn),并構(gòu)建穩(wěn)定高效的預(yù)測(cè)模型,一直是技術(shù)難點(diǎn);傳統(tǒng)模型多為靜態(tài)預(yù)測(cè),無法實(shí)時(shí)反映個(gè)體在干預(yù)措施(如生活方式改變、藥物治療)后生物學(xué)年齡的動(dòng)態(tài)變化。
技術(shù)實(shí)現(xiàn)思路
1、基于此,本發(fā)明有必要提供一種基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,以解決至少一個(gè)上述技術(shù)問題。
2、為實(shí)現(xiàn)上述目的,一種基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,包括以下步驟:
3、步驟s1:獲取人體外周血樣本的全基因組甲基化測(cè)序數(shù)據(jù);對(duì)人體外周血樣本進(jìn)行細(xì)胞亞群分類,并對(duì)各細(xì)胞亞群進(jìn)行單細(xì)胞rna測(cè)序處理,得到包括淋巴細(xì)胞、中性粒細(xì)胞和單核細(xì)胞在內(nèi)的單細(xì)胞測(cè)序數(shù)據(jù);
4、步驟s2:根據(jù)單細(xì)胞測(cè)序數(shù)據(jù)以及全基因組甲基化測(cè)序數(shù)據(jù)對(duì)各細(xì)胞亞群特異性轉(zhuǎn)錄因子結(jié)合位點(diǎn)上下游2000個(gè)堿基對(duì)范圍內(nèi)的cpg位點(diǎn)進(jìn)行組織特異性分析,得到候選標(biāo)記位點(diǎn)數(shù)據(jù);
5、步驟s3:對(duì)候選標(biāo)記位點(diǎn)數(shù)據(jù)進(jìn)行動(dòng)態(tài)演變分析,篩選出在20-80歲年齡段內(nèi)甲基化水平變化呈單調(diào)遞增或單調(diào)遞減趨勢(shì)且變化幅度大于30%的cpg位點(diǎn),得到年齡相關(guān)位點(diǎn)數(shù)據(jù);
6、步驟s4:根據(jù)預(yù)獲取的衰老基因的啟動(dòng)子區(qū)域信息以及年齡相關(guān)位點(diǎn)數(shù)據(jù)對(duì)位于衰老基因啟動(dòng)子上下游1000個(gè)堿基對(duì)范圍內(nèi)且甲基化水平與基因表達(dá)量相關(guān)系數(shù)絕對(duì)值大于0.6的cpg位點(diǎn)進(jìn)行篩選,得到核心年齡標(biāo)記位點(diǎn)數(shù)據(jù);
7、步驟s5:利用基于細(xì)胞類型加權(quán)的彈性網(wǎng)絡(luò)回歸算法根據(jù)核心年齡標(biāo)記位點(diǎn)數(shù)據(jù)構(gòu)建生物學(xué)年齡預(yù)測(cè)模型。
8、本發(fā)明通過獲取人體外周血樣本的全基因組甲基化測(cè)序數(shù)據(jù)以及對(duì)細(xì)胞亞群進(jìn)行單細(xì)胞rna測(cè)序處理,為后續(xù)分析奠定了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。這不僅能夠全面了解個(gè)體的基因組甲基化狀態(tài),還能深入探究不同細(xì)胞亞群的基因表達(dá)特征,從而更精準(zhǔn)地把握細(xì)胞層面的生物學(xué)信息,為篩選與年齡相關(guān)的標(biāo)記位點(diǎn)提供了豐富的數(shù)據(jù)來源,有效提升了模型構(gòu)建的起點(diǎn)質(zhì)量。基于單細(xì)胞測(cè)序數(shù)據(jù)和全基因組甲基化測(cè)序數(shù)據(jù)對(duì)各細(xì)胞亞群特異性轉(zhuǎn)錄因子結(jié)合位點(diǎn)上下游2000個(gè)堿基對(duì)范圍內(nèi)的cpg位點(diǎn)進(jìn)行組織特異性分析,這一操作精準(zhǔn)地鎖定了可能與年齡變化相關(guān)的特定區(qū)域。這樣的分析有助于篩選出具有潛在價(jià)值的候選標(biāo)記位點(diǎn),大大縮小了后續(xù)研究的范圍,提高了研究的針對(duì)性和效率,使得后續(xù)對(duì)年齡相關(guān)位點(diǎn)的篩選更加有的放矢,為構(gòu)建精準(zhǔn)的生物學(xué)年齡預(yù)測(cè)模型提供了關(guān)鍵的中間數(shù)據(jù)。進(jìn)一步對(duì)候選標(biāo)記位點(diǎn)數(shù)據(jù)進(jìn)行動(dòng)態(tài)演變分析,篩選出在20-80歲年齡段內(nèi)甲基化水平變化呈單調(diào)遞增或單調(diào)遞減趨勢(shì)且變化幅度大于30%的cpg位點(diǎn)。這一篩選過程能夠有效剔除那些甲基化水平變化不穩(wěn)定或變化幅度較小的位點(diǎn),保留下來的年齡相關(guān)位點(diǎn)數(shù)據(jù)更具代表性和可靠性,更能準(zhǔn)確反映個(gè)體在不同年齡階段的甲基化變化趨勢(shì),為后續(xù)構(gòu)建的模型提供了高質(zhì)量的核心數(shù)據(jù),增強(qiáng)了模型對(duì)年齡預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性。依據(jù)預(yù)獲取的衰老基因的啟動(dòng)子區(qū)域信息以及年齡相關(guān)位點(diǎn)數(shù)據(jù),對(duì)位于衰老基因啟動(dòng)子上下游1000個(gè)堿基對(duì)范圍內(nèi)且甲基化水平與基因表達(dá)量相關(guān)系數(shù)絕對(duì)值大于0.6的cpg位點(diǎn)進(jìn)行篩選。這一步驟將甲基化水平與基因表達(dá)量緊密聯(lián)系起來,篩選出的核心年齡標(biāo)記位點(diǎn)數(shù)據(jù)不僅與年齡變化密切相關(guān),還與衰老基因的表達(dá)調(diào)控有著直接的聯(lián)系。這樣的篩選機(jī)制使得最終得到的核心年齡標(biāo)記位點(diǎn)更具生物學(xué)意義,為構(gòu)建的模型提供了強(qiáng)有力的生物學(xué)依據(jù),進(jìn)一步提升了模型的科學(xué)性和可信度。利用基于細(xì)胞類型加權(quán)的彈性網(wǎng)絡(luò)回歸算法根據(jù)核心年齡標(biāo)記位點(diǎn)數(shù)據(jù)構(gòu)建生物學(xué)年齡預(yù)測(cè)模型。該算法充分考慮了不同細(xì)胞類型在年齡預(yù)測(cè)中的權(quán)重差異,能夠更準(zhǔn)確地整合核心年齡標(biāo)記位點(diǎn)數(shù)據(jù),構(gòu)建出的模型不僅具有較高的預(yù)測(cè)精度,還能有效避免過擬合等問題。通過對(duì)模型進(jìn)行交叉驗(yàn)證確定最優(yōu)的正則化參數(shù),進(jìn)一步優(yōu)化了模型的性能,使其在實(shí)際應(yīng)用中能夠更加準(zhǔn)確地預(yù)測(cè)個(gè)體的生物學(xué)年齡,為評(píng)估個(gè)體的衰老程度和健康狀況提供了有力的工具,具有重要的科學(xué)價(jià)值和應(yīng)用前景。
1.一種基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,其特征在于,步驟s1包括以下步驟:
3.根據(jù)權(quán)利要求2所述的基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,其特征在于,步驟s13包括以下步驟:
4.根據(jù)權(quán)利要求3所述的基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,其特征在于,步驟s2包括以下步驟:
5.根據(jù)權(quán)利要求4所述的基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,其特征在于,步驟s24包括以下步驟:
6.根據(jù)權(quán)利要求5所述的基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,其特征在于,步驟s3包括以下步驟:
7.根據(jù)權(quán)利要求6所述的基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,其特征在于,步驟s32包括以下步驟:
8.根據(jù)權(quán)利要求7所述的基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,其特征在于,步驟s4包括以下步驟:
9.根據(jù)權(quán)利要求8所述的基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,其特征在于,步驟s45包括以下步驟:
10.根據(jù)權(quán)利要求9所述的基于dna甲基化的生物學(xué)年齡預(yù)測(cè)模型的構(gòu)建方法,其特征在于,步驟s5包括以下步驟: