在daGOAT模型的實際應(yīng)用中,研究者會每天更新移植患者的實驗室檢驗數(shù)據(jù),根據(jù)模型預(yù)測患者是高危還是低危aGVHD,再預(yù)防性給藥,以期在不提高感染率的情況下降低重度aGVHD的發(fā)生風(fēng)險。
◎本報記者 代小佩
急性移植物抗宿主?。╝GVHD),是患者接受造血干細(xì)胞移植后可能發(fā)生的一種急性并發(fā)癥,要邁過這道檻,關(guān)鍵在預(yù)防。
而守好“預(yù)防”這個關(guān)口,基于大數(shù)據(jù)的預(yù)測模型大有可為。近日,中國醫(yī)學(xué)科學(xué)院血液病醫(yī)院(中國醫(yī)學(xué)科學(xué)院血液學(xué)研究所)信息與資源中心首席技術(shù)專家陳俊仁、干細(xì)胞移植中心主任姜爾烈和兒童血液病診療中心主任竺曉凡團隊聯(lián)合在計算科學(xué)頂尖期刊《自然·計算科學(xué)》在線發(fā)表了一項研究成果,該研究基于成人和兒童移植患者隊列的臨床數(shù)據(jù)進行數(shù)學(xué)建模,他們提出的模型,將有助于臨床醫(yī)生預(yù)測患者在接受移植手術(shù)后發(fā)生aGVHD的概率。
梳理10年移植案例記錄制成數(shù)據(jù)集
造血干細(xì)胞移植是治療急性白血病、骨髓衰竭性疾病等血液疾病的最終手段之一。有些造血干細(xì)胞移植患者可能出現(xiàn)aGVHD,主要表現(xiàn)為皮疹、腹瀉、膽紅素升高等癥狀。
aGVHD是造血干細(xì)胞移植后100天內(nèi)可能發(fā)生的重大并發(fā)癥,其發(fā)生時供者的免疫細(xì)胞會對患者的肝膽、腸道以及皮膚進行攻擊。這種并發(fā)癥的發(fā)生率為30%—45%,綜合國內(nèi)外的統(tǒng)計數(shù)據(jù),重度aGVHD的短期死亡率可能高達30%。
“理論上,在干細(xì)胞移植后加強免疫抑制可以降低重度aGVHD的發(fā)生風(fēng)險。但是,免疫抑制本身也是一個風(fēng)險因素;如果我們給所有造血干細(xì)胞移植患者都加強免疫抑制,那么患者的整體感染發(fā)生率就會提高,死亡率隨之也會提高,而這并不是我們所希望看到的。”陳俊仁表示。
業(yè)內(nèi)人士公認(rèn)的一點是,要降低aGVHD的發(fā)生概率,重在預(yù)防。“如果我們能提前預(yù)測重度aGVHD的發(fā)生,那么就能只對重度aGVHD患者給予較強的免疫抑制。”陳俊仁說。
長期以來,中國醫(yī)學(xué)科學(xué)院血液病醫(yī)院(中國醫(yī)學(xué)科學(xué)院血液學(xué)研究所)的醫(yī)生一直想要解決患者移植后重度aGVHD防治的實際臨床問題。為了解決該問題,中國醫(yī)學(xué)科學(xué)院血液病醫(yī)院(中國醫(yī)學(xué)科學(xué)院血液學(xué)研究所)的信息與資源中心、干細(xì)胞移植中心、兒科團隊,以及醫(yī)渡云(北京)技術(shù)有限公司的數(shù)據(jù)科學(xué)團隊組成了項目研究團隊。
研究團隊協(xié)同梳理了長達10年的移植案例記錄,并最終形成了一個名為“aGOAT”的數(shù)據(jù)集。
整合涵蓋200多個變量的動態(tài)指標(biāo)
在獲取數(shù)據(jù)集之后,研究團隊進行了數(shù)據(jù)建模,將模型命名為“daGOAT”,該模型納入了584名成人患者、45名兒童患者的數(shù)據(jù),其中16%的成人患者和24%的兒童患者在100天內(nèi)發(fā)生了重度aGVHD。
陳俊仁介紹:“我們發(fā)現(xiàn),從來沒有研究者系統(tǒng)性地整合造血干細(xì)胞移植患者在移植后的所有動態(tài)指標(biāo)”。而研究團隊提出的daGOAT模型整合了多維度時間序列數(shù)據(jù)計算重度aGVHD的風(fēng)險。
造血干細(xì)胞移植患者在移植后動態(tài)指標(biāo)涵蓋200多個變量,包括生命體征、血液細(xì)胞計數(shù)、血液生化指標(biāo)、血清免疫因子、血液免疫細(xì)胞分型等。由于涉及到的參數(shù)多,而且不是每天持續(xù)檢測,存在較多數(shù)據(jù)的缺失,即血液病患者臨床數(shù)據(jù)“多參數(shù)、小樣本”的問題。面對這一問題,很多統(tǒng)計方法以及機器學(xué)習(xí)方法都束手無策。
“而我們提出的daGOAT模型可以解決這一問題,并且在成人和兒童兩群患者的交叉驗證AUROC都達到0.78以上(滿分為1),遠超出過去
文獻報道的最佳水平。”陳俊仁介紹,研究團隊建立的模型預(yù)測效果顯著優(yōu)于MAGIC評分、Ann Arbor評分、基于圍移植特征的靜態(tài)模型和XGBoost動態(tài)模型。
這一成績的取得離不開中國醫(yī)學(xué)科學(xué)院血液病醫(yī)院(中國醫(yī)學(xué)科學(xué)院血液學(xué)研究所)信息化的發(fā)展。陳俊仁解釋稱:“daGOAT模型使用了大量的動態(tài)參數(shù),而且這些數(shù)據(jù)來自不同的檢測科室。運算daGOAT模型基本上不可能依靠手工輸入數(shù)據(jù),必須讓模型和醫(yī)院信息系統(tǒng)無縫銜接。因此,我們認(rèn)為醫(yī)學(xué)人工智能要進一步發(fā)展離不開醫(yī)院信息化的不斷升級。”
多學(xué)科的跨領(lǐng)域合作也是daGOAT模型得以建立并發(fā)揮作用的條件。“此次研究得益于全方位跨領(lǐng)域的協(xié)同整合,包括數(shù)學(xué)建模、數(shù)據(jù)庫統(tǒng)整、生物統(tǒng)計、實驗室技術(shù)以及臨床醫(yī)學(xué)。”陳俊仁說。
研究論文第一作者、中國醫(yī)學(xué)科學(xué)院血液病醫(yī)院(中國醫(yī)學(xué)科學(xué)院血液學(xué)研究所)信息與資源中心助理研究員劉雪鷗介紹,在模型的實際應(yīng)用中,他們會每天更新移植患者的實驗室檢驗數(shù)據(jù),根據(jù)模型預(yù)測患者是高危還是低危aGVHD,再預(yù)防性給藥,以期在不提高感染率的情況下降低重度aGVHD的發(fā)生風(fēng)險。目前,研究團隊正在加緊籌備這項工作。
“這項研究對事前預(yù)警提示臨床干預(yù)、降低不良事件發(fā)生率進行了初步探索。”陳俊仁表示。
未來將完善模型并開展前瞻性臨床研究
陳俊仁介紹,研究論文投稿到《自然·計算科學(xué)》后,編輯非常感興趣并很快決定送審。論文審稿人認(rèn)為,daGOAT模型是一個將患者基本特征和實驗室檢驗數(shù)據(jù)結(jié)合起來的機器學(xué)習(xí)預(yù)測模型,與僅采用患者基本特征預(yù)測的模型相比,這種模型精確度更高,更加適合臨床應(yīng)用,有助于醫(yī)生進行臨床決策。
相關(guān)專家表示,上述研究是基于多維度、高質(zhì)量臨床數(shù)據(jù)資源整合的典型研究范例,為血液系統(tǒng)疾病科學(xué)研究奠定了重要基礎(chǔ)。
“我們希望提供daGOAT模型也能應(yīng)用于其他應(yīng)用場景的證據(jù)。”陳俊仁介紹,當(dāng)時,研究團隊想到的最“夸張”的應(yīng)用場景是:能不能通過智能手機的微小移動或信號的振動,在一個人還坐著的時候就提前預(yù)測他是不是在接下來幾秒鐘將要站起來。
為此,研究團隊從美國加州大學(xué)獲得了一個智能手機數(shù)據(jù)集后專門測試了一下,他們發(fā)現(xiàn)daGOAT模型在這個應(yīng)用場景的預(yù)測效果也比隨機森林、XGBoost等機器學(xué)習(xí)模型的預(yù)測效果好。
“雖然我們對自身的定位還是堅守血液疾病的數(shù)據(jù)科學(xué)研究與工具開發(fā),但偶爾偏離主題做一些異想天開的研究,其實也挺好。”陳俊仁說。
談及該模型的不足之處,陳俊仁指出,該研究納入的數(shù)據(jù)僅限于中國醫(yī)學(xué)科學(xué)院血液病醫(yī)院(中國醫(yī)學(xué)科學(xué)院血液學(xué)研究所)一家血液中心的數(shù)據(jù),daGOAT模型還有待完善。下一步,研究團隊將開展daGOAT模型的前瞻性臨床研究。