研究人員寫道,之所以選擇1年死亡率作為預(yù)測窗口,是因?yàn)樗鼘⒃试S與其它研究進(jìn)行比較,而且它將考慮在兩年內(nèi),多次接受與急性髓系白血病相關(guān)的ICU治療的患者。
對風(fēng)險評估,需要手動計算,而基于機(jī)器學(xué)習(xí)的預(yù)測死亡率等疾病的結(jié)果可以用來節(jié)省時間和提高預(yù)測精度,他們寫的一篇論文中(在ICU患者急性心肌梗塞和心肌梗死后綜合征,構(gòu)建計算模型來預(yù)測一年死亡率)。本研究建立并評價各種機(jī)器學(xué)習(xí)模型,預(yù)測急性心肌梗死或心肌梗死后綜合征患者一年的死亡率。
為了收集數(shù)據(jù)集,論文的作者們從麻省理工學(xué)院計算生理學(xué)實(shí)驗(yàn)室維護(hù)的免費(fèi)重癥護(hù)理數(shù)據(jù)庫模擬-iii(模擬-iii)中獲取數(shù)據(jù)。模擬-iii包含來自4萬名患者的5.8萬例住院病例。他們通過選擇已被證明是死亡率預(yù)測因素的特征(如腎功能和肝功能、入院、人口統(tǒng)計學(xué)、治療、評估長期和短期總體健康的實(shí)驗(yàn)室值以及各種心臟標(biāo)志物),將研究對象的數(shù)量減少到5037名 。
最后,研究小組決定根據(jù)這些確診為急性心肌梗塞或經(jīng)前綜合癥(PMS)的患者的數(shù)據(jù)進(jìn)行分析,經(jīng)前綜合癥與心悸有關(guān),而非個體。這是因?yàn)樵谀承┣闆r下,病人在一次住院中存活了一年,但在另一次住院中卻沒有存活一年。
研究人員對這些記錄進(jìn)行預(yù)處理,以刪除重復(fù)記錄、對相同的輸入、數(shù)據(jù)輸入錯誤和異常值進(jìn)行多次處理。 在一臺搭載2.2GHz Intel Core i7處理器的PC上,使用谷歌開源TensorFlow框架,團(tuán)隊(duì)對其屬性選擇分類器、回歸分類等十余種分類算法進(jìn)行了訓(xùn)練。
在測試中,兩種人工智能模型,邏輯模型樹(LMT)和簡單的邏輯算法表現(xiàn)得比其它模型更好,在從數(shù)據(jù)集(1629人)中識別30%入院一年內(nèi)死亡的患者方面,準(zhǔn)確率達(dá)到85.12%。(第三種算法J48緊隨其后,準(zhǔn)確率為84.88%。)有趣的是,深層神經(jīng)網(wǎng)絡(luò)模型在識別一年內(nèi)死亡病人的能力上,優(yōu)于所有機(jī)器學(xué)習(xí)算法,該模型具有多層數(shù)學(xué)功能,可以模擬人腦中的行為神經(jīng)元。
研究人員寫道,這反映了數(shù)據(jù)科學(xué)中的一個共識,即沒有一種普遍適用的算法一直優(yōu)于所有其它算法。有許多因素可以影響心肌梗死后的死亡率。找出利用這些因素信息的方法將有助于準(zhǔn)確預(yù)測可能的結(jié)果。
這篇論文的作者指出,數(shù)據(jù)集是這項(xiàng)研究一個限制因素,實(shí)驗(yàn)室和圖表值缺失等數(shù)據(jù)缺口,也是一個限制因素。但他們認(rèn)為,結(jié)果表明,正確診斷和治療急性心肌梗塞對1年死亡率有明顯影響。他們寫道,從這個數(shù)據(jù)集可以看出,并沒有特定的因素提供了所需的可預(yù)測性信息,同時能包含所有相關(guān)標(biāo)準(zhǔn),可以改善預(yù)測。利用機(jī)器學(xué)習(xí)獲得更好的可預(yù)測性,可以幫助高?;颊吲ψ袷刂委熡媱?,以提高死亡率風(fēng)險。