這個(gè)小女孩雖比同齡孩子稍矮,且已經(jīng)失去了大部分乳牙和幾顆已經(jīng)長(zhǎng)出來(lái)的成年牙齒,但并沒(méi)有其他明顯的罕見(jiàn)病指征。
Gripp曾閱讀過(guò)描述Wiedemann-Steiner綜合征患兒牙齒過(guò)早生長(zhǎng)的病例報(bào)告。該疾病是由KMT2A基因突變引起的一種極為罕見(jiàn)的疾病。但Gripp并不確定。
于是,Gripp將這個(gè)女孩的照片上傳到一個(gè)智能手機(jī)應(yīng)用中,Wiedemann-Steiner綜合征出現(xiàn)在該軟件的提示中。
Gripp后來(lái)通過(guò)有針對(duì)性的DNA測(cè)試確定了女孩的病情。Gripp表示,人工智能方法幫助她縮小了疾病的潛在范圍,并節(jié)省了昂貴的多基因面板測(cè)試的成本。
近日,研究人員在《自然—醫(yī)學(xué)》上撰文描述了這種診斷輔助手段(一個(gè)叫做Face2Gene智能手機(jī)應(yīng)用)的技術(shù)特點(diǎn)。
它依靠機(jī)器學(xué)習(xí)算法和類腦神經(jīng)網(wǎng)絡(luò)對(duì)先天性和神經(jīng)發(fā)育障礙患者照片中的面部特征進(jìn)行分類。利用從圖片中推斷出的“經(jīng)驗(yàn)”,對(duì)可能的診斷進(jìn)行定位,并提供可能的選項(xiàng)列表。
該研究負(fù)責(zé)人、馬薩諸塞州波士頓數(shù)字健康公司FDNA首席技術(shù)官Yaron Gurovich告訴《中國(guó)科學(xué)報(bào)》,以標(biāo)準(zhǔn)化方式描述顯型能力的增強(qiáng),為未來(lái)的研究和應(yīng)用,以及識(shí)別新的遺傳綜合征打開(kāi)了大門(mén)。“它展示了如何將先進(jìn)的算法,比如深度學(xué)習(xí),應(yīng)用到一個(gè)具有挑戰(zhàn)性的領(lǐng)域。”
看“臉”識(shí)病
目前,人工智能蓬勃發(fā)展,甚至能“達(dá)到或超越人類表現(xiàn)”。在醫(yī)療健康領(lǐng)域,人工智能開(kāi)始成為醫(yī)生的“小助手”。
例如,各種遺傳綜合征會(huì)表現(xiàn)出獨(dú)特的面部特征,然而,綜合征數(shù)量巨大,要正確識(shí)別并非易事。利用人工智能或能幫助診斷遺傳綜合征。
但是早期此類人工智能研究采用的訓(xùn)練數(shù)據(jù)集規(guī)模不大,僅能識(shí)別少量綜合征。而Face2Gene正是人工智能輔助診斷的再進(jìn)一步。
FDNA研究人員首先訓(xùn)練了人工智能系統(tǒng),以區(qū)分狄蘭吉氏癥候群和天使人綜合征(這是兩種面部特征截然不同的病癥)與其他類似病癥。他們還教會(huì)該模型對(duì)努南綜合征的不同基因形式進(jìn)行分類。
他們?cè)谒惴ㄖ休斎肓撕w216種不同綜合征的17000多張確診病例的圖像。所有患者被確診的遺傳綜合征總計(jì)達(dá)幾百種。
研究人員利用兩個(gè)獨(dú)立的測(cè)試數(shù)據(jù)集測(cè)試人工智能的表現(xiàn),每一個(gè)數(shù)據(jù)集都包含數(shù)百?gòu)堉敖?jīng)過(guò)臨床專家分析的患者面部圖像。對(duì)于每一張測(cè)試圖像,F(xiàn)ace2Gene按照一定順序列出各種潛在的綜合征。
在兩組測(cè)試中,在約90%的情況下,F(xiàn)ace2Gene提出的前10條建議中都包括了正確的綜合征。當(dāng)看到面孔新圖像時(shí),該應(yīng)用程序的最佳診斷率約為65%。
“這是人們期待已久的醫(yī)學(xué)遺傳學(xué)領(lǐng)域突破。”Gripp說(shuō),“通過(guò)這項(xiàng)研究,我們已經(jīng)證明,在臨床工作中添加自動(dòng)面部分析框架,如DeepGestalt,可以幫助實(shí)現(xiàn)更早地診斷和治療,并改善生活質(zhì)量。”
此外,澳大利亞和巴西聯(lián)合研究團(tuán)隊(duì)于近日基于人工智能技術(shù)開(kāi)發(fā)出一種圖像處理算法,通過(guò)分析眼底相機(jī)拍攝的視網(wǎng)膜圖像,可以瞬時(shí)自動(dòng)識(shí)別出糖尿病視網(wǎng)膜病變的關(guān)鍵特征,即眼球內(nèi)由于視網(wǎng)膜毛細(xì)血管破裂而滲漏出來(lái)的液體,準(zhǔn)確率達(dá)98%。
“打敗”專家
FDNA希望不斷改善Face2Gene,以幫助其他公司在DNA分析過(guò)程中篩選、優(yōu)先排序和解釋未知基因變異等。但是為了訓(xùn)練它,F(xiàn)DNA需要大量數(shù)據(jù)。
Face2Gene目前對(duì)醫(yī)療專業(yè)人士是免費(fèi)的。而且,許多醫(yī)生已經(jīng)開(kāi)始將該系統(tǒng)作為診斷罕見(jiàn)遺傳病的第二選擇。它還可以為醫(yī)生不知道如何判斷病人癥狀的情況提供一個(gè)起點(diǎn)。“這就像谷歌搜索。”Gripp說(shuō)。
隨著越來(lái)越多的醫(yī)療保健專業(yè)人員將患者照片上傳到應(yīng)用程序,該應(yīng)用的準(zhǔn)確性略有提高?,F(xiàn)在它的數(shù)據(jù)庫(kù)中有大約150000張圖像。
去年8月,F(xiàn)ace2Gene和臨床醫(yī)生在出生缺陷研討會(huì)上進(jìn)行了一次非官方的“較量”。結(jié)果顯示,該應(yīng)用的表現(xiàn)優(yōu)于人類。
南卡羅萊納州格林伍德遺傳中心遺傳學(xué)家Charles Schwartz分發(fā)了10名兒童的面部照片,這些照片具有“相當(dāng)可識(shí)別的”綜合征特征,并要求與會(huì)者提出正確的診斷。
在49名參與研究的臨床遺傳學(xué)家中,只有一半人對(duì)兩個(gè)病例選擇正確。Face2Gene在其中7張圖片上做出了正確的選擇。
“我們慘遭失敗,F(xiàn)ace2Gene完勝。”馬里蘭州貝塞斯達(dá)美國(guó)國(guó)家人類基因組研究所的臨床遺傳學(xué)家Paul Kruszka說(shuō),“我認(rèn)為每個(gè)兒科醫(yī)生和遺傳學(xué)家很快都會(huì)有這樣的應(yīng)用程序,并將像用聽(tīng)診器一樣使用它。”
“目前的挑戰(zhàn)仍在于數(shù)據(jù),如果有更多且更多樣化的數(shù)據(jù),我們就能夠提供更好的結(jié)果。”Gurovich說(shuō)。
存在風(fēng)險(xiǎn)
但是,該算法的好壞取決于它的訓(xùn)練數(shù)據(jù)集,而且存在風(fēng)險(xiǎn),尤其是在那些只影響全球少數(shù)人的罕見(jiàn)疾病開(kāi)始受到關(guān)注的情況下,該公司和研究人員將對(duì)數(shù)據(jù)集進(jìn)行存儲(chǔ)和商品化。
醫(yī)生可以把這項(xiàng)技術(shù)當(dāng)作一種輔助手段,盡管它并不能提供明確的診斷。但研究人員表示,這也引發(fā)了一些倫理和法律方面的擔(dān)憂,例如培訓(xùn)數(shù)據(jù)集的種族偏見(jiàn)和數(shù)據(jù)庫(kù)的商業(yè)碎片化。這兩種情況都可能限制診斷工具的使用。
英國(guó)牛津大學(xué)計(jì)算生物學(xué)家Christoffer Nellaker表示:“這威脅到了這項(xiàng)技術(shù)的主要潛在好處。”Nellaker一直在推動(dòng)該領(lǐng)域的數(shù)據(jù)共享。
一直以來(lái),在訓(xùn)練數(shù)據(jù)集中的種族偏見(jiàn)都是一個(gè)問(wèn)題。
2017年對(duì)智障兒童進(jìn)行的一項(xiàng)研究發(fā)現(xiàn),在比利時(shí)白人兒童中,F(xiàn)ace2Gene對(duì)唐氏綜合征的識(shí)別率為80%,而在剛果黑人兒童中這一比例僅為37%。
然而,隨著訓(xùn)練數(shù)據(jù)集多樣化,該算法對(duì)非洲面部識(shí)別的準(zhǔn)確性得到改善,表明更公平地代表不同人群是可以實(shí)現(xiàn)的。
“正因?yàn)槿绱?,我們成功地開(kāi)發(fā)和培訓(xùn)了一種可以被認(rèn)為是種族平等的人工智能解決方案。我們計(jì)劃繼續(xù)擴(kuò)大和開(kāi)發(fā)人工智能解決方案,幫助減少醫(yī)療保健領(lǐng)域的種族差異。”Gurovich告訴《中國(guó)科學(xué)報(bào)》,“隨著我們向前發(fā)展,技術(shù)偏見(jiàn)會(huì)越來(lái)越少。”