Google 再次“登月” Baseline工程把基因大數(shù)據(jù)化

責任編輯:editor004

2014-07-27 11:14:48

摘自:虎嗅網(wǎng)

縱觀幾年,谷歌蘋果三星微軟幾家巨頭在健康領(lǐng)域投入越來越大,勢頭愈加生猛。Google在讓我們更清晰的了解自己身體秘密的同時,是否正在將我們趨向一個沒有隱私的時代,我們不得而知,只能猜想和等待。

Google 再次“登月” Baseline工程把基因大數(shù)據(jù)化

Google 在下一盤大棋。

縱觀幾年,谷歌蘋果三星微軟幾家巨頭在健康領(lǐng)域投入越來越大,勢頭愈加生猛。據(jù)華爾街日報報道,緊接無人駕駛汽車,隱形眼鏡式血糖儀,高原氣球網(wǎng)絡(luò)服務(wù),Google儼然開始了一項自公司成立以來最具野心,最為困難的科學(xué)項目,一個“登月”工程。Google X 實驗室開始了 Baseline“基線”項目,大量收集人類基因組標本并利用大數(shù)據(jù)合成一份完美的健康人類基因圖譜,為多種疾病的提早發(fā)現(xiàn)及治療提供前提。

基線工程的第一步是采集175個參與者的匿名基因和分子信息,取樣包括基因排序,血液,唾液,眼淚,尿液,以及參與者的食物及藥物代謝信息,心率,家族病史等,第一波測量過后,參與者將佩戴可穿戴測量設(shè)備,持續(xù)提供體征信息。Google將通過第三方的隱私過濾得到匿名的基因組信息。下一步將把實驗群體擴大到數(shù)千人,獲得更多更廣的基因數(shù)據(jù)。

項目領(lǐng)導(dǎo)者分子生物學(xué)家安德魯·康拉德(Andrew Conrad)2013年3月加盟Google,現(xiàn)在已經(jīng)建立起了一支70-100人的隊伍,包括生理,生物化學(xué),成像和細胞生物學(xué)的專家??道抡J為基線工程處在剛剛起步階段,基因圖譜的制作和分析是一項極其艱難的工作,我們對于DNA,蛋白,酶類間的相互關(guān)系和外界的影響知之甚少,但隨著掌握的數(shù)據(jù)量增多,依賴Google 強大的大數(shù)據(jù)計算能力,研究者們可以從海量的基因組數(shù)據(jù)中獲得生物標記(biomarker)的規(guī)律,而這些生物標記將對預(yù)防,治療,制藥領(lǐng)域產(chǎn)生強大的引領(lǐng)和促進作用。

舉例來說,每個人對于食物脂肪的代謝功能都是不一樣的,部分人的基因組中缺乏幫助人體代謝多余食物脂肪的生物標記,從而導(dǎo)致早年的心血管疾病,通過數(shù)據(jù)收集,研究者們可以準確的定位生物標記在基因中的位置,確定新病人是否缺乏這段標記,及時做出準確的治療和飲食推薦。大量減少心血管疾病的發(fā)生。

既然基因組的作用如此強大,在Google之前為什么沒有人開始同樣的收集工作呢?原因很簡單,沒錢沒時間。人類的基因組及其龐大,一個基因組由十萬以上的基因分段組成,每個基因段又由成百上千個核苷酸配對組成,放在幾十年前,受集一份整套的基因組的工作量是不可想象的。2001年,第一份基因組才被排序成功,而在十年前,單單一份基因排序需要一億美金,隨著排序技術(shù)的發(fā)展,如今只需要1000美金就可以完成。但一般的公司和個人還是支付不起系統(tǒng)性收集基因組的。記著之前在學(xué)校學(xué)起DNA排序時,十分激動的問生物老師我們要是收集幾萬人的DNA后通過大數(shù)據(jù)豈不是可以把人體的秘密通通展現(xiàn)出來,老師淡然一笑:好想法,你有錢嗎?

我沒有,但是Google財大氣出,魄力十足。

有人可能會好奇當今基因排序技術(shù)的準確度,老實說,不是很高,Emory大學(xué)的神經(jīng)學(xué)系主任Allan Levey在講座中勸告聽眾不要盲目花錢做基因排序,提到一位老友的故事:50歲后這位仁兄去做了一個基因排序以防基因病來得錯手不急,結(jié)果發(fā)現(xiàn)他的APP基因突變了,這個基因突變理論上必然導(dǎo)致老年癡呆癥(Alzheimer’sDisease),結(jié)果老兄喪氣地找到Levey 教授尋求解釋,經(jīng)過一番測試后發(fā)現(xiàn)他已經(jīng)過了開始發(fā)病年齡卻一點癥狀沒有,后來發(fā)現(xiàn)是基因排序出了差錯。這類事件時有發(fā)生,但是終歸是針對個人案例的。大數(shù)據(jù)的絕對優(yōu)點就是海量數(shù)據(jù)彌補個別差錯?;蛟S基線工程的第一波實驗結(jié)果會出現(xiàn)不準確的風險,但是幾年后,當實驗群擴張到千人甚至萬人的時候,通過計算足以剔除DNA中的大量無用分段和錯誤信息,將研究者的目光直接導(dǎo)向致病的基因段。人類的健康基因圖譜將得到越來越多的完善,接近完美。

那么關(guān)于老生常談的隱私問題呢?Google 已經(jīng)建立起當今世界上最為強大的電腦和信息網(wǎng)絡(luò)來支撐搜索引擎和YouTube這樣強勁的數(shù)據(jù)捕獲手段,今年年底又要利用安卓涉足穿戴式設(shè)備領(lǐng)域,數(shù)據(jù)的掌控量之恐怖,自然會讓我們不放心Google獲得大量的基因組數(shù)據(jù)??道略诓稍L中提到Google將與斯坦福和杜克大學(xué)的醫(yī)學(xué)院合作,兩個大學(xué)將把基線工程參與者的身份信息抹掉,把匿名數(shù)據(jù)交給Google,聽起來讓人稍稍安心一些,但仔細想想,那些被抹掉的也只是參與者的信息,Google獲得的卻是人類身體中最為珍貴的秘密,如果Google不將這些計算后的結(jié)果公開,而單獨和幾家制藥公司分享,我們作為普通老百姓可能一點辦法沒有,任由巨頭們把我們的弱點和需求看個透。

Google創(chuàng)始人之一拉里佩奇(Larry Page) 多次提到大數(shù)據(jù)在健康和醫(yī)藥領(lǐng)域的巨大潛能,常常不忿隱私法律對于人體數(shù)據(jù)獲取的制約,現(xiàn)在來看,Google可能在建立一個獨立的龐大數(shù)據(jù)池,僅供自己所用,直接繞過隱私法獲得數(shù)據(jù),為其數(shù)據(jù)計算能力找到了新的用武之地。我們只能寄希望于斯坦福和杜克為大眾把好隱私關(guān),制約Google的數(shù)據(jù)用法和走向。

Google在讓我們更清晰的了解自己身體秘密的同時,是否正在將我們趨向一個沒有隱私的時代,我們不得而知,只能猜想和等待。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號