你以前聽過這樣的故事:一對高才生在一所精英大學(xué)里相識,出于對計算機(jī)的熱愛而走到一起,在經(jīng)過了幾次開到深夜的技術(shù)討論會后,創(chuàng)建了一家網(wǎng)站或是一種應(yīng)用程序。沒等你聽說,他們的課余小項(xiàng)目就變成了新創(chuàng)企業(yè),兩位青澀少年從投資者那里籌集到了大筆資金,入駐了高檔寫字樓,組建了一家讓他們一夜之間至少在賬面上成為百萬富翁的公司。
初看上去,納特 特納(Nat Turner)和扎克 溫伯格(Zach Weinberg)就是這樣的人。他們到賓夕法尼亞大學(xué)讀大一的第一天即成為密友。現(xiàn)在,這對年輕的二人組—都是28歲—在紐約經(jīng)營著一家新創(chuàng)企業(yè)??墒撬麄兊膭?chuàng)業(yè)夢想比絕大多數(shù)人都要宏大。他們的嶄露頭角的新創(chuàng)企業(yè)不是普通的社交網(wǎng)絡(luò)、照片共享軟件或是約會網(wǎng)站。他們制作的工具不是給十幾歲和二十幾歲的人用來在手機(jī)屏幕上調(diào)情或是買夜宵的。
他們在兩年前創(chuàng)辦的公司Flatiron Health正在追逐一個相當(dāng)大膽的目標(biāo):撼動醫(yī)療界。他們針對的,并非是一般的醫(yī)療難題。特納和溫伯格希望通過收集和分析海量的臨床數(shù)據(jù),打入醫(yī)學(xué)界最為復(fù)雜、最需要研究、也是最艱難的一個領(lǐng)域:癌癥治療。不過,這二位在沃頓商學(xué)院(Wharton School)學(xué)的是經(jīng)濟(jì)學(xué)和創(chuàng)業(yè)學(xué),從來沒有上過一堂像樣的生物課。
不過,在你嘲笑他們之前,先想想這個吧:Flatiron不是他們一起創(chuàng)辦的第一家公司,而是第三家。他們嘗試過為大學(xué)生開辦一家在線食品購買服務(wù)網(wǎng)站,結(jié)果失敗了。他們的第二次創(chuàng)業(yè)是在讀大三時開辦的Invite Media,利用大數(shù)據(jù)技術(shù)來提高數(shù)字營銷的效力。他們獲得了巨大的成功,大數(shù)據(jù)教父、全球最大的數(shù)字營銷企業(yè)谷歌公司(Google)在2010年出資超過8,000萬美元,買下了Invite。
現(xiàn)在,谷歌為特納和溫伯格再次打開了支票薄,通過其風(fēng)險資本部門谷歌風(fēng)投公司(Google Ventures)給Flatiron注資超過1億美元。(Flatiron總共籌集了1.38億美元。)不只有谷歌被這兩位年輕的技術(shù)人員打動。杜克大學(xué)的一位醫(yī)學(xué)教授、著名的腫瘤學(xué)家艾米 阿伯內(nèi)西(Amy Abernethy)承認(rèn),F(xiàn)latiron的目標(biāo)極難實(shí)現(xiàn)。但是,它的收集整理臨床數(shù)據(jù)的方法嚴(yán)密而周全,她深受吸引,在今年7月決定加盟公司,擔(dān)任首席醫(yī)學(xué)官。阿伯內(nèi)西說:“上了Flatiron這條船,我已經(jīng)把聲譽(yù)都搭上了。”她不久前主持過杜克大學(xué)癌癥研究計劃(Duke Cancer Care Research Program),曾經(jīng)介入早期的一些通過收購大量臨床數(shù)據(jù)以改進(jìn)癌癥治療的“夢幻”項(xiàng)目。
即使沒有背書以及谷歌的投資,這種極端自負(fù)的主張也值得關(guān)注:一對長著娃娃臉的IT技術(shù)人員居然將癌癥治療推進(jìn)到迄今為止連科研人員和受過高度培訓(xùn)的醫(yī)生都達(dá)不到的程度。Flatiron的首席執(zhí)行官特納為人謙遜,卻無所畏懼。“我們在打造一家正好處于癌癥空間的科技公司。”他說。(他經(jīng)常使用“空間”這個詞。)
Flatiron的論點(diǎn)如下:目前,僅有一小部分癌癥患者的治療數(shù)據(jù)得到了有系統(tǒng)的采集。這種采集基本上是在臨床試驗(yàn)中隨意為之的,只覆蓋了大約4%的成人癌癥患者(不過,相關(guān)的估計有差異)。Flatiron將余下大約96%的信息加以整理,實(shí)現(xiàn)標(biāo)準(zhǔn)化,然后將數(shù)據(jù)提供給醫(yī)生。公司認(rèn)為,這能幫助醫(yī)生找出更好的治療方案。
理論上,醫(yī)生們能夠找出病情類似的患者的最有效療法,或者是評估自己的療效,比如他們可以將自己的乳腺癌治療效果與美國各地其他專家的治療效果做比較,并且快速糾正不足之處。這些數(shù)據(jù)可以突顯出最為經(jīng)濟(jì)的療法,反之也能展示哪里浪費(fèi)了醫(yī)療開支。它能給更多的病人匹配合適的臨床試驗(yàn),有可能加快新藥開發(fā)和審批的過程。特納和溫伯格并沒有在鼓吹通過數(shù)據(jù)來終結(jié)癌癥困擾的烏托邦式的科技夢想,而是希望能夠帶來有意義的進(jìn)步。特納表示:“我們所做的一切是在表明,如果我們能從其他行業(yè)中借鑒些什么,那就是數(shù)據(jù)的價值。有多大價值,現(xiàn)在還不知道。”即使好處不大,也能影響千百萬人。“哪怕只有影響到各種癌癥的5% ……”他說話的聲音漸漸變?nèi)酢?014年,美國有約170萬人新確診為癌癥,患者整體存活率提高5%,相當(dāng)于一年就拯救了數(shù)萬人的生命。(參見圖表)
特納首次對癌癥產(chǎn)生興趣是在2009年。當(dāng)時,他和親屬在北卡羅來納州度假,7歲的表弟布倫南 西姆金斯(Brennan Simkins)生病了。經(jīng)過一連串的化驗(yàn),表弟被確診患上了急性骨髓細(xì)胞白血病,由此開始了多年的折磨,先是骨髓移植,然后又復(fù)發(fā),再移值,再復(fù)發(fā)。西姆金斯總共經(jīng)受了四次痛苦的骨髓移值,還被數(shù)次誤診。他今年12歲,病情自2011年以來一直處于緩解期。
表弟痛苦求生的經(jīng)歷促使特納和溫伯格開始動腦筋,為患有類似病癥的人們做點(diǎn)什么。他們討論了開辦一家新公司的創(chuàng)意,起初考慮通過互聯(lián)網(wǎng)提供補(bǔ)充性的專業(yè)醫(yī)療建議。特納(他的橡膠手鐲上刻有西姆金斯的名字)說:“在半年的時間里,我們把精力都放在了癌癥上。”二人造訪了大約60家癌癥中心,與專家交談,和醫(yī)生巡訪,探討可能的商業(yè)創(chuàng)意。經(jīng)常與他們同行的,還有克里施納 耶什萬特(Krishna Yeshwant),他是一名醫(yī)生和谷歌風(fēng)投公司的合伙人,專業(yè)從事生命科學(xué)投資。
經(jīng)過數(shù)十次交談,特納和溫伯格形成了一個新的創(chuàng)意:整理分散在美國各地的腫瘤治療中心檔案里的海量臨床數(shù)據(jù),無論是數(shù)字形式還是其他材質(zhì)的數(shù)據(jù),加以編排匯總,再返回給醫(yī)生,目的是幫助他們更好地決定怎樣治療病人。
對于特納和溫伯格這兩位數(shù)據(jù)狂人來說,腫瘤學(xué)臨床數(shù)據(jù)的問題既明顯又熟悉。盡管多年來,醫(yī)學(xué)機(jī)構(gòu)一直在努力說服醫(yī)生和醫(yī)院采用電子病歷(簡稱“EMR”),但是腫瘤學(xué)的數(shù)據(jù)依舊難于查找和使用。特納說:“EMR的數(shù)據(jù)太不合格。”一位病人的數(shù)據(jù)可能有幾十個來源:實(shí)習(xí)醫(yī)師、腫瘤科醫(yī)生、放射科醫(yī)生、外科醫(yī)生、化驗(yàn)室和病理報告,等等。即使數(shù)字化的數(shù)據(jù)也存在著技術(shù)人員所說的“格式散亂”的問題。數(shù)據(jù)庫沒有經(jīng)過規(guī)整,展示方式因化驗(yàn)報告和病歷的不同而存在差異。更糟糕的是,隱藏的報告里的海量數(shù)據(jù)有的是手寫的,有的是掃描文件,有的是從沒有人聽過的錄音,還有的是由傳真機(jī)生成的低分辨率PDF文檔,結(jié)果造成各種數(shù)據(jù)系統(tǒng)無法兼容,再加上有關(guān)個人健康信息的嚴(yán)格隱私規(guī)定,令共享數(shù)萬種腫瘤療法變得難上加難。
坦白地說,挑戰(zhàn)極為巨大。
理論上,電子病歷應(yīng)該很容易做這樣的數(shù)據(jù)匯總和整合。但是想想這樣的情況:假設(shè)要測量某一種蛋白質(zhì)的水平,比如癌癥病人通常要化驗(yàn)的白蛋白,來自于某家癌癥中心的EMR可能會被用30多種格式展示出來。這算是一大挑戰(zhàn),考慮到癌癥治療中采用的蛋白質(zhì)和遺傳化驗(yàn)、活組織檢查及其他診斷方法超過100種,整理的難度將成倍增長。再考慮到美國獨(dú)立的EMR系統(tǒng)和癌癥中心的數(shù)量,難度又會提高很多倍。想必現(xiàn)在,你已經(jīng)理解這個問題的復(fù)雜性了。
為了解決這一問題,特納和溫伯格花了兩年多的時間建立他們所謂的數(shù)據(jù)模型,也就是將海量數(shù)據(jù)清楚地分門別類的方法。他們很快發(fā)現(xiàn),針對所有類型的癌癥來做這項(xiàng)工作實(shí)在是太復(fù)雜了。因此,他們與一群醫(yī)生顧問合作,專注于結(jié)腸癌。利用公開的臨床數(shù)據(jù),他們提取了超過350個類別,包括人口結(jié)構(gòu)、地點(diǎn)、癌癥發(fā)展期、疾病的生物學(xué)標(biāo)識以及對療法的反饋,等等。然后,他們再對其他類型的癌癥重復(fù)這一過程。
從EMR中提取數(shù)據(jù)是一項(xiàng)極度勞動密集型的工作,為了將這一過程自動化,F(xiàn)latiron采用了各種計算機(jī)技巧,包括給化驗(yàn)報告確定價值的匹配算法。公司還完善了一種叫做“自然語言處理”的技術(shù),讓計算機(jī)“閱讀”文件,并且從中提取數(shù)據(jù)。這類系統(tǒng)特別容易出錯,所以Flatiron創(chuàng)造了一種人機(jī)混合感知系統(tǒng),鎖定并糾正錯誤。其實(shí)就是公司聘請了一個由50名護(hù)士組成的團(tuán)隊(duì),手工錄入500名患者的數(shù)據(jù),制作出特納所謂的“培訓(xùn)模板”,可以用來發(fā)現(xiàn)自動收集的數(shù)據(jù)中的錯誤。相關(guān)的差異再被反饋回系統(tǒng)中,幫助完善自動收集程序。
早期的努力——包括美國國家癌癥研究所(National Cancer Institute)的一項(xiàng)耗資5億美元之巨、名叫“caBIG”的生物信息學(xué)計劃—不是失敗,就是尚未產(chǎn)生積極的效果。但是,阿伯內(nèi)西說,F(xiàn)latiron對復(fù)雜數(shù)據(jù)的專注讓她驚嘆。她曾經(jīng)擔(dān)任過CancerLinQ項(xiàng)目顧問委員會主席,并且參與了其他的臨床腫瘤數(shù)據(jù)的數(shù)字化編纂工作。她說,特納和溫伯格顯然明白,“光有技術(shù)解決不了這個問題,這是我決定和他們一起努力的原因”。
谷歌風(fēng)投公司的投資不僅提升了Flatiron的信譽(yù),還讓它有本錢收購為腫瘤醫(yī)學(xué)創(chuàng)造EMR服務(wù)的Altos Solutions公司。該公司位于加利福尼亞州山景城(Mountain View),距離谷歌不遠(yuǎn),收購它讓Flatiron擁有了更大的用戶基礎(chǔ),加強(qiáng)了與醫(yī)生的聯(lián)系。目前,大約有210家癌癥醫(yī)療中心使用Flatiron的系統(tǒng),每年共收治大約30萬名新患者。大多數(shù)客戶是社區(qū)癌癥診所,但是也有一些大型學(xué)術(shù)機(jī)構(gòu),比如耶魯紐黑文醫(yī)院(Yale-New Haven)的斯米洛癌癥診所(Smilow Cancer Hospital)、賓夕法尼亞大學(xué)(University of Pennsylvania)的艾布拉姆森癌癥中心(Abramson Cancer Center)。谷歌表示,給Flatiron投資的原因之一,是想讓一個前景光明的領(lǐng)域快點(diǎn)出成果。谷歌風(fēng)投公司的主管比爾 馬里斯(Bill Maris)說:“我們努力不讓電子醫(yī)療紀(jì)錄還要再過一代人的時間才能得到廣泛應(yīng)用。我希望,我們能省去人們的很多麻煩和痛苦。”
橫穿美國,前往位于長島(Long Island)林木蔥蘢的郊區(qū)杰斐遜港(Port Jefferson)的一座不起眼的低板辦公樓,這里的杰弗里 瓦奇爾卡(Jeffrey Vacirca)醫(yī)生相信Flatiron的愿景。瓦奇爾卡說,他已經(jīng)使用了數(shù)年Altos的EMR系統(tǒng),幫助他改進(jìn)了對患者的治療,但是這個系統(tǒng)還有很大的潛力沒有發(fā)揮出來。他說:“數(shù)據(jù)非常多,但是沒有人能整理它,沒人知道其中的含義。我認(rèn)為,F(xiàn)latiron的重要性就在這里。它提取所有的詳細(xì)數(shù)據(jù)和數(shù)百萬名患者的治療結(jié)果,加以評估和歸類,尋找真正有效的方法。”瓦奇爾卡醫(yī)生將Flatiron系統(tǒng)稱為“癌癥治療的基礎(chǔ)設(shè)施”。他說,未來有了它,他就能發(fā)現(xiàn),他對特定癌癥的治療方法是否在哪些方面已經(jīng)落后并加以調(diào)整,還能確定是否有更多的病人符合臨床試驗(yàn)的資格。他還說:“如果積累患者的速度增加五倍,想象一下,你能讓多少藥物通過規(guī)定的流程?”
該領(lǐng)域的一些領(lǐng)軍人物仍然對大數(shù)據(jù)的長期抗癌前景表示懷疑。在不久前發(fā)表在《細(xì)胞》雜志(Cell)上的一篇論文中,開創(chuàng)性研究者羅伯特 溫伯格(Robert Weinberg)指出了大數(shù)據(jù)和癌癥之間不穩(wěn)定的關(guān)系。他與扎克 溫伯格沒有親戚關(guān)系,是麻省理工學(xué)院懷特黑德生物醫(yī)學(xué)研究所(MIT's Whitehead Institute for Biomedical Research)的創(chuàng)始人之一。他強(qiáng)調(diào),從腫瘤里的蛋白質(zhì)間的相互作用到基因突變,方方面面的數(shù)據(jù)膨脹已經(jīng)超過了研究人員的解讀能力。他后來在一次采訪中對記者說:“有人對生物信息學(xué)太著迷,以為只要做一下數(shù)據(jù)匯總,就可以獲得從前無法得到的高質(zhì)量的見解。對我來說,這一點(diǎn)并不明顯。”
羅伯特 溫伯格還說,即便可以利用數(shù)據(jù)來提高某些治療方案的療效,其改進(jìn)的程度也并非大到足以讓醫(yī)生改變他們的療法。他說:“有很多大膽的嘗試和樂觀的聲明。相比于已經(jīng)付出的努力,實(shí)際得到的經(jīng)驗(yàn)很少。”
斯坦福大學(xué)的一位醫(yī)學(xué)健康研究和政策教授約翰 約安尼季斯(John Ioannidis)給出的評價要高一些,但是也有限。他認(rèn)為,如果有能力通過一個集中的系統(tǒng)將患者的病歷與療法進(jìn)行匹配,有助于減少小診所與大醫(yī)院在癌癥治療方法上的巨大差異。但是除了高度受控的臨床試驗(yàn),依靠其他數(shù)據(jù)能否實(shí)現(xiàn)重大進(jìn)步,約安尼季斯心存疑問。他說:“我們能從這個沒有試驗(yàn)設(shè)計的數(shù)據(jù)大集合中學(xué)到多少東西,是個公開的疑問。”
特納和扎克 溫伯格并不期望能迅速打消別人的疑慮。但是他們和很多客戶(Flatiron的客戶數(shù)量還在不斷增長)都相信,他們的“智能數(shù)據(jù)”將給癌癥患者帶來更佳的治療。阿伯內(nèi)西說,它首先可以消除社區(qū)診所和醫(yī)術(shù)通常更高的頂級教學(xué)醫(yī)院之間的差距。與此同時,聯(lián)合創(chuàng)始人溫伯格說,F(xiàn)latiron從事的是長期抗癌斗爭:“我們是一家只有兩年歷史,但有著雄心勃勃的龐大計劃的新創(chuàng)企業(yè)。我們已經(jīng)來了個開門紅,但歸根到底,這是一個需要花數(shù)十年才能解決的問題。”