5月24日消息,據(jù)Technologyreview報道,微軟公司旗下研究院的研究人員表示,在早期利用NDA存儲電影和文檔的研究基礎(chǔ)上,該公司正在研發(fā)利用生物學取代磁帶驅(qū)動器的存儲裝置。
微軟研究院的計算機架構(gòu)師表示,該公司已經(jīng)正式制定了一個目標,即在2020年之前,在數(shù)據(jù)中心內(nèi)建立一個以DNA為基礎(chǔ)的操作存儲系統(tǒng)。微軟研究院架構(gòu)師道格·卡米(Doug Carmean)說:“我們希望3年內(nèi)實現(xiàn)這樣的愿景,即在原始商業(yè)系統(tǒng)中的DNA上存儲相當于1個數(shù)據(jù)中心的數(shù)據(jù)量。”卡米還描述了最終設(shè)備的大小,它與20世紀70年代的施樂復印機差不多。在內(nèi)部,微軟懷有更宏偉的目標,即利用生物學取代磁帶驅(qū)動器,這是一種用于歸檔信息的通用格式。卡米說:“我們希望把它命名為‘DNA存儲'。”
這些計劃表明,許多科技公司正嚴肅地對待這個看似奇怪的想法,希望將視頻、照片或有價值的文檔保存在基因構(gòu)成的分子中。Semiconductor Research Corporation首席科學家維克多·日爾諾夫(Victor Zhirnov)表示,努力增加計算機內(nèi)存依然存在物理極限,而DNA卻擁有令人難以置信的密度,可用其存儲數(shù)據(jù)。
在DNA中,每部電影都被壓縮到比方糖更小的體積。日爾諾夫說:“DNA是宇宙中已知最密度最高的存儲介質(zhì),這就是為什么人們會看重這種研究潛力的原因,我們正在解決存儲信息呈現(xiàn)指數(shù)增長的問題。”去年七月份,微軟公開宣稱它在DNA鏈中儲存了200兆字節(jié)的數(shù)據(jù),其中包括一段音樂視頻,創(chuàng)下了新的記錄??着c微軟研究院專家卡琳·斯特勞斯(Karin Strauss)、華盛頓大學計算機實驗室科學家路易斯·塞澤(Luis Ceze)在預印服務器BioRxiv上發(fā)表論文,介紹了他們?nèi)〉玫倪M展。
利用DNA存儲數(shù)據(jù)的主要障礙仍然存在,將數(shù)字位轉(zhuǎn)換成DNA編碼(由A、G、C和T組成的核苷酸鏈)仍然費力而昂貴,因為制造DNA鏈需要漫長的化學過程。在其示范項目中,微軟使用了13448372個獨特的DNA片段。專家表示,在公開市場上購買這些材料要花80萬美元。哥倫比亞大學研究DNA存儲方法的教授雅尼弗·埃里奇(Yaniv Erlich)說:“用DNA存儲數(shù)據(jù)的主要問題是成本高昂,因此微軟方案最重要的地方是其是否能解決這個問題”。在閱讀卡米等人的論文后,埃里奇說:“我沒有看到幫助實現(xiàn)這個目標的任何進展,但也許他們還有更多新東西。”
微軟表示,DNA存儲成本需要下降10000倍后才可能被廣泛采用。雖然許多專家認為這是不可能的,但微軟堅信這種進步可能會發(fā)生,前提是計算機行業(yè)需要它。將數(shù)字數(shù)據(jù)寫入DNA的過程自動化也是至關(guān)重要的。根據(jù)數(shù)周的實驗顯示,卡米估計向DNA中轉(zhuǎn)存數(shù)據(jù)的速率是每秒400字節(jié)。微軟表示,這個速度需要增加到每秒100兆字節(jié)。
讀取數(shù)據(jù)變得越來越容易,通過使用高速測序機就可實現(xiàn),包括召回文件的特定部分,類似于計算機上的隨機存取存儲器。微軟認為,如果DNA閱讀獲得兩倍改進,就能促使該系統(tǒng)的效率滿足商業(yè)用途。由于寫入和檢索數(shù)據(jù)到DNA中非常緩慢,任何早期使用的技術(shù)將僅限于特殊情況。這可能是因為需要存檔的數(shù)據(jù)存在法律或監(jiān)管原因,如警察機構(gòu)的CAM視頻或醫(yī)療記錄。
微軟目前正與位于舊金山的DNA制造商Twist Bioscience合作,后者是新成立的公司,致力于提高DNA產(chǎn)量。除Twist Bioscience之外,其他類似公司還包括DNAScript、Nuclera Nucleics、Evonetix、Molecular Assemblies、Catalog DNA、Helixworks以及從Oxford Nanopore剝離出來的Genome Foundry。
有些初創(chuàng)公司正追求令人興奮的愿景,即用一種使用酶的DNA代替40年的化學反應過程,就像我們自己的身體那樣。Technicolor Research的科學主管讓·伯洛特(Jean Bolot)說:“我相信今年會看到結(jié)果。”他的公司始終在與電影公司討論如何用DNA存儲。他說,1951年之前的半數(shù)電影因為存儲在電影膠片上而丟失?,F(xiàn)在有了新的格式,如高清視頻和虛擬現(xiàn)實,正在擴大工作室保存這些作品的能力。
日爾諾夫表示,計算機芯片制造商非??粗谼NA存儲技術(shù),因為傳統(tǒng)媒介(如磁帶或硬盤)存儲數(shù)據(jù)總是存在物理限制。日爾諾夫所在的機構(gòu)由微軟、英特爾以及其他機構(gòu)資助,他們正進行應用研究,并從2013開始開始瞄準DNA。他說,認為DNA太“軟”的半導體專家們驚訝地發(fā)現(xiàn),它比硅器件長100到1000倍。這種分子非常穩(wěn)定,經(jīng)??梢詮拿歪锵蠊穷^和遠古人類遺骸中提取到。
但其最重要的特征是高密度性。DNA可以在1立方毫米的片段上容納100億億字節(jié)信息。日爾諾夫說“密度才是最重要的”。微軟研究院發(fā)言人表示,該公司目前無法確認“產(chǎn)品計劃的具體細節(jié)”。在公司內(nèi)部,DNA存儲的想法顯然得到許多人支持,但尚未被普遍接受??渍f:“我們內(nèi)部的人相信我們,但支持磁帶存儲的人還存在懷疑。”
除了質(zhì)密耐用外,DNA存儲還有其他不被經(jīng)常提到優(yōu)勢,即與人類物種的極端相關(guān)性。想想那些你已經(jīng)無法讀取的舊軟盤或難以辨認出象形文字的粘土片。與這些媒介不同的是,DNA永遠不會過時??妆硎荆?ldquo;只要我們依然是人類,我們永遠都能讀取DNA。”