深圳科學家破解DNA存儲技術世界性難題
深圳科學家破解DNA存儲技術世界性難題
“DNA硬盤”登上頂級期刊
4月25日,《自然-計算科學》發表了由深圳華大生命科學研究院主導的研究成果,研究團隊開創了一套獨具優勢的編解碼系統,用以解決當前DNA信息存儲領域的技術難題。
據悉,研究團隊結合DNA雙鏈模型,開創了一套比特—堿基編解碼系統,并在實驗中驗證了該系統在信息密度、技術兼容性、數據恢復穩定性等多方面的優勢。
廣州日報全媒體記者王納
DNA數據存儲擁有巨大潛能
我們知道,所有信息在計算機中只由二進制的方式存儲,即0和1兩個數碼。而生物的遺傳信息則儲存在DNA中,以A、T、G、C四種堿基表現。
也許你會思考:倘若把信息語言的0和1,轉換為生物語言的ATGC,我們是不是就能把各類信息長久地保存在DNA中,讓DNA成為“完美”的存儲器了?擅長把假設變為現實的科學家,已經用實際研究成果對這個問題給出了樂觀的回答。這也就是這項研究的重要意義。
深圳華大生命科學研究院科研人員告訴記者,DNA的數據存儲潛能其實是超越現有信息存儲器的。
隨著5G技術、大數據、人工智能等領域的蓬勃發展,海量數據如何長期穩定存儲已成為亟待解決的一大難題,而以“BT+IT”融合的DNA信息存儲技術,或能為這個問題提供更優解,因此受到了越來越多的關注。
畢竟在存儲信息這件事上,DNA可以說是坐擁數十億年經驗的資深前輩。相較于現有的U盤、硬盤、磁帶等介質,DNA具備無法比擬的優勢。
一是超高的信息密度。2012年《科學》雜志文章指出,1克DNA理論上可以存儲455EB數據,相當于數千萬個1TB移動硬盤的大小。
二是超長的待機時間。DNA作為相對穩定的分子,其半衰期長達521年,在理想狀態下甚至可保存成千上萬年。
三是超強的生物兼容性。DNA作為絕大多數生物遺傳信息的載體,相對無機物、金屬等存儲介質而言,具有更強的生物兼容性。
2019年,“DNA數據存儲器”入選《時代周刊》年度100項最佳發明。我們有理由相信,DNA憑借其獨家天然優勢,在信息密度、復制與維護成本、使用壽命等方面都具有顛覆現有技術的巨大潛能。
這項技術從2012年起步至今短短十年時間,DNA信息存儲領域已取得不少令人矚目的研究成果,包括檢索、修改等高級功能也已完成原理驗證性的測試,以微軟、谷歌等產業巨頭形成的DNA存儲聯盟更是在為其商業化廣泛合作蓄勢。
深圳科學家巧妙破難題
但是,如何在保證信息轉換效率和技術兼容的同時,大幅提高信息恢復的穩定性?這是DNA存儲中編解碼系統存在的棘手問題。如今,DNA存儲的技術壁壘,深圳華大生命科學研究院(以下簡稱“華大研究院”)提供了全新的解決思路。
4月25日,華大研究院、深圳國家基因庫等多家機構的研究團隊聯合在《自然》子刊《自然-計算科學》發表研究論文。研究團隊結合DNA雙鏈模型,開創了一套比特—堿基編解碼系統,驗證了該系統在信息密度、技術兼容性、數據恢復穩定性等多方面的優勢。
華大研究院團隊以兩套不同的規則,分別對兩條二進制信息進行“一對一”編譯轉換,再取兩者統一交集的部分為最終解,實現將兩條獨立的信息組合統一為一串DNA序列。
機智的朋友可能會問,人工合成的DNA要保存在哪?目前,常用的保存方法分為體內和體外兩種模式,兩者孰優孰劣尚未形成明確定論。為了全方位驗證新系統的信息恢復穩定性,華大研究院團隊通過體外DNA干粉和細胞體內大片段兩種存儲環境進行測試,皆實現了原始存儲數據的完整恢復。
在體外模式方面,研究結果證明,深圳科學家研究的編碼采用的線性數據恢復模式在每種DNA分子的平均拷貝數僅有100時,仍然能恢復最高88%的原始數據。
在體內模式方面,研究將信息存在了酵母活細胞的體內,酵母菌株經過1000代以上傳代之后,信息仍可以被完美恢復。這在一定程度上意味著,利用活體細胞作為DNA存儲的載體,上千年后原始信息或仍能被解讀。這樣的存儲方式可以得到接近于天然DNA分子存儲理論極限的物理信息密度,每克DNA能存儲的信息量約為432.2EB。據透露,華大研究院團隊曾將《開國大典》影片存儲于DNA中。
該研究由深圳華大生命科學研究院主導,深圳國家基因庫、首都師范大學、美國哈佛大學等多個研究團隊共同參與。華大研究院平質博士為論文第一作者。
相信隨著華大等全球科研機構、數字信息產業界的不斷突破,在不遠的未來,“DNA硬盤”將成為我們日常生活中必不可少的數據存儲設備之一。
版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。