|
驅動中國2017年12月11日消息 上周,谷歌發布了一款DeepVariant程序工具,它具備先進的AI深度學習能力,能利用測序數據拼湊更精準的人類基因圖譜,還可以精確識別DNA序列中的突變。這也是15年前科學家對人類基因測序后,首次實現計算機工具來解碼基因數據。
據悉,DeepVariant可實現將高通量測序所測區的數據,轉換成完整的基因組圖像。其可以自動識別測序數據中的插入基因、缺失突變以及單堿基對變異。之前,科學家所運用的高通量測序,雖然可以讓基因測序更容易實現。不過,這一測序方法所提供數據有限且易出錯。 目前, 科學家普遍使用的測序方法有: GATK、 VarDict 和 FreeBayes。不過這些工具都是通過排除讀取錯誤來鑒別突變。像使用最廣泛的GATK,就是通過簡易的人工設計的算法來測序。不過,谷歌推出的DeepVariant借助AI神經網絡來構建基于圖像要比這些方法都要更精確。
谷歌的研究團隊,試著將DNA測序數據轉換成一個圖像從而利用圖像識別技術來建立更精確的DNA序列。科學家還對數百萬份基因組測序以及高通量測序法進行了研究,來教會DeepVariant哪些數據重要,哪些可以忽略。 據DeepVariant的創造者來自哈佛大學公共衛生學院的Brad Chapman教授介紹,“其中一個挑戰在于基因組的復雜片段,每種工具都有優缺點。這些復雜區域對臨床測序異常重要,使用多種方法很有必要。” 谷歌此次發布的DeepVariant,在之前由三種顏色和三種數據組成的基因圖像在新發布的版本中達到了7種,可以更精準的表示基因數據信息。此外,DeepVariant目前還是款開源軟件,其他研究人員也可以使用DeepVariant進行基因測序的研究。
|

