當前位置:潮流男>生活趣聞>世間印象>

承啟生物實現純國產硬體高效能分析大規模基因測序資料

潮流男 人氣:1.29W

日前,承啟生物首 次實現了在純國產電腦上使用自研FANSe演算法高效能分析大規模基因測序資料,其速度與當前基於主流Intel和AMD處理器的桌上型電腦和伺服器相當。這實現了精 準醫學基因測序領域的純國產流程實用化,在這一領域中國徹 底擺脫了“卡脖子”問題。

承啟生物實現純國產硬體高效能分析大規模基因測序資料

大規模測序,又稱新一代測序、二代測序,將DNA或RNA打斷成許多小片段進行平行測序,一次測序即可得到幾百萬至幾億個小片段的核酸片段序列資訊,在生物學研究、疾病診斷、流行病溯源等領域有著廣泛的應用。但產生的海量資料必須經過大量運算才能得到有生物學意義的結論,通常這需要很強算力的計算機或伺服器才能在數小時內給出結果

然而,高效能CPU和GPU高度依賴進口,不但有被國外斷供“卡脖子”的危險,而且進口CPU還可能存在後門,有洩密風險。在政府等對安全性要求極高的場合,以往一直沒有純國產計算機能滿足大規模測序的分析需求,這是由於國產CPU難以滿足需求。

承啟一直在生物資訊國產化處理領域做努力,經過深入調研發現,兆芯開先CPU架構的整數效能理論上比較優 秀,實際應用時需要軟體的特定優化才能發揮其全部效能潛力,因此選擇了兆芯開先CPU作為FANSe演算法適配優化的目標。

承啟生物自研的FANSe演算法是目前唯 一規模化商用的純國產高效能大規模測序比對演算法,2020年其曾創下單機5分鐘分析完一個30X人全基因組測序資料集的世界紀錄,並一直保持至今。演算法完全自研帶來了顯著的優勢,可以任意根據CPU的特性而進行特別優化,而依賴於國外智慧財產權的傳統演算法則難以做到。

承啟生物在純國產電腦上使用自研FANSe演算法高效能分析大規模基因測序資料

日前,FANSe演算法在純國產平臺上執行成功,CPU是兆芯開先KX-U6780A,固態硬碟來自長江儲存,記憶體晶片來自長鑫。與之對比的是一臺雙Intel E5V3 (共28核56執行緒)的伺服器,都部署在承啟基因測序分析雲平臺上。在常見的轉錄組、翻譯組、細菌菌群巨集基因組等應用中,純國產計算機的效能僅比伺服器慢1%~12%,使用中幾乎感覺不到其效能差異。這也是純國產計算裝置在大規模測序資料處理上第 一次在實際應用效能上幾乎追平國際主流伺服器。

此前,承啟生物和華大智造聯合釋出了國產大規模測序的全流程,將測序儀、試劑、分析演算法等全面實現國產化,不依賴國外智慧財產權,有力地捍衛了中國精 準醫學的自主權。

如今,承啟再進一步,憑藉專門優化的FANSe演算法,將純國產計算裝置的應用效能提高到比肩國際主流的水平,標誌著中國的基因測序的安全性和自主可控達到一個全新的高度,不僅能支撐諸多精 準醫學應用,更能在檢驗檢疫、流行病控制、生物戰防治、法醫鑑定等直接關係到國家安全的方面大顯身手。

深圳承啟生物科技有限公司簡介

承啟生物是基於自主核心技術“多組學+資訊學”提供醫學服務、IVD及治療方案的綜合性精 準醫學平臺,致力於用生物醫學前沿科技為人們提供精 準醫療及健康管理解決方案。旗下有四家國家高新技術企業以及一家持牌臨檢中心。

承啟生物擁有完全自主研發並獲得國際高度認可的超高精度基因測序資料分析FANSe演算法。該FANSe演算法於2020年創造了演算法準確度和速度的世界紀錄,被作為國際人類蛋白質組計劃核心支柱的推薦演算法。承啟生物還建立了國內第 一個全自主基因檢測流程,在基因組、轉錄組、翻譯組、蛋白質組、代謝組全組學層次均有精 準的自主技術,該流程被作為國家醫學生命組學質量控制標準的藍本。(文章來源:網際網路)