基因測序攜大數據打通上下游
作者:佚名 來源:醫藥網 2017-7-28 打印內容
橫向資源協調合作
創新制造以智能化為典型特征,要求中國醫藥企業以新技術提升運營效率。精準醫療是未來醫療行業的發展趨勢,而精準醫療發展必須依托大數據平臺,因為平臺運營與數據服務是生物醫療產業發展的重要環節,基礎設施供應商合作并采用聯合運營的方式,才能為醫療機構、測序企業等數據提供方企業提供產業支持保障。
值得關注的是,從生命大數據提供方企業的角度,包括華大基因、諾禾致源、金域檢驗、藥明康德、達安基因等,數據都需要“存、管、算、察”的強大核心功能支撐,以實現數據空間分布式存儲應用,解決存儲空間和數據持久化、數據解耦、分級部署、數據發現、動態重組、信息分析調度、跨集群分布式計算等復雜性問題。
隨著人類基因組測序成本以“超摩爾定律”速度下降,與之相匹配的基因組數據分析成本也在下降,尤其是在2016年至今,短短一年,基因數據分析成本的下降速度遠遠超過了基因測序成本下降的速度。現在,單個人的全基因組數據分析成本已經降低至100元人民幣以內。
基因大數據分析包括十幾個步驟,如果每個企業做數據分析面對不同的步驟選擇差異化方法,如何來組織不同的工具更優地高效分配計算任務,這是目前整個基因測序、云計算、器械設備研發等軟硬件企業都在致力于優化的戰略性工作。北京聚道科技(GeneDock)有限公司CEO李夏戎指出,不僅需要每個企業聚焦自身的底層數據優化,還需要產業鏈橫向跨步驟協同。“包括GATK算法優化,加速計算運轉過程,減少CPU開銷,并且同產業鏈合作伙伴一同將技術封裝,制定數據壓縮、存儲方案;基因測序公司也需要將數據調整成分布式,從而協同開發更加易用的操作流程。”
華大基因CEO尹燁表示,檢測成本下降,如今已不是單個公司憑技術挖掘就可以解決的,“從上游醫療器械設備廠商,到中游基因測序企業,再到下游健康服務平臺,基因檢測產業基于生命大數據各環必須共有、共為、共享;全行業預計到2020年能夠將單個人的全基因組測序和分析總費用控制在2000元人民幣以內,數據分析流程標準化和費用快速下降,將有望提前實現行業預期。”
上篇:
下篇: