某某科技公司
震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!
来源: | 作者:it-101 | 发布时间: 04-28 03:51:23 | 0次浏览 | 分享到:
 2017年5月,19岁世界人人围棋第有有一有一个人柯洁九段在和AlphaGo的围棋终极人机...

 2017年5月  ,19岁世界人人围棋第有有一有一个人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败  ,加之 是人类自然顶尖高手与这台机器群体之群体之间加之第第四次较量 ,同年10月 《Nature》杂志发表了低于它所有人加之版本的AlphaGo Zero。最终结果拿到向世界人展示了强化建立运行系统美女球迷学成功后完成复杂任务后的加之  ,而其背后所说明值得一提运算具备  ,是计算机科学的分支细分领域--高能计算(High Performance Computing)  ,加之 际应用不仅仅成了了其他国家综合自身实力的体现  ,更给现代人的日常每天生活能给了需要变动  ,目前仍然该新型技术已在航空航天、核试验模拟、天气预报、人类生命科学、高新制造(汽车、电子)等细分领域拿到了广泛应用。

以人类生命科学细分领域举例  ,日渐人类生命遗传密码(基因组)的日渐破解  ,人的生老病死最终结果复杂这件其它 用数字化的多种渠道具体情况呈现 ,以期成功后完成疾病的精准综合分析、诊断和治疗后  ,让现代人远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病  ,加之整体提高人均预期寿命  ,并大幅度加之整体提高国家社会卫生负担。

二十年来 ,有有一有一个人的全基因组测序的成本以“超摩尔定律”的加速度度下降 ,而高能计算在测序表现数据综合分析反方向的应用也经常发生了翻天覆地的需要变动。目前仍然世界人主流的基因组测序表现数据综合分析工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit)  ,该项人类生命科学细分领域公认的最佳工作中流程成功后完成最终结果有有一有一个人都有全基因组(Whole Genome Sequencing  ,WGS)30X表现数据综合分析其它 1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算细分领域拿到一突破进展  ,于日成功后成功后完成6分钟成功后完成30X WGS全流程的综合分析任务后 ,相较于GATK基础标准计算时长提速300倍。

根据上述NIH公布的最新资料  ,日渐测序新型技术的日渐发展  ,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟成功后完成30X WGS任务后是由华大基因自主研发的LUSH工具集成功后完成的  ,打破了软件工具工具在2020年1月创造的15分钟极限加速度度。不仅仅的黑科技是是因为设计了全的新底层架构设计造型  ,新型技术提供了此基础中央处理方法器和图形处理方法器结合起来起来予以 基因表现数据综合分析的高能加速度方案  ,在加之整体提高集群计算资源消耗、加之整体提高检出加速度度是不仅仅  ,成功后完成了全程自动化、信息内容化 ,有记录可回溯 ,其它 更完美地用于精准医学的应用场景。

LUSH工具集加速度的的新底层架构逻辑

LUSH工具集新型技术提供这有一种“CPU+GPU”的高并行软硬件才能大大减少无法解决 方案  ,此基础经典流程中不软件工具模块BWA、SAMTOOLS和GATK  ,多种渠道GPU的通用运算新型技术 ,予以 计算引擎和加速度引擎的的新架构设计造型  ,成功后完成算法优化和并行化处理方法 ,并结合起来华大自主研发的超高通量测序仪  ,成功后完成碱基表现数据流的超高速综合分析  ,加之拿到一准确的综合分析加之。

LUSH工具集加速度流程示意图

是是因为加之 人类生命数字化进程其它 严谨的科学精神精神思想  ,而其应用场景两个方面体目前仍然的精准医疗、健康管理等与人类自然健康都有息息相应的细分领域  ,加之各是不同于其它高能计算细分领域  ,基因组表现数据综合分析对精度有极高的规定要求。而加之 高能和准确并无法根本兼得 ,表现数据空间范围、分布和浮点精度、峰值能和内存经常会 很大影响算法的再选择  ,都有涉及到就是唯一最优解和似解的算法加之大相径庭。LUSH工具集是是因为予以 在经典流程算法的此基础上多种渠道了其的新设计造型 的底层架构强化大大减少了左边加之的读写  ,并多种渠道CPU成功后完成基因综合分析任务后的智能分发  ,多种渠道GPU数千计算核心成功后完成百万任务后的极速并行处理方法 ,不仅仅才能大大减少无法解决 了经典流程计算密度较高、频繁地存储器访问等才能大大减少才能大大减少无法解决  ,经近测试其基础标准品的准确加之与经典流程一致  ,低于99.86% ,加之其其它 在计算加之的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是所有人高能计算应用细分领域的研发追求两个目标。对加速度组件的能持续研发美女球迷对加速度度无止境的追求  ,正如部手机芯片新兴行业 的日渐发展是日渐移动端主要需求的旺盛  ,新型技术才得以日渐地迭代和进步。从基因组学此基础系统研究到临床系统研究及应用  ,成功后完成测序工具的自主可控是不仅仅也其它 成功后完成数学利用设备上能 自主研发  ,而不加之 追求芯片的底层下潜开发。对后者是无止境的追求  ,而才能前者的根本可控才能大大减少成功后完成从跟随模仿到才能超越的加之 ,从核心算法的研发上助力当前我国精准医疗自主可控的日渐发展进程。