基因探秘:HPC创新是基因测序普惠万众的捷径

原标题:AI就是高性能计算

原标题:基因探秘:HPC创新是基因测序普惠万众的捷径

阿里云推出全新一代人工智能异构加速平台,总计6款异构实例,其中AI芯片包括GPU和FPGA,
9月12日阿里推出全新一代人工智能异构加速平台,总计6款异构实例,其中AI加速卡包括GPU和FPGA。本次阿里云推出的AI计算异构加速平台实例包括GA1、GN4、GN5、GN5i、FPGA
F1、FPGA F2,适用于机器学习、图形图像和科学计算等海量数据计算。

SUN说:网络就是计算机。

著名未来学家库兹韦尔在《奇点临近》中,预言在2045年随着基因、纳米和机器人三大技术实现革命性突破,技术力量会以指数规律快速发展,人类亘古追求的“永生”将有望变为现实,而基因技术则是这一切的基础之一。

    人工智能异构计算是什么?何时产生?机会如何?

联想说:AI就是HPC(高性能计算)。

原来做一次完整的基因测序在几年前需要数万美金,但现在一套基因测序只需要一千美金左右,那么未来基因测序在价格上还有多大的让利空间?一套完整的基因测序动辄会产生数GB基本的庞大数据,在后期分析这些基因样本时需要怎样的计算力去做支撑?现在做基因检测大概要等一周甚至更长的时间,那么未来有没有可能像做血液检查一样,可以在数小时内就得到检测结果?

   
当前实现完整人工智能计算的方式为CPU+AI芯片的不同架构芯片协同计算,即异构计算。目前主要有3类芯片作为AI芯片:GPU(图形处理器)、FPGA(现场可编程逻辑阵列)、ASIC(专用集成电路)。2000年以后,科学计算、数值分析、金融分析等高性能运算(HPC)需求催生了CPU+GPU的异构计算。数据+计算力+算法逐步成熟,AI再次兴起,CPU+GPU/FPGA/ASIC的异构计算快速发展。英特尔预计,2016年到2020专注于AI的计算力或将会增加12倍。异构计算作为AI计算的主要方式,发展空间大。

抱歉,联想没有说。这是小编总结的。

图片 1

    阿里云年初至今陆续发布4款GPU异构实例,擅长AI计算和科学计算

尽管联想没有明确这样说,但在8月31日举行的2018联想全球超算峰会上,联想对外发布了全新AI产品家族,将HPC、AI紧紧关联在一起。

基因探秘:HPC创新是基因测序普惠万众的捷径。在2018年联想全球智慧超算峰会的生命科学圆桌会议上,带着以上诸多问题我们采访了诺禾致源副总裁吴俊和联想数据中心业务集团制造行业总监许子牛,在他们的解答中,我们可以看出超算已经成为了基因技术进一步发展的重要推力。

   
GA1、GN4、GN5、GN5i都是阿里云中的实例(可以理解为具体的云计算产品),用户可购买该实例(租赁该产品)用于深度学习和科学计算。GA1是阿里云采用AMD
GPU的弹性计算GPU可视化实例(ECS
GPU),于2017年初推出,更多侧重于图像处理和高性能计算(HPC)。GN4、GN5、GN5i采用NVIDIA
GPU,适用于AI计算和科学计算,其中GN4、GN5均为上半年推出,GN5i为本次最新推出。下半年,阿里云还计划推出搭载目前性能最强V100(Volta架构,NVIDIA
GPU的最新架构)的高性能GPU异构实例。

图片 2

style=”font-size: 16px;”>基因测序行业再次印证“螺旋加速定律”

    阿里云FPGA实例最大亮点:“FPGA版淘宝”推出

这也是AI就是HPC的灵感来源

有人曾把基因碱基链,比作破解生命密码的终极钥匙。其实现在基因检测已经不再是阳春白雪般的存在,利用基因测序技术,可以对孕妇进行无创伤的产前先天遗传缺陷检测,也可以通过检测肿瘤基因特征片段提早预防癌症,还可以通过基因技术来寻找最优的药物治疗方案。基因技术已经被公认是,有可能改变人类命运的关键技术。

   
2016年底,AWS宣布测试FPGA异构实例,用于加密、金融、机器学习等,阿里云紧随其后,于2017年初推出了FPGA实例F1。阿里云FPGA实例一般需要经过获取镜像、开发、验证、部署四道流程。结合FPGA硬件重编程的特点,阿里云推出了镜像市场,用户可购买或出售FPGA方案(IP)。阿里云FPGA实例节省成本、提高效率、促进交易,预计会有更多AI初创企业和高校采用阿里云开发AI。

早已经是产业共识

图片 3

   
重点标的:“AI芯片+”产业链投资机遇大,AI芯片是基础,基于AI芯片的数据、场景应用前景极为广阔。我们分别从AI芯片产业链上下游,从技术、数据、场景应用等方面优选个股–首推:中科曙光、浪潮信息、中科创达。重点推荐:四维图新、汉王科技、佳都科技、景嘉微、科大讯飞、海康威视、大华股份、同花顺、东方网力、思创医惠。

AI就是高性能计算,这已经是产业界的共识。

基因技术站在了自然科学的风口,而诺禾致源则站在了基因行业的风口之上。据吴俊介绍,诺禾致源的业务覆盖科技服务、肿瘤基因检测及遗传检测三大领域,为全球研究型大学、科研院所、医院、医药研发企业、农业企业等提供基因测序、质谱分析和生物信息技术支持等服务。其中科研服务的内容是为大专院校、医院、药企提供测序的服务,从测序到后续的数据分析,最后给到客户分析报告,客户根据相应的实验设计挖掘出数据具体的生物学意义。目前诺禾致源已在全球运行25台NovaSeq、20台PacBio
Sequel、30台HiSeq X、11台HiSeq 2000/2500/4000、4台MiSeq、4台NextSeq
500、6台Life Ion Proton(DA8600)、2台S5XL和5套Q Exactive
HF-X等最先进的基因测序仪,建立了亚洲通量规模最大的基因测序平台,将实现每年280,000人全基因组测序的超高通量。

    风险提示:AI芯片技术及应用进展不及预期;竞争加剧毛利率下滑等。

但以小编知识结构,其实一时转不过来,没有领悟其中的奥秘。

在半导体产业有著名的摩尔定律,而基因测序技术的技术更新甚至超越了半导体发展的速度。有相关统计数据显示,2007年全球基因测序市场规模仅为800万美元,而到2018年全球基因测序市场规模将有望达到117亿美元,这是典型的指数级增长实例,也是高新技术常出现的性能飞速提升、价格快速下降、用户规模几何级数增长的“螺旋加速定律”的鲜活案例。

HPC为AI提供了计算引擎,大数据为AI提供了数据引擎;反过来,AI、大数据给HPC带来了新的业态。”这就是结论。

吴俊在采访中表示,在几年前测一个人的基因组需要一万美金,现在大概只需要一千美金,整体的测序成本降速是非常快的,相比于半导体产业著名的摩尔定律,整个基因测序产业的成本降幅速度甚至超过了摩尔定律的。这就面临一个亟待解决的现实问题,在基因测序成本降得迅速、测序样本数量又在快速增大的前提下,找到能满足基因测序行业特定需求的HPC解决方案就成为必须解决的问题。

如何理解这个结论呢?

style=”font-size: 16px;”>基因测序应对爆发性成长,需要HPC有新突破

先说说AI,如今AI有泛化的趋势,无助于人们的理解。

据吴俊介绍,基因测序行业因为自身的业务特性,所以对HPC的选择上有鲜明的行业特征要求:

简单说,这一波AI浪潮的兴起和深度神经元网络和机器学习有关。AlphaGO就是最初的表现。其中最关键的技术是以大数据处理为基础的机器学习,对于算法模型的不断调优,从而使得其具备智能判断、分析的能力。

第一,要满足大数据量需求。基因测序产生的数据量都是TB级别,以诺禾致源为例,每台测序机器一天产生的数据量是6TB,按照目前60台测序机器产生的数据量,2018年产生的数据量将达到30PB,这就必须要求HPC系统具有海量数据存储能力。

说到AI,很容易和人脸识别、语音识别、步态识别等具体技术联系在一起。

第二,对内存需求量大。在后期基因序列分析时,往往会进行序列对比,这就要求要将海量数据一次性的载入到内存并加以处理,而不适宜分批导入,这就对内存有了非常严苛的容量要求。

但实际上,AI分为重型AI和轻型AI**。**

第三,对计算力要求高。根据实际测试,目前基因测序所用的专用软件,用GPU来跑还不够成熟和稳定,所以对CPU的性能要求就变得更高。

图片 4

经过缜密的选型,最终诺禾致源选择了联想HPC。据了解,联想提供的刀片是高性能运算系统,配置超过10PB的存储空间,单节点配置了最高达2TB的超大容量内存。并且通过统一的集群监控管理、作业调度,不单保证了整套系统的稳定性,而且还可以利用调优来不断释放系统的计算潜力。经过改造升级,如今诺禾致源已经拥有全球领先的高性能计算平台,数据中心运算能力已提升至1727T
flops,总内存410TB,总存储60.2PB,有效地支撑着生命科学研究和医疗健康两大领域对大数据分析和存储的需求。

其中,轻型AI在消费级产品领域应用比较快,更加容易被人们所熟悉,例如AI手机,如摄影模式的智能判断和选择等

吴俊在采访时表示,在不考虑成本、投入巨量算力的前提下,现在基因测序的后期数据处理周期可以从2.5天缩短到20分钟,所以诺禾致源对HPC的算力提升有殷切的期待,尤其是当E级计算实现之后,软件不断会针对GPU加速和多核调优,那么做一次基因测序后期比对的时间缩短到一个小时内是可以期待的。