计算机运算速度增长跟不上测序速度的提升怎么办?


2005年的Roche 454测序仪运行一次可产生400MB左右的基因序列文件
2010年的Illumina HiSeq 2000运行一次,可以产生200GB的基因序列文件
华大基因在2010年拥有137台Illumina HiSeq,每年的数据产出量将达到PB量级
。。。。
已邀请:

赞同来自:


还是从软件、硬件合理搭配上寻求满足处理速度要求的计算体系吧。
摩尔定律由Gordon Moore提出的,其内容为:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。现在已经放缓到36个月翻一番。而基因测序速度在短短的五年内提升了500倍,相应的计算能力增长显得相形见绌。
在苏州大学医学部高性能计算平台的建设上,浪潮以软硬一体的高性能计算集群方案,很好地解决了这一问题,浪潮高性能计算平台投入运行后,苏州大学医学部的测序数据处理量从原来的每天500GB提高到了4TB,从512核到1152核的运行效率提高了4倍。
苏州大学医学部现阶段主要运行MPI编程的GROMACS、NAMD、LAMMPS以及OpenMP编程类型的VASP、Gaussian等应用软件。这两种编程对通讯速率、内存带宽的要求不同。根据这些软件的特点,浪潮制定高性能天梭TS10000集群系统解决方案。整个系统的计算网络采用业界主流的56Gbps全线速Infiniband网络,并且采用了模块化Infiniband交换机,相对于小交换机堆叠网络可靠性高,易管理,且能够节省1/2数量的线缆,从而充分满足系统的高速通信需求。
存储系统采用浪潮TSExaStor并行文件系统存储,该文件系统是浪潮自主研发的高带宽、高IOPS的统一存储系统。除此之外,浪潮自主开发的智能化、专用定制化的Cluster Engine高性能计算服务平台,具有更多人性化功能,帮助用户更快的构建系统、更好的应用系统、完善的管理系统,提升整体集群的使用效果,保证了用户良好的应用。

要回复问题请先登录注册