杭州DELL服务器代理
您现在的位置:首页 > 信息动态  > 解决方案

全国服务热线

189 6990 1748

远程医疗-为生命科学插上计算的翅膀

信息来源:www.0571dell.cn | 发布时间:2021年06月24日

数字时代,通过生命科学提高人类健康和改善生活环境,已经是指日可待。基于生命科学实现个性化医药医疗,让更多病人通过DNA和RNA以及蛋白质综合手段,大幅度提升治 愈率。然而,在生命科学研究中,计算能力是研究成果以及从科研到应用的关键。清华大学蛋白质技术研究中心就构建生物计算平台,提供高性能计算服务,并取得众多影响重大的研究成果。


客户背景需求


数字时代,通过生命科学提高人类健康和改善生活环境,已经是指日可待。基于生命科学实现个性化医药医疗,让更多病人通过DNA和RNA以及蛋白质综合手段,大幅度提升治 愈率。然而,在生命科学研究中,计算能力是研究成果以及从科研到应用的关键。清华大学蛋白质技术研究中心就构建生物计算平台,提供高性能计算服务,并取得众多影响重大的研究成果。



方案价值


从生命科学到病理参考

生命科学的研究成果和人类生活息息相关。比如蛋白质结构的研究工作对于揭示生物体内诸多生命过程的细节,以及重大疾病的防治和和药物的发明具有重要的指导意义。而以蛋白质为主体的生物大分子的功能主要决定于它们的三维结构。而要获取蛋白质的三维结构,单颗粒冷冻电子显微镜(以下简称“冷冻电镜”)是一种强有力的手段。冷冻电镜获得的是分子的二维图像,但为了解析二维图像与生物大分子的三维空间结构之间的关系,这个过程需要大量的图像数据,通常满足分子分辨率的要求需要图像数据>10000张,而要获得原子分辨水平的结构则需要上百万张图像,处理这种级别的数据,需要一套强大的高性能计算平台。


清华大学蛋白质研究技术中心建立了一个面向生物研究的高性能生物计算平台,为其生物科学和医疗的研究项目提供计算服务。在这个平台的支持下,科学家捕获到真核细胞剪接体复合物的高分辨率空间三维结构,并阐述相关工作机理,为人类进一步揭示与剪接体相关疾病的机理,提供了结构基础和理论,加速从生命科学到病理参考的进程。


清华大学蛋白质研究技术中心生物计算平台


清华大学蛋白质研究技术中心(简称“中心”)旨在建立标准化、自动化的工程技术手段,以提升蛋白质结构解析水平,高精度地测定从蛋白质分子到全细胞的三维结构,并在此基础上揭示蛋白质及其复合体的功能、规模化制备蛋白/抗体,建成具有国际水平和综合示范作用的蛋白质科学研究的核心基地。


就生命科学研究项目来说,每个项目所涉及的数据量小在上百TB,对于时间周期长和涉猎范围广的项目,未来数据需求可能在PB级。此外,中心需要考虑支撑多种生命科学研究项目,而这之中,不同应用作业对于高性能平台计算环境的要求也不尽相同,如基因测序对于I/O性能需求高,内存消耗大,而分子动力学研究除了对I/O性能需求高之外,对于网络行和并发处理能力的需求也相当高。这些都对中心搭建高性能平台提出了挑战:


数据量增长10多倍,计算能力要“跟得上”。清华大学研究团队所采用的冷冻电镜技术在过去两年里取得了革命性的进展,具体来说就是照相机技术实现了飞跃,将采集数据的能力提升了10多倍,甚至上百倍,由此使得研究蛋白质结构的源数据呈几何级数增加,这就要求中心必须提升后期的数据处理与计算能力。


亟需简化管理保障服务品质。随着生命科学研究项目不断增加,如何根据不同项目和研究人员个性化需求配置资源,即时回收资源,实现跨整个高性能资源池的集中统一管理,并简化维护和管理,降低运维人员的负担,是科研高性能计算平台普遍面临的问题。


TCO居高不下。生命科学研究快速成为国家战略级发展方向,引发研究项目快速增加,以及跨学科科研需求。传统分层的计算存储资源利用率低,导致新增开支快速攀升。此外,能耗也成为阻碍高性能计算中心扩容的一堵无法越过的“高墙”。

网络性能不能拖后腿。高性能网络作为保障高性能集群正常运行承担着重要的连接任务的关键。伴随单节点计算和存储性能的不断提高,高性能用户需要万兆,四万兆,十万兆,以及InfiniBand网络选择来满足不同高性能计算需求。


戴尔科技助清华蛋白质中心搭建高性能平台


戴尔基于融合架构助力清华蛋白质研究中心构建了一个拥有250个物理计算节点,5000个计算核心、存储总容量为 1.92PB、理论计算能力为208Tflops,通过 Lustre 技术构建分布式高性能平台,实现跨 20 个融合架构的集中统一管理。戴尔易安信为高性能平台提供了端到端的配置安装服务。


4.1TFLOPS/U的计算密度,4倍性能提升


中心基于戴尔 PowerEdge FX2融合架构方案构建高性能平台,可以针对不同项目量身定制FX2配置。其中,FC430 高密度计算节点支持14核英特尔®至强TM E5-2600v3处理器,在2U密度已高达224 个计算核心,单U空间的计算性能密度达到业界4.1TFLOPS。同时,支持64 DIMM高密度内存,保证高性能和低延迟性能要求。不仅如此,FC430还支持InfiniBand接口,这非常适合要求超低延迟的工作负载。在强大计算能力作保下,计算效率提升 3-4倍,可以在1天内完成以往4-5天才可以完成的计算任务。


简化高性能资源池监控管理


既要满足不同项目个性化需求,又要简化 IT 管理,是中心选择戴尔高性能平台方案的另外一个重要原因。戴尔高性能方案让中心可根据项目需求,定制不同FX系统配置,同时通过机箱管理控制器(CMC)对20个FX系统,实现高性能资源的集中监控管理。此外,戴尔无代理生命周期管理和一对多远程管理功能,保证BIOS和固件程序更新不影响业务稳定性,以及提高系统内计算节点生命周期管理效率。并且,在扩展服务器的时候,IT人员可以通过配置文件下发的方式,让系统自动完成更新 BIOS和固件程序的工作,避免了重复输入配置参数的繁琐,也减少了由于人工输入错误而导致的系统故障,简化管理运维,降低管理开支。 


TCO降低约20%


综合模块化部署,自动化集中统一管理,以及高密度和低耗能,中心降低约20%的TCO。其中,戴尔PowerEdge FX2将经过模块化设计将服务器、存储和1G0b网络通过主板链接构成融合一体机,同时提供共享的散热、电源、网络、管理和PCIe扩展插槽,降低数据中心占地耗能,帮助中心获得了良好的成本效益。


高速网络保障平台I/O性能


戴尔为中心提供四万兆高性能网络,保证高性能高性能和低延迟需求。Networking Z9500 40Gbps 高性能交换机,提供132个40Gb以太网端口,为未来高性能网络提供高可扩展空间。此外,Z9500支持 “按需购买、渐进扩展”定价模式,在保持成本优势的基础上为用户提供稳定的网络性能。Z9500支撑软件定义网络和OpenFlow架构,优化高性能网络长期投资回报。


戴尔科技加速科研高性能应用


戴尔科技,开展合作推动高性能应用

“双一 流“加大高校在科研投入。作为科研创新前沿阵地,高校科研院所对于高性能的科研应用显然拥有大需求。而教育部发布的《高等学校基础研究珠峰计划》,则进一步推动高等学校建设重大科技基础设施。戴尔易安信在全球高校和科研高性能计算有着丰富积累,如在国外,与加州大学圣地亚哥分校、德州大学奥斯汀分校以及佛罗里达大学合作建设了计算机中心。在国内,戴尔易安信不光与清华大学、上海交大高校合作搭建高性能应用平台,还联合中科院成立了“人工智能与计算联合实验室” 。实验室将面向人工智能领域搭建IT支撑平台,其中包括脑与认知数据分析、脑系统计算模拟、认知功能模拟、人工智能等方向的新型计算体系,戴尔为计算研究中心设计了支撑整个研究中心的高性能体系。


戴尔易安信,加速高性能方案落地

随着云计算、大数据和人工智能的发展应用,从早期的科学工程计算到新兴的数据密集型计算和人工智能计算,高性能市场在不断被重新定义,外延不断得到拓展。在面对实验精度和获取的数据量的不断提升、跨学科之间合作以及新IT技术对于高性能系统带来的挑战,戴尔易安信通过提供基于开放技术的高性能产品组合,包括从服务器、存储、网络到工作站,以及通过战略合作提供的高性能管理软件和平台,为用户提供更为广泛的应用支持。


•  高性能计算:主要针对高性能计算开发的服务器,包括 R940/R940xa、C4140、C6420,R6415、R7415、R7425,以及高密度刀片服务器和融合架构。

•  高性能存储:包括Luster分布式存储、高性能 NFS存储、Isilon存储,以及Elastic Cloud Storage(ECS)归档。

•  高性能网络:戴尔易安信提供基于英特尔Omni-Path架构的H系列交换机、Mellanox EDR InfiniBand选择,以及万兆、四万兆、十万兆高性能网络。


戴尔易安信让用户可以根据自身需求定制高密度高性能方案,降低TCO;通过参考架构和咨询团队服务,保证方案的可用性;通过跨高性能资源池集中透明管理,提高使用效率,简化管理运维。