行业资讯

剑桥大学超级计算机,用的是PowerEdge服务器

2020-06-12 09:26:35 david 19

当超级计算机的数据处理能力飞速向前发展,存储I/O却成为了瓶颈,制约着那些运行数据密集型工作负载的人员更快获取洞察的可能。而现在,剑桥大学已经解决了该问题。为此,他们在Virtual Institute公布的2019I/O-500榜单中,以620.69的得分位列第一,领先第二名290分

谈到这一话题时,剑桥大学高性能计算主任Paul Calleja表示:“通过独特的数据加速器,我们已经破解了HPC存储问题。”

而这个数据加速器的背后,正是戴尔科技提供技术支撑



图片关键词

助力世界顶尖学府

加速前沿科学研究

坐落于英国剑桥的剑桥大学建立于1209年,乃是世界上最古老的大学之一,也是备受尊崇的学术中心。其开展的均为前沿的科学研究,这也是大学使命的一部分,即通过追求国际最高水平的教育、学习和研究为社会做出贡献。

这些原则指导着剑桥大学研究计算服务部的工作,该服务部为学校所有学科以及英国科学界和工业界等领域提供计算服务。如今,为了帮助他们保持在人工智能(AI)和科学研究领域的领先优势,研究计算服务部启动了英国最大的学术超级计算机“Cumulus–英国科学云”

Cumulus采用搭载英特尔®至强®处理器和英特尔®Omni-Path架构的戴尔易安信PowerEdge服务器,其性能可达每秒超过2千万亿次浮点运算。该系统集成了OpenStack软件,以控制计算、存储和网络资源池,并使用户可以通过云界面随时访问这些资源。

Cumulus还集成了高度创新的戴尔数据加速器(Dell Data Accelerator:DAC)。DAC系统由戴尔易安信PowerEdge R740xd服务器构建。Cumulus使用了24台这样的服务器,每台服务器有12个NVMe驱动器。为了平衡系统(基于评估NVMe的峰值性能和网络带宽),24台服务器中的每一台都有两个英特尔OPA适配器。

图片关键词

戴尔易安信PowerEdgeR740xd

除了优化单个DAC服务器配置外,研究计算服务部还与戴尔易安信、英特尔、StackHPC(一家致力于HPC和云融合的英国初创公司)密切合作,优化网络拓扑结构,并利用Lustre文件系统中的数据加速器和分布式名称空间(DNE)功能来优化Cumulus集群的顶级I/O性能。

而在OpenStack方面,该系统利用戴尔易安信服务器中嵌入的iDRAC功能来进行集群的调配和管理,特别是在Ansible驱动的基础设施作为代码方面。

图片关键词

联网的数据加速器节点是Cumulus集群的核心


正是在领先科技力量的共同合作之下,使得Cumulus超级计算机在I/O-500基准测试中取得了令人震惊的成绩。根据研究计算服务部的数据,DAC加速器可提供超过500GB/秒的I/O读取性能,使其成为英国最快的HPCI/O平台,为研究人员提供闪电般快速的吞吐量


图片关键词

深耕HPC 20余年

助力探索人类知识边界

剑桥大学高性能计算主任Paul Calleja介绍,人工智能项目需要非常高的速度处理大量数据,Cumulus有能力帮助用户解决极其困难的数据驱动、模拟和AI挑战,许多涉及剑桥研究人员的人工智能项目已经在进行中。


图片关键词“在生命科学领域,我们正在研究医学成像分析和基因组学,在天文学领域,科学家们正在利用AI研究绘制系外行星图,”他说,“我们还围绕基因组学开展了一些相当具有突破性的工作,其中有英国10K项目,研究人员正在使用Hadoop数据分析引擎,围绕非常大的人群基因组研究推动突破性成果。”

图片关键词

图片关键词

事实上,不仅是剑桥大学,戴尔科技长期处于推动客户采用最新HPC技术的一线,大力推动广泛的科学发现和研究工作

图片关键词

例如德州大学奥斯汀分校的德州超算中心(TACC)选择与戴尔科技合作,在去年6月最新公布的TOP500榜单当中,戴尔科技为TACC设计并制造的Frontera超级计算机获得了第五名的成绩,其速度在美国排名第三,并且也是所有大学中规模最大的系统

还有密歇根大学正在部署Great Lakes计算集群,用于模拟、建模、人工智能、机器学习、数据科学、基因组学等等。这个新系统采用了基于戴尔易安信PowerEdge服务器的HPC基础设施。Great Lakes是业内第一个受益于Mellanox HDR 200Gb/s InfiniBand网络的系统,实现了更快的数据传输速度和更高的应用性能

图片关键词

在国内,戴尔科技也与很多高校成功实施部署了规模不等的HPC平台,包括清华大学生命科学与技术学院、北京大学生命科学联合中心、西湖大学生命科学学院、哈尔滨工业大学生命科学与技术学院等,助力探索人类知识边界。

图片关键词






客户引言



“传统HPC集群技术提供预配置的静态资源池,能够在很大程度上满足数量有限但非常重要的用户群。通过实现云模式,包含在裸机环境中,软件定义基础设施的优势在于包含传统HPC集群,无需牺牲性能,并在支持现代混合云工作负载方面提供更高的敏捷性。

我们看到此类新工作负载的用户大幅增长,而Cumulus让我们的用户可以在安全且灵活的环境中更轻松地进行HPC和HPDA级计算。与戴尔易安信等合作伙伴携手,我们打造了英国计算能力最强、I/O效率最高的资源之一。

——PaulCalleja,剑桥大学高性能计算主任



文章来源:戴尔易安信解决方案

首页
产品
新闻
联系