中国建成子午工程专用12万亿次刀片式超级计算机

来源:百度文库 编辑:神马文学网 时间:2024/07/03 10:21:02
中国建成子午工程专用12万亿次刀片式超级计算机2010年02月24日 

子午工程示意图,主要以东经120°和北纬30°检测台链组成(图片来源:国家发改委网站)

来自中国科学院网站的消息:近日,国家重大科技基础设施子午工程专用高性能计算平台——12万亿次刀片式超级计算机建成。子午工程专用高性能计算平台是子午工程研究与预报系统的核心硬件设备,为子午工程的运行计划的制定、子午工程物理与应用预报模式的大规模计算以及空间环境数据的三维可视化提供支撑。

子午工程专用高性能计算平台的刀片式超级计算单元由1024颗INTEL Xeon E5450(主频3.0GHz、内存16GB)CPU构成,计算刀片之间的通信通过目前最先进的全线速、无堆叠20Gb Infiniband高速互连网络完成,支持并行软件和并行运算及开发环境(GNU和Intel C/C++ 、Intel fortran、MPI),其计算峰值为12.28万亿次、Linpack性能为10.33万亿次;专用高性能计算平台的存储单元为全光纤SAN架构,I/O结点配备了4路4核Intel Xeon E7440处理器,采用并行文件系统,支持基于阵列的快照和克隆及异地远程同步和异步镜像复制等;专用高性能计算平台的虚拟现实可视化及数字视频会议单元采用SGI32核CPU、NVIDIA Quadro FX 4600专业图形生成器,两台高清分辨率三片多晶硅LCD的BARCO iCon H600投影机以实现背投、被动全三维立体可视化表达。

专用高性能计算平台经过半年的试运行,已有效集成子午工程L1-磁层-电离层因果链物理模式、数值磁层库软件及地磁暴预报模式、电离层预报模式、多站点中层大气气候模式等五个空间天气物理与应用预报模式,使得240*160*160网格规模下的地球磁层准稳态解的模拟计算时间由过去的三个月缩短为三天,模式计算数据与空间环境监测数据的展示实现了由二维平面向三维立体的本质转变,极大提升了系统开展子午链模式与基于子午链的空间天气预报方法的综合研究能力,在两种主要的行星际扰动(动压脉冲、激波)与地球磁层相互作用、太阳高能粒子传播与加热机制及磁层电流体系研究方面取得了一些非常重要的阶段性成果,特别是发现在IMF南向时,弓激波和磁层顶均对越尾电流供电的创新结果引起了国际同行的高度关注。

这样一个资源共享、信息交互的协同工作平台的建成有助于进一步充分利用子午工程空间环境监测系统的观测能力和产出,开展和组织灾害性空间天气事件的连锁过程、时变模式及空间天气变化规律的系统研究,直接服务于子午工程整体建设目标的实现。

专用高性能计算平台已通过中科院空间科学与应用研究中心组织的测试与验收。

图为子午工程LOGO,为减轻和防止灾害性空间天气给航天、通信、导航、电力、国家安全和人类健康等领域带来的巨大损失,全面、系统地开展空间环境监测已成为一种紧迫的国家需求。中国正式启动建设子午工程——空间环境监测系统工程无疑具有极其重要的战略和现实意义。

中国目前最快的“天河一号”计算机

 

天河一号采用6144个Intel至强(Xeon)多核服务器CPU(2.53 GHz的E5540和3GHz的E5450均有),5120个AMD-ATI 镭(Radeon)4870 显卡GPU,内存总容量98TB(100352 GB,10万G),各刀片式服务器之间使用万兆网连接,而共享磁盘总容量则达到1PB(1048576 GB,104.8万 G)。将这么庞大的民用处理器集中起来协调并行运算,需要成熟的互联控制技术,研制专门的操作系统。

天河一号具有高性能、高能效、高安全和易使用等显著特点,其中易使用性对计算需求单位很重要。图为通过天河一号辅助设计飞机气动外形(终端用户入口界面)。

除了传统的“石油勘探数据处理、生物医药研究、航空航天装备研制、资源勘测和卫星遥感数据处理、金融工程数据分析、气象预报、新材料开发和设计、基础科学理论计算”等科学与工业方面的应用以外,近年来兴起的互联网特别是搜索和网络游戏服务,则开辟了超级计算机的新型娱乐用途,资料显示,国内最强的Top10超级计算机榜单中,已常常出现网络游戏服务器的身影。

如2007年的榜单,九城公司分布在上海、北京、成都、西安的6组《魔兽世界》HP网游服务器集群,就以每组1950个处理器、近7万亿次的的平均计算能力占据了Top10的大部分位置。

2005年九城进口的HP网游服务器集群正在安装

已被拆出的HP刀片服务器包装空箱

2008年的中国最强计算机——曙光5000A,峰值计算能力233万亿次,平均计算能力175万亿次。

2009年的中国最强计算机——天河一号,平均计算能力563万亿次,峰值计算能力1206万亿次。曙光5000A退居第2,此外,Top10的榜单上再度出现了网络公司服务器的身影。这一次是接手《魔兽世界》的网易公司新购买的IBM网游服务器集群,以每组7168或5376个处理器,38.8万亿或31万亿的平均计算能力进入中国前十。 

把几千个普通计算机服务器节点联合起来协调高速运算,不是简单的攒机和连线能解决的,需要解决高速内部通信网络,专门研制包括节点管理软件、终端用户入口界面软件和后台运算软件等在内的操作系统等研制任务。图为用数值模拟方法预报台风(终端用户入口界面)。

按照2009年06月的性能数据,天河一号实测性能排列全球超级计算机TOP500排行榜第四位,峰值性能列第三位。

克雷-2(Cray 2)-1985年至1989年时全球最快的超级计算机,运算能力39亿次(浮点运算),而目前个人计算机的中央处理器CPU的运算能力大约在100-200亿次左右,高端显卡的图形处理器GPU则可达到10000亿次。

Roadrunner(走鹃)是一套由IBM为美国能源部建立的超级计算机,耗资1.33亿美元。在2008年5月25日,此电脑的运算能力达到1026万亿次,成为第一台持续运算能力超过千万亿次的超级计算机。此电脑安放在新墨西哥州的洛斯阿拉莫斯国家核实验室,以新墨西哥州州鸟走鹃命名。主要供模拟核试验和计算美国现有核武器储存可靠性所用。

根据2009年6月的全球超级计算机榜单(第一栏为计算机拥有者,第二栏为计算机名称及配置、建成年份,第三栏为微处理器计算核心数量,第四栏为平均计算能力,第五栏为峰值速度。),平均计算能力563万亿次的“天河一号”运算能力次于德国于利希研究中心的Jugene(平均825万亿次),但峰值速度1206万亿次高于德国Jugene的1002万亿次

以1105万亿次(平均值,下同)排名世界第1的洛斯-阿拉莫斯的Roadrunner(走鹃),1059万亿次排世界第2的橡树岭的Jaguar(美洲豹),以及未来20000万亿次的劳伦斯-利弗莫尔的Sequoia(加州红杉),全球最顶尖的超级计算机一直都为美国能源部的几大核试验室所把持。

超级计算机是世界高新技术领域的战略制高点,是体现科技竞争力和综合国力的重要标志。各大国均将其视为国家科技创新的重要基础设施,投入巨资进行研制开发。