Professional Documents
Culture Documents
HP 解决方案体验中心
根 据 当 前 H P TC 技 术 发 展 趋 势 , H P 把 基 于
Itanium 处理器系列 (IPF) Linux 集群作为高端和
超级计算机系统主要发展方向,为用户提供
全面的 Linux 集群解决方案。用户可以选择在
HP 支持下自行组装系统,或者采用 HP 提供的
成套 Linux 集群产品,从而以最大灵活性满足
自己的应用需求、计划进度和经费预算。
图 1: HP 的四种 Linux 集群
解决方案 Customer Cuslomer selects sw to HP defined sw stack on
assembled manage HP cluster platform qualified platforms
HP support
Comprehensive HP
Interconnects
LC Cluster engineered and
supported solution
HP component support
HP support
Tested packages for
partner and
community solutions
Source: HP,2003
2
图 2: HP 基于 Linux 集群超
级计算机设计思想
级计算机系统解决方案的设计思想,形象地说明它们的 理工具和开发软件,避免重复开发、降低研发投入、
基本要点: 提高发展速度;
够更充分利用现代半导体工艺发展成果快速提高性能 能够应用于市场容量最大的企业应用,满足企业电子
放性和强大水平可伸缩性,通过高性能互联网络把大量
3
图 3: Beowulf 集群示意图
图 3 Beowulf 集群示意图
集群的目标是以比通常低得多的成本建立一个并行计算 集群节点
重要途径之一。 点,提供作为高端系统基础节点所需的浮点和整数处理
能力、高速缓存容量、高速带宽、总内存容量、内存带
宽、系统互联网络通信吞吐能力及 IO 能力,实现最佳的
性价比。用户也可以根据需要采用企业级的 SuperDome
更高的性能。
存储设备
构网络存储系统、为高端和超级计算机系统提供了强有
力的支持。
4
图 4: Myrinet 和 QsNet
互联网络
块切入的分组路由。多端口交换器通过联线与其他交换
器或者任何网络中的单端口主机接口相连接。每个交换
器内部有流水线的交叉交换器,带有流控制和输入缓冲
区。Myrinet 分组是任意长的,它可以携带任何类型的分
组而不需要适配层。
5
Linux 操作系统 • ClusterWare-Platform Computing 公司的 ClusterWare
选择。 供用户管理集群系统;
• MSC.Linux-MSC.Linux 集群软件是专门为高性能科学和
集群软件
技术计算设计的集群软件,提供很高的并行处理功能
HP 与 Linux 集群领域中领先的 ISV 合作,在提供丰富的集
和管理 Beowulf 集群所需的所有管理工具;
群软件、管理软件和开发工具,支持利用 Linux 下 Beowulf
除了提供商品化系统外,HP 也提供全面的服务,支持用
户根据自己的实际需求和条件选择适当的硬软件产品,
6
• Scali UniverseXE 和 ClusterEdge-Scali 为 HP 的 ProLiant
三、HP 基于 IPF 处理器 Linux
和 Itanium2 平台开发了独特的集群软件技术和产品,
提供容易使用、高安全性和高可伸缩性;
集群的应用
2002 年 5 月 IPF 第二代产品 Itanium2 问世后,基于 IPF 和
• Scyld Beowulf-Scyld Computing 公司是领先的 Beowulf
和高性能集群的开发厂商。该公司的 Scyld Beowulf 集 Linux 集群体系结构的高端系统和超级计算机应用日益广
群软件被称为第二代 Beowulf 集群软件。Scyld Beowulf 泛。随着 IPF 系列和 Linux 集群技术的发展,基于 IPF 的超
软件具有简化集群集成和设置、容易管理和管理工作 级计算机系统将在高性能技术计算最高端占据越来越重
量最小、高可靠性和无缝集群扩展等一系列特性。 要的地位,并进而向更加广泛的企业应用领域发展,推
为了管理由大量节点组成的系统资源,HP 基于 Itanium2
超级计算机系统解决方案提供先进的作业管理、资源管
理和运行管理功能,提高系统资源使用效率、简化管理、
降低总拥有成本,包括:作业管理、系统状态管理、负
载平衡管理、配置管理等。
软件开发工具
HP 基于 Itanium2 高端和超级计算机系统解决方案提供齐
全和优质的软件开发工具,支持用户方便和高效地开发
和移植软件,包括:多种编译程序、子程序库、查错软
件、性能分析和优化软件、移植工具等。
7
表 1: 基于 IPF Linux 集群和超级计算机部分用户清单
用户名称 用户简介 系统配置 主要应用
清华大学 清华大学高性能计算中 120 台 rx2600 服务器 网格、高性能计算技术研究
心,该校是中国最著名 组成的 Linux 网格、集群
的综合性大学之一 系统
华中理工大学 国内著名理工大学 57 台 rx2600 服务器组成的 生命科学等领域
Linux 集群系统
中国科技大学 国内著名的理工大学 2 台基于 Itanium2 的 校内外高性能技术技术应
SuperDome 服务器 用,是国内教育界性能最高
32 台 rx2600 组成的 的超级计算机系统
Linux 集群系统
PNNL (西北太平洋 属于美国能源部一个专门 由 1540 个 Itanium2 组成的 是美国能源部科学网格的
国立实验室) 从事高级化学、分子物理 Linux 集群系统,完全建成 组成部分之一,支持广泛
研究的国立实验室 后速度达到 11 TFLOPS, 是 范围的科学计算
世界上最大的 Linux 集群系
统,在 TOP500 中位居第 8
Energy Company 美国大型能源公司 由 545 个 Itanium 组成的 地球物理研究
Linux 集群使用 GigE 作为互
联网络、rx5670 作为节点,
在 TOP500 中位居第 46
Ohio Supercomputer 美国 Ohio 州的一个为大学 由 zx6000 工作站、通过 计算化学、物理和机械工程、
Center 和私人公司提供计算服务 Myrinet 联接组成 Linux 全球天气预报等方面计算
的计算中心 集群系统,包含 256 个
Itanium2 处理器,在 TOP500
中居第 87 位
D-IMAG/INRIA 法国大型科研机构 由 rx2600 服务器、通过 基础研究
Rhone-Aples Myrinet 联接组成 Linux 集群
系统,包含 208 个 Itanium2
处理器,在 TOP500 中
居第 152 位
8
KTH-Royal Institute 瑞典皇家技术学院是瑞典 由 rx2600 服务器、通过 教学和基础科学研究
of Tech 著名的大学之一 Myrinet 联接组成 Linux 集群
系统,包含 180 个 Itanium2
处理器,在 TOP500 中居第
198 位
Rice University Texas 州一所大学,是美国 由 132 台 zx6000 工作站 高性能技术计算和高端的
最好的技术和研究大学之 和 4 台 rx5670 服务器,通 可视化应用
一;建立该州大学中第一 过 Myrinet 联接,组成 Linux
个速度高达 1 TFLOPS 的 的集群系统包含 174 个
超级计算机-RTC (Rice Itanium2 处理器,在 TOP500
Telescale Cluster) 中居第 199 位
University of Illinois 美国著名的大学之一 由 rx2600 服务器,通过 教学和基础科学研究
Myrinet 联接,组成 Linux
的集群系统,包含 128 个
Itanium2 处理器,居
TOP500 第 352 位
HP 公司 世界上最大的 IT 产品和 由 rx2600 服务器,通过 公司内部技术开发和性能
技术服务公司之一 Quadrics 联接,组成 Linux 基准测试
的集群系统,包含 118 个
Itanium2 处理器,居
TOP500 第 353 位
BP 世界上最大石油、天然气 15 套由 4 台 i2000 工作站 高性能技术计算
生产和零售商之一 组成的集群系统
California Institute 加州技术学院的高级计算 6 套 4 处理器的 rx4610 科学和工程计算机
of Technology 研究中心,支持学院和设 服务器与 HP SuperDome 模型研究
在该院的喷气发动机实验 和 V2500 等大型服务器
室的科研 联网
9
DOE Lab 美国能源部实验室 32 个 rx5670 组成的计算 高性能技术计算
集群系统
Ericsson Utvecklings AB 全球领先的移动和 使用基于 Itanium2 的工作 运行基于 TeIORB 软件支持
Internet 通信公司 站集群系统 电信和数据通信网络
An European government 欧洲一个大型政府机构 126 个基于 Itanium2 的服 用于国防和政府管理人工
organization 务器组成的集群 智能软件
(名字不详)
FHWA/NHTSA National 属于美国公路管理局和 Rx4610 和 rx5670 等 4 路 解决与研究车辆碰撞对车辆
CrashAnalysis Center 公路交通安全管理局的 服务器组成的 Linux 集群 影响有关的复杂计算机模拟
(全国碰撞分析中心) 全国汽车碰撞分析中心 系统 问题
Microsoft 世界上领先的软件厂商 80 套 4 路 rx4610 服务器 基于 Itanium 软件开发
包括各种集群系统
Queen' s University 英国北爱尔兰一家大学 23 个节点(50 个 Itanium2 高性能技术计算
Belfast CPU) HP-UX 集群系统 (以后
使用 Linux 操作系统)
Sencel Bioinformatics AS 挪威一家生物信息学公司, 多套 i2000 工作站组成的 与挪威 4 所大学的高性能
是挪威 Oslo 等四所大型高 集群系统 计算网格联网,使用其
性能计算网格的用户 HP Superdome 等服务器
University of Oslo 挪威的一所大学,与 利用基于 Itanium 工作站 生物信息学、天体物理、
Trosmo 大学等四个单位 的 Linux 集群系统与两台 地球物理、化学和金融
联合组成一个支持高性能 HP SuperDome 服务器 模拟等领域的计算
技术计算的网格 联接,组成网格系统
University of Tennessee 美国田纳西州的一所大学 使用由大量基于 Itanium2 支持该校的开放性校园间
大量从事网格计算研究 的集群系统组成网络 工程(SinRG)网格
, 支持网格计算
University of Tromso 挪威的一所大学,与 Oslo 利用基于 Itanium 工作站的 生物信息学、天体物理、
大学等四个单位联合组成 Linux 集群系统与两台 地球物理、化学和金融
一个支持高性能技术计算 HP SuperDome 服务器 模拟等领域的计算
的网格 联接,组成网络系统
10
下面我们进一步介绍其中两个典型系统。它们分别使用 网络通信、满足高性能计算的需要。该系统建成以后峰
Myrinet 和 QsNet 进行互联、提供超级的计算能力。 值计算能力将达到 11.52 TFLOPS, 一举成为国内高校中
迄今为止规模最大的高性能计算系统之一,有望跻身全
中国科技大学基于 IPF 的超级计算机系统
球 TOP100 行列。该系统将应用于满足本校生命科学、
在国内,随着许多大学和科研机构在基因、气象和材料
工程科学、化学和材料科学等专业的科研和教学需要,
科学等领域研究的深入,普通的计算机已无法满足用户
同时成为支持中国教育网的重要计算节点,满足全国高
的需求,普遍要求以尽可能低的投资建立能够满足各种
校的需要。
用户不同需求的超级计算中心。许多大学和科研领域用
户在考查所有著名计算机厂商后,选择了 HP。HP 与中国 HP 已经成为科教领域建立超级计算机系统的首选厂商,
中一例。 产品、为清华、华中理工大学等许多高校采用,市场需
求和用户数量正在不断扩大。
中国科技大学是国内著名的理工大学,在国际上也享有
很高的盛誉,是国家重点建设的高水平学府之一。HP 与
该校合作建立的超级计算机系统采用基于 Linux 系统的
Beowulf 集群体系结构。该系统使用 2 台 HP Integrity
Superdome, 每台的配置:64 个 1.5GHz Itanium2 (内部
代号 Madison)处理器、64G RAM。1TB storage; 32 台
Integrity rx2600 服务器,每台配置 2 个 1.5GHz Itanium2
处理器、2G RAM、1 个 36G 的磁盘 HDD。该系统使用
Myrinet 互联网络,提供节点间高带宽、低延迟、无阻塞
11
PNNL 基于 IPF 的超级计算机系统 该系统第二阶段建设的配置使用 764 个 2 处理器服务器
业管理和负载平衡。 科学、计算化学、分子化学、核物理、材料科学、气象
预报等广泛领域的需要,也是每个美国能源部高性能计
该系统第一阶段建设的配置使用 116 个 rx2600 服务器 算网格最重要的计算节点之一。该系统是 HP 基于 Linux
(232 个 Itanium2 处理器)作为计算节点,两个 rx2600 服务 集群体系结构超级计算机的参考解决方案,充分显示了IPF
器作为登录节点,2 个 rx2600 服务器作为系统管理节点, 处理器的高性能和HP系统设计技术的优势和强大生命力。
Quadrics 公司的 Elan3 网络接口,提供 1 TFLOPS 浮点计
算能力、超过 1 TB 内存、26 GB/s 的聚合 IO 带宽。该系
统使用新一代的 2 GB 光纤 SAN 体系结构的网络存储,提
供 26TB 共享存储。
12