GPU将改变HPC新格局

  随着GPU的突袭,高性能计算(HPC)领域似乎正在酝酿一场技术+应用的革命,而且迅速波及到国内的HPC厂商,那么,未来中国的HPC将会面临怎样的挑战呢?

  最近,国内服务器领域关于超级计算机、高性能计算的话题不少,先是5月15日曙光5000A落户中国国家网格南方主节点上海超级计算中心;随后的5月25日,联想深腾7000也在国家网格北方主节点中科院计算机网络信息中心宣布投入使用,这两套系统的计算性能都突破了100万亿次每秒,堪称当前国产运算速度最快的计算机。

  据《2008年中国高性能计算机性能Top 100排行榜》显示,TOP100系统的总Linpack测试性能首次突破千万亿次,达到1.01 千万亿次,是2007年的3.29倍,与国际上的差距进一步缩小,单位计算能力的价格也进一步下降。

  而在应用范围上,除了能源、科学计算、政府部门、工业和气象等传统高性能用户的需求持续旺盛之外,动漫渲染、地震、视频计算和网络加速等新兴行业应用热点也不断涌现。

  除此之外,国内HPC厂商跟随技术发展的脚步也越来越快了。随着GPU在HPC领域的日益火爆,近期,国内服务器厂商浪潮、曙光、宝德等都相继推出了整合了GPU处理器的超级计算机。

  在这种形式下,不久的将来,中国的HPC市场会有怎样的发展趋势呢?

  GPU的挑战

  近几年,随着GPU的发展,人们开始尝试使用GPU来完成某些计算任务,但是由于编程模式的束缚,它并没有流行起来。然而,随着NVIDIA的Telsa芯片和CUDA环境的日臻完善,GPU走进了高性能计算领域并向CPU提出了挑战。

  “GPU是多核CPU一个主要的竞争对手,它是一种用于科学计算的图形卡。关于GPU主要有四点:它的速度很快,而且会越来越快;它的价格很低;它的能耗更低,但是第四点也是它的瓶颈所在。”一业内工程师这样描述GPU。

  这些数字说明了GPU的巨大潜力。AMD和Nvidia最快的图形芯片已经达到了Teraflops层级,在这个范围内,普通的多核芯片的速度就显得相形见绌了。

  那么,GPU未来能取代CPU吗?答案无外乎3种:第一,未来除了Power、Sparc、Intel和AMD之外,Tesla可能会继续发展成为其中一个主流芯片,以GPU取代CPU的大部分功能和用途;第二,GPU未来的发展也可能像AMD Fusion计划那样,CPU和GPU融合到了一起,在芯片层各自发挥各自的作用;第三,GPU依旧继续以辅助CPU的方式独立存在,比如作为专门针对图形应用的加速器存在,不过更多的计算任务交由CPU处理。

  第三种情况在国内早就有了应用。据中科院超算中心主任迟学斌介绍,这样的机器已经在中科院北京基因组研究所发挥作用。在基因分析领域,以每个人大约有30亿个基因对,基因分析需要海量数据处理和计算。“尽管图形加速GPU技术很强大,单台计算力相当于10台普通高性能设备,但是GPU技术是这些年刚刚兴起的一种计算技术,应用还不成熟,所以,我们选用的是浪潮搭建的GPU+CPU的全新计算平台模式。”

  其实,大家所担心的GPU真正的问题在于,它不能像普通的x86、Sparc或者Power CPU那样进行编程。这就是为什么Nvidia GPU提供了CUDA技术的支持,而CUDA提供了一系列用户层级的子路径,允许GPU利用标准C语言或者Fortran进行编程,无需使用专门针对图形的API。

  为此,有人预测,未来的高性能计算系统中,硬件架构将成为一个由专门CPU和GPU类型内核所组成的系统。

  但是就现在来说,高性能计算最具挑战性的问题就是应用软件和能耗。

  并行软件呼声高

  目前,英特尔已经研究出具有80个内核,世界首个万亿次浮点运算性能的可编译处理器,所以在多核心时代的来临,对多核并行技术的优化至关重要。“多内核就是多CPU,多CPU就必然要采用并行计算才能发挥全部CPU的作用和功能。到那个时候没有并行软件就不可能真正利用多CPU的功能,要想发挥多核功能,你的软件就首先要能做并行计算。”英特尔公司软件产品部全球业务发展与营销总监/首席软件专家James Reinders表示。

  从硬件技术上来讲,从上世纪40年代第一台计算机ENIAC的5000次/秒到目前的千万亿次每秒,速度提高了2000亿倍左右,这主要归功于硬件技术的发展。然而,在高性能计算领域,相对于硬件,并行软件技术几十年来没有获得突破性地进展。特别是分布式计算技术,自动并行识别技术等。这种软硬差距在中国尤为明显。

  据了解,美国能源部虽然拥有世界上最先进的计算平台,但实际花费在硬件上的投资不到总投资的1/6,大部分预算都花在了物理建模和软件算法方面。“高端计算真正的危机在于软件,软件已成为了现代技术中最主要的经济开支。”迟学斌表示。

  硬件架构内计算组件的增加意味着我们要在应用程序的并行化上投入更多精力。向并行模式的转变并非易事,因为目前已经有很多项目是在单核技术基础上实施的。

  “和其他国家一样,中国也越来越重视并行软件的开发。”迟学斌说道。

  前不久,浪潮宣布与中科院计算机网络信息中心及其下属的中科院超级计算中心达成战略性合作,双方表示将把浪潮的“天梭”高性能计算系统硬件和超算中心的应用开发技术进行整合,为广泛的中低端高性能计算用户提供“一站式”的HPC解决方案,缓解当前高性能计算产业“偏重计算峰值,忽视软件应用,导致软硬失衡”的瓶颈。

  据记者了解,作为硬件系统专业制造商的浪潮和作为国内HPC应用开发“专家团”的中科院超算中心之所以一拍即合,双方都看到了对方的优点和合作的价值。作为国内HPC领导厂商之一,浪潮服务器在服务器硬件领域表现不俗。浪潮集团高性能产品总经理刘军告诉记者,2008年浪潮的HPC业务增长了200%左右。而中科院超算中心作为国内最早的大型超级计算中心的优势则在于他的高性能计算机的应用经验以及在并行计算领域的成绩。

  笔者认为,双方的合作模式也许没有什么新意,但是如果有更多的用户敢吃这一对“螃蟹组合”的话,也许对未来中国的高性能软件会有不小的改善。

  绿色IT和能耗

  在高性能计算领域,用户对于计算性能的需求是无止境的,这使得计算机系统的规模越做越大,系统功耗也成为超级计算机发展面临的重大挑战。

  以中石油的计算处理中心为例,从2002年到2007年CPU从340颗增长到13308颗,增长了近40倍。其运算能力当初是189亿次/秒,现在高达139万亿次/秒,短短5年间处理能力获得了质的飞跃。

  正是因为有了强大的计算能力,处理中心在冀东南堡油田的发现过程中发挥了至关重要的的作用,为油井位置的选择提供了重要的依据。据统计,2005年处理中心有1500个CPU时,电费是334万元;2006年CPU增加到2300颗,电费达到492万元;2008年电费至少需要1500万-1700万元。

  在去年的全国高性能计算学术年会上,国家并行计算机工程技术研究中心、中国工程院院士金怡濂这样说道,系统功耗是超级计算机发展面临的重要挑战,当今全球百万亿次级超级计算机系统功耗在1000千瓦左右。一台千万亿次超级计算机系统的功耗能达到数兆瓦,每年的电费开销高达数千万元。

  此外,Gartner预言,在接下来的几年里,世界上一半左右的数据中心将受电力和空间的约束,能耗会占到一个IT部门预算的1/3。IDC也表示,IT组织能耗的花费将达到硬件花费的1/4。以往高性能必然高功耗的时代已经过去,评价高性能计算系统的优劣要看性能,更要关注能效。因此,未来的超级计算机必须在节能方面有新的技术突破。

  鉴于此,目前许多厂商已经将降低高性能计算系统的能耗和绿色计算作为努力的方向。例如处在高性能计算产业链上游的处理器厂商英特尔就在制程工艺上采用了最新的45纳米技术,这不仅从晶体管层面解决了漏电问题,而且还可以让芯片做得更小,性能更高,这使得45纳米产品可以用较少的时间完成相同的任务,从而减少能源的消耗。

  另外,英特尔也在芯片中不断增强能源管理功能,如对能耗按需管理,把不忙的处理器核的功耗降低,以便提升繁忙的处理器核的主频。而在基础架构方面,英特尔认为一定要和整个产业的伙伴进行共同合作才能让整个生态系统共同走向绿色计算。

  在绿色计算的呼声下,国内的HPC厂商也越来越关注能耗问题。比如,为了将能耗降到最低,曙光的5000A超级计算机在选择芯片时,毅然决然的选择了AMD的低功耗设计CPU,据了解,该CPU比常规CPU要节约30%耗电,而全系统因采用低功耗CPU产生的节电规模超过200KW。

  而结合了虚拟化方案的浪潮天梭TS30000则同时实现了高性能商用系统的高效能。浪潮集团高性能服务器产品部总经理刘军表示,未来高性能计算用户们将更多地关注能源效率问题,因此,开发降低了能耗的高性能计算系统是很有必要的。

  评论:

  拓展新兴行业

  受全球金融危机的波及,09年国内服务器市场增长放缓,总体需求疲软。在这种局势下,传统行业,比如气象、油田、能源、政府、工业等对高性能服务器的采购已经不能满足国内高性能服务器厂商的需求。所以,拓展新兴行业,开辟另一片高性能服务器的应用天地成为众多厂商的当务之急。

  其实,09年对服务器场上来说,是危机并存,甚至机遇更大些。因为在一些政策和项目的拉动下,不少新兴行业对高性能服务器的要求越来越强烈。

  在国家四万亿投资的带动下,以电子政务和民生工程为代表的一批政府主导下的信息化项目正在陆续上马;

  由于3G牌照的发放,运营商将有2,000亿的资金投入到网络建设和改造上,电信及其增值业务对服务器市场增长的一大亮点;

  大型企业级市场引发的新一轮数据中心建设,尤其是能源、建筑等细分行业规范化所带来的IDC重建、新建,也将刺激服务器采购;

  经济的不稳定,使得政府采购更加谨慎,对于成本控制更加敏感,中央大部委集中采购、入围选型采购的几率增加;

  在事关国家经济命脉、国计民生等领域中,国家对信息安全的关注程度日益提高,对国产系统安全产品和解决方案的需求也更加迫切。为此,国家正逐渐加大对自主创新品牌的扶持力度,强调安全自主可控。

  就像一句名言说的那样,“这个世界不缺少美,缺少的是发现美的眼睛。”折射到中国的服务器行业亦是如此,其实09年国家对高性能服务器的需求并没有减少,关键是看厂商们有没有发现这些需求的“眼睛”。

关注读览天下微信, 100万篇深度好文, 等你来看……