AMD联手开源小伙伴为哪般?新异构时代或将来临
- 2013-12-23 19:19:46
- 类型:原创
- 来源:电脑报
- 报纸编辑:程朋
- 作者:
【电脑报在线】谈到AMD,大家首先想到它是英特尔的死对头。的确,作为X86桌面处理器的“二哥”,AMD长期被英特尔打压得“不成人样”,多亏收购ATI后借助GPU的优势才得以苦苦支撑下去,特别是随着CPU+GPU异构系统的日渐流行,让AMD似乎看到了希望。不过,随着英特尔Xeon Phi协处理器的出现,AMD的安稳日子似乎又要结束了。或许是迫于英特尔在异构领域的威胁,AMD终于明白了“打架也得拉帮结派”的道理,这不,前不久AMD就宣布与开源社区和技术伙伴们联手推动其下一代APU产品……
谈到AMD,大家首先想到它是英特尔的死对头。的确,作为X86桌面处理器的“二哥”,AMD长期被英特尔打压得“不成人样”,多亏收购ATI后借助GPU的优势才得以苦苦支撑下去,特别是随着CPU+GPU异构系统的日渐流行,让AMD似乎看到了希望。不过,随着英特尔Xeon Phi协处理器的出现,AMD的安稳日子似乎又要结束了。或许是迫于英特尔在异构领域的威胁,AMD终于明白了“打架也得拉帮结派”的道理,这不,前不久AMD就宣布与开源社区和技术伙伴们联手推动其下一代APU产品……
异构系统在HPC中渐成趋势
提到超级计算机,可能许多朋友并不是很了解。它不同于我们以往所见到的普通家用或商务PC,从定义上来讲,超级计算机通常是指由数百、数千甚至更多的处理器(机)组成的、能计算普通PC和服务器不能完成的大型复杂课题的计算机。由于采用通用CPU打造超级计算机规模大、功耗大,不仅制造起来费用高,而且使用起来也不一定好用。所以,从2005年以来,技术人员一直在研究如何将通用CPU和GPU加速器结合起来提高超级计算机的计算性能。目前异构计算系统已经在超算领域起着至关重要的作用。如异构系统现在已经被认为是冲击全球HPC TOP500的利器,甚至在最近几年的榜单中,基本上第一名的HPC都采用了异构系统,而美国的很多高性能超算中心和德国的一些超算中心都采用了GPU加速并行计算。在现在的超级计算机中,CPU只贡献了10%左右的计算性能,甚至还要更低,GPU却贡献了大部分计算任务,很多的计算性能都是由GPU来完成的。可以说,异构计算已经成为了全球超算中心的重要发展方向。
虽然异构计算系统的魅力不少,但也有不少的缺点。在传统的异构计算系统中,GPU还是作为CPU的协作处理器存在,通过PCIe线传输数据,这似乎是一个严重的瓶颈,GPU有两个问题。
第一是硬件瓶颈问题,就是GPU与CPU之间的通信和数据搬迁造成成性能功耗比较低的问题。CPU代码通过系统调用向GPU发送任务,此类系统调用一般由GPU驱动程序管理,而驱动程序本身又受到其他调度程序管理。这么多的环节造成了很大的调用开销,以至于只有在需要处理的数据规模足够大、任务的并行计算量足够多时,这样的调用开销才是划算的。而其他的调用形式,比如由GPU向 CPU发送任务,或者GPU向自己发送任务,在今天还不被支持。
第二是硬件特定编码的特性问题。当前CPU和GPU是分立设计的处理器,不能高效率地协同工作,编写同时运行于CPU和GPU的程序也相当麻烦。由于CPU和GPU拥有独立的地址空间,应用程序不得不控制数据在CPU和 GPU之间的流动。目前的CPU+GPU异构系统,针对GPU加速卡的应用程序都要用重新编写,这对开发人员来说是一个巨大的挑战。在图形图像处理中,大部分的操作是流水线化的,这对于流处理器来说没有任何问题,但是一旦有了分支、线程并行、数据交换等情况,流处理器就显得“无所适从”。
受架构制约,GPU只有在大量规则数据并行环境中才能发挥其优势,而程序中的分支跳转以及线程间的数据共享都是GPU的软肋。特别是受硬件特定编码的制约,开发人员需要对针对GPU的应用程序进行大量优化,以挖掘出GPU的并行性能,这个优化过程需要开发人员对GPU结构和被优化的程序有深刻地理解,这和在通用处理器编程中打开几个优化选项的难度不可同日而语。
正是看到了CPU+GPU异构系统所存在的不足,英特尔推出了Xeon Phi协处理器,在异构系统市场大有后发制人的气势。英特尔至强处理器+Xeon Phi协处理器作为异构系统发展的另一个全新方向,由于架构仍沿用X86指令集的编程体系,本质上还是一个通用的Xeon内核,这使得原来的编程模式可以通用。因此研发人员在开发针对Xeon Phi平台的软件时,是在一个较为熟悉的领域继续开展研发工作——能够通过使用标准的C、C++和Frotran源代码进行编程,以简化开发和优化过程,这一优势是传统异构架构(使用CPU与GPU加速器的组合)所无法实现的。如在6月17日,采用Xeon E5与Xeon Phi的“天河二号”就将采用AMD Opteron 6274+NVIDIA Tesla K20的“泰坦”(Titan)拉下了全球HPC TOP500榜的冠军宝座。
“天河二号”采用了英特尔Xeon Phi协处理器
面对来自英特尔的威胁,为了充分释放并行处理器的计算能力,以CPU+GPU异架构为代表的AMD到了必须创新的时候了:必须重塑计算系统,把同一个平台上分立的处理单元紧密整合成为单颗处理器,同时不要大幅改变软件开发者的原有编程方式,而AMD正在与开源社区和技术伙伴们联手推动的下一代APU产品就是为了解决这些问题。
本文出自2013-12-23出版的《电脑报》2013年第50期 A.新闻周刊
(网站编辑:pcw2013)
读者活动
48小时点击排行
编辑推荐
论坛热帖
网站地图 | 版权声明 | 业务合作 | 友情链接 | 关于我们 | 招聘信息
报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sina.com 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcw*.c*m
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号
报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sina.com 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcw*.c*m
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号