继2007年年底发布Spider“蜘蛛”平台后又一次大型的产品发布会后,2008年1月23日AMD在北京威斯汀大酒店召开了AMD 780G、Radeon HD 3600系列、Radeon HD 3400系列及Radeon HD 3870 x2的发布会。虽然此次发布会发布的产品众多,但其中最引人注目的莫过于Radeon HD 3870 x2,因为这是AMD继Radeon X1950XTX之后,第一款正面与NVIDIA争夺性能王者的作品,而这个时间跨度,已经是一年四个月零十三天。
2006年,由于G71系列无法撼动R580的性能霸主地位,而那时G80还没有研发完成,无奈之下NVIDIA将两颗G71核心放在一起以SLI的形式协同工作,这就是近年著名的双核显卡GeForce 7950GX2。而今天AMD也发布了将两颗RV670核心集成在一张PCB上的双核心显卡Radeon HD 3870 x2,Radeon HD 3870 x2除了肩负这对抗终结GeForce 8800Ultra的使命外,更深层次的意义是GeForce 7950GX2所远不能比的。
GeForce 7950GX2
GeForce 7950GX2是一款纯粹的为NVIDIA“面子”而生的显卡,其作用只是为了在性能上超越Radeon X1900XTX,也就成了G80发布前的一个“集结号”,在NVIDIA的显卡发展史上,我们找不到GeForce 7950GX2的位置,来的匆忙,走的也匆忙。而Radeon HD 3870 x2则将在AMD的显卡发展史上产生举足轻重的的作用,R680将是AMD显卡多核化的号角。
于是在R680发布前期,外界曾有猜测Radeon HD 3870 x2为一款NUMA(Non Uniform Memory Access Achitecture) 架构的产品。因为在NUMA架构中,每个核心都可以访问系统的内存,这也就彻底的解决了SLI与CrossFire显存不能不能共享的问题,并且在NUMA架构中,我们可以随意的增加核心的数量,为今后多核的发展奠定了基础,这些优势都使得NUMA架构成为R680的首选方案。
由于每个核心都可以访问共有的显存,在NUMA架构中必须有强大的I/O带宽所支撑,否则ALU的周期都将浪费在多核之间的数据等待上,那么其效能可能还不如单芯片产品,也就是说类似与GeForce 7950GX2那样的双PCB的双核心模式根本就无法实现。所以为了为以后NUMA的发展奠定基础,Radeon HD 3870 x2采用了一张PCB上集成两颗芯片的做法,虽然R680目前无法解决I/O带宽的问题,仍旧以CrossFire的模式进行运算,但是其设计思路更加符合今后的显卡多核发展道路,也许在R700上我们将看到NUMA的实现。
HD 3800正式引入了对DirectX 10.1的支持,其实支持DX10.1,早在AMD的HD 2000系列产品中,就能够实现部分的特效,但是由于当时DX10.1并未发布,所以AMD并没有确认。但是在研发RV670的时候,微软DX10.1补丁的框架和内容已经成型,因此AMD毫不犹豫地将DX10.1纳入RV670之中,成为首颗完整支持DX10.1和SM4.1的GPU。
Microsoft DirectX 10.1主要包括下面几个方面的特性:
.Shader Model 4.1
.32-bit floating point texture filtering
.Intexed cube map arrays
.Independent blend modes per rendering target
.Pixel coverage sample masking
.Read/write mulit-sample surfaces with shaders
.Gather4 texture fetching
Radeon HD 3870 x2其实就是将两颗RV670核心合并在一张PCB上,因此其规格正如其命名,Radeon HD 3870 x2拥有1+TeraFLOPS的浮点运算能力,这在单卡GPU史上是史无前例的,对比Radeon HD 3870,Radeon HD 3870 x2的核心频率有所增加,不过显存频率则有所降低,这主要是与Radeon HD 3870 x2所采用的GDDR3显存与Radeon HD 3870的GDDR4有所区别。
Radeon HD 3870 x2规格对比
Radeon HD 3870 x2
Radeon HD 3870
Radeon HD 2900XT
晶体管
~13亿
~6.7亿
7亿
制程
55nm
55nm
80nm
SPU
640
320
320
纹理单元
32
16
16
渲染器后端
32
16
16
核心频率
825+MHz
775+MHz
740MHz
显存频率
1800MHz
2250MHz
1650MHz
浮点能力
1+TeraFLOPS
479+GigaFLOPS
475GigaFLOPS
DirectX版本
10.1
10.1
10
UVD
√
√
×
PowerPlay
√
√
×
显存容量
512MB×2
512MB
512MB
位宽
256Bit×2
256Bit
512Bit
在安装完的Radeon HD 3870 x2驱动后,我们发现在驱动面板中并没有CrossFire选项,并且实际此时已经开启了CrossFire功能,操作非常的简单,优于两片Radeon HD 3870组成的CrossFire平台。
Radeon HD 3870 x2赏析
初次邂逅Radeon HD 3870 x2时,因为其风扇比较纤细,我们感觉这是我们见过最长的显卡,不过随后与GeForce 8800Ultra的比较中,我们发现其PCB长度相同。
Radeon HD 3870 x2采用双槽设计,大口径涡轮风扇及背部显存散热片的加增为散热提供了保证,正面柱形显存散热片也增加了显卡的散热面积;而4pin风扇接口的设计则使得显卡在工作时可以随意调节风扇转速,智能的在噪音和散热效能之间寻求平衡点。8pin+6pin的接口设计为两颗RV670的工作提供了电力的保障,在R680的使用中,插入两组6pin接口也也可以工作,不过无法打开AMD Over Driver功能。
Radeon HD 3870 x2拆解(一)
拆下背部散热篇可看到背部8颗显存颗粒
设计合理的散热片
三星16M×32Bit 1.0ns显存颗粒
密密麻麻的陶瓷电容 做工之强可见一斑
拆开巨大而纤细的散热器,一铜一铝散热底座映入眼帘
铝
铜
拆开之后发现其中是一铜一铝两个铜块
Radeon HD 3870 x2的散热器为两颗核心分别提供了铜与铝的散热片,由于靠近DVI接口部分的核心负责CrossFire的数据合成与输出,负载较大,温度也较高,所以VPU核心使用了铜质散热,而付芯片的负载较小,所以铝制散热片就能满足其散热需求,然后通过大口径涡轮风扇将热量吹出机箱外,即减轻了显卡的重量也降低了成本。不过我们在这里要补充一下,实测主芯片的温度并不低,建议AMD可以将这款旗舰型产品改装热管风扇。
Radeon HD 3870 x2拆解(二)
数字供电的采用一直是AMD旗舰显卡引以为傲的地方,此次Radeon HD 3870 x2也不例外。显卡采用显存与核心分离式供电设计,没个核心分别由一颗VOLTERRAVT1165MF PWM控制芯片来进行对电流输入输出的调节和控制。同时继续采用优秀的MultiPhase技术,所使用的则是QFN封装的VT1165SF芯片,该芯片内置Mosfet场效应管,每颗核心供电拥有两颗,搭配Pulse PA1312NL(两项)及MLCC多层陶瓷电容构成完美的供电解决方案。Pulse PA1312NL没相可以承受40A的电流,作为RV670核心来说,极限状态下也不可能达到80A电流,所以虽然Radeon HD 3870 x2的每相核心较之前的Radeon HD 2900XT弱,但无论显卡稳定运行还是超频都足以保障。
PC版《失落的星球》用增强的画面与游戏性来弥补没有新增内容的遗憾。游戏支持DirectX 9与DirectX 10,所以游戏可以运行在Windows XP与Windows Vista系统上。游戏光影效果与各种其他效果看起来都美轮美奂,较Xbox 360版本游戏有大幅度提升。作为Nvidia“The Way It's Meant To Be Played”列表中的一个,Capcom的游戏开发小组专门为Nvidia显卡做游戏画面优化。
《冲突世界》(World in Conflict)本作是一款以虚拟全球冷战为故事背景的RTS游戏,PC版游戏画面真正达到高清大片的水准。Vivendi公司希望通过X360的发布,来进一步拓展本作的玩家群体,让更多的人有机会接触这款次世代的RTS游戏。《冲突世界》以发生于21世纪的虚拟全球战争为背景,是Vivendi旗下著名的Massive Entertainment公司(代表作有《地面控制》系列)最新开发的产品。
游戏名称:冲突世界
英文名称:World in Conflict
游戏制作:Massive Entertainment
游戏发行:Sierra
游戏语种:英文
游戏类型:即时战略
官方网址:http://www.square-enix.co.jp/ccff7/
《冲突世界》(World in Conflict)设定在一个虚拟历史的世界中,并没有像我们知道的那样结束,而是一直持续,苏联也并没有解体,而且苏联开始进攻美国。该作中没有资源采集的过程,一切资源补给全部依靠战略支援。《冲突世界》的一大特点是拥有第一人称视角
Radeon HD 3870 x2拥有2D降频技术及AMD引以为傲的PowerPlay技术,因此在待机时功耗控制较好,不过满载时Radeon HD 3870 x2超越了GeForce 8800Ultra,同时也超越了Radeon HD 3870 CF,可见Radeon HD 3870 x2核心利用效率及合作效率比Radeon HD 3870 CF更高。
无论是待机还是满载,Radeon HD 3870 x2的温度均超越了GeForce 8800Ultra,但是这并不能说明GeForce 8800Ultra的温度控制比Radeon HD 3870 x2,而是因为Radeon HD 3870 x2采用的铜铝结合散热器较GeForce 8800Ultra所采用的热管比起来,实在太寒酸了。
测试总结
漫长的测试结束了,Radeon HD 3870 x2是否是世界上最快的显卡,我想大家心里都应该很清楚。对比GeForce 8800Ultra,Radeon HD 3870 x2虽然没有做到完胜,但是表现亦十分另我们满意,在《Crysis》及《生化奇兵》等年度大作中,Radeon HD 3870 x2都以较大优势领先,甚至在NVIDIA御用的《失落星球》中,Radeon HD 3870 x2在高分辨率下也取得了胜利。
虽然在显存频率上Radeon HD 3870 x2只有1800MHz,与Radeon HD 3870 CF相去甚远,但是我们看到在绝大多数的测试中,Radeon HD 3870 x2仍旧以微弱的优势领先,这当然与GDDR4的显存延迟较高有关,不过我想与两颗芯片集成于一张PCB后数据不需要经过PCI-E通道不无关系,PLX PEX8547传输速率优于CrossFire MIO接口。
正如文章开篇所述,Radeon HD 3870 x2可以看做是AMD全面转向多核显卡领域的号角,无论R700能不能实现NUMA架构,至少现在Radeon HD 3870 x2将两颗芯片集成在一张PCB上的做法为今后NUMA实现积累了宝贵的经验。Radeon HD 3870 x2的发布同样是AMD 2008年全面复苏反攻的号角, AMD会如同Radeon HD 3870 x2向GPU性能制高点发起总攻一样,沉默了一年之后,在AMD处处被制约的假象背后,巨狮在2008年将会彻底的觉醒。