2024年11月4日发(作者:詹耘)
=:!
GF100虽然是惊天动地,不过并不亲民 接近4干元的价位
让很多玩家对GTX480望而却步。由GF1 OO深度 阉割”的
GTX465虽然更加接近一般高端玩家的胃口.不过超过2000元的
价格和大众的心理价位并没交集。为了弥 ̄I-GTX400中端主流的
缺失,NVlDiA炮制出了重型武器GF1 04核心。
基于GF104的GTX460以1 299元与1499元的价格高速切入购
买力最密集的市场空间。同时对AMD的HD5830、HD5770形成夹
击。GTX460上市后.非公版便广泛地在市场上铺开.为用户提
中包括:
1 GFU-全局拥有共享二级缓存
2每组sM单元配备可配置一级缓存/Shared Memory:
3.拥有多个并行的多形体引擎.提供强悍的曲面细分性能
4
.
支持D×11标准,原生支持D×1 1硬件指令:
5支抽#CUDA3 O特性:
6.32倍覆盖抗锯齿等技术;
7.专门为DirectCompute; ̄l]:OpenCL优化。
供多样化的选择 除此之外.市面上还有不少设定频率较高的
超频版等。
Fermi架构扼要回顾
GTX460拥有两个规格的版本,一是768MB版本.另一个是
1GB版。它们同样是基于GF104的芯片。而当中.GF104就是一
片在Fermi架构上.经过深度改良以及为游戏优化而来的芯片。
当然.GF104同样会继承之前Fe rmI的特性.不过说到底
GF104是一款真真正正为游戏而生的芯片.用于游戏渲染方面的
晶体管比例有所增加。
同样 回顾之前.GF1 04继承了Ferml惊天动地的特性.其
NVIDIA通过GPU通用技术在各个领域上得到广泛的应用,并且都
取得了极高的加速度。
名词解析:
O1penCL DirectCompute
CUDA
CUDA(Compute Unified
OpenCL(Open Computing Language)中文直
Di rectCompute同样是一种
通用运算标准 它由微软提出的
译为:开放运算语言。是由苹果提出,得到多家厂商
的支持的标准。它是一种语言框架,可以在与硬件无
关的平台上实现(包括CPU和GPU)。OpenCL以
种GPU通用运算APl。它可以在
Device Architecture),统一计算
架构是由NVlDIA推出的一种GPU
通用运算标准。它由硬件和软件
两个层次组成。由G efo r ce
GTX8800的统一渲染架构之后的
所有NVIDIA GPU都支持CUDA。
J
W%dows Vista以及Win7下实现,
从而把显卡的运算能力为操作系
统所用。Di rectCOmPUte支持
DX1 0和D×11的GPU。
c99标准来供开发者写内核函数。它适合做并行的算法,
同时屏蔽掉GPU的细节让程序员方便地使用GPU的运
算能力。现在OpenCL有1 0和1 1版本。
...
革命不断:GF1 04游戏架构再进化
之前我们探讨过基于Ferml的GF1 O0在图形以及通用运算的
Fermi架构中.更加
入了L1/L2来增加
优势,同时也说明了32'f ̄晶体管的来路.当从性能晶体管数量
比的角度出发时 我们会发现GF100的超前性。因此,为了更加
适应主流市场的需求.卜^/DIA经过深度的优化和改良炮制出了(3=104,
随机数据操作的速
度 右图为Shared
Memory在矩阵运算
当中的应用。
在曲面细分功
能上.基于Fermi架
从官方公布的晶体管数量以及功耗等情况看,可以得知它在3D
渲染能力用性能晶体管数量比来计算的话将有更好的表现,同
时也更加适合现在40nm乃至32nm_qZ艺。下面我们进~步分析
GF104的再次变革。
通用运算、曲面细分一脉相承
说 ̄IJGF1 04的变化 不得不重提GF1 O0 Ferm1的革命性通用
GPU体系继承了下来 其中革命性的3级缓存体系把渲染架构和
通用运算完美地结合。在通用运算架构当中,我们可以知道
构的GF1 04同样是
通过多形体引擎来
乱序并行实现.这
Matrix pI 惦n with Shared№mory
样实现的效率比同
期产品Cpyress有数
信的提升。曲面细
分技术是DX11引入
的新技术.它从几
何构造上为画质带
来新的体验。在
GF1 04上面.我们
CPU拥有较大的高速缓存来保证数据的命中率.从而提升程序
的性能。由于GPU类似于SIMD 因此它花费在寄存器以及运算
单元的晶体管数量会十分巨大.不过几平没有数据统~性的缓
存。那么就导致了GPU在通用算法上的难以移植而且效能偏低。
Fe rmI的一 二级缓存机制 ̄BGPU通用引入了新纪元,为
GPGPU(GPU通用)的发展引领到新的台阶。在图像处理、电路
设计 金融 科学、天文学乃至我们日程生活的软件加速都可
可以看到多形体引
擎、纹理单元以及
CUDA核心、后端
以用到GDU.那么GPU通过GPGPU ̄{走进我们日常的生活。
在通用计
算领域上.有
开放的OpenCL
以及DI r ec卜
操作单元等比例都
经过了更加优化的
调整,这种调整类
唧 大AR,
NVIDIA和AMD
似于AMD当时的像
素着色/定点着色
由于软件并内应用到Fe rmi架构关键的
都是分别通过
自家的通用技
术去支持这些
API
。
黄金比例的策略。 shared memory ̄,导致GTX4O系列的
通过对图形流水线 通用性能未能正常发挥。
0PenCL是苹果提出的一种开放通用计算
API,它不但适用于GPU通用,而且还适用于
通用处理器等其他体系的硬件使用。
的硬件分配调整来更加适应当前3D渲染的需求。
上述的特性,GF1 04都一脉相承地继承下来.不过在细节上
有微量的调整.下面我们进一步分析。
譬 ̄DNVl-
DlA通过CUDA
而AMDI)]lJ通过AT Stream去各自支撑。
由于两者架构的不同,所以在效率上也有一定差异 尤其
在不同算法的实现上更是如此。观看AMD架构是偏向以运算单
元较多,而Fermi体系是以综合平衡为主 尤其在GPU体系当中
增加了类似通用处理器的多级存储体系,令FermI更像是一块智
能的GPU。
测试小花絮:
在本专题中,我们会包括显卡的OpenCL ̄lJ试和CUDA
效能测试。在Di rectCompute方面,由于Di rectCompute
Mark并没有运用 ̄IJCUDA架构中的Shared Memory导致性能
与AMD显卡有巨大效能的差异,所以我们放弃此项目的测试。
在通用运算应用当中,Shared Memory的应用是性能提升的
I关键,Shared Memory适用于存储规则性的数据便于软件管理。
同样I ̄CUDA Core情况下.GPC: ̄I]:SM数量会有所下降.这也直
第三代sM(流式多核处理机)的重组
GF104最大的变化.就是在SM级别上的变化。Fermi渲染架
构上.图形架构分为了GPC(Graphiscs Processing Clusters)纹
理处理集群 SM(Streaming Multiprocessor)流式多处理机.
SPs(Streaming Processor)。其中.GF104出乎意料地不从GPC
接影响到与之绑定的多形体引擎以及光栅化引擎。图形架构的
比例上.可以看到光栅化以及多形体引擎有了减半,同时流处
理器和纹理单元所占比例有了大幅提升。
GTX 480 G PU GTX 460 GPU
重组而来.而是在SM层上形成深度的变化。这种变化从技术上
来说影响更加深远。
以前推测GF104是通过重组GPC数量而面向中端主流.不过
NVIDIA方面为了在游戏有更大的优化而采取了SM级别上重组,
在架构图上可以看出以往GF1 00的SM拥有32个CUDA Cores.而
且GF104却拥有48个CUDA cores。以前的SM阵列中.由4个
CUDA核心共用一对lO操作单元。
在架构分析上.GF1 04拥有2组GPC.而GF1 0o ̄jJ拥有4组GPC。
从SM单元上看.每组的CUDA核心由原来的32个飙升到了48个.
并在每组SM绑定的纹理单元由原来的4个翻倍到了8个.并且全
局的二级缓存变为5|2KB。
GF100和GF104的对比,GF104中的19.5亿晶体管,将拥有更大的
比例用来加强图形渲染。
在GF1 04架构的微调当中,可以知道现在游戏对曲面细分以
及通用性能要求并不是十分苛刻。相反.对渲染着色器.纹理
处理能力以及显存带宽的比重还是偏高.因此GF104的变动将在
同样的晶体管数量下.更加切合现在游戏对硬件的需求 DX1 1
主要用于柔和阴影映射过滤和其他一些细微的性能优化。然而.
回顾GF1 O0可知它是一个超前的图形架构。
总结GF1 04的各项主要变化
1.每组SM的CUDA核心大增 ̄JJ48个;
2.每组SM的纹理单元增加一倍.达到8个之多:
3.SM中的SFU(特殊函数单元)同时也增加了一倍.达到
了8个;
GF104架构图,从中可以看出完整版的GF104拥有384个CUDA核
心。
4.ROP单元由48个减少到32个:
5.多形体引擎由原来的16个减到8个。
在Fermi体系下.由GF100 ̄IJGF104的改良当中,我们可以发现
为游戏优化!渲染单元、纹理单元比例大大增加
从细微的变化.笔者推测48个渲染单元为一组SM并且绑定
8个纹理单元是游戏架构优化的关键。首先专门为游戏优化最直
接的方法就是增加渲染单元.另外就是纹理单元.其次就是在
衡量芯片效能的数个有效参数.分别是性能功耗比 每晶体管
性能以及单位面积峰值性能。
在芯片发展的过程当中,除了单纯堆砌晶体管之外还需要对
以上的参数进行考量。GF1 00虽然性能极其强悍.但用性能功
耗比来衡量的话GF100还是比Cypress ̄不少。如果从性能每晶
体管来衡量的话纯粹的3D游戏中优势并不明显。在上个月刊中
我们也分析了GF100是一块高度 一心二用 的芯片.它除了
对图形优化外更是对通用进行超强优化。那么在当前工艺制
带宽以及调度上如何高效地利用资源。着色器负责像素颜色以
及光线的计算.同时也负责顶点的变换.纹理单元方面主要负
责纹理寻址 纹理过滤等。
经过SM的再变革.渲染单元和纹理单元对整个电路的比例
有较大增加。譬如每组SM上的指令缓存 warp调派单元以及线
程排分单元等不变的情况下,渲染单元和纹理单元有了大幅的
程并不完善豹今天,导致了庞大晶体管而引起高热高温
这也催生了针对游戏而生并优化过晶体管的GF104。
提高。而且我们也看到了另一个细节.就是这样的改良后,在
L
左为GTX460 1GB供电电路,右为GT×460 768MB供电电路,从细节上看两者几乎没区
别。设计上同是3相核心供电加上1相显存供电组成。核心供电每相由3个MOS管组成2个
“上一下”模式。滤波电容方面采用大量的高频陶瓷以及固态电容。
1GB版本的核心代号为GF104—325,而768MB的核心代号为GF104—300。从拆解可以
看出,GF104的核心比较奇特,为长方形,笔者猜测是由于芯片内部架构的改动导致。
在SM阵列的行处理器由4个变成了6个,因此对外部形状也造成了一定影Ⅱ向。
显存使用上,1 GB版和768MB版都是采
用三星0.5纳秒显存。
热门品牌GTX460新品检阅
自从GTX460正式发布到上市之时.各大厂家便推出了各式的非
公版.下面我们一起了解时下最热门的各款GTX460。
索泰GTX460-1 GD5极速版
我们的评分方法
●综合效能评分方法
综合效能分数由散热指数、性能指数和做工指数等三个指标组成.
每个单项指标的满分为70分.而综合效能分数的计算公式为[(散热
指数刊生能指数+做工指数)/3】×10 满分刚好为1∞分(得出结果
越大越好)。
其中.散热指数以我们下文的温度测试为参考;性能指数以显
卡的核心以及默认频率设定为参照;做工指数则以产品外观设计.
电路设计用料以及产品的稳定性做参考。■■■—粤粤圈 —-价格 价格指数(越小越好】
1翻自莞
13
・性价比评分方法 :器
为1GB,而且位宽为256bit。除此之外,显卡的RO
单元为32个,比768MB版本的24个多了四分之一。
电路设计上,显卡采用成本较高的公版设计,为显
的稳定性提供了良好的保证。
所谓性价比.很容易理解 就是性能和价格的比值。在本次测
试中,我们的计算公式为:性价比指数=(性能指数/价格指数)
其中.价格指数则是我们根据产品的售价来没定f如上表所示)。
根据性价比指数公式计算.得出来的结果越大,产品的性价比越高
耕异GTX460关羽版
点评:显卡采用的是非公版设计,PCB
要短不少。可以让显卡对不同机箱的兼容
供电电路上。采用常规的3+1相设计,同时
了高端显卡上超低阻值MOS管,让电流更
发热更低。频率设定上,定义为较高的800
对于公版675MHZ有巨幅提升,性能的强
知。
性能指数:9
散热指数 8.5
做工指数 8
价格指数:9
综合效能:85(Winner
性价比指数:1
DR5)
翔升GTX460+1 GB金刚版
点评:翔升的GTX460 4-默认频率提升到了
7 2 5 M H Z,性能完全可以媲美完整版核心的
GF1O4,因此这也算是为真正“460+”的预演。显
卡凭借超前的市场预测将替代之前中端王者
GTX2604-,同时翔升GTX460+金刚版依然保持着
1499元价格十分适合中高端用户选择。
性能指数:8,5
散热指数+8
做工指数:8
价格指数.8
综合效能82
性价比指数:1 06
参数:725/3600MHz f,GB GDDR5)
价格:1499元
电话:800—888—01 23
测试平台以及3D理论测试
测试平台介绍:
硬件平台搭建处理器:Core i5-750,超频4GHz
内存:RAMAX DDR3 2×2GB 超频1600MHz
主板:Intel P55主板
显卡 GTX460/HD5830
软件平台
系统:Win7 32位旗舰版
驱动:NVIDIA ForceWare 259.1 3
AMD Catalyst 10.6
电源为航嘉X7 900W 内存采用RAMAX DDR3 OC 16O0MHz组成双通道 散热器配搭:酷冷至尊V6
●3DMARK Vantage
3DMarkVantage测试
3DMark Vantage是业界第一
套专门基于微软DX10 API打造的
综合性基准测试工具.并能全面
发挥多路显卡 多核心处理器的
优势。我们测试设定在Pe rfo r—
mance以及High两个档次。
从测试结果可以看出,GTX46O不同版本之间和HD583O之间的差距并不大,当然,测试是检验显卡在
老一代DX10API的性能。在细节上GT×460还是以微弱的优势而领先。
●Heaven Benchmark 2.1
Heaven Benchmark 2.1基于
Unigine;]f擎,它是检验DX1 1 API
性能的基准测试之一。在测试中.
我们把分辨率统—设定为19幻×IC80,
Shaders开到最高,抗锯齿关闭
曲面细分打开常规以及极致两种
模式测试。
●《孤岛惊魂2》
Far Cry 2中文名为《孤岛
惊魂2》,是Ubisoft推出的次世
代第一人称射击游戏.游戏将
带玩家到非洲这个最美丽同时
也充满危机的场景里。游戏基
于DJ1ja引擎.具有动态天气系统
动态火焰传递系统.拟真火焰
效果、拟真物理效果等.是一
款出色的考验显卡DX1 0性能的
游戏。
测试结果分析:测试方法是游戏自 ̄Benchma rk,测试为场景一。由测试结果可以看出,GTX460 ̄对
于同级别的HD5830有较大优势,即使定位较低的768MB版也凸显性能的强悍。
在测试中,画质是这样设定的:分辨率设定为1920×1080.画质设定为uft旧High.抗锯齿分别调节0ff 4倍以及8倍
●《孤岛危机:弹头》
《孤岛危机:弹头》在与《孤
岛危机》游戏时空平行的全新
剧情中,饰演人称Psycho士官长
奉命执行秘密任务,在途中会
遇到朝鲜士兵以及外星人。游
戏是基于C ryEngine2引擎.它相
对于《孤岛危机》在效能上有
较大提升.而且支持在DX9情况
下打开最高特效。
在测试中,我们把分辨率
测试结果分析:测试方法为游戏白带的Benchmark软件,测试为场景一。测试中,GTX460同样拥有较
大优势,在测试数据可以看出HD5830在AA打开情况下效能下降速度较大。
设定为1 920 080.画质设定到玩家级别,抗锯齿级别分别设计为0 4.8倍。
●《生化危机5》
《生化危机5》的故事是在
一
片酷热沙漠中的无名小镇上
展开的,这个地区发生了类似
种族>中突的纷争.居民们情绪
激动且各种暴力事件频发。游
戏支持NVIDIA的3D视觉效果技术
(GeForce 3D Vision)。另外 PC
版中还将新增角色隐藏服装一
套以及在佣兵模式中追加大量
丧尸登场的新模式力求tBPC机
测试结果分析:测试采用游戏里面的效能测试,场景选择为第二场景。测试成绩可以看到,GTX460
1GB版在所有选项中都占尽优势,即使768MB版都可以对抗HD5830。
能用尽。在测试中.分辨率调节到1 920X 1080.游戏画质设定到最高.同时设定不同倍速的抗锯齿。
●《世界冲突》
测试游戏: 《 中突世界》
(Worfd in Confl ict)是一款重
点在于单位策略.行动,团队
游戏和毁灭上的后冷战时期的
即时战略游戏。游戏当中所有
场景都可以破坏,同时会生成
大量碎片以及粒子 游戏还支
持逼真的水纹效果以及高动态
光源.是~款对cPu和显卡要求
测试结果分析:测试中GTX46O一直压制HD5830,在没开抗锯齿时GT×46O 768MB版本和HD5830相
当,不过当在4倍抗锯齿打开后,GTX460的优势更加明显。
较高的RTS游戏。测试中.分辨
率设定为1 920 X 1080.把画质开到最高.AA分别调至O.4 8倍抗锯齿。
●《鹰击长空》
测试游戏: 《鹰击长空》
的故事背景设定在201 29.私
人企业武装力量日趋强大.世
界正处在分崩离析陷入大战的
边缘。游戏中支持超大场景的
渲染,同时支持环境光照以及
DX1 0.1特效。测试分辨率为
1920X 1080
.
打开DX10.1特效.
测试结果分析:测试中,结果同样明显,GTX460 1GB版本强于768MB版,同B,-J'768MB版又强于
HD5830。
同时把画质开到最高.抗锯齿
分别设置为0 4.8倍抗锯齿。
●《战地:叛逆连队2》
《战地:叛逆连队2》使用
加强版的寒霜引擎,细节画质
有一些提高.优化工作更加完善.
程序漏洞有所减少。Pc版游戏
拥有DX1 1的部分技术,DX1 1中
主要用于柔和阴影映射过滤和
其他一些细微的性能优化。破
坏效果方面.游戏引入了Havok
物理引擎的Destruction 2 0系统,
可破坏的物件也由前作的92%
上升到99%,因此破坏将进行
测试结果分析:测试结果中,GTX460 1GB版本性能一直高居在上,而且抗锯齿效率优秀。在1x抗锯
齿跳跃到4x抗锯齿中,可以看到个3款显卡都有较大的下跌幅度。而在4×抗锯齿到8x中下跌幅度收
窄,由此可以判断,游戏的8×算法是经过优化。不过,高倍数抗锯齿效能上,N卡同样占优势。
得更为彻底.能做到真正的“夷为平地 。当然这对显卡以及处理器来说都~个考验。测试分辨率设定为1 920 X 1080,画质设置到最
高 同时分配。x.4xSEI8x抗锯齿做测试
特别策划Special TI[)Dic
瑚 一 蔫 ^
砸 ff舅新l 2010.09 1 7
我们知道.GF104是在Fermi上把图形流水线进行了调整 其 在GF104芯片里比例提升到了48:1.而光栅化引擎和多形体引擎
中渲染单元的比例大幅提升 与之同时.光栅化单元以及多形
体引擎的数量有了一定的缩减。 在统一渲染架构上,渲染单元
把之前分离式的工作统一起来 从而做到负载可以动态地调整
平衡。不过,在非编程单元中. 负荷的比例就受限于流水线中
硬件单元的比例。
在GF100当中,CORE核心与多形体引擎的比例为32:1.而且
的比例还是4:1。在当前的游戏当中,像素着色 纹理性能等在
游戏当中的需要还是十分之高,GF1 04经过精心的调整.让其更
加切合当前游戏对图形应用的要求.性能上值得肯定。下面,
让我们~起考察GF1 04的曲面细分性能
测试上,我们重点测试曲面细分的效能.因此选择了不同
的游戏以及基于不同API的基准测试。
1.Heaven Benchmark 2.1
Heaven Benchmark2 1采用了
大量的曲面细分技术.景深及高
动态光照等技术。考虑到时下游
戏对曲面细分要求还没达到很高.
因此测试只把曲面细分调到中等.
同时渲染质量设置最高。从测试
结果看.GTX460在性能较有优势.
尤其当几何特征环境复杂的时候
优势更加明显。
2.《巨石人》
(巨石人) (Stone Giant)也
是~款基于DX1 1的基准测试。测
试中可以自由调节曲面细分参数。
本次测试我们把曲面细分数值设
定到高.以便体验显卡的性能。
在数据上表明.GTX460在复杂的
几何环境当中表现出超强的性能,
帧数保持在3O以上。反观HD5830
由于DX1 1架构效率问题.导致性能大幅下降。
进步。测试中.我们只#EDX11特效设置为中等.渲染质量调节到高.在测试数据分析中可以看到.当环境多变复杂的时候.架构更为
优异的GF104表现出更大的优势。
4.《尘埃2》(DXl1)
《尘埃2》虽然也支持DX1 1效
果,不过只是局部支持.并没完
全使用 ̄JJDX1 1指令带来的效果。
当然 我们期待《尘埃3》会给我
们带来惊喜。
在测试中我们采用游戏自带
的性能工具.同时记录帧率。从
数据看至I.曲线之间几乎相似.
也就是说明了游戏对硬件架构的差异造成的效能影响不大(如果两条曲线之间颠簸可以得直达游戏对不同架构的芯片在不同场景会较
大差别)。从平均帧数看出.GF1 04核心依然优势依然明显。
5.GTX460竟有3倍效能!OpenGL 4.0的曲面细分效能体验
正当Dx标准大行其道的时候.其实OpenGL并没在我们的视线当
中消失.虽然近年来没有基于OpenGL的大型3D游戏.不过OpenGL却
在更加专门图形专业领域上拥有广泛应用 在Di rectX升级到1 1版本
的时候.OpenGL并没停止.同时也升级
6Mba口 ^‘ 山 0mm
I
■q ●_…I
r|
Ill●-1 -I..1lII●…-●
到了4 0版本。下面我们采用TessMark对
显卡进行OpenGL的曲面细分性能测试
I
∞ 。J l0 …_ *0
APt h t J
测试中我们分别把曲面细分调节到中等、极致以及疯狂三个级
别。从结果可以看出,GTX460在OpenGL4.O的曲面细分针对测试
中竟然有HD583O三倍效能之多。可见GF104架构不但在游戏渲染
方面出色。几何性能同时也十分惊人的。
’自… P ‘I¨I {’J
…
……
…
…, 『… :』
…n…
…
-j
。
-
f PUl…H
…
…
…
^…
j0 -1
…’
…
0
…
*d ・rⅢ
∞J
…,
vo 2 … ~
J
I
! …
,
I
I
软件支持4种级别的曲面
细分因子。其中包括适量
级别、中等级别、极致级
别和最后的疯狂级别。
TessMark中曲面细分中等级别
TessMark中曲面细分极致效果TessMark#曲面细分中的疯狂效果,注
意图只是网格效果,可以看到疯狂的网 J
格密度让人看到有纹理效果的错觉。 J
—
冲击2000元级别,耕异关羽GTX460 KO HD5850
Heaven Benchmark2
■蔓舅——■■■●——■—■■■——■●●■■■—■■■—■_《孤岛惊魂2*
1920x1080匮质(Ultra High)AA(off/85 79 98 124%
.
1
Tessellation Normal
Tessellation Extreme
.
GTX460(1G)
819
578
HD5850 耕异关羽GTx460
647 939
403 675
 ̄HOSSSOLI较 与默认GTx480比较
145.00% 125 70% 1
167 ̄/( _.6% I
l
115
00%
1920×1080画质(U Etra High)AA(4x)
1920x1080画质(Uttre High)AA(Bx)
73
63
61
48
83
72
1 36%
T50%
113 00%
71400%
l
1
I
在供电设计上,显卡采用高效的4相输出,每相
配搭封闭的电感以及高效场效应管。
《孤岛危机:弹头》
1920×1080画质f玩家级IAA(off)
1920x 108O画质I玩家级)AA(4x)
l
44
38
48
41
51
43
1 06%
104%
11 6%
1.3%
I
I
I
{920X1 080画质f甄家级)AA(Sx}
性化危机5
1920×1080画质{最高}AA(off)
1920×1080画质{最高}AA{4 xl
1920×1080画质i最高)AA(Bx)
37
92
86
77
36
87
77
71
42
1O9
1 00
90
1I6%
125%
1 30%
126%
1I4%
118%
116%
117%
I
J
l
l
II
■—■—●■■■—■●■—■■■●●■——■■■—■■■■■-《尘埃2*
1920x1080画质(最高)AA(of}
1920×1080画质{最高)AA(4x)
Il
I
63
55
50
45
75
61
1 50%
135%
120%
111%
l
1920×1080画质f最高}AAc8)【j
《战地:叛逆连队2》
1920×1080画质c最高)AA(I x】
1920x1080西质(最高JAA(4x}
50
67
55
43
78
64
55
76
63
128%
97%
98%
110%
11 3%
114%
l
l
l
l
1920×1080画质f最高】AA(Bx)
显示输出上,显卡配备双DVI、mini HDMI以及
VGA接口。
54 56 62
.
11o%
,
115% -I
显现出 1 0%到20%的优l
势 性能十分强悍 据悉.GTX480赵云和G丁x460马超同一个PCB
那么.是否可以I
通过@ ̄JBIOS变身成为GTx460赵云或关羽版 我们将在近期揭开谜底
I
.
耕 关羽GT×460在与2。00元价位的HD5850竞技当中
,_r
无视HD5870,翔升双GTX460+与GTX480同门竞技
在前文的测试中可以看 ̄JGTX460在性能上力压HD5830,同时对定位更高的HD5850造成沉
重打击 由于GTX460具备惊人的超频能力 因此超频后的1GB可以完胜2000元以上的HD5870。
那么.GTX460真的没有对手7下面我们采用翔升GTX460+金刚版1 G D5组建双卡SLI.看看它
和单核心王者GTX480之间的性能区别。
翔升GTX460+金刚版1G D5产品区别于公版产品的最大特点是采用5相核,b/显存分离式
供电没计(公版仅4相).并只配备1×
让超频效率更高。
接电源,设定t明显高于公版的默; 频率7压/3∈玎0/1钓 .
而且显卡还具备超强的超频潜力。显卡还可以配搭翔升自己研发的金刚超频软件进行超频,
翔升GTX460+金刚版1 G D5解析
GTX460
自从AMD推出 双芯“单卡HD5970 ̄.GTx480也只能充其量是单芯卡王。单
卡之王一直落 ̄_AMD-T:-J:_.NVIDIA会不会推出双GTx48O芯片的单卡呢?我们认为.
从GTX480的温度以及功耗来看,这种可能性较小。
翔升GTX460+拆解
不过在高效的GF104芯片诞生之后.我们又重燃了对NVIDIA ̄芯单卡的希望。
虽然还没确定,不过可以通过GTx460组建sLl去探究 ̄GF104芯片的效能到底如何?
显卡采用4+1相供电设计,规格上比公版设计
优秀。
K尘埃2》
1g20x 1O8o 质(最高)hA(off)
1920 x 1080画质I最高)AA(4x)
71
64
97.8
854
119
106
96
1明%
165%
1 54%
122%
124%
123%
1920x 1080画质{最高)AA(8x)
62 77 5
《战地:叛逆莲PZ2)
1920×1080画质(最高l AA(1x)
192Ox1080画质(最高)AAt4 ̄3,
1920 x 1080画质I最高}AA(8x}
94
77
10045
86.16
8445
111 45
1O5
103
118%
111%
122%
T23%
136%
154%
67
从表中可以看出.双GF104性能完全超越GT×480.超越幅度在1O%到3O%之间。
L 晶 田堕只Pin世由沿汁
.
...
第三步:安装暴力扇。
我们先把其中一个圆形
的”暴力扇”安装到了散热
器之上,取代原装风扇 另
外一块涡轮造型的“暴力扇
则用于对PCB背面的散热。
●超额实战:频率艰难上调,修改BIOS冲击极限
超频过程,我们采用影驰提供的超频软件对显卡进行超频。在GPU体质测试
当中.我们发现显卡核心的体质算不上特别出色.默认电压状态下只能超到
840MHz左右。当然.大多数GF104的体质也在800—850MHz之间。为了进一步发
挥GPU的潜能,我们对显卡进行加压 十分遗憾的是.该显卡默认电压最大为
1
.
087V(这是NVIDIA的安全限制).在这一状态下显卡只能稳定在900MHz。
在默认81 0MHz的高频下,影驰GT×460骨灰黑将
显卡在3DMarkVantageAIJ ̄. ̄中取得了18168分,这
是本次GT×460横评的最佳得分。
由于显卡体质的限制.在电压上限1 087V情况下核心频率已经无法上调。不
过.我们并没放弃,决定通过修改BIOS来对电压限制进行调整。修改当中.我们
采用NiBiTor编辑显卡的BIOS.把显卡的设备ID改为与GTX470--致,然后通过Fermi
电压功能选项对它的最大电压限制由1.087V改到1 2V。在这一电压状态下,我们
最终把GTX460的核心频率锁定在977MHz,这是显卡在3DMarkVantage P模式中得
到了21363的成绩。
小提示:我们是如何把GTX460的电压提升至1。2V的
在默认情况下,考虑到GTX460核心的安全性和稳定性,NVIDIA对GF104
的电压进行了限制,默认最大仅为1.087V,但要想冲击更高的频率,我们必
须提升GPU的最大电压值。其原理为t
在Windows系统中,用NiBiTor软件备份GTX460的默认BIOS,接着用它
把显卡设备ID改为与GTX470--致,修改成功后就保存一个可以把GTX460认
通过影驰魔灵软件的加压后,显卡的核心频率最终
可以稳定在900MHz,并 ̄13DMmark Vantage的得
分为20204,比默认频率高2036分。
作为GTX470的BIOS文件 在被识别成为GTX470之后就可以把GPU的电压上
限调至1 2V,然后在NiBiTor软件把设备ID改回GTX460默认值并保存一个
BIOS文件。这一步完成之后,进入D0S系统用NVFlash软件把该BIOS文件写
入GTX460显卡中即可。
—量舅■●
总结:我们的超频心得和对超频意义的理解
我们认为.对于显卡进行适当的超频.例如影驰黑将把默认频率上调 ̄81aVHz.
意义上 无疑是提高了产品的性价比。但是.在极限的超频当中更是体验一种追
求.一种对极致性能的追求和一种认同感的寻找。随着这种理念的推动.极限超
温度/功耗测试以及全文总结
功耗以及温度测试
我们的测试方法
温度测试:测试环境是室温在25 ̄J26摄氏度的密闭空间。空闲温度是待机5分钟
之后用软件记录的温度.而满载温度则是FurMark烤机5分钟得出的数据。
功耗测试:我们采用专业的功耗测试仪器.在整机待机5分钟后记录功率值.而
满载功率同样是在Furmark拷机5分钟的情况下得出
温度测试总结
从测试可以看出.温度普
遍在60到70摄氏度之间,不过
要注意.FurMark是极端的烤机
软件,在一般大型的3D游戏过
程当中也极少会出现烤机这种
情况,所以测试结果只能表明
是~个极端值.并不代表正常
玩大型游戏的时候出现。
但是.得出的结果还是有
一
功率测试数据
温度测试数据
定的参考价值,可以根据数据来判断产品的散热效能。从结果可以看出.映众的
GTX460采用了3热管设计,因此在温度上表现更为出色。其次就是盈通的开放式散热
设计也让其温度持平在66摄氏度之间。
总结
功率控制出色,温度降低不少
功耗方面:GF1 04凭借极其出色的架构优化让其在这方面表
现力压HD5830,同时温度也相对于GF100有大幅降低。在公版散
热器情况下.即使在FurMark这样严酷的考验下温度也控制得相
当出色.这相对于一款中高端的显卡来说,是难能可贵的。相
对于GF104来说 功耗控制的关键是由于工艺的成熟以及电路设
为厂商推出各种超频版提供了条件.在默认频率6 75MHz下
GTX460已经十分出色.然而市面上普遍超到725MHz到8OOMHz左
右的超频版更是比对手的2000元级别的显卡更为优异.如果对
于性能有较高要求的话.以1 699元的价位去购买超频版还是十
分值得的。
写在最后
本次专题我们详尽地介绍并测试了NVIDIA中端利器GTX460.
希望可以为读者的带来一定的指引。到截稿之时.笔者了解到
GTS450系列正在密锣紧鼓的准备当中。那么.我们将在下一期
对其继续关注。
另外.有留意的读者可能会问,自从Ferml之后AMD貌似并
没有多少应对产品。不过根据了解.AMDi在密谋HD6000的产
计的完善。除此之外.芯片架构的改动也为功耗控制带来了不
少好处。
横扫千元价位,震慑2000元市场
性能方面:GTX460可谓是力压群豪,对直接对手HD5830达
到沉重的打击。价格方面,以1 299元和1499元切入了购买力最
密集的区间.同时各大厂商也为市场带来多样化的产品.为消
费者及时提供了货源。
品.预期会在10月发布,到时我们将迎来一场真正的划时代
DX1 7大战,届时我们(现代计算机)评测室将为大家
报道以及深入评测。圆
现在非公版GTX460也已大量到货,GF104出色的超频能力也
2024年11月4日发(作者:詹耘)
=:!
GF100虽然是惊天动地,不过并不亲民 接近4干元的价位
让很多玩家对GTX480望而却步。由GF1 OO深度 阉割”的
GTX465虽然更加接近一般高端玩家的胃口.不过超过2000元的
价格和大众的心理价位并没交集。为了弥 ̄I-GTX400中端主流的
缺失,NVlDiA炮制出了重型武器GF1 04核心。
基于GF104的GTX460以1 299元与1499元的价格高速切入购
买力最密集的市场空间。同时对AMD的HD5830、HD5770形成夹
击。GTX460上市后.非公版便广泛地在市场上铺开.为用户提
中包括:
1 GFU-全局拥有共享二级缓存
2每组sM单元配备可配置一级缓存/Shared Memory:
3.拥有多个并行的多形体引擎.提供强悍的曲面细分性能
4
.
支持D×11标准,原生支持D×1 1硬件指令:
5支抽#CUDA3 O特性:
6.32倍覆盖抗锯齿等技术;
7.专门为DirectCompute; ̄l]:OpenCL优化。
供多样化的选择 除此之外.市面上还有不少设定频率较高的
超频版等。
Fermi架构扼要回顾
GTX460拥有两个规格的版本,一是768MB版本.另一个是
1GB版。它们同样是基于GF104的芯片。而当中.GF104就是一
片在Fermi架构上.经过深度改良以及为游戏优化而来的芯片。
当然.GF104同样会继承之前Fe rmI的特性.不过说到底
GF104是一款真真正正为游戏而生的芯片.用于游戏渲染方面的
晶体管比例有所增加。
同样 回顾之前.GF1 04继承了Ferml惊天动地的特性.其
NVIDIA通过GPU通用技术在各个领域上得到广泛的应用,并且都
取得了极高的加速度。
名词解析:
O1penCL DirectCompute
CUDA
CUDA(Compute Unified
OpenCL(Open Computing Language)中文直
Di rectCompute同样是一种
通用运算标准 它由微软提出的
译为:开放运算语言。是由苹果提出,得到多家厂商
的支持的标准。它是一种语言框架,可以在与硬件无
关的平台上实现(包括CPU和GPU)。OpenCL以
种GPU通用运算APl。它可以在
Device Architecture),统一计算
架构是由NVlDIA推出的一种GPU
通用运算标准。它由硬件和软件
两个层次组成。由G efo r ce
GTX8800的统一渲染架构之后的
所有NVIDIA GPU都支持CUDA。
J
W%dows Vista以及Win7下实现,
从而把显卡的运算能力为操作系
统所用。Di rectCOmPUte支持
DX1 0和D×11的GPU。
c99标准来供开发者写内核函数。它适合做并行的算法,
同时屏蔽掉GPU的细节让程序员方便地使用GPU的运
算能力。现在OpenCL有1 0和1 1版本。
...
革命不断:GF1 04游戏架构再进化
之前我们探讨过基于Ferml的GF1 O0在图形以及通用运算的
Fermi架构中.更加
入了L1/L2来增加
优势,同时也说明了32'f ̄晶体管的来路.当从性能晶体管数量
比的角度出发时 我们会发现GF100的超前性。因此,为了更加
适应主流市场的需求.卜^/DIA经过深度的优化和改良炮制出了(3=104,
随机数据操作的速
度 右图为Shared
Memory在矩阵运算
当中的应用。
在曲面细分功
能上.基于Fermi架
从官方公布的晶体管数量以及功耗等情况看,可以得知它在3D
渲染能力用性能晶体管数量比来计算的话将有更好的表现,同
时也更加适合现在40nm乃至32nm_qZ艺。下面我们进~步分析
GF104的再次变革。
通用运算、曲面细分一脉相承
说 ̄IJGF1 04的变化 不得不重提GF1 O0 Ferm1的革命性通用
GPU体系继承了下来 其中革命性的3级缓存体系把渲染架构和
通用运算完美地结合。在通用运算架构当中,我们可以知道
构的GF1 04同样是
通过多形体引擎来
乱序并行实现.这
Matrix pI 惦n with Shared№mory
样实现的效率比同
期产品Cpyress有数
信的提升。曲面细
分技术是DX11引入
的新技术.它从几
何构造上为画质带
来新的体验。在
GF1 04上面.我们
CPU拥有较大的高速缓存来保证数据的命中率.从而提升程序
的性能。由于GPU类似于SIMD 因此它花费在寄存器以及运算
单元的晶体管数量会十分巨大.不过几平没有数据统~性的缓
存。那么就导致了GPU在通用算法上的难以移植而且效能偏低。
Fe rmI的一 二级缓存机制 ̄BGPU通用引入了新纪元,为
GPGPU(GPU通用)的发展引领到新的台阶。在图像处理、电路
设计 金融 科学、天文学乃至我们日程生活的软件加速都可
可以看到多形体引
擎、纹理单元以及
CUDA核心、后端
以用到GDU.那么GPU通过GPGPU ̄{走进我们日常的生活。
在通用计
算领域上.有
开放的OpenCL
以及DI r ec卜
操作单元等比例都
经过了更加优化的
调整,这种调整类
唧 大AR,
NVIDIA和AMD
似于AMD当时的像
素着色/定点着色
由于软件并内应用到Fe rmi架构关键的
都是分别通过
自家的通用技
术去支持这些
API
。
黄金比例的策略。 shared memory ̄,导致GTX4O系列的
通过对图形流水线 通用性能未能正常发挥。
0PenCL是苹果提出的一种开放通用计算
API,它不但适用于GPU通用,而且还适用于
通用处理器等其他体系的硬件使用。
的硬件分配调整来更加适应当前3D渲染的需求。
上述的特性,GF1 04都一脉相承地继承下来.不过在细节上
有微量的调整.下面我们进一步分析。
譬 ̄DNVl-
DlA通过CUDA
而AMDI)]lJ通过AT Stream去各自支撑。
由于两者架构的不同,所以在效率上也有一定差异 尤其
在不同算法的实现上更是如此。观看AMD架构是偏向以运算单
元较多,而Fermi体系是以综合平衡为主 尤其在GPU体系当中
增加了类似通用处理器的多级存储体系,令FermI更像是一块智
能的GPU。
测试小花絮:
在本专题中,我们会包括显卡的OpenCL ̄lJ试和CUDA
效能测试。在Di rectCompute方面,由于Di rectCompute
Mark并没有运用 ̄IJCUDA架构中的Shared Memory导致性能
与AMD显卡有巨大效能的差异,所以我们放弃此项目的测试。
在通用运算应用当中,Shared Memory的应用是性能提升的
I关键,Shared Memory适用于存储规则性的数据便于软件管理。
同样I ̄CUDA Core情况下.GPC: ̄I]:SM数量会有所下降.这也直
第三代sM(流式多核处理机)的重组
GF104最大的变化.就是在SM级别上的变化。Fermi渲染架
构上.图形架构分为了GPC(Graphiscs Processing Clusters)纹
理处理集群 SM(Streaming Multiprocessor)流式多处理机.
SPs(Streaming Processor)。其中.GF104出乎意料地不从GPC
接影响到与之绑定的多形体引擎以及光栅化引擎。图形架构的
比例上.可以看到光栅化以及多形体引擎有了减半,同时流处
理器和纹理单元所占比例有了大幅提升。
GTX 480 G PU GTX 460 GPU
重组而来.而是在SM层上形成深度的变化。这种变化从技术上
来说影响更加深远。
以前推测GF104是通过重组GPC数量而面向中端主流.不过
NVIDIA方面为了在游戏有更大的优化而采取了SM级别上重组,
在架构图上可以看出以往GF1 00的SM拥有32个CUDA Cores.而
且GF104却拥有48个CUDA cores。以前的SM阵列中.由4个
CUDA核心共用一对lO操作单元。
在架构分析上.GF1 04拥有2组GPC.而GF1 0o ̄jJ拥有4组GPC。
从SM单元上看.每组的CUDA核心由原来的32个飙升到了48个.
并在每组SM绑定的纹理单元由原来的4个翻倍到了8个.并且全
局的二级缓存变为5|2KB。
GF100和GF104的对比,GF104中的19.5亿晶体管,将拥有更大的
比例用来加强图形渲染。
在GF1 04架构的微调当中,可以知道现在游戏对曲面细分以
及通用性能要求并不是十分苛刻。相反.对渲染着色器.纹理
处理能力以及显存带宽的比重还是偏高.因此GF104的变动将在
同样的晶体管数量下.更加切合现在游戏对硬件的需求 DX1 1
主要用于柔和阴影映射过滤和其他一些细微的性能优化。然而.
回顾GF1 O0可知它是一个超前的图形架构。
总结GF1 04的各项主要变化
1.每组SM的CUDA核心大增 ̄JJ48个;
2.每组SM的纹理单元增加一倍.达到8个之多:
3.SM中的SFU(特殊函数单元)同时也增加了一倍.达到
了8个;
GF104架构图,从中可以看出完整版的GF104拥有384个CUDA核
心。
4.ROP单元由48个减少到32个:
5.多形体引擎由原来的16个减到8个。
在Fermi体系下.由GF100 ̄IJGF104的改良当中,我们可以发现
为游戏优化!渲染单元、纹理单元比例大大增加
从细微的变化.笔者推测48个渲染单元为一组SM并且绑定
8个纹理单元是游戏架构优化的关键。首先专门为游戏优化最直
接的方法就是增加渲染单元.另外就是纹理单元.其次就是在
衡量芯片效能的数个有效参数.分别是性能功耗比 每晶体管
性能以及单位面积峰值性能。
在芯片发展的过程当中,除了单纯堆砌晶体管之外还需要对
以上的参数进行考量。GF1 00虽然性能极其强悍.但用性能功
耗比来衡量的话GF100还是比Cypress ̄不少。如果从性能每晶
体管来衡量的话纯粹的3D游戏中优势并不明显。在上个月刊中
我们也分析了GF100是一块高度 一心二用 的芯片.它除了
对图形优化外更是对通用进行超强优化。那么在当前工艺制
带宽以及调度上如何高效地利用资源。着色器负责像素颜色以
及光线的计算.同时也负责顶点的变换.纹理单元方面主要负
责纹理寻址 纹理过滤等。
经过SM的再变革.渲染单元和纹理单元对整个电路的比例
有较大增加。譬如每组SM上的指令缓存 warp调派单元以及线
程排分单元等不变的情况下,渲染单元和纹理单元有了大幅的
程并不完善豹今天,导致了庞大晶体管而引起高热高温
这也催生了针对游戏而生并优化过晶体管的GF104。
提高。而且我们也看到了另一个细节.就是这样的改良后,在
L
左为GTX460 1GB供电电路,右为GT×460 768MB供电电路,从细节上看两者几乎没区
别。设计上同是3相核心供电加上1相显存供电组成。核心供电每相由3个MOS管组成2个
“上一下”模式。滤波电容方面采用大量的高频陶瓷以及固态电容。
1GB版本的核心代号为GF104—325,而768MB的核心代号为GF104—300。从拆解可以
看出,GF104的核心比较奇特,为长方形,笔者猜测是由于芯片内部架构的改动导致。
在SM阵列的行处理器由4个变成了6个,因此对外部形状也造成了一定影Ⅱ向。
显存使用上,1 GB版和768MB版都是采
用三星0.5纳秒显存。
热门品牌GTX460新品检阅
自从GTX460正式发布到上市之时.各大厂家便推出了各式的非
公版.下面我们一起了解时下最热门的各款GTX460。
索泰GTX460-1 GD5极速版
我们的评分方法
●综合效能评分方法
综合效能分数由散热指数、性能指数和做工指数等三个指标组成.
每个单项指标的满分为70分.而综合效能分数的计算公式为[(散热
指数刊生能指数+做工指数)/3】×10 满分刚好为1∞分(得出结果
越大越好)。
其中.散热指数以我们下文的温度测试为参考;性能指数以显
卡的核心以及默认频率设定为参照;做工指数则以产品外观设计.
电路设计用料以及产品的稳定性做参考。■■■—粤粤圈 —-价格 价格指数(越小越好】
1翻自莞
13
・性价比评分方法 :器
为1GB,而且位宽为256bit。除此之外,显卡的RO
单元为32个,比768MB版本的24个多了四分之一。
电路设计上,显卡采用成本较高的公版设计,为显
的稳定性提供了良好的保证。
所谓性价比.很容易理解 就是性能和价格的比值。在本次测
试中,我们的计算公式为:性价比指数=(性能指数/价格指数)
其中.价格指数则是我们根据产品的售价来没定f如上表所示)。
根据性价比指数公式计算.得出来的结果越大,产品的性价比越高
耕异GTX460关羽版
点评:显卡采用的是非公版设计,PCB
要短不少。可以让显卡对不同机箱的兼容
供电电路上。采用常规的3+1相设计,同时
了高端显卡上超低阻值MOS管,让电流更
发热更低。频率设定上,定义为较高的800
对于公版675MHZ有巨幅提升,性能的强
知。
性能指数:9
散热指数 8.5
做工指数 8
价格指数:9
综合效能:85(Winner
性价比指数:1
DR5)
翔升GTX460+1 GB金刚版
点评:翔升的GTX460 4-默认频率提升到了
7 2 5 M H Z,性能完全可以媲美完整版核心的
GF1O4,因此这也算是为真正“460+”的预演。显
卡凭借超前的市场预测将替代之前中端王者
GTX2604-,同时翔升GTX460+金刚版依然保持着
1499元价格十分适合中高端用户选择。
性能指数:8,5
散热指数+8
做工指数:8
价格指数.8
综合效能82
性价比指数:1 06
参数:725/3600MHz f,GB GDDR5)
价格:1499元
电话:800—888—01 23
测试平台以及3D理论测试
测试平台介绍:
硬件平台搭建处理器:Core i5-750,超频4GHz
内存:RAMAX DDR3 2×2GB 超频1600MHz
主板:Intel P55主板
显卡 GTX460/HD5830
软件平台
系统:Win7 32位旗舰版
驱动:NVIDIA ForceWare 259.1 3
AMD Catalyst 10.6
电源为航嘉X7 900W 内存采用RAMAX DDR3 OC 16O0MHz组成双通道 散热器配搭:酷冷至尊V6
●3DMARK Vantage
3DMarkVantage测试
3DMark Vantage是业界第一
套专门基于微软DX10 API打造的
综合性基准测试工具.并能全面
发挥多路显卡 多核心处理器的
优势。我们测试设定在Pe rfo r—
mance以及High两个档次。
从测试结果可以看出,GTX46O不同版本之间和HD583O之间的差距并不大,当然,测试是检验显卡在
老一代DX10API的性能。在细节上GT×460还是以微弱的优势而领先。
●Heaven Benchmark 2.1
Heaven Benchmark 2.1基于
Unigine;]f擎,它是检验DX1 1 API
性能的基准测试之一。在测试中.
我们把分辨率统—设定为19幻×IC80,
Shaders开到最高,抗锯齿关闭
曲面细分打开常规以及极致两种
模式测试。
●《孤岛惊魂2》
Far Cry 2中文名为《孤岛
惊魂2》,是Ubisoft推出的次世
代第一人称射击游戏.游戏将
带玩家到非洲这个最美丽同时
也充满危机的场景里。游戏基
于DJ1ja引擎.具有动态天气系统
动态火焰传递系统.拟真火焰
效果、拟真物理效果等.是一
款出色的考验显卡DX1 0性能的
游戏。
测试结果分析:测试方法是游戏自 ̄Benchma rk,测试为场景一。由测试结果可以看出,GTX460 ̄对
于同级别的HD5830有较大优势,即使定位较低的768MB版也凸显性能的强悍。
在测试中,画质是这样设定的:分辨率设定为1920×1080.画质设定为uft旧High.抗锯齿分别调节0ff 4倍以及8倍
●《孤岛危机:弹头》
《孤岛危机:弹头》在与《孤
岛危机》游戏时空平行的全新
剧情中,饰演人称Psycho士官长
奉命执行秘密任务,在途中会
遇到朝鲜士兵以及外星人。游
戏是基于C ryEngine2引擎.它相
对于《孤岛危机》在效能上有
较大提升.而且支持在DX9情况
下打开最高特效。
在测试中,我们把分辨率
测试结果分析:测试方法为游戏白带的Benchmark软件,测试为场景一。测试中,GTX460同样拥有较
大优势,在测试数据可以看出HD5830在AA打开情况下效能下降速度较大。
设定为1 920 080.画质设定到玩家级别,抗锯齿级别分别设计为0 4.8倍。
●《生化危机5》
《生化危机5》的故事是在
一
片酷热沙漠中的无名小镇上
展开的,这个地区发生了类似
种族>中突的纷争.居民们情绪
激动且各种暴力事件频发。游
戏支持NVIDIA的3D视觉效果技术
(GeForce 3D Vision)。另外 PC
版中还将新增角色隐藏服装一
套以及在佣兵模式中追加大量
丧尸登场的新模式力求tBPC机
测试结果分析:测试采用游戏里面的效能测试,场景选择为第二场景。测试成绩可以看到,GTX460
1GB版在所有选项中都占尽优势,即使768MB版都可以对抗HD5830。
能用尽。在测试中.分辨率调节到1 920X 1080.游戏画质设定到最高.同时设定不同倍速的抗锯齿。
●《世界冲突》
测试游戏: 《 中突世界》
(Worfd in Confl ict)是一款重
点在于单位策略.行动,团队
游戏和毁灭上的后冷战时期的
即时战略游戏。游戏当中所有
场景都可以破坏,同时会生成
大量碎片以及粒子 游戏还支
持逼真的水纹效果以及高动态
光源.是~款对cPu和显卡要求
测试结果分析:测试中GTX46O一直压制HD5830,在没开抗锯齿时GT×46O 768MB版本和HD5830相
当,不过当在4倍抗锯齿打开后,GTX460的优势更加明显。
较高的RTS游戏。测试中.分辨
率设定为1 920 X 1080.把画质开到最高.AA分别调至O.4 8倍抗锯齿。
●《鹰击长空》
测试游戏: 《鹰击长空》
的故事背景设定在201 29.私
人企业武装力量日趋强大.世
界正处在分崩离析陷入大战的
边缘。游戏中支持超大场景的
渲染,同时支持环境光照以及
DX1 0.1特效。测试分辨率为
1920X 1080
.
打开DX10.1特效.
测试结果分析:测试中,结果同样明显,GTX460 1GB版本强于768MB版,同B,-J'768MB版又强于
HD5830。
同时把画质开到最高.抗锯齿
分别设置为0 4.8倍抗锯齿。
●《战地:叛逆连队2》
《战地:叛逆连队2》使用
加强版的寒霜引擎,细节画质
有一些提高.优化工作更加完善.
程序漏洞有所减少。Pc版游戏
拥有DX1 1的部分技术,DX1 1中
主要用于柔和阴影映射过滤和
其他一些细微的性能优化。破
坏效果方面.游戏引入了Havok
物理引擎的Destruction 2 0系统,
可破坏的物件也由前作的92%
上升到99%,因此破坏将进行
测试结果分析:测试结果中,GTX460 1GB版本性能一直高居在上,而且抗锯齿效率优秀。在1x抗锯
齿跳跃到4x抗锯齿中,可以看到个3款显卡都有较大的下跌幅度。而在4×抗锯齿到8x中下跌幅度收
窄,由此可以判断,游戏的8×算法是经过优化。不过,高倍数抗锯齿效能上,N卡同样占优势。
得更为彻底.能做到真正的“夷为平地 。当然这对显卡以及处理器来说都~个考验。测试分辨率设定为1 920 X 1080,画质设置到最
高 同时分配。x.4xSEI8x抗锯齿做测试
特别策划Special TI[)Dic
瑚 一 蔫 ^
砸 ff舅新l 2010.09 1 7
我们知道.GF104是在Fermi上把图形流水线进行了调整 其 在GF104芯片里比例提升到了48:1.而光栅化引擎和多形体引擎
中渲染单元的比例大幅提升 与之同时.光栅化单元以及多形
体引擎的数量有了一定的缩减。 在统一渲染架构上,渲染单元
把之前分离式的工作统一起来 从而做到负载可以动态地调整
平衡。不过,在非编程单元中. 负荷的比例就受限于流水线中
硬件单元的比例。
在GF100当中,CORE核心与多形体引擎的比例为32:1.而且
的比例还是4:1。在当前的游戏当中,像素着色 纹理性能等在
游戏当中的需要还是十分之高,GF1 04经过精心的调整.让其更
加切合当前游戏对图形应用的要求.性能上值得肯定。下面,
让我们~起考察GF1 04的曲面细分性能
测试上,我们重点测试曲面细分的效能.因此选择了不同
的游戏以及基于不同API的基准测试。
1.Heaven Benchmark 2.1
Heaven Benchmark2 1采用了
大量的曲面细分技术.景深及高
动态光照等技术。考虑到时下游
戏对曲面细分要求还没达到很高.
因此测试只把曲面细分调到中等.
同时渲染质量设置最高。从测试
结果看.GTX460在性能较有优势.
尤其当几何特征环境复杂的时候
优势更加明显。
2.《巨石人》
(巨石人) (Stone Giant)也
是~款基于DX1 1的基准测试。测
试中可以自由调节曲面细分参数。
本次测试我们把曲面细分数值设
定到高.以便体验显卡的性能。
在数据上表明.GTX460在复杂的
几何环境当中表现出超强的性能,
帧数保持在3O以上。反观HD5830
由于DX1 1架构效率问题.导致性能大幅下降。
进步。测试中.我们只#EDX11特效设置为中等.渲染质量调节到高.在测试数据分析中可以看到.当环境多变复杂的时候.架构更为
优异的GF104表现出更大的优势。
4.《尘埃2》(DXl1)
《尘埃2》虽然也支持DX1 1效
果,不过只是局部支持.并没完
全使用 ̄JJDX1 1指令带来的效果。
当然 我们期待《尘埃3》会给我
们带来惊喜。
在测试中我们采用游戏自带
的性能工具.同时记录帧率。从
数据看至I.曲线之间几乎相似.
也就是说明了游戏对硬件架构的差异造成的效能影响不大(如果两条曲线之间颠簸可以得直达游戏对不同架构的芯片在不同场景会较
大差别)。从平均帧数看出.GF1 04核心依然优势依然明显。
5.GTX460竟有3倍效能!OpenGL 4.0的曲面细分效能体验
正当Dx标准大行其道的时候.其实OpenGL并没在我们的视线当
中消失.虽然近年来没有基于OpenGL的大型3D游戏.不过OpenGL却
在更加专门图形专业领域上拥有广泛应用 在Di rectX升级到1 1版本
的时候.OpenGL并没停止.同时也升级
6Mba口 ^‘ 山 0mm
I
■q ●_…I
r|
Ill●-1 -I..1lII●…-●
到了4 0版本。下面我们采用TessMark对
显卡进行OpenGL的曲面细分性能测试
I
∞ 。J l0 …_ *0
APt h t J
测试中我们分别把曲面细分调节到中等、极致以及疯狂三个级
别。从结果可以看出,GTX460在OpenGL4.O的曲面细分针对测试
中竟然有HD583O三倍效能之多。可见GF104架构不但在游戏渲染
方面出色。几何性能同时也十分惊人的。
’自… P ‘I¨I {’J
…
……
…
…, 『… :』
…n…
…
-j
。
-
f PUl…H
…
…
…
^…
j0 -1
…’
…
0
…
*d ・rⅢ
∞J
…,
vo 2 … ~
J
I
! …
,
I
I
软件支持4种级别的曲面
细分因子。其中包括适量
级别、中等级别、极致级
别和最后的疯狂级别。
TessMark中曲面细分中等级别
TessMark中曲面细分极致效果TessMark#曲面细分中的疯狂效果,注
意图只是网格效果,可以看到疯狂的网 J
格密度让人看到有纹理效果的错觉。 J
—
冲击2000元级别,耕异关羽GTX460 KO HD5850
Heaven Benchmark2
■蔓舅——■■■●——■—■■■——■●●■■■—■■■—■_《孤岛惊魂2*
1920x1080匮质(Ultra High)AA(off/85 79 98 124%
.
1
Tessellation Normal
Tessellation Extreme
.
GTX460(1G)
819
578
HD5850 耕异关羽GTx460
647 939
403 675
 ̄HOSSSOLI较 与默认GTx480比较
145.00% 125 70% 1
167 ̄/( _.6% I
l
115
00%
1920×1080画质(U Etra High)AA(4x)
1920x1080画质(Uttre High)AA(Bx)
73
63
61
48
83
72
1 36%
T50%
113 00%
71400%
l
1
I
在供电设计上,显卡采用高效的4相输出,每相
配搭封闭的电感以及高效场效应管。
《孤岛危机:弹头》
1920×1080画质f玩家级IAA(off)
1920x 108O画质I玩家级)AA(4x)
l
44
38
48
41
51
43
1 06%
104%
11 6%
1.3%
I
I
I
{920X1 080画质f甄家级)AA(Sx}
性化危机5
1920×1080画质{最高}AA(off)
1920×1080画质{最高}AA{4 xl
1920×1080画质i最高)AA(Bx)
37
92
86
77
36
87
77
71
42
1O9
1 00
90
1I6%
125%
1 30%
126%
1I4%
118%
116%
117%
I
J
l
l
II
■—■—●■■■—■●■—■■■●●■——■■■—■■■■■-《尘埃2*
1920x1080画质(最高)AA(of}
1920×1080画质{最高)AA(4x)
Il
I
63
55
50
45
75
61
1 50%
135%
120%
111%
l
1920×1080画质f最高}AAc8)【j
《战地:叛逆连队2》
1920×1080画质c最高)AA(I x】
1920x1080西质(最高JAA(4x}
50
67
55
43
78
64
55
76
63
128%
97%
98%
110%
11 3%
114%
l
l
l
l
1920×1080画质f最高】AA(Bx)
显示输出上,显卡配备双DVI、mini HDMI以及
VGA接口。
54 56 62
.
11o%
,
115% -I
显现出 1 0%到20%的优l
势 性能十分强悍 据悉.GTX480赵云和G丁x460马超同一个PCB
那么.是否可以I
通过@ ̄JBIOS变身成为GTx460赵云或关羽版 我们将在近期揭开谜底
I
.
耕 关羽GT×460在与2。00元价位的HD5850竞技当中
,_r
无视HD5870,翔升双GTX460+与GTX480同门竞技
在前文的测试中可以看 ̄JGTX460在性能上力压HD5830,同时对定位更高的HD5850造成沉
重打击 由于GTX460具备惊人的超频能力 因此超频后的1GB可以完胜2000元以上的HD5870。
那么.GTX460真的没有对手7下面我们采用翔升GTX460+金刚版1 G D5组建双卡SLI.看看它
和单核心王者GTX480之间的性能区别。
翔升GTX460+金刚版1G D5产品区别于公版产品的最大特点是采用5相核,b/显存分离式
供电没计(公版仅4相).并只配备1×
让超频效率更高。
接电源,设定t明显高于公版的默; 频率7压/3∈玎0/1钓 .
而且显卡还具备超强的超频潜力。显卡还可以配搭翔升自己研发的金刚超频软件进行超频,
翔升GTX460+金刚版1 G D5解析
GTX460
自从AMD推出 双芯“单卡HD5970 ̄.GTx480也只能充其量是单芯卡王。单
卡之王一直落 ̄_AMD-T:-J:_.NVIDIA会不会推出双GTx48O芯片的单卡呢?我们认为.
从GTX480的温度以及功耗来看,这种可能性较小。
翔升GTX460+拆解
不过在高效的GF104芯片诞生之后.我们又重燃了对NVIDIA ̄芯单卡的希望。
虽然还没确定,不过可以通过GTx460组建sLl去探究 ̄GF104芯片的效能到底如何?
显卡采用4+1相供电设计,规格上比公版设计
优秀。
K尘埃2》
1g20x 1O8o 质(最高)hA(off)
1920 x 1080画质I最高)AA(4x)
71
64
97.8
854
119
106
96
1明%
165%
1 54%
122%
124%
123%
1920x 1080画质{最高)AA(8x)
62 77 5
《战地:叛逆莲PZ2)
1920×1080画质(最高l AA(1x)
192Ox1080画质(最高)AAt4 ̄3,
1920 x 1080画质I最高}AA(8x}
94
77
10045
86.16
8445
111 45
1O5
103
118%
111%
122%
T23%
136%
154%
67
从表中可以看出.双GF104性能完全超越GT×480.超越幅度在1O%到3O%之间。
L 晶 田堕只Pin世由沿汁
.
...
第三步:安装暴力扇。
我们先把其中一个圆形
的”暴力扇”安装到了散热
器之上,取代原装风扇 另
外一块涡轮造型的“暴力扇
则用于对PCB背面的散热。
●超额实战:频率艰难上调,修改BIOS冲击极限
超频过程,我们采用影驰提供的超频软件对显卡进行超频。在GPU体质测试
当中.我们发现显卡核心的体质算不上特别出色.默认电压状态下只能超到
840MHz左右。当然.大多数GF104的体质也在800—850MHz之间。为了进一步发
挥GPU的潜能,我们对显卡进行加压 十分遗憾的是.该显卡默认电压最大为
1
.
087V(这是NVIDIA的安全限制).在这一状态下显卡只能稳定在900MHz。
在默认81 0MHz的高频下,影驰GT×460骨灰黑将
显卡在3DMarkVantageAIJ ̄. ̄中取得了18168分,这
是本次GT×460横评的最佳得分。
由于显卡体质的限制.在电压上限1 087V情况下核心频率已经无法上调。不
过.我们并没放弃,决定通过修改BIOS来对电压限制进行调整。修改当中.我们
采用NiBiTor编辑显卡的BIOS.把显卡的设备ID改为与GTX470--致,然后通过Fermi
电压功能选项对它的最大电压限制由1.087V改到1 2V。在这一电压状态下,我们
最终把GTX460的核心频率锁定在977MHz,这是显卡在3DMarkVantage P模式中得
到了21363的成绩。
小提示:我们是如何把GTX460的电压提升至1。2V的
在默认情况下,考虑到GTX460核心的安全性和稳定性,NVIDIA对GF104
的电压进行了限制,默认最大仅为1.087V,但要想冲击更高的频率,我们必
须提升GPU的最大电压值。其原理为t
在Windows系统中,用NiBiTor软件备份GTX460的默认BIOS,接着用它
把显卡设备ID改为与GTX470--致,修改成功后就保存一个可以把GTX460认
通过影驰魔灵软件的加压后,显卡的核心频率最终
可以稳定在900MHz,并 ̄13DMmark Vantage的得
分为20204,比默认频率高2036分。
作为GTX470的BIOS文件 在被识别成为GTX470之后就可以把GPU的电压上
限调至1 2V,然后在NiBiTor软件把设备ID改回GTX460默认值并保存一个
BIOS文件。这一步完成之后,进入D0S系统用NVFlash软件把该BIOS文件写
入GTX460显卡中即可。
—量舅■●
总结:我们的超频心得和对超频意义的理解
我们认为.对于显卡进行适当的超频.例如影驰黑将把默认频率上调 ̄81aVHz.
意义上 无疑是提高了产品的性价比。但是.在极限的超频当中更是体验一种追
求.一种对极致性能的追求和一种认同感的寻找。随着这种理念的推动.极限超
温度/功耗测试以及全文总结
功耗以及温度测试
我们的测试方法
温度测试:测试环境是室温在25 ̄J26摄氏度的密闭空间。空闲温度是待机5分钟
之后用软件记录的温度.而满载温度则是FurMark烤机5分钟得出的数据。
功耗测试:我们采用专业的功耗测试仪器.在整机待机5分钟后记录功率值.而
满载功率同样是在Furmark拷机5分钟的情况下得出
温度测试总结
从测试可以看出.温度普
遍在60到70摄氏度之间,不过
要注意.FurMark是极端的烤机
软件,在一般大型的3D游戏过
程当中也极少会出现烤机这种
情况,所以测试结果只能表明
是~个极端值.并不代表正常
玩大型游戏的时候出现。
但是.得出的结果还是有
一
功率测试数据
温度测试数据
定的参考价值,可以根据数据来判断产品的散热效能。从结果可以看出.映众的
GTX460采用了3热管设计,因此在温度上表现更为出色。其次就是盈通的开放式散热
设计也让其温度持平在66摄氏度之间。
总结
功率控制出色,温度降低不少
功耗方面:GF1 04凭借极其出色的架构优化让其在这方面表
现力压HD5830,同时温度也相对于GF100有大幅降低。在公版散
热器情况下.即使在FurMark这样严酷的考验下温度也控制得相
当出色.这相对于一款中高端的显卡来说,是难能可贵的。相
对于GF104来说 功耗控制的关键是由于工艺的成熟以及电路设
为厂商推出各种超频版提供了条件.在默认频率6 75MHz下
GTX460已经十分出色.然而市面上普遍超到725MHz到8OOMHz左
右的超频版更是比对手的2000元级别的显卡更为优异.如果对
于性能有较高要求的话.以1 699元的价位去购买超频版还是十
分值得的。
写在最后
本次专题我们详尽地介绍并测试了NVIDIA中端利器GTX460.
希望可以为读者的带来一定的指引。到截稿之时.笔者了解到
GTS450系列正在密锣紧鼓的准备当中。那么.我们将在下一期
对其继续关注。
另外.有留意的读者可能会问,自从Ferml之后AMD貌似并
没有多少应对产品。不过根据了解.AMDi在密谋HD6000的产
计的完善。除此之外.芯片架构的改动也为功耗控制带来了不
少好处。
横扫千元价位,震慑2000元市场
性能方面:GTX460可谓是力压群豪,对直接对手HD5830达
到沉重的打击。价格方面,以1 299元和1499元切入了购买力最
密集的区间.同时各大厂商也为市场带来多样化的产品.为消
费者及时提供了货源。
品.预期会在10月发布,到时我们将迎来一场真正的划时代
DX1 7大战,届时我们(现代计算机)评测室将为大家
报道以及深入评测。圆
现在非公版GTX460也已大量到货,GF104出色的超频能力也