去年NVIDIA公布了30系GPU,搭载NVIDIA Ampere架构的GeForce RTX30系GPU,在性能上的大幅提升使得玩家们欢呼雀跃,获得了很多游戏玩家尤其是追求极致画质的3A大作玩家的追捧。NVIDIA发布了RTX 3080 以及更为强大的RTX 3090 GPU,RTX 3090相比于RTX 3080的游戏性能提升不足15%,而价格却是高了一倍有余,玩家们对于RTX 3090兴致缺缺,玩家们十分乐于看到RTX 3080 Ti GPU的问世。
今天清风硬件提前拿到了一套全新的公版GeForce RTX 3080 Ti,带领玩家们提前感受Ti级旗舰游戏GPU。
架构分析
RTX 3080 Ti采用NVIDIA Ampere架构,它意味着巨大的性能飞跃。为使其成为全球最快的GPU,NVIDIA投入了大量的精力。NVIDIA Ampere架构采用改进的流式多处理器(SM) 、用于改进光线追踪硬件加速的第二代RT Cores、用于提高AI推理和DLSS性能的第三代Tensor Cores。
NVIDIA Ampere Streaming Multiprocessor (SM)是GPU的构件,它由CUDA Cores、全新Tensor Cores、全新RT Core、纹理单元、加载/存储单元、L0和L1缓存、共享显存和寄存器文件等等。
与上一代Turing架构GPU相比,NVIDIA Ampere SM架构的FP32性能提升一倍。NVIDIA Ampere架构GPU的特点是每个SM有四个处理分区,以及一个用于FP32和INT32操作的新数据路径设计,所有四个SM分区组合在一起,每个时钟可执行128 FP32操作。
NVIDIA Ampere架构的GeForce RTX 30系列GPU统一了INT32与FP32单元,原本只能做整数运算的INT32单元现在既能做整数运算,也能做单精度浮点运算。这一项技术革新将传统意义上的流处理器数量直接翻倍,同时GPU的浮点运算能力也提升了一倍。
RTX 3080 Ti采用8nm工艺设计,从整体晶体管密度来看,GA102 每平方毫米包含4500万个晶体管,基于GA102-225-A1核心,具有80组SM单元/10240 个CUDA 核心、112个ROP、320个纹理单元、80个第二代RT Cores。搭配12GB GDDR6X显存,频率方面,主频1365MHz,Boost频率1665MHz,稍低于RTX3080。我们可以看到RTX 3080 Ti的流处理器数量直接从RTX 3080的8704个暴增到了10240个,15%的流处理器数量提升,几乎和RTX 3090相当。
RTX 3080 Ti还拥有三项基础处理技术:NVIDIA在15年前首次推出的可编程着色器、用于加快光线三角形和光线边界框相交计算的RT Core,以及称为Tensor Core的AI处理管线。