从GTX到RTX NVIDIA GPU架构的变迁史

  • 时间:
  • 浏览:0
  • 来源:大发快3-大发快3平台_大发快3网投平台

本文转载自超能网,越多媒体转载需经超能网同意

GPU发展史上,30006年是有有兩个那么错过的节点——你是什么年AMD以54亿美元的代价收购了ATI公司,从此手握CPU及GPU两张好牌,AMD此后无缘无故以此为荣,强调亲戚亲戚朋友是业界唯一才能一齐提供高性能CPU及高性能GPU的公司,CPU拳打NVIDIA,GPU脚踢英特尔。当年另外一件事要是我微软在DX10 API上推出了统一渲染架构,NVIDIA 30006年发布的G3000架构GeForce 830000 GTX显卡率先支持统一渲染,从此NVIDIA的CUDA也闪亮登场了。

30006年地处的这两件事本质上没哪些关联,越多回想起当年及之前 的GPU发展具体情况,总忍不住遐想一下越多当年ATI没被AMD收购,ATI、NVIDIA两家GPU公司今天的发展会怎样才能?越多在30006年前后,ATI在独显GPU市场上的份额与NVIDIA并那么多大差距,05年之前 市场份额甚至还领先越多,但30006年被收购之前 越多两家公司时需整合,AMD/ATI两边的CPU、GPU产品路线图都会免受到影响,也是从那个之前 AMD显卡的份额不断下滑,与NVIDIA的差距不断拉大,从要是我的55开变成了46开、37开,直到今年初双方的差距越多是28开了。



Reddit上有帖子讨论了30002年到2017年GPU市场的份额变化

NVIDIA做大靠的是AMD收购ATI的机遇吗?我知道你有天时地利的因素,但从根本上来说双方差距的拉大还是源于产品/技术的差异,NVIDIA在G3000架构之前 就开始英文英文占上风了,期间嘴笨 都会GTX 43000要是我的翻车事故,但总体上还是一路上扬的,40nm Fermi费米架构之前 Kepler、Maxwell、Pascal、Volta(这代那么Titan V这有有兩个桌面版显卡),再到去年的Turing图灵显卡,NVIDAI在GPU市场上的地位越多稳如狗了,AMD近几代显卡掀不起大风大浪了。

NVIDIA的GPU路线图越多四五年没更新了,最新的还是15年版

NVIDIA以往会在GTC大会上提前两三年敲定 GPU路线图,不过2015年之前 更新过Pascal显卡之前 就不再推新的GPU路线图了,Turing图灵显卡发布之前 就没在路线图上无缘无故出现过,图灵之前 的GPU架构官方也是守口如瓶,目前的说法称之为Amper安培,但最终算不算那么还是未知数。

今天的超能课堂里亲戚亲戚朋友儿就来回顾下NVIDIA GPU的发展过程,回头来看下这10年中NVIDIA GPU都经历了怎样才能的变化。同样地,后续还有AMD的GPU发展路程姊妹篇,敬请期待。

NVIDIA G3000到GF3000架构:40nm费米GPU的教训

NVIDIA的GPU发展史少说也要从G3000时代CUDA架构开始英文英文讲起,不过限于篇幅导致 ,这里不打算再挖坟那么深了,G3000及衍生版的G92核心在NVIDIA GPU中非常经典,马甲卡当初要是我形容你是什么时期变化的,能才能说花样频出,比现在的刀法精湛多了。



microway之前 总结过GF3000架构及之前 的NVIDIA GPU架构具体情况

要是我有段时间业界形容AMD、NVIDA在GPU策略上的不同是“AMD擅长小核心,性能适中,越多低功耗、NVIDIA偏重大核心,性能强,但功耗高、成本更贵”,NVIDIA在GT3000核心上嘴笨 是大核心策略,在GF3000核心上达到了巅峰,从SP单精度、DP双精度配比上亲戚亲戚朋友儿应该能才能看出来,这之前 NVIDIA越多在大幅提升GPU的计算性能了。

在40nm Fermi费米架构中,NVIDIA一下子将CUDA核心数提升到了51有有兩个,是GT3000核心的两倍,越多单双精度达到了1:2,少量核心用于双精度计算。越多第一代费米核心的GTX 43000显卡也越多翻车了,还记得那个著名的显卡红外温度3000°C+的图片吗?说的要是我GTX 43000时代的事。



当年的GTX 43000显卡(上)与GTX 53000显卡(下)

GTX 43000在功耗、发热上的翻车教训导致 NVIDIA一度迅速堪,直到愿意推出了GTX 53000显卡才有所缓解,完正具体情况亲戚亲戚朋友儿能才能翻看亲戚亲戚朋友儿之前 的评测:Fermi威力完美呈现,GeForce GTX 53000全球同步评测

总的来说,40nm费米架构你是什么代,NVIDIA在GPU设计上有了一次飞跃,规格大幅提升,不仅注重游戏性能,也重视计算性能,为此塞入了更多的双精度计算单元,但也越多带来了诸多难题报告 ,GTX 43000翻车事故带给NVIDIA越多教训,多哪好多个少都影响了愿意的GPU挂接。

2012年NVIDIA Kepler架构:游戏、计算GPU分离,NVIDIA后发制人

距离GTX 53000显卡发布一年下午英语 间后,2012年3月22日NVIDIA推出了GTX 63000显卡,由此28nm工艺的Kepler架构闪亮登场。这之前 AMD基于全新GCN架构的HD 7970显卡越多发布将近兩个月了(海外市场2011年12月底发布,国内是次年1月初),后者当旧旧时光 芒万丈,GCN架构一齐融合了计算及游戏的优点,性能比之前 的VLIW架构显卡有了明显进步,越多还首发了台积电28nm工艺、PCIe 3.0等等。



GTX 63000发布于2012年3月底

GTX 63000显卡使用的是Kepler家族中的GK104核心,但GK104反应的挂接思路早在GF3000到GF104、GF114架构中都会所体现了,那要是我减少SM单元数(NVIDA这代的正式称呼是SMX单元),提升每组SM单元中的CUDA核心数,GF3000时代每组SM单元还是3有有兩个CUDA核心,GF104/GF114则是每组SM单元48个CUDA核心,而到了Kepler时代,每组SM单元的CUDA核心数一下子提升到了19有有兩个,纹理单元也增加到16组,前端渲染单元也增加到四组,一齐SFU以及LD/ST单元也是水涨船高,增加到32组,纹理单元再次翻倍,8组SMX单元总计有1536个流处理器、128个纹理单元以及3有有兩个ROP单元。



GF110 SM单元(左)、GF114 SM单元(中)以及GK104 SMX单元(右)对比

除了SM单元大变之外,NVIDIA在Kepler架构中还做了一项重要改变——从Kepler开始英文英文,NVIDIA以往坚持的Core:Shader=1:2的分频模式越多那么了,之前 采用你是什么土法子是越多核心频率那么大幅提高,为了提高性能就时需让CUDA的核心频率增加一倍,越多这也导致 更高的能耗。



GK104架构的一大特点要是我CUDA规模大幅增长

GTX 63000中NVIDIA将SMX单元中的CUDA核心数提高至要是我的3倍,越多核心频率也达到1GHz以上,不再时需Shader异步了,二者将同频运行,有有助于于降低显卡功耗,越多GTX 63000在CUDA数量暴增的一齐功耗更低,而每瓦性能比更是提高了一倍。



GTX 63000显卡的规格

在Kepler时代,NVIDIA还改变了有有兩个潜规则——以往GPU发布是首发大核心,比如费米时代的GF3000到GF104/GF106,而Kepler时代是首发GK104,更大的核心GK110是上面才发布的。不过这次改变也要是我Kepler时代无缘无故出现的,在上面的Pascal、Volta及现在的Turing中多是大核心先发(GTC大会上首发,Tesla计算卡先用),GX104/106核心后续才会跟进。

GTX 63000显卡的发布处理了NVIDIA的燃眉之急,游戏性能小幅领先AMD的HD 7970,扳回了一局,不过计算性能上不如后者,毕竟GK104并都会为计算而生的架构。对NVIDIA来说,Kepler是亲戚亲戚朋友真正贯彻了游戏、计算卡彻底分离的产品,愿意更好的计算性能?那就找大核心的GK110核心吧。

2012的GTC大会上NVIDIA就展示了GK110大核心的威力,年底的SC超算大会上正式发布了基于GK110的Tesla K20X及Tesla K20加速卡,完正版GK110核心拥有15组SMX单元,总计283000个CUDA核心,集成了71亿晶体管,核心面积也达到了551mm2。

GK110核心的SMX单元中依然有19有有兩个CUDA核心,但DP双精度单元数量从GK104的8个提升到了64组,要是我一来但双精度的比例就变成了1:3,嘴笨 还那么达到费米时代1:2那么夸张的地步,但远高于GK104的1:24了,加进去去进去总性能的提升,GK110核心的计算性能总体来说还是进步的。

此外,GK110不仅仅是计算规模的增加,还增加了越多计算专用的新技术,比如NVIDIA开发的Grid Management Unit、GPUDirect、Hyper-Q以及Dynamic Parallelism动态并行技术。



第一代Titan显卡

在消费级显卡中,GK110首先用于2013年3月发布的GTX Titan显卡中,自此NVIDIA也开辟了二根新的产品线——Titan显卡,售价是999美元起步,比当时的高端显卡翻倍。

此外,Titan显卡的公版设计也与之前 的显卡大为不同,并影响了上面的GTX XX3000/3000 Ti系列公版显卡的设计。

Titan显卡都会一般人买得起的,2013年11月份NVIDIA又推出了基于GK110核心的GTX 73000系列显卡,其中GTX 73000 Ti使用的是GK110-425-B1新核心,与此前的GK110还有所不同,核心面积更小越多,越多启用了完正版SMX单元,导致 它的规格实际上比Titan显卡更好,性能更强,以致于上面NVIDIA又推出了完正版GK110核心的Titan Black显卡。

在Kpler架构的尾声阶段,NVIDIA还推出了GK210核心,它能才能说是GK110核心的再改良版,也被称为Kepler 2.0,CUDA计算能力从GK104的3.0、GK110的3.5升级到了CUDA 3.7。

此外,NVIDIA并那么改变CUDA核心数越多CUDA的架构,亲戚亲戚朋友改进的要是我SMX单元之间的内存子系统,GK110(B)的SMX单元拥有256KB寄存器文件,64KB共享缓存,GK210的规模翻倍,拥有512KB寄存器文件,128KB共享缓存,越多它改进了SMX单元的数据吞吐量,提高了下行速率 ,确保CUDA核心的更容易频繁使用。

不过GK210架构主要是我用在计算卡上, 消费级显卡中那么,越多DIY玩家的影响力非常少,倒是有同样Kpler 2.0的GK208等核心用于低端的GT 740/7300/720及移动版产品中。

2014年NVIDIA Maxwell架构:SMM单元又重组,更注重能效

在Kpler时代,NVIDIA显卡从AMD HD 7970显卡的阴影中走出来了,GK104核心的GTX 63000追上了HD 7970,但那么全面优势,GK110大核心的GTX 73000系列性能上有绝对优势了,要是我功耗要高,但此时的NVIDIA越多掌握主动权了,毕竟AMD愿意推出HD 7970继任者的R9 290X同样地处功耗、发热的难题报告 。

根据NVIDIA的路线图,Kepler之前 要是我Maxwell架构了,这之前 制程工艺还是28nm,Maxwell架构的重点则是改进能效。在你是什么阶段,NVIDIA又上演了一次出人意料的举动,Maxwell架构既都会GM3000也都会GM204,要是我GM107,用在了GTX 73000 Ti及GTX 73000显卡,从命名上也都会更新一代的,还是沿用了GTX 700系列的。

GM107核心使用的是Maxwel一代架构,其最大变化要是我将SM单元(你是什么代称为SMM单元)再次重组,从Kpler时代的每组SM单元19有有兩个CUDA核心减少到了每组128个,越多每个SMM单元将将拥有更多的逻辑控制电路,便于精确控制,这使得GM107核心的每核心效能提升了35%,每瓦功耗比提升了一倍。

你是什么全新的 SM 架构可大幅提升节能性,越多在着色器有限的工作场合中可令每个CUDA核心的性能提升 35%。实现哪些进步时需对架构进行少量重大更改。 NVIDIA重新编写了SM调度器架构和算法,使其更加智能,处理了并并不的停顿,一齐进一步降低了调度每条指令所需的能耗。

当然,SMM单元都会越多改进的地方,比如L2缓存容量从之前 的256KB大幅增加到2MB,H.264及NVENC编码/解码能力也提升了,指令周期性能也改善了。

反映到显卡上,GTX 73000 Ti及GTX 73000显卡拥有极好的能效比,游戏功耗比同期的HD 7770、GTX 6300甚至GTX 63000 Ti功耗要低越多,越多温度、噪音也非常低,这款显卡能才能说是近年来的一代经典。

在GM107核心的Maxwell一代架构之前 ,NVIDIA又在2014年9月份推出了GTX 93000/970显卡,它们使用的是GM204核心,也被称为Maxwell 2.0架构。整个GM204核心可分为4组GPC单元,每组GPC则含有高有兩个SMM单元,每个SMM单元又含有128个CUDA核心,8个纹理单元以及有有有兩个边形引擎单元(PolyMorph Engine 3.0),总计2048个CUDA核心,128个纹理单元。

在桌面级显卡命名上,NVIDIA这次跳过了GTX 30000系列(OEM及移动版GPU上有GTX 30000系列),直接进入了GTX 900系列,GTX 93000使用的是GM204-300核心,搭配4GB GDDR5显存,但它的性能越多超过了GK110大核心的GTX 73000 Ti显卡,TDP则从23000W直降到165W,整机功耗测试中也印证了功耗的大幅下降,能才能说能效优势非常明显,不论是对AMD的显卡还是对自家上代显卡而言都会那么,能效嘴笨 是碾压般的地处。

在GM107、GM204、GM206核心之前 ,NVIDIA在Titan X显卡上又使用了GM3000核心,越多是完正版的GM3000-300核心,该卡发布于2015年3月18日,它使用的GM3000核心拥有6组GPC单元,24组SMM单元,每组SMM单元128个CUDA核心,总计3007有有兩个CUDA核心,而显存控制器也从之前 4组64bit GDDR5变成了6组,位宽384bit。

不过6月1日NVIDIA又推出了GTX 93000 Ti显卡,使用的也是GM3000大核心,越多阉割版的GM3000-310核心,CUDA核心数为2816个。GTX 93000 Ti显卡的完正规格如下:

2016年NVIDIA Pascal架构:16nm制程红利,计算游戏核心再分离

时间减慢到了2016年,4月初的GTC大会上NVIDIA发布了Tesla P3000加速卡,使用的是GP3000核心,这是pascal架构的大核心,制程工艺升级到了16nm,你是什么工艺则是高性能工艺,越多在Pascal显卡上其GPU频率大幅提升,起步就达到了1.6GHz,加速频率达到2GHz稀松平常。

在Pascal显卡上,最大的特色要是我先进工艺带来的制程红利,不过这之前 的GPU架构再次无缘无故出现了游戏、计算的分离,无缘无故出现了GP3000、GP102某种 大核心,越多使用的架构、显存都会不同的,其中GP3000是纯粹的计算核心,不仅有358有有兩个单精度CUDA核心,双精度核心也达到了179有有兩个,重新回到了1:2的比例。

此外,计算用的GP3000核心使用的是HBM 2显存,等效位宽4096bit,下行速率 达到了720GB/s,嘴笨 那么实现HBM2显存1TB/s的满速下行速率 ,但下行速率 越多比当时的GDDR5显存大幅提升了,只不过HBM2显存嘴笨 太贵了,别说2016年,直到2019年的今天都远未普及。

2016年7月份NVIDIA推出了Titan X Pascal显卡,它使用的也是16nm Pascal架构,但核心是GP102,全规格的GP102核心嘴笨 能才能称为目前最强大的微架构:120亿晶体管、358有有兩个流处理器、12GB GDDR5X 显存、384-Bit位宽,相比Tesla P10的HBM 2显存和NVLink有所妥协,越多显存下行速率 为43000GB/s,8+6Pin供电,显示接口提供Display Port 1.4、HDMI 2.0b以及双链DVI,最大支持763000*4320@300Hz输出,性能上达到11TFLOPS。

在Titan X Pascal之外,桌面的GTX 103000 Ti显卡也是GP102核心,除了显存容量、位宽的变化之外,GP102核心的SM单元架构也跟GP3000核心不同,后者为了追求更高的计算性能,每组SM单元的CUDA核心数减少到了6有有兩个,但集成了更多组SM单元,高达56组,而GP102核心嘴笨 也是358有有兩个CUDA核心总数,但那么28组,每组SM单元的数量回归到了Maxwell的128个,越多你是什么代游戏及计算再次分离,本质上来说GP3000是真正的Pascal核心,而GP102核心是16nm加强版的Maxwell架构。



Maxwell(左)架构与GP104核心的SM单元架构

从GTX 103000的GP104到GTX 103000 Ti的GP102核心,它们的SM单元架构倒是一致的,要是我CUDA核心数量的区别。

除此之外,GTX 103000系列显卡在在技术上也比GTX 93000系列有所增强,使用了频率更高的GDDR5X显存及更先进的内存压缩算法,改进了异步运算及对VR的支持。

2017年NVIDIA Volta:真正为计算而生的GPU,支持AI加速

在NVIDIA的路线图上,要是我Maxwell之前 是Volta,后者技术迈进的更多,但越多种种导致 ,Volta显卡进度不如预期,越多上面多了个Pascal显卡,这才能才能解释为哪些GP102/104核心的架构嘴笨 比Maxwell没哪些质的变化。

越多Volta就不同了,这又是一款真正为计算而生的显卡架构了,与Pascal相比,GV3000核心的CUDA核心数一下子增加到了5120个,尽管使用了16nm改良版的12nm FFN工艺,但它各方面规格都很惊人——815mm2核心面积、211亿晶体管、5120个CUDA核心、15TFLOPS浮点性能等等。

在GV3000大核心中,每组GPC单元是1有有兩个SM单元,总数应该是84组SM单元,越多现在Tesla V3000跟Tesla P3000一样都都会完正体,前者启用了56组SM单元,后者启用了3000组SM单元,总计3000x64=5120个CUDA核心。

除此之外还有FP64单元,GV3000依然延续了GP3000中FP32:FP64=2:1的比例,每个SM单元含有3有有兩个FP64单元,理论上有2688个FP64单元,实际启用的是25300个。

更重要的是,Volta架构在传统的单双精度计算之外还增加了专用的Tensor Core张量单元,用于深度图学习、AI运算等,在GV3000大核心中,每组SM单元中还有8个Tensor单元,要是我整个SM单元中要是我FP32:FP64:Tensor=64:32:8的比例地处,GV3000也越多有了Tensor计算能力你是什么指标,Tesla P3000的Tensor计算能力高达120TFLOPS,NVIDIA宣称它的Tensor性能是Pascal架构的12倍。

Volta架构那么之特殊,以致于NVIDIA并那么推出对应的消费级产品,除了TITAN V你是什么款显卡,TITAN V从Tesla V3000的4096-bit、16GB缩减为30072-bit、12GB的HBM2显存,显存频率83000MHz,等效数据频率1700MHz,下行速率 高达652.8GB/s,另外TITAN V的L2缓存减少到4.5MB,哪些使得在深度图学习运算性能上稍不如Tesla V3000(112TFLOPS),显卡供电接口是6+8pin,显卡TDP 23000W,显示接口为兩个DP+有有兩个HDMI。

2018年NVIDIA Turing架构:追光十二年,RTX全新品牌诞生

Volta你是什么代没哪些主流游戏卡问世,但这也没影响NVIDIA的显卡布局,GTX 10系列显卡时代恰逢矿卡市场再次火爆,导致 GTX 10300等显卡完正不愁销路,2017到2018年上两天的之前 NVIDIA及AMD都会担心互相抢市场了,光是卖矿卡就大赚特赚了,越多GTX 10系列的Pascal显卡升级换代周期长达2年多,发布2年之前 不光那么退市,还那么降价,嘴笨 是显卡市场上的奇迹。

不过2018年下两天了,矿卡崩了,NVIDIA及显卡厂商即便有矿卡库存难题报告 ,还是要推新架构,8月底的德国科隆游戏展上NVIDIA正式发布了Turing图灵架构,当然这次嘴笨 是游戏展之前 的SIGRAPH大会上现发布了面向工作站的Quadro RTX 300000/30000系列专业卡。

对于图灵显卡,亲戚亲戚朋友儿越多很熟悉了,你是什么代显卡最大的变化首先是全新的品牌命名,从GTX变成了RTX,而RTX代表要是我实旧旧时光 线追踪技术,越多这是图灵显卡技术升级最多的地方,NVIDIA CEO黄仁勋在发布会热情敲定 图灵是亲戚亲戚朋友12年来GPU架构变化最大的一次,导致 要是我RTX,通过专用的RT Core核心,NVIDIA实现了游戏中可用的实旧旧时光 线追踪渲染。

除了RTX之外,图灵显卡也支持Volta的Tensor Core,能才能用于AI加速,NVIDIA之前 也提供了多种显卡可用的AI玩法,比如DLSS抗锯齿技术,不过相比RTX光追技术,AI加速在游戏中应用越多,欠缺吸引人。

在SM单元架构中,图灵你是什么代又有所不同了,不同于Pascal架构中的GP102/GP104核心,更像是Volta架构的GV3000大核心,越多每组SM单元又变成了6有有兩个CUDA核心,其中RTX 203000 Ti使用的TU102核心一共分为6组GPC单元,每组GPC单元又拥有1有有兩个SM单元,一共是7有有兩个SM单元,但RTX 203000 Ti也只用到其中的68个而已,算下来68 x 64=435有有兩个CUDA流处理器。

至于RTX 203000显卡使用的TU104核心,完正版的TU104核心依然是6组GPC单元,不过每组GPC改为8个SM单元,一共是6×8=48个,而RTX 203000的GPU核心是TU104-300,只用上了46组,还有预留有2组空缺的,46×64=294有有兩个,规模要比RTX 203000 Ti小多了。

支持RTX光追是图灵显卡的特色,不过RTX光追除了游戏数量的难题报告 之外,还有有有兩个难题报告 要是我它对性能的要求还是太高了,越多在图灵显卡你是什么代中NVIDIA的市场策略要是我同,支持RTX技术的显卡主要是我RTX Titan、RTX 203000 Ti、RTX 203000、RTX 2070及RTX 20300,而不支持RTX的则变成了GTX 16系列,包括GTX 16300 Ti、GTX 16300及之前 发布的GTX 163000显卡。



RTX 20系列显卡的规格



GTX 16系列显卡的规格

总结:五代GPU性能大幅提升,能效更高,但价格也更高

从2012年的Kepler显卡到今天为止,NVIDIA的显卡越多推出了五代架构,越多算上每代中的大核心与游戏核心,那要是我相当于10款了,哪些显卡的制程工艺也从28nm一路升级到16nm、12nm。在游戏性能上,根据超能网的显卡天梯榜,如今的RTX 203000 Ti显卡的性能是GTX 43000显卡的7倍左右,而GPU的晶体管数量也从300亿增长到了210亿,与性能增幅基本同步。

越多考虑到性能、功耗,那么多年来NVIDIA显卡的能效增长还是很明显的,毕竟大核心的TDP功耗多年来无缘无故维持在23000-3000W之间,但性能越多增长了6-7倍。

此外,前面亲戚亲戚朋友儿那么完正提及历代显卡的价格,越多你是什么趋势也很明显了,GTX 300到GTX 700阶段中,高端显卡的售价都会3999元,越多这几年来价格越多水水涨船高,NVIDIA这边尤其明显,Titan显卡从最初7999元的价格一路涨到了2万元,而主流市场上的旗舰显卡价格也涨到了30000元以上,RTX 20你是什么代涨价更多,RTX 203000 Ti售价直奔9999元,这是以往Titan显卡的级别了。

微信公众号搜索"

驱动之家

"加关注,每日最新的手机、电脑、汽车、智能硬件信息能才能愿意一手全掌握。推荐关注!【

微信扫描下图可直接关注