按照NVIDIA的路线图来看,GTX 600以及GTX 700系列所采用的Kepler架构已经垂垂老矣,最早在明年第一季度,其继任者Maxwell架构可能就会和我们正式见面了。目前外媒已经放出了关于Maxwell的架构规格,但还无法确定是否为真。

根据WCCFTech的报道,Maxwell架构依然采用来自台积电的28nm制造工艺,而NVIDIA计划推出四款Maxwell芯片,分别是GM104、GM106、GM108和GM100,相对目前的Kepler来说,Maxwell最为明显的特性就是CUDA核心会有爆发性的提升,而深层次的改变则是增强SMX单元设计并优化双精度逻辑单元。

具体来说,Maxwell的每个SMX单元将会拥有256个CUDA核心,而目前Kepler架构中这一数字为192个,当然由于DP单元和纹理单元数量保持不变,所以DP双精度浮点单元的比例会从Kepler的1:3降低到1:4。当然Maxwell依然会延续Kepler中DP双精度浮点单元可关闭的特性,从而降低功耗。

除了数量上的变化之外,Maxwell魅族SMX单元会的寄存器数量会增加两个,L1缓存会从64kb增加到128kb,而且可以32/96、64/64、96/32的比列来分配成缓存和共享内存。另外每个GPC单元中还会有768kb的L2缓存作为指令集缓存。


GPU架构路线图

下面来看看具体的核心:

GM108:

GM108拥有576个CUDA核心,48个纹理单元,8个光栅单元,显存位宽为64bit,核心面积则和当年的GF117差不多,显然是低端入门级产品。

据说在GM108之前还有一个GM107,但尚不能确定具体规格。

GM106:

GM106自然是要取代目前的GK106了,定位中端,具体取代的产品是GTX 650Ti以及GTX 660家族。

GM106的CUDA核心数量从GK106的960个暴涨到2304个,拥有144个纹理单元,24个光栅单元,显存位宽为192bit,容量为3GB,等效显存频率能够达到7GHz左右。

GM104:

从命名上看他显然是为了接替目前的GK104核心,也就说定位中高端。

CM104拥有5组GPC单元(GK104为4组),共计3840个CUDA核心、240个纹理单元以及40个光栅单元,位宽为320bit,容量为3GB,也有可能是2.5GB。核心频率可能会在1GHz左右,等效显存频率能够达到7GHz左右。

GM100:

GM100是完整的Maxwell架构,共计有8个GPC单元,每个GPC单元有三组SMX单元,总计之后拥有6144个CUDA核心,384个纹理单元以及64个光栅单元,显存位宽512bit,容量更是达到了夸张的8GB。

具体频率方面,GeForce系列的GM100核心频率为930MHz左右,加速频率为1GHz左右,而Tesla中的GM100核心频率为850MHz左右,双精度浮点性能为2.61TFLOPS,达到目前GTX TITAN的两倍。

如果Maxwell架构真的和文中说的这么强大的话,那么下一代的NVIDIA显卡的性能确实值得我们期待,AMD会拿什么来抵挡呢?

NV Maxwell architecture的更多相关文章

  1. Tesla-> Fermi (550Ti) -> Kepler(680) -> Maxwell (750Ti) -> Volta(was Pascal)

    Pascal GPU Pascal (from French mathematician Blaise Pascal) is Maxwell successor. In this news, we l ...

  2. NVlink

    Nvidia's Pascal to use stacked memory, proprietary NVLink interconnect by Scott Wasson — 6:50 PM on ...

  3. [CUDA] 00 - GPU Driver Installation & Concurrency Programming

    前言 对,这是一个高大上的技术,终于要做老崔当年做过的事情了,生活很传奇. 一.主流 GPU 编程接口 1. CUDA 是英伟达公司推出的,专门针对 N 卡进行 GPU 编程的接口.文档资料很齐全,几 ...

  4. Introduction to 3D Game Programming with DirectX 12 学习笔记之 --- 第十八章:立方体贴图

    原文:Introduction to 3D Game Programming with DirectX 12 学习笔记之 --- 第十八章:立方体贴图 代码工程地址: https://github.c ...

  5. NVIDIA GPU Pascal架构简述

    NVIDIA GPU Pascal架构简述 本文摘抄自英伟达Pascal架构官方白皮书:https://www.nvidia.com/en-us/data-center/resources/pasca ...

  6. 5 Things You Should Know About the New Maxwell GPU Architecture

    The introduction this week of NVIDIA’s first-generation “Maxwell” GPUs is a very exciting moment for ...

  7. [ZZ] Maxwell 架构

    http://digi.163.com/14/0218/23/9LDCTFON00162DSP.html [IT168 评测]随着一句“娘娘,封神啦(宝鸡口音)”,中国的观众迅速认识到了两个极其出彩的 ...

  8. Nvidia 的新显卡架构 Maxwell 性能相比开普勒提升了多少?

    作者:喵西和熊链接:https://www.zhihu.com/question/22630075/answer/29041618来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注 ...

  9. nvcc fatal : Unsupported gpu architecture 'compute_11'

    使用VS编译OpenCV编译源代码时候,对Cmake生成的工程文件编译,会出现 nvcc fatal : Unsupported gpu architecture 'compute_11'  问题.原 ...

随机推荐

  1. mongoose学习笔记1--基础知识2

    Schema简述 Schema —— 一种以文件形式存储的数据库模型骨架,无法直接通往数据库端,也就是说它不具备对数据库的操作能力,仅仅只是数据库模型在程序片段中的一种表现,可以说是数据属性模型(传统 ...

  2. JPush Wiki

    极光推送包含有通知与自定义消息两种类型的推送.本文描述他们的区别,以及建议的应用场景. 功能角度 通知 或者说 Push Notification,即指在手机的通知栏(状态栏)上会显示的一条通知信息. ...

  3. Struts2 Action与Servlet API耦合

    单元测试在开发中是非常重要的一个环节程序员在写完代码时,相应的单元测试也应写完整,否则你的代码就是不能让人信服的Struts2将Action与Servlet的API进行解耦之后,就使得单元测试变得非常 ...

  4. tar -cvPf new.tar `rpm -ql vsftpd` 建议不要用绝对路径'/'

    tar -cvPf new.tar `rpm -ql vsftpd` 解压这样的压缩包,会在当前用户的家目录下解压:~./xxxx;加参数-C :tar -xvf xxx.tar -C /  ;来指定 ...

  5. wp8 导航方法

    全局跳转 (App.Current.RootVisual as PhoneApplicationFrame).Navigate(new Uri("/Tools/SpatialQueryCha ...

  6. STL 常见操作

    stl的操作不是很熟练, 记录一下 1.vector: 排序: sort(vc.begin(),vc.end()); 去重: sort(vc.begin(),vc.end()); num.erase( ...

  7. 电赛菜鸟营培训(三)——STM32F103CB之串口通信

    一.串口通信概念 1.缩写 USART:Universal Synchronous/Asynchronous Receiver/Transmitter 通用同步/异步接收和发送器 2.用处 (1)同步 ...

  8. SQL SERVER 与ACCESS、EXCEL的数据转换

    --Excel导入到SQL的一个新思路: /*比如Excel有两列,A列和B列需要导入到SQL表中,反正我已经有几年不用DTS之类的工具了. 在Excel中的新的一列中,直接写公式 =CONCATEN ...

  9. asp.net控件开发基础(1)(转)原文更多内容

    asp.net本身提供了很多控件,提供给我们这些比较懒惰的人使用,我认为控件的作用就在此,因为我们不想重复工作,所以要创建它,这个本身便是一个需求的关系,所以学习控件开发很有意思. wrox网站上有本 ...

  10. DFS POJ 2676 Sudoku

    题目传送门 题意:数独问题,每行每列以及每块都有1~9的数字 分析:一个一个遍历会很慢.先将0的位子用vector存起来,然后用rflag[i][num] = 1 / 0表示在第i行数字num是否出现 ...