Pascal GPU

Pascal (from French mathematician Blaise Pascal) is Maxwell successor. In this news, we learnt that Volta was the post-Maxwell architecture, but it seems that Pascal is the new official name. One of the main feature of the Pascal architecture is the 3D memory or stacked DRAM that should provide terabyte bandwidth.

Update (2014.03.26): according to techreportVolta is the successor of Pascal:

Turns out Volta remains on the roadmap, but it comes after Pascal and will evidently include more extensive changes to Nvidia’s core GPU architecture.

Maxwell GPU architecture (post-Kepler) is not available yet, but NVIDIA is already talking, at GTC 2013, about post-Maxwell architecture called Volta that features 3D stacked DRAM in order to provide terabyte bandwidth.

According to the guys at videocardz, NVIDIA Maxwell GM107 features 128 CUDA cores per SMX (streaming multiprocessor) against 192 for a Kepler-based GPU. The GeForce GTX 750 Ti has 5 SMX (640 cores) while the GTX 750 packs 512 cores in 4 SMX. The L2 cache has also received some changes: in Kepler the L2 cache has 256KB while on Maxwell, the cache has 2MB!

In the power consumption side, the GM107 has a TDP of 60W. And to finish, the GM107 will offer at least the same level (if not better) of performance than the GF100, the GPU behind the old good GTX 480.

Update (2013.03.20)

NVIDIA has just launched the first graphics cards based on Maxwell, NVIDIA’s new GPU architecture. TheGeForce GTX 750 Ti and GeForce GTX 750 are both powered by a GM107, a cut down version of an upcoming flagship (GM110 ?) GPU. The Maxwell architecture is focused on power efficiency:

Kepler SMXs (streaming multiprocessors) are now replaced by Maxwell SMMs. A SMM packs 128 CUDA cores(SMX = 192 cores). The L2 cache size has been increased from 256KB in Kepler to 2048KB in Maxwell.

The new GTX 750 and GTX 750 Ti targets the old GeForce GTX 650 Ti and the recently launched AMD Radeon R7 265.

GeForce GTX 750 Ti specifications

  • GPU: GM107 @ 1020MHz (base) / 1085MHz (boost), 28nm
  • Cores: 640 (5 SMMs)
  • Texture units: 40
  • ROPs: 16
  • Memory: 2048MB @ 5.4GHz GDDR5, 128-bit
  • TDP: 60W
  • Price: USD $149

GeForce GTX 750 specifications

  • GPU: GM107 @ 1020MHz (base) / 1085MHz (boost), 28nm
  • Cores: 512 (4 SMMs)
  • Texture units: 32
  • ROPs: 16
  • Memory: 1024MB @ 5.0GHz GDDR5, 128-bit
  • TDP: 55W
  • Price: USD $119

Related Articles and Reviews


NVIDIA GeForce GTX 750 Ti global performance

 

Tesla-> Fermi (550Ti) -> Kepler(680) -> Maxwell (750Ti) -> Volta(was Pascal)的更多相关文章

  1. CUDA ---- GPU架构(Fermi、Kepler)

    GPU架构 SM(Streaming Multiprocessors)是GPU架构中非常重要的部分,GPU硬件的并行性就是由SM决定的. 以Fermi架构为例,其包含以下主要组成部分: CUDA co ...

  2. NVIDIA GPU架构与原理分析(一)——GPU简介与主流Fermi、Kepler架构GPU概述

    1 GPU简介 图形处理单元GPU英文全称Graphic Processing Unit,GPU是相对于CPU的一个概念,NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GP ...

  3. AI芯片

    课程作业,正好自己也在学深度学习,正好有所帮助,做了深度学习的AI芯片调研,时间比较短,写的比较仓促,大家随便看看 近年来,深度学习技术,如卷积神经网络(CNN).递归神经网络(RNN)等,成为计算机 ...

  4. CUDA程序设计(一)

    为什么需要GPU 几年前我启动并主导了一个项目,当时还在谷歌,这个项目叫谷歌大脑.该项目利用谷歌的计算基础设施来构建神经网络. 规模大概比之前的神经网络扩大了一百倍,我们的方法是用约一千台电脑.这确实 ...

  5. CSDN日报20170312——《成功人士的七个习惯》

    [程序人生]成功人士的七个习惯 作者:liumiaocn 所谓温故而知新.重读往往会带来新的收获,即使没有新的收获,可以带来新的思考也是非常不错.在个人成长的历程中.习惯所扮演的角色不言而喻,Step ...

  6. 显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么?

    在使用深度学习框架的过程中一定会经常碰到这些东西,虽然anaconda有时会帮助我们自动地解决这些设置,但是有些特殊的库却还是需要我们手动配置环境,但是我对标题上的这些名词其实并不十分清楚,所以老是被 ...

  7. CUDA Programming Guide 学习笔记

    CUDA学习笔记 GPU架构 GPU围绕流式多处理器(SM)的可扩展阵列搭建,每个GPU有多个SM,每个SM支持数百个线程并发执行.目前Nvidia推出了6种GPU架构(按时间顺序,详见下图):Fer ...

  8. NVIDIA FFmpeg 转码技术分析

    NVIDIA FFmpeg 转码技术分析 所有从 Kepler 一代开始的 NVIDIA GPUs 都支持完全加速的硬件视频编码,而从费米一代开始的所有 GPUs 都支持完全加速的硬件视频解码.截至 ...

  9. Life of a triangle - NVIDIA's logical pipeline

    Home GameWorks Blog Life of a triangle - NVIDIA's logical pipeline   Life of a triangle - NVIDIA's l ...

随机推荐

  1. WampServer phpadmin apache You don't have permission to access

    1.Forbidden You don't have permission to access / on this server. 后来咨询了一下朋友(php高手),说修改一下php的配置文件http ...

  2. Maximum sum(poj 2479)

    题意:给一段数列,将这个数列分成两部分,使两部分的最大子段和的和最大,输出和 /* 看数据没想到是(O)n的算法,求出从前向后的最大子段和和从后向前的最大子段和, 然后枚举断点. 第一次提交不小心折在 ...

  3. android 输入法出现挤压屏幕、android输入键盘覆盖了屏幕控件的解决办法

    如果希望输入法键盘弹出时不自动向上挤压activity,在Manifest清单文件中对应的activty中设置属性android:windowSoftInputMode="adjustPan ...

  4. cocos2dx实现象棋之运动

    1.头文件 void moveStone(int moveid, int killid, int x, int y); void moveComplete(CCNode*, void*); bool ...

  5. svn分支管理进行迭代开发

    [root@ok svndata]# svn co svn://192.168.1.111/app01 # checkout项目到本机 开始规划我们的svn项目目录: [root@ok svndata ...

  6. oracle 10g 学习之单行函数(5)

    目标 通过本章学习,您将可以: l  SQL中不同类型的函数. l  在 SELECT 语句中使用字符,数字和日期函数. l  描述转换型函数的用途. 字符函数 字符函数分为大小写控制函数和字符控制函 ...

  7. [编辑器] Tab转换成空格

    Notepad++: 设置 -> 首选项 -> 制表符设置 怎样设置EditPlus中Tab用空格替换http://jingyan.baidu.com/article/63f236280b ...

  8. hdu 2108:Shape of HDU(计算几何,判断多边形是否是凸多边形,水题)

    Shape of HDU Time Limit: 3000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Tota ...

  9. pl/sql developer 登陆提示ORA-12514(转)

      pl/sql developer 登陆提示ORA-12514 说明监听服务已经起来了 备注:通过 lsnrctl 命令来启动/停止/查看/重载监听器/服务 lsnrctl start|stop|s ...

  10. 常用的 Python 爬虫技巧总结

    用python也差不多一年多了,python应用最多的场景还是web快速开发.爬虫.自动化运维:写过简单网站.写过自动发帖脚本.写过收发邮件脚本.写过简单验证码识别脚本. 爬虫在开发过程中也有很多复用 ...