关于GPU的传输速度与什么有关??
1. i5-8250U 1.6GHz
2. PCIE
3 4K 105fps = 10.45Gps 4K 一帧 = 99.5Mbit
4K YUV444 + mask = 3840*2160*4*8 = 265.42Mbit
4K YUV444 = 3840*2160*3*8 = 199.07Mbit
i9-9900K + RTX2080Ti :
H->D : 199.07Mbit * (1000/3.47) /1000 = 57.37Gbit /s = 7.17GB/s
D->H : 265.42Mbit * (1000/4.8)/1000 = 55.30Gbit/s = 6.91GB/s
MX150 :7.17GB/s * 3.47 / 11.73 = 2.12GB/s
H->D : 6.91GB/s * 4.8 / 13.87 = 2.39GB/s
GTX1060 : 7.17GB/s * 3.47 / 6.42 = 3.88 GB/s
H->D : 6.91GB/s * 4.8 / 8.96 = 3.70 GB/s
4. 4K 60fps I420 = 60*100Mbps = 5Gbps 如果YUV444的话 则需要10Gbps
5. 实测
硬件 | CPU/Hz | GPU/Hz | PCIE | DDR | GDDR | CPU-->GPU/ms | Handle | GPU--->CPU |
i5-8250U + MX150 | 1.8G | 1468 - 1532M | ?? | DDR4 |
DGGR5 6.008 Gbps |
11.73 | 6.97 | 13.87 |
i5-8标压+GTX1060+DDR4 | 2.80G | 1759M | X16-3.0 | DDR4 2400MHz 2.4*16/8=4.8GB/s | GDDR5 8GHz 8Gbps | 6.42 3.88GB/s | 2.13 | 8.96 3.70GB/s |
i9-9900K + RTX2080Ti | 3.60G | 1545M | X16-3.0 15.8GB/s | DDR4 4266?? 4.266*16/8 = 8.53GB/s | GDDR6 14Gbps | 3.47 7.17GB/s | 0.01 | 4.80 6.91GB/s |
推测的公式: 因为只有16根线连接了显存:
对于1060 台式机
CPU---->GPU CPU频率*16 = 2.80G*16 = 44.8Gbps 即 2.22 ms / 帧I420 4.44ms/帧YUV444
GPU---->CPU GPU频率*16 = 1.759G*16 7.0ms/帧 YUV444 + 2.33 ms / 帧 Mask = 9.33ms /帧
共计 4.44 + 7.0 +2.33 = 13.77ms /帧 即 72.6fps YUV444
对于MX150 笔记本:
CPU---->GPU 6.91 ms 一帧YUV444 如果是8位PCIE 那就是 13.82ms
GPU----->CPU 10.94 ms 一帧YUV444 如果是8位PCIE 那就是21.88 ms
fps 如果是8位PCIE 那就是28.01fps
PCIE 与传输速率关系 感觉图有问题??
看这个 https://zhuanlan.zhihu.com/p/26172972
CUDA 性能:
Device | block/Grid | run time waste |
MX150 | block=60X60 grid=64X36 4K | |
MX150 | block=32X8 4K | 6.97 |
关于GPU的传输速度与什么有关??的更多相关文章
- STM32的bulk双缓冲传输速度的讨论,硬件的坑永远填不完
详情:http://bbs.21ic.com/forum.php?mod=viewthread&tid=109584 USB 1.0的最高12Mbps. USB 2.0的高速模式480Mb ...
- 网络传输速度bps与下载文件所需时间的换算
相信很多同志都非常关注自己家的计算机上网的宽带是多少.关心单位上网的宽带是多少! 但是很多同志都经常误解网络传输速度,以至于责备网络接入商(电信.网通.铁通等单位)欺骗用户,限制上网的速度! 本文,就 ...
- 加速scp传输速度
当需要在机器之间传输400GB文件的时候,你就会非常在意传输的速度了.默认情况下(约125MB带宽,网络延迟17ms,Intel E5-2430,本文后续讨论默认是指该环境),scp的速度约为40MB ...
- 从网卡发送数据再谈TCP/IP协议—网络传输速度计算-网卡构造
在<在深谈TCP/IP三步握手&四步挥手原理及衍生问题—长文解剖IP>里面提到 单个TCP包每次打包1448字节的数据进行发送(以太网Ethernet最大的数据帧是1518字节,以 ...
- spi、iic、can高速传输速度与选择
uart: 无限制,常用9600.115200bps等保证双方通信速度相同. iic: 通讯速率400Kbps can: 一般为1Mbps SPI: 通信速率 fosc/4其传输速度可达几Mb/s 缺 ...
- nfs 提高传输速度
通常挂载 nfs 的命令为: mount -t nfs -o nolock 192.168.0.124:/home/admin/rootfs /mnt 之前我一直都是用这个命令来挂载,那个传输速度啊, ...
- Httpd服务入门知识-使用mod_deflate模块压缩页面优化传输速度
Httpd服务入门知识-使用mod_deflate模块压缩页面优化传输速度 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.mod_deflate模块概述 mod_deflate ...
- YOLO---Darknet下的 GPU vs CPU 速度
YOLO---Darknet下的 GPU vs CPU 速度 目录 一.基础环境 二.安装Darknet-yolo v3 三.CPU下测试 四.GPU下测试 五.测试速度对比结论 正文 一.基础环境 ...
- 【VS开发】千兆以太网的传输速度
千兆以太网主流标准 千兆以太网络技术早在上世纪90年代末就已成熟,其中,1995年国际标准化组织TIA/EIA颁布了1000Base-TX标准,该标准的目的是把双绞线用于千兆以太网中,其目的是在6类非 ...
随机推荐
- myeclipse启动的过程中没提示就自动退出,闪退的有效解决方法
今天遇到一个问题,已经打开myeclipse的电脑因为非正常关机后myeclipse打不开了,进度条进到十分之一就闪退,什么提示都没有的解决方案如下: 1.打开myeclipse工作空间(存放项目 ...
- Qt学习过程
1.常用控件的使用[除了常见的还有QTableWidget.QTreeWidget...]2.信号与槽[需要知道connect函数的最后一个参数Qt::ConnectionType取不同枚举时的含义] ...
- APPSCAN使用外部浏览器的方法
在使用appscan扫描时,自带浏览器可能存在兼容性问题(比如HTML5),故需要用到其他浏览器.在做139邮箱HTML5项目,需要使用chrome浏览器进行扫描.因此分享下如何使用外部浏览器,将之前 ...
- mysql定时任务event——清理过期数据 (转)
1.查询是否开启事件调度 SHOW VARIABLES LIKE 'event_scheduler'; 2.开启事件调度 临时: SET GLOBAL event_scheduler = 1; 永久: ...
- Node.js event loop 和 JS 浏览器环境下的事件循环的区别
Node.js event loop 和 JS 浏览器环境下的事件循环的区别: 1.线程与进程: JS 是单线程执行的,指的是一个进程里只有一个主线程,那到底什么是线程?什么是进程? 进程是 CPU ...
- Node.js导入jquery.min.js报错
报错如下: 一看就是路径问题,可是代码中路径看起来貌似没错,如下: 解决方法: 引入方式如下: <script type="text/javascript" src=&quo ...
- 【Leetcode_easy】796. Rotate String
problem 796. Rotate String solution1: class Solution { public: bool rotateString(string A, string B) ...
- react中,用key值来解决一些奇葩问题
编辑用户信息,角色信息无法加载到值 改进之后:思路:由于值是设置在state里面的,界面编辑时,会重服务器拉去数据,值也设置在state里面了,但是CheckboxGroup依然不会去渲染选中的值, ...
- 第十八章 并发登录人数控制——《跟我学Shiro》
目录贴:跟我学Shiro目录贴 在某些项目中可能会遇到如每个账户同时只能有一个人登录或几个人同时登录,如果同时有多人登录:要么不让后者登录:要么踢出前者登录(强制退出).比如spring securi ...
- iOS技术面试06:应用程序
1.NSRunLoop的实现机制,及在多线程中如何使用 NSRunLoop是IOS消息机制的处理模式 >1.NSRunLoop的主要作用:控制NSRunLoop里面线程的执行和休眠,在有事情做的 ...