关于GPU的传输速度与什么有关??
1. i5-8250U 1.6GHz
2. PCIE
3 4K 105fps = 10.45Gps 4K 一帧 = 99.5Mbit
4K YUV444 + mask = 3840*2160*4*8 = 265.42Mbit
4K YUV444 = 3840*2160*3*8 = 199.07Mbit
i9-9900K + RTX2080Ti :
H->D : 199.07Mbit * (1000/3.47) /1000 = 57.37Gbit /s = 7.17GB/s
D->H : 265.42Mbit * (1000/4.8)/1000 = 55.30Gbit/s = 6.91GB/s
MX150 :7.17GB/s * 3.47 / 11.73 = 2.12GB/s
H->D : 6.91GB/s * 4.8 / 13.87 = 2.39GB/s
GTX1060 : 7.17GB/s * 3.47 / 6.42 = 3.88 GB/s
H->D : 6.91GB/s * 4.8 / 8.96 = 3.70 GB/s
4. 4K 60fps I420 = 60*100Mbps = 5Gbps 如果YUV444的话 则需要10Gbps
5. 实测
硬件 | CPU/Hz | GPU/Hz | PCIE | DDR | GDDR | CPU-->GPU/ms | Handle | GPU--->CPU |
i5-8250U + MX150 | 1.8G | 1468 - 1532M | ?? | DDR4 |
DGGR5 6.008 Gbps |
11.73 | 6.97 | 13.87 |
i5-8标压+GTX1060+DDR4 | 2.80G | 1759M | X16-3.0 | DDR4 2400MHz 2.4*16/8=4.8GB/s | GDDR5 8GHz 8Gbps | 6.42 3.88GB/s | 2.13 | 8.96 3.70GB/s |
i9-9900K + RTX2080Ti | 3.60G | 1545M | X16-3.0 15.8GB/s | DDR4 4266?? 4.266*16/8 = 8.53GB/s | GDDR6 14Gbps | 3.47 7.17GB/s | 0.01 | 4.80 6.91GB/s |
推测的公式: 因为只有16根线连接了显存:
对于1060 台式机
CPU---->GPU CPU频率*16 = 2.80G*16 = 44.8Gbps 即 2.22 ms / 帧I420 4.44ms/帧YUV444
GPU---->CPU GPU频率*16 = 1.759G*16 7.0ms/帧 YUV444 + 2.33 ms / 帧 Mask = 9.33ms /帧
共计 4.44 + 7.0 +2.33 = 13.77ms /帧 即 72.6fps YUV444
对于MX150 笔记本:
CPU---->GPU 6.91 ms 一帧YUV444 如果是8位PCIE 那就是 13.82ms
GPU----->CPU 10.94 ms 一帧YUV444 如果是8位PCIE 那就是21.88 ms
fps 如果是8位PCIE 那就是28.01fps
PCIE 与传输速率关系 感觉图有问题??
看这个 https://zhuanlan.zhihu.com/p/26172972
CUDA 性能:
Device | block/Grid | run time waste |
MX150 | block=60X60 grid=64X36 4K | |
MX150 | block=32X8 4K | 6.97 |
关于GPU的传输速度与什么有关??的更多相关文章
- STM32的bulk双缓冲传输速度的讨论,硬件的坑永远填不完
详情:http://bbs.21ic.com/forum.php?mod=viewthread&tid=109584 USB 1.0的最高12Mbps. USB 2.0的高速模式480Mb ...
- 网络传输速度bps与下载文件所需时间的换算
相信很多同志都非常关注自己家的计算机上网的宽带是多少.关心单位上网的宽带是多少! 但是很多同志都经常误解网络传输速度,以至于责备网络接入商(电信.网通.铁通等单位)欺骗用户,限制上网的速度! 本文,就 ...
- 加速scp传输速度
当需要在机器之间传输400GB文件的时候,你就会非常在意传输的速度了.默认情况下(约125MB带宽,网络延迟17ms,Intel E5-2430,本文后续讨论默认是指该环境),scp的速度约为40MB ...
- 从网卡发送数据再谈TCP/IP协议—网络传输速度计算-网卡构造
在<在深谈TCP/IP三步握手&四步挥手原理及衍生问题—长文解剖IP>里面提到 单个TCP包每次打包1448字节的数据进行发送(以太网Ethernet最大的数据帧是1518字节,以 ...
- spi、iic、can高速传输速度与选择
uart: 无限制,常用9600.115200bps等保证双方通信速度相同. iic: 通讯速率400Kbps can: 一般为1Mbps SPI: 通信速率 fosc/4其传输速度可达几Mb/s 缺 ...
- nfs 提高传输速度
通常挂载 nfs 的命令为: mount -t nfs -o nolock 192.168.0.124:/home/admin/rootfs /mnt 之前我一直都是用这个命令来挂载,那个传输速度啊, ...
- Httpd服务入门知识-使用mod_deflate模块压缩页面优化传输速度
Httpd服务入门知识-使用mod_deflate模块压缩页面优化传输速度 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.mod_deflate模块概述 mod_deflate ...
- YOLO---Darknet下的 GPU vs CPU 速度
YOLO---Darknet下的 GPU vs CPU 速度 目录 一.基础环境 二.安装Darknet-yolo v3 三.CPU下测试 四.GPU下测试 五.测试速度对比结论 正文 一.基础环境 ...
- 【VS开发】千兆以太网的传输速度
千兆以太网主流标准 千兆以太网络技术早在上世纪90年代末就已成熟,其中,1995年国际标准化组织TIA/EIA颁布了1000Base-TX标准,该标准的目的是把双绞线用于千兆以太网中,其目的是在6类非 ...
随机推荐
- markdown中如何设置字体为红色?
答: 语法如下: <font color='red'> text </font>
- nginx里面的location 规则匹配
nginx location语法 ~ # 区分大小写的正则匹配 location ~ \.(gif|jpg|png|js|css)$ { #规则D } ~* # 不区分大小写的正则匹配(和~的功能相同 ...
- 03--STL算法(常用算法)
一:常用的查找算法 (一)adjacent_find():邻接查找 在iterator对标识元素范围内,查找一对相邻重复元素,找到则返回指向这对元素的第一个元素的迭代器.否则返回past-the-en ...
- Django使用request和response对象
当请求一张页面时,Django把请求的metadata数据包装成一个HttpRequest对象,然后Django加载合适的view方法,把这个HttpRequest 对象作为第一个参数传给view方法 ...
- 使用 ServiceStack.Text 序列化 json的实现代码
相信做 .net 开发的朋友经常会遇到 json 序列化这样的需要,今天发篇文章总结下自己使用ServiceStack.Text 来序列化 json.它的速度比 Newtonsoft.Json 快很多 ...
- Linux配置代理IP
Linux配置代理IP: vim /etc/profile http_proxy=http://username:password@ip:port/ https_proxy=http://userna ...
- sql 索引【转】
T-SQL查询进阶--理解SQL Server中索引的概念,原理以及其他 简介 在SQL Server中,索引是一种增强式的存在,这意味着,即使没有索引,SQL Server仍然可以实现应有的功能 ...
- 推特Twitter视频下载的2种方法
Twitter上面的小视频越来越受欢迎了,其实,从社会发展的角度看,短视频的流行是一种必然的趋势.首先,智能手机和高速网络的普及,让人们的碎片化时间得以利用.坐地铁.吃饭的时间,点开一个视频段子.学一 ...
- 【OpenGL学习】 四种绘制直线的算法
我是用MFC框架进行测试的,由于本人也没有专门系统学习MFC框架,代码若有不足之处,请指出. 一,先来一个最简单的DDA算法 DDA算法全称为数值微分法,基于微分方程来绘制直线. ①推导微分方程如下: ...
- Egret入门学习日记 --- 第一篇 (引擎的选择)
第一篇 (引擎的选择) 我人比较笨,得慢慢学,我就一点一点来好了. 首先,我个人喜欢游戏.网页开发相对游戏开发来说,网页开发实在太枯燥了,没劲.所以打算转游戏开发了. 游戏开发要选择游戏引擎,我去看了 ...