顶点这边

我看powerVR也就是说苹果也是如此

还有mali

目前看这俩平台的顶点数据都有这样一步优化

一个render pass的所有顶点shade的时候 先算pos 用这个结果拿最上一层顶点数据 只对这部分顶点做其它数据varyings的计算

这样cull那些顶点都不需要计算除了pos外的其它数据了

它接下来的说法我是比较困惑的

他说 这部分顶点数据是交错放置的

所有postion顶点数据pack一个buffer

其它non-pos数据包一起 这部分可以去ue里确认下 这是上层做的事情 还是硬件已经完成了的 值得一试在mali

这是个好事情 至少巨大的vertex 带宽数据这部分 少了好多 至少mali是这样 估计apple也是如此的

IDVS的数据在mali上是可以测试的 用streamline我们可以得到多少顶点 只做了pos (被剔掉了 )不用做varyings的计算

根据这下面给的建议来看 是要把 数据分开包的 这个很值得做了

-Called glBindFramebuffer () to change the theGL_FRAMEBUFFER or GL_DRAW_FRAMEBUFFER target target
– Called glFramebufferTexture *() or  glFramebufferRenderbuffer ()  to change the attachments
– Called eglSwapBuffers ()
– Called glFlush () or glFinish ()
– Created a glFenceSync () then called glClientWaitSync () to wait

这几个opengles会end render pass

用这几个做load

glClear () , glClearBuffer *() , glInvalidateFramebuffer()

用glInvalidateFramebuffer()做store

配合Framebuffer fetch服用吧

https://community.arm.com/developer/tools-software/graphics/b/blog/posts/mali-midgard-family-performance-counters

https://community.arm.com/developer/tools-software/graphics/b/blog/posts/mali-bifrost-family-performance-counters

powervr apple 和mali

应该都做了 把pos先算的事情

然后把顶点数据里的pos都合到一个buffer上增加了read时的cache命中 应该并不是硬件做这件事情的开关 但肯定要这样做 这样效率高

然后ue我估计做了

unity没做

但是新出的DOTS

在ecs这边的原理和合并顶点数据是一样的

在renderpipeline这边似乎有提交

https://forum.unity.com/threads/dots-render-pipeline.752198/

https://github.com/Unity-Technologies/ScriptableRenderPipeline/commits/dots-instancing

mali --mobile platform GPU arch about vertex pipeline的更多相关文章

  1. 3.1 - Apps or metadata that mentions the name of any other mobile platform will be rejected

    3.1 - Apps or metadata that mentions the name of any other mobile platform will be rejected3.1 Detai ...

  2. 安卓平台下ARM Mali OpenCL编程-GPU信息检测(转)

    对于ARM Mali GPU,目前是支持OpenCL1.1,所以我们可以利用OpenCL来加速我们的计算. 一直以来,对于Mali GPU的OpenCL编程,一直没有环境来测试.好不容易弄到一个华为M ...

  3. What is mobile platform?

    高屋建瓴 From Up to Down Outside into inside The Internet Of Things. http://wenku.baidu.com/view/5cdc026 ...

  4. 移动匿名支付购物方案 A Lightweight Anonymous Mobile Shopping Scheme Based on DAA for Trusted Mobile Platform

  5. Mali GPU OpenGL ES 应用性能优化--測试+定位+优化流程

    1. 使用DS-5 Streamline定位瓶颈 DS-5 Streamline要求GPU驱动启用性能測试,在Mali GPU驱动中激活性能測试对性能影响微不足道. 1.1 DS-5 Streamli ...

  6. 剖析虚幻渲染体系(12)- 移动端专题Part 2(GPU架构和机制)

    目录 12.4 移动渲染技术要点 12.4.1 Tile-based (Deferred) Rendering 12.4.2 Hierarchical Tiling 12.4.3 Early-Z 12 ...

  7. PatentTips - Indexes of graphics processing objects in GPU commands

    BACKGROUND A graphics processing unit (GPU) is a specialized electronic device that is specifically ...

  8. GPU端到端目标检测YOLOV3全过程(上)

    GPU端到端目标检测YOLOV3全过程(上) Basic Parameters: Video: mp4, webM, avi Picture: jpg, png, gif, bmp Text: doc ...

  9. A trip through the Graphics Pipeline 2011_01

    It’s been awhile since I posted something here, and I figured I might use this spot to explain some ...

随机推荐

  1. React学习,搭建项目,入门

    react项目基于node.js.用npm包管理工具; 在cmd命令行中输入: npm install -g create-react-app 等待其安装,意思是全局安装create-react-ap ...

  2. (4.36)sql server中的waitfor

    关键词:waitfor SQL有定时执行的语句 WaitFor,可以写到一个存储过程中再执行一次 语法:WaitFor{Delay 'time'|Time 'time} Delay后面的时间为延迟多少 ...

  3. NoSQL数据库一Redis基本使用

    基本操作 参考教程:https://www.yiibai.com/redis/Redis 是 Key-Value 内存数据库,操作是通过各种指令进行的,比如 SET 指令可以设置键值对,而 GET 指 ...

  4. Java基础---JavaJShell脚本工具

    JShell脚本工具是JDK9的新特性 什么时候会用到 JShell 工具呢,当我们编写的代码非常少的时候,而又不愿意编写类,main方法,也不愿意去编译和运行,这个时候可以使用JShell工具. 启 ...

  5. PAT甲级 模拟题_C++题解

    模拟题 PAT (Advanced Level) Practice 模拟题 目录 1008 Elevator (20) 1042 Shuffling Machine (20) 1046 Shortes ...

  6. Python列表推导

    一. 列表推导式   ord() 函数是 chr() 函数(对于8位的ASCII字符串)或 unichr() 函数(对于Unicode对象)的配对函数, 它以一个字符(长度为1的字符串)作为参数,返回 ...

  7. 利用Python进行数据分析_Numpy_基础_3

    通用函数:快速的元素级数组函数 通用函数,是指对数组中的数据执行元素级运算的函数:接受一个或多个标量值,并产生一个或多个标量值. sqrt 求平方根 np.sqrt(arr) exp 计算各元素指数 ...

  8. Django dumpdata and loaddata

    目录 dumpdata 命令 dumpdata 基本数据库的转存 dumpdata 备份特定的 app dumpdata 备份特定的表 dumpdata (--exclude) dumpdata (- ...

  9. SAS学习笔记20 CAT函数

  10. Intercity Travelling CodeForces - 1009E (组合计数)

    大意: 有一段$n$千米的路, 每一次走$1$千米, 每走完一次可以休息一次, 每连续走$x$次, 消耗$a[1]+...+a[x]$的能量. 休息随机, 求消耗能量的期望$\times 2^{n-1 ...