graphic rendering pipeline
整理下管线
此时一定要有这张图


注意表中的数据流向
强调几个细节 之前对次序理解有点乱
rasterizer之前 管线里是只有逐顶点信息的
IA里面会setup primitive 通过PrimitiveTopology属性 triangle strip之类的
-------------------
在vs 会用matrix 做space trans到 hcs
model- world ---view---- homogeneous clip space-----normalized device coordinates(线性部分/r)
这五个变换都在一个矩阵里 一步就出来了
mvp这个参数是uniform里传入 vs 在vs里乘到 semantic为positon的 varying(vs-ps的structure)
这步只是把顶点数据 变到了 cvv 在hcs
接下来是硬件做了/w真正到了 ndc
之后硬件又做了screen mapping 到了 screen space(这步的涉及的数据在rs的viewport参数表里)
有另外一片blog https://www.cnblogs.com/minggoddess/p/10582663.html讲了相关细节
---------------
setup triangle的时候 会做back face cull 可设置 这附近会做一次earlyz
rasterization
插值顶点属性 在triangle traversal阶段
此时属性是逐像素了
之后pixel process shadeing and merge
merge阶段称为 ROP raster operation pipeline
ROP顺序
pixel Ownership test
Scisssor test
Alpha Test(dx9之后这不是硬件功能了 在shader里用alpha做discard)
Stencil test
depth test
blending
dithering
logic op(color blending 非alphablend的一些位操作 或者max min)
---------------------
CS
gpu computing
以下列了几种cs的使用场合
1这种用法 比较有意思 数据gpu处理之后不交给cpu直接用cs在gpu处理 这样 就不需要cpugpu相互wait了
2因为它能共享资源shared memtory 所以用cs算distribution or average luminace of an image是ps操作的2倍速度 ,这个也挺有意思 可以看下
Giesen, Fabian, \A Trip through the Graphics Pipeline 2011," The ryg blog, July 9, 2011.
Cited on p. 32, 42, 46, 47, 48, 49, 52, 53, 54, 55, 141, 247, 684, 701, 784, 1040
3particle systems, mesh processing such as
facial animation [134], culling [1883, 1884], image ltering [1102, 1710], improving
depth precision [991], shadows [865], depth of feld [764], and any other tasks where a
set of GPU processors can be brought to bear.
4Wihlidal [1884] discusses how compute
shaders can be more ecient than tessellation hull shaders
cs可能比ts有更好的性能
----------如果我们有更多的gpu budget
----------------
TS

hs加control points
ts加面
ds将他们组合起来 生成vertex normal uv。。。
-------------
gs modify or copy primitives
gs。。。项目里用起来性能略尴尬
cubemap
http://www.zwqxin.com/archives/shaderglsl/talk-about-geometry-shader.html
http://www.klayge.org/2011/07/26/%E4%B8%8D%E4%BA%89%E6%B0%94%E7%9A%84geometry-shader/
可以做着试试 说不定现在显卡不一样了呢。。。
有个实时cubemap的优化 比延迟更新 降低分辨率 是不是帅多了。。会对不上 闪烁
六个matrix传过去画在texturearray上面一个pass出(所以这里也是个texturearray做rtv的例子了 还csm也可以用texturearray做rtv
csm 原理同上https://docs.nvidia.com/gameworks/content/gameworkslibrary/graphicssamples/opengl_samples/cascadedshadowmapping.htm
在ff里用过 一次画四个cascades出来,性能未见明显提升。。因为没bound在那里。。。shadow费 vertex太多。。应该延迟更新 或者bake
fastgeometry 可以试试
毛发 粒子 边缘检测forshadow
---------------------------------------------------------------
stream output 用stream output可以把顶点数据 作为下一次pipleine的输入
比如tessellation lod 第一次pipeline 先生成新的面 去掉rs ps阶段 第二次过pipeline 走vs ps处理刚刚新生成的那些面
还可以做水流 粒子 皮肤 那些需要迭代顶点的
浮点数返回
以primitive展开来返回数据 失去索引 所以用point primitive处理第一遍
================================
pbe 这边有个dither 值得关注 tbdr 下dither once
graphic rendering pipeline的更多相关文章
- Rendering pipeline overview(读书笔记1 --- Real-Time rendering)
1. Rendering pipeline的作用就是在给定的虚拟相机.三维物体.光源.着色方程式.纹理等的条件下产生(渲染)二维图像 2. pipeline包含很多个stage,其效率由最慢的stag ...
- 高屋建瓴 cocos2d-x-3.0架构设计 Cocos2d (v.3.0) rendering pipeline roadmap(原文)
Cocos2d (v.3.0) rendering pipeline roadmap Why (the vision) The way currently Cocos2d does rendering ...
- Real-Rime Rendering (1) - 渲染管线(Rendering Pipeline)
提要 渲染管线是实时渲染中最重要的部分,它的最主要的任务就是在给定一个虚拟的场景,包括相机,object,灯光,纹理等等,生成一副2D的图像. 最基础的渲染管线如下图所示: 主要的阶段包括三个:App ...
- DirectX 11游戏编程学习笔记之6: 第5章The Rendering Pipeline(渲染管线)
本文由哈利_蜘蛛侠原创,转载请注明出处.有问题欢迎联系2024958085@qq.com 注:我给的电子版是700多页,而实体书是800多页,所以我在提到相关概念的时候 ...
- Shader、Draw Call和渲染管线(Rendering Pipeline)
翻阅了很多资料,也做了不少笔记,决定还是对渲染进行一个总结,以巩固所学的东西. <Real-Time Rendering, Third Edition> (PDF的配图链接)将一个渲染 ...
- Geometry Stage in Rendering pipeline (读书笔记2 --- Real-Time rendering)
Geometry Stage一般包含下面几个阶段 1. Model & View Transform(模型和视图变换) --- 模型空间--> 世界空间 模型变换:每个模型经过模型变换来 ...
- OpenGL渲染管线(rendering pipeline)
OpenGL中的渲染管线包括:顶点着色器(vertex shader).细分着色器(里面包含两种:细分控制着色器和细分控制着色器)(tessellation shader).几何着色器.光栅化及片元着 ...
- 浅谈Unity的渲染优化(1): 性能分析和瓶颈判断(上篇)
http://www.taidous.com/article-667-1.html 前言 首先,这个系列文章做个大致的介绍,题目"浅谈Unity",因为公司和国内大部分3D手游开发 ...
- A trip through the Graphics Pipeline 2011_11 Stream Out
Welcome back! This time, the focus is going to be on Stream-Out (SO). This is a facility for storing ...
随机推荐
- 使用 Python 可以做什么?
翻译自 <Python学习手册(第5版)> Systems Programming Python 对操作系统服务的内置接口使其非常适合编写可移植.可维护的系统管理工具和实用程序 utili ...
- 使用GNU工具链进行嵌入式裸机开发
Embedded-Programming-with-the-GNU-Toolchain Vijay Kumar B. vijaykumar@bravegnu.org 翻译整理:thammer gith ...
- leetcode easy problem set
*勿以浮沙筑高台* 持续更新........ 题目网址:https://leetcode.com/problemset/all/?difficulty=Easy 1. Two Sum [4m ...
- NetCore+Dapper WebApi架构搭建(三):添加实体和仓储
上一节讲了类库添加一些底层的基本封装,下面来添加实体和仓储 1.Entities文件夹添加一个实体类Users,继承BaseModel,即拥有BaseModel的主键 using System; na ...
- nyoj zb的生日
zb的生日 时间限制:3000 ms | 内存限制:65535 KB 难度:2 描述 今天是阴历七月初五,acm队员zb的生日.zb正在和C小加.never在武汉集训.他想给这两位兄弟买点什么庆祝 ...
- 机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合
分享一下 线性回归中 欠拟合 和 过拟合 是怎么回事~为了解决欠拟合的情 经常要提高线性的次数建立模型拟合曲线, 次数过高会导致过拟合,次数不够会欠拟合.再建立高次函数时候,要利用多项式特征生成器 生 ...
- Jquery API学习笔记
学习网站 JQuery API 中文网: http://www.jquery123.com/ 学习一遍API可以更熟练的运用jquery并且拓展思路. 这里只挑选了一些我认为在开发中会用到的一些API ...
- SPOJ7586 NUMOFPAL manacher算法
题目大意: 求一个串中有多少个回文子串 这..... 妥妥的模板题吧.... 对所有的$r[i] / 2$进行求和即可,其中,$r[i]$为以$i$为中心的回文半径 $r[i] / 2$怎么来的,画下 ...
- [USACO5.5]Hidden Password
题目大意: 求字符串最小表示. 思路: 本来按照lbn187的课件,知道SAM可以求字符串最小表示. 然而他并没有提供例题,就自己找了一道做. 大体思想就是把字符串复制一遍接在后面,构建SAM,然后每 ...
- lnmp环境一键搭建及卸载
系统需求: CentOS/Debian/Ubuntu Linux系统 需要2GB以上硬盘剩余空间 128M以上内存,OpenVZ的建议192MB以上(小内存请勿使用64位系统) VPS或服务器必须已经 ...