DirectDraw打造极速图形引擎(Alpha混合)
显然DirectDraw是Windows下写2D图形程序的最好选择,虽然Direct3D也可以写,但是没DirectDraw简单方便,特别对于初学者,一来就接触那么多函数和参数总不是件愉快的事,所以我的文章主要结合我做的工作,谈谈DirectDraw编程中一些比较关键的技术,大多是我自己想出来的。我想先声明,我的文章可以任意转载,源代码可以任意使用和修改。
由于我是业余时间写的文章,所以只能每次发表一篇,希望我的工作可以为大家的游戏增光添彩,同时我的文章主要面向有基本C++,DirectDraw,汇编和MMX编程经验的朋友,如果你对这些了解不够,请先学习一下再阅读。也欢迎大家和我交流,我的QQ是35830152,EMAIL:EUHO@SINA.COM。
作为第一篇,我想先谈谈Alpha混合的问题。这里32位色的图形模式我们不考虑,因为技巧并不多,占用显存和内存大,实际应用的也不多。我们把焦点放在16位色的模式上。我们把源点C2和Alpha通道点C1用Alpha混合,混合后得到点C,如果Alpha取0~1,公式如下:
C = C2*Alpha + C1*(1-Alpha)
如果Alpha取0~32,公式如下:
C = (C2*Alpha + C1*(1-Alpha))>>5
每个点由R,G,B 3个分量组成,所以上面的运算要分别对每个分量进行计算,如果整体计算,由于进位的关系我们会得到错误的结果。我们只考虑用得较多的565格式,即16位的颜色值为RRRRRGGGGGGBBBBB,555格式原理是一样的。显然我们每次处理一个点似乎只能按照“拆分-分别运算-拆分”来写代码,但是这样是低效的,想想1024*768模式下运算一帧要进行多少次运算,一定快不到哪里去。
Intel有段很长的代码,我没仔细看,也没试验,总觉得不太可靠(呵呵)。还看了GameRes上的一些相关文章,还是有值得参考的地方,就是觉得看了还是有些茫然。
下面说我的算法,首先说明这个快速算法是针对每个Alpha值建立一个函数进行运算,如果在一个函数里实现任意Alpha的运算,一次只能运算2个点,而且汇编代码是26行,而且有2次乘法,也用到了部分MMX加速。经过针对每一级Alpha的优化处理,每次处理4个点,代码只要8行左右,移位代替了乘法运算,完全发挥了MMX的威力。我只做了17级变换,0级和17级不用做,1到15原理一样,只有少少的不同,现在我举例半透明的算法,其他大家可以自己实现,有问题也可以和我交流。
Alpha运算中每个点3个色素,每个色素都要按上面那个公式运算,也就是每个色素要做2次乘法和一次加发,尽管可以变换一下不做浮点运算,但性能又能提高多少?我先讲一下我算法的一个基本原理,即“任意分组移位”,意思就是把一个数中分为N组,每组位数并不要求相同,我们用一次移位和一次与运算就能做到好像是每个分组移位而互不影响的效果。比半透明下Alpha=0.5,换成移位就是>>1,我们先把C右移一位,然后AND 一个2进制的数0111101111101111(0x7BEF),就完成了3个色素同时*0.5的运算,简单吧。
代码相信大家很容易就看懂了,大家把汇编部分和自己的程序结合就可以了,只要提供一些参数,比如页面数据指针和长度高度等资料.下次我会发布带Colorkey和Clip功能的代码,同样是MMX处理的,而且不用if(这会大大降低流水线的效率).以后还会介绍动态光源,灰度图,动画控制等高级主题,欢迎大家指导,由于水平和打字原因,可能文章中会有错误,请谅解.
下面是任意Alpha的混合运算
BOOL
CAresMaterial::DrawAlpha( LONG X, LONG Y, LPRECT pRect, BYTE Alpha )
{
unsigned __int16 *pSrc, *pDest;
unsigned __int32 A, PA;
unsigned __int16 Width, Height;
unsigned __int32 D1, D2;
RECT Rect; A = Alpha & 0x1F;
PA = 0x1F - A;
Width = (unsigned __int16)(pRect->right - pRect->left + );
Height = (unsigned __int16)(pRect->bottom - pRect->top + );
D1 = (m_Desc.dwPitch - Width + )<< ;
D2 = (m_Desc.pAres->GetScreenPitch() - Width + )<< ;
SetRect( &Rect, X, Y, X+Width-, Y+Height- );
m_Desc.pAres->BackToDILayer( &Rect );
pSrc = m_Desc.pData + pRect->top*m_Desc.dwPitch + pRect->left;
pDest = m_Desc.pAres->GetDILayerData() + Y*m_Desc.pAres->GetScreenPitch() + X; __asm
{
mov esi,pSrc
mov edi,pDest
movd mm2,A
movd mm3,PA mov cx,Height
shl ecx,
mov cx,Width LOOPA:
ror ecx,
dec cx
jz DONE
ror ecx, LOOPB:
dec cx
jz NEXTLINE
//Process one point
mov ax,[esi]
mov dx,ax
shl eax,
mov ax,dx
and eax,0x7E0F81F
movd edx,mm2
mul edx
movd mm0,eax mov ax,[edi]
mov dx,ax
shl eax,
mov ax,dx
and eax,0x7E0F81F
movd edx,mm3
mul edx
movd mm1,eax paddd mm0,mm1
psrlq mm0,
movd eax,mm0
and eax,0x7E0F81F
mov edx,eax
shr edx,
or eax,edx
mov [edi],ax inc esi
inc edi
inc esi
inc edi
jmp LOOPB NEXTLINE:
add esi,D1
add edi,D2
mov cx,Width
jmp LOOPA DONE:
emms
} m_Desc.pAres->DILayerToBack( &Rect ); return TRUE;
}
下面是半透明Alpha的混合运算
void
CAresMaterial::DrawAlpha1( LONG X, LONG Y, LPRECT pRect )
{ unsigned __int16 *pSrc, *pDest;
unsigned __int16 Width, Height, DW, DLeft;
unsigned __int32 D1, D2;
static unsigned __int64 MASKER = 0x7BEF7BEF7BEF7BEF;
RECT Rect; Width = (unsigned __int16)(pRect->right - pRect->left);
Height = (unsigned __int16)(pRect->bottom - pRect->top + );
pSrc = m_Desc.pData + pRect->top*m_Desc.dwPitch + pRect->left;
pDest = m_Desc.pAres->GetBackData() + Y*m_Desc.pAres->GetScreenPitch() + X; DLeft = (Width % ) + ;
DW = (Width>>) + ; D1 = (m_Desc.dwPitch - Width)<< ;
D2 = (m_Desc.pAres->GetScreenPitch() - Width)<< ;
SetRect( &Rect, X, Y, X+Width, Y+Height- ); __asm
{
mov esi,pSrc
mov edi,pDest
mov bx,DLeft mov cx,Height
shl ecx,
mov cx,DW LOOPA:
ror ecx,
dec cx
jz DONE
ror ecx, LOOPB:
dec cx
jz ENDLINE
//Process four points once
movq mm0,[esi]
movq mm1,[edi]
psrlq mm0,
psrlq mm1,
pand mm0,MASKER
pand mm1,MASKER
paddw mm0,mm1
movq [edi],mm0 add esi,
add edi,
jmp LOOPB ENDLINE:
dec bx
jz NEXTLINE
mov ax,[esi]
mov dx,[edi]
shr ax,
shr dx,
and ax,0x7BEF
and dx,0x7BEF
add ax,dx
mov [edi],ax
inc esi
inc esi
inc edi
inc edi
jmp ENDLINE NEXTLINE:
add esi,D1
add edi,D2
mov cx,DW
mov bx,DLeft
jmp LOOPA DONE:
emms
}
}
DirectDraw打造极速图形引擎(Alpha混合)的更多相关文章
- D3D中深度测试和Alpha混合的关系
我在学习D3D的深度测试和Alpha混合的时候,有一些遗憾.书上提供的例子里说一定要先渲染不透明物体,再渲染透明物体,对渲染状态的设置也有特殊要求.我看的很晕.自己查图形学的书,上网找资料,结果还是糊 ...
- 16位图像Alpha混合的实现(用汇编写的,比MMX还要快)
Alpha 混合的算法很简单,基于下面的公式就可以实现: D := A * (S - D) / 255 + D D 是目标图像的像素, S 是源图像的像素 A 是 Alpha 值, 0 为全透明, 2 ...
- 【转载】Alpha混合物体的深度排序
原文:Alpha混合物体的深度排序 先说个题外话, 本来我想解答一下最近Creators Club论坛上经常出现的一个问题, 意外的是在网上竟然找不到什么全面的答案.. 这是个有着复杂答案的简单问题: ...
- 【转载】D3D深度测试和Alpha混合
原文:D3D深度测试和Alpha混合 1. 深度测试 a) 深度缓冲区:屏幕上每个像素点的深度信息的一块内存缓冲区.D3D通过比较当前绘制的像素点的深度和对应深度缓冲区的点 ...
- Alpha混合
ShaderLab syntax: Blending 混合 Blending is used to make transparent objects. 混合是用来制作透明物体的. When graph ...
- 《逐梦旅程 WINDOWS游戏编程之从零开始》笔记8——载入三维模型&Alpha混合技术&深度测试与Z缓存
第17章 三维游戏模型的载入 主要是如何从3ds max中导出.X文件,以及如何从X文件加载三维模型到DirextX游戏程序里.因为复杂的3D物体,要用代码去实现,那太反人类了,所以我们需要一些建模软 ...
- Shader第十三讲 Alpha混合
http://blog.sina.com.cn/s/blog_471132920101d8z5.html Alpha Blending,中文译作Alpha混合Blending就是控制透明的.处于光栅化 ...
- 【STM32H7教程】第56章 STM32H7的DMA2D应用之刷色块,位图和Alpha混合
完整教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=86980 第56章 STM32H7的DMA2D应用之刷色块, ...
- 深度排序与alpha混合
原文: https://blogs.msdn.microsoft.com/shawnhar/2009/02/18/depth-sorting-alpha-blended-objects/ 翻译:李现民 ...
随机推荐
- ylbtech-Unitity-CS:AnonymousDelegates
ylbtech-Unitity-CS:AnonymousDelegates 1.A,效果图返回顶部 1.B,源代码返回顶部 1.B.1, using System; using System.Co ...
- 用block响应button的点击事件
1.继承UIButton : 2.在自己定义的button类中的方法 addTarget:(id)target action:(SEL)action forControlEvents:(UIContr ...
- 拥抱高效、拥抱 Bugtags 之来自用户的声音(五)
Bugtags使用心得(创业公司场景篇) ——成都嘿嘿科技有限公司 作者:小花 一.产品定义 关于手机客户端产品(APP)的 bug 提交.监测及管理且具有团队协作性质的系统. 二.使用环境 公司:初 ...
- dede织梦列表页如何调用全站子栏目
网站原代码:{dede:channel type='son'} <a href="[field:typelink/]">[field:typename/]</a& ...
- C++学习27 用全局函数重载运算符
运算符重载函数既可以声明为类的成员函数,也可以声明为所有类之外的全局函数. 运算符重载函数作为类的成员函数 将运算符重载函数声明为类的成员函数时,二元运算符的参数只有一个,一元运算符不需要参数.之所以 ...
- cshell学习
一. 文件的读写执行: 1)读:可以显示该文件的内容 2)写:可以编辑或者删除它 3)执行:如果该文件是一个shell脚本或者程序. 如果希望一次设置目录下所有文件的权限,可使用:chmod 644 ...
- 如何将MVC Areas中的某一个页设为起始页
area的默认页: routes.MapRoute( name: "MyArea", url: "{controller}/{action}/{id}", de ...
- [HDU 2546]饭卡 (动态规划)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2546 题意:见题目 刚开始怎么写都写不对,后来吃饭的时候想了想记忆化搜索的办法 就是说设dp(now, ...
- kylin一种OLAP的实现
1.基于hive.hadoop的预先计算. 2.cube存储在HBASE里面.利用HBase的列存储,实现MOLAP 3.在cube上做数据分析,kylin实现标准的SQL,实现查询HBase 所以说 ...
- 《Code Complete》ch.16 控制循环
WHAT? 反复执行的代码片段(你是第一天学编程吗) WHY? 知道如何使用及何时使用每一种循环是创建高质量软件的一个决定性因素 HOW? 检测位于循环开始/循环结尾 带退出的循环 进入循环 只从一个 ...