DirectDraw打造极速图形引擎(Alpha混合)

显然DirectDraw是Windows下写2D图形程序的最好选择，虽然Direct3D也可以写，但是没DirectDraw简单方便，特别对于初学者，一来就接触那么多函数和参数总不是件愉快的事，所以我的文章主要结合我做的工作，谈谈DirectDraw编程中一些比较关键的技术，大多是我自己想出来的。我想先声明，我的文章可以任意转载，源代码可以任意使用和修改。

　　由于我是业余时间写的文章，所以只能每次发表一篇，希望我的工作可以为大家的游戏增光添彩，同时我的文章主要面向有基本C++，DirectDraw，汇编和MMX编程经验的朋友，如果你对这些了解不够，请先学习一下再阅读。也欢迎大家和我交流，我的QQ是35830152，EMAIL:EUHO@SINA.COM。

　　作为第一篇，我想先谈谈Alpha混合的问题。这里32位色的图形模式我们不考虑，因为技巧并不多，占用显存和内存大，实际应用的也不多。我们把焦点放在16位色的模式上。我们把源点C2和Alpha通道点C1用Alpha混合,混合后得到点C，如果Alpha取0~1，公式如下：

C = C2*Alpha + C1*(1-Alpha)

如果Alpha取0~32，公式如下：

C = (C2*Alpha + C1*(1-Alpha))>>5

每个点由R,G,B 3个分量组成，所以上面的运算要分别对每个分量进行计算，如果整体计算，由于进位的关系我们会得到错误的结果。我们只考虑用得较多的565格式，即16位的颜色值为RRRRRGGGGGGBBBBB，555格式原理是一样的。显然我们每次处理一个点似乎只能按照“拆分-分别运算－拆分”来写代码，但是这样是低效的，想想1024*768模式下运算一帧要进行多少次运算，一定快不到哪里去。

　　Intel有段很长的代码，我没仔细看，也没试验，总觉得不太可靠（呵呵）。还看了GameRes上的一些相关文章，还是有值得参考的地方，就是觉得看了还是有些茫然。

　　下面说我的算法，首先说明这个快速算法是针对每个Alpha值建立一个函数进行运算，如果在一个函数里实现任意Alpha的运算,一次只能运算2个点，而且汇编代码是26行，而且有2次乘法，也用到了部分MMX加速。经过针对每一级Alpha的优化处理，每次处理4个点，代码只要8行左右，移位代替了乘法运算，完全发挥了MMX的威力。我只做了17级变换，0级和17级不用做，1到15原理一样，只有少少的不同，现在我举例半透明的算法，其他大家可以自己实现，有问题也可以和我交流。

　　Alpha运算中每个点3个色素，每个色素都要按上面那个公式运算，也就是每个色素要做2次乘法和一次加发，尽管可以变换一下不做浮点运算，但性能又能提高多少？我先讲一下我算法的一个基本原理，即“任意分组移位”，意思就是把一个数中分为N组，每组位数并不要求相同，我们用一次移位和一次与运算就能做到好像是每个分组移位而互不影响的效果。比半透明下Alpha=0.5，换成移位就是>>1，我们先把C右移一位，然后AND 一个2进制的数0111101111101111（0x7BEF），就完成了3个色素同时*0.5的运算，简单吧。

　　代码相信大家很容易就看懂了,大家把汇编部分和自己的程序结合就可以了,只要提供一些参数,比如页面数据指针和长度高度等资料.下次我会发布带Colorkey和Clip功能的代码,同样是MMX处理的,而且不用if(这会大大降低流水线的效率).以后还会介绍动态光源,灰度图,动画控制等高级主题,欢迎大家指导,由于水平和打字原因,可能文章中会有错误,请谅解.

下面是任意Alpha的混合运算

BOOL

CAresMaterial::DrawAlpha( LONG X, LONG Y, LPRECT pRect, BYTE Alpha )

{

    unsigned __int16 *pSrc, *pDest;

    unsigned __int32 A, PA;

    unsigned __int16 Width, Height;

    unsigned __int32 D1, D2;

    RECT Rect;

    A = Alpha & 0x1F;

    PA = 0x1F - A;

    Width = (unsigned __int16)(pRect->right - pRect->left + );

    Height = (unsigned __int16)(pRect->bottom - pRect->top + );

    D1 = (m_Desc.dwPitch - Width + )<< ;

    D2 = (m_Desc.pAres->GetScreenPitch() - Width + )<< ;

    SetRect( &Rect, X, Y, X+Width-, Y+Height- );

    m_Desc.pAres->BackToDILayer( &Rect );

    pSrc = m_Desc.pData + pRect->top*m_Desc.dwPitch + pRect->left;

    pDest = m_Desc.pAres->GetDILayerData() + Y*m_Desc.pAres->GetScreenPitch() + X;

    __asm

    {

        mov esi,pSrc

        mov edi,pDest

        movd mm2,A

        movd mm3,PA

        mov cx,Height

        shl ecx,

        mov cx,Width

    LOOPA:

        ror ecx,

        dec cx

        jz DONE

        ror ecx,

    LOOPB:

        dec cx

        jz NEXTLINE

        //Process one point

        mov ax,[esi]

        mov dx,ax

        shl eax,

        mov ax,dx

        and eax,0x7E0F81F

        movd edx,mm2

        mul edx

        movd mm0,eax

        mov ax,[edi]

        mov dx,ax

        shl eax,

        mov ax,dx

        and eax,0x7E0F81F

        movd edx,mm3

        mul edx

        movd mm1,eax

        paddd mm0,mm1

        psrlq mm0,

        movd eax,mm0

        and eax,0x7E0F81F

        mov edx,eax

        shr edx,

        or eax,edx

        mov [edi],ax

        inc esi

        inc edi

        inc esi

        inc edi

        jmp LOOPB

    NEXTLINE:

        add esi,D1

        add edi,D2

        mov cx,Width

        jmp LOOPA

    DONE:

        emms

    }

    m_Desc.pAres->DILayerToBack( &Rect );

    return TRUE;

}

下面是半透明Alpha的混合运算

void

CAresMaterial::DrawAlpha1( LONG X, LONG Y, LPRECT pRect )

{

    unsigned __int16 *pSrc, *pDest;

    unsigned __int16 Width, Height, DW, DLeft;

    unsigned __int32 D1, D2;

    static unsigned __int64 MASKER = 0x7BEF7BEF7BEF7BEF;

    RECT Rect;

    Width = (unsigned __int16)(pRect->right - pRect->left);

    Height = (unsigned __int16)(pRect->bottom - pRect->top +  );

    pSrc = m_Desc.pData + pRect->top*m_Desc.dwPitch + pRect->left;

    pDest = m_Desc.pAres->GetBackData() + Y*m_Desc.pAres->GetScreenPitch() + X;

    DLeft = (Width % ) + ;

    DW = (Width>>) + ;

    D1 = (m_Desc.dwPitch - Width)<< ;

    D2 = (m_Desc.pAres->GetScreenPitch() - Width)<< ;

    SetRect( &Rect, X, Y, X+Width, Y+Height- );

    __asm

    {

        mov esi,pSrc

        mov edi,pDest

        mov bx,DLeft

        mov cx,Height

        shl ecx,

        mov cx,DW

    LOOPA:

        ror ecx,

        dec cx

        jz DONE

        ror ecx,

    LOOPB:

        dec cx

        jz ENDLINE

        //Process four points once

        movq mm0,[esi]

        movq mm1,[edi]

        psrlq mm0,

        psrlq mm1,

        pand mm0,MASKER

        pand mm1,MASKER

        paddw mm0,mm1

        movq [edi],mm0

        add esi,

        add edi,

        jmp LOOPB

    ENDLINE:

        dec bx

        jz NEXTLINE

        mov ax,[esi]

        mov dx,[edi]

        shr ax,

        shr dx,

        and ax,0x7BEF

        and dx,0x7BEF

        add ax,dx

        mov [edi],ax

        inc esi

        inc esi

        inc edi

        inc edi

        jmp ENDLINE

    NEXTLINE:

        add esi,D1

        add edi,D2

        mov cx,DW

        mov bx,DLeft

        jmp LOOPA

    DONE:

        emms

    }

}

DirectDraw打造极速图形引擎(Alpha混合)的更多相关文章

D3D中深度测试和Alpha混合的关系
我在学习D3D的深度测试和Alpha混合的时候,有一些遗憾.书上提供的例子里说一定要先渲染不透明物体,再渲染透明物体,对渲染状态的设置也有特殊要求.我看的很晕.自己查图形学的书,上网找资料,结果还是糊 ...
16位图像Alpha混合的实现（用汇编写的，比MMX还要快）
Alpha 混合的算法很简单,基于下面的公式就可以实现: D := A * (S - D) / 255 + D D 是目标图像的像素, S 是源图像的像素 A 是 Alpha 值, 0 为全透明, 2 ...
【转载】Alpha混合物体的深度排序
原文:Alpha混合物体的深度排序先说个题外话, 本来我想解答一下最近Creators Club论坛上经常出现的一个问题, 意外的是在网上竟然找不到什么全面的答案.. 这是个有着复杂答案的简单问题: ...
【转载】D3D深度测试和Alpha混合
原文:D3D深度测试和Alpha混合 1. 深度测试 a) 深度缓冲区:屏幕上每个像素点的深度信息的一块内存缓冲区.D3D通过比较当前绘制的像素点的深度和对应深度缓冲区的点 ...
Alpha混合
ShaderLab syntax: Blending 混合 Blending is used to make transparent objects. 混合是用来制作透明物体的. When graph ...
《逐梦旅程 WINDOWS游戏编程之从零开始》笔记8——载入三维模型&Alpha混合技术&深度测试与Z缓存
第17章三维游戏模型的载入主要是如何从3ds max中导出.X文件,以及如何从X文件加载三维模型到DirextX游戏程序里.因为复杂的3D物体,要用代码去实现,那太反人类了,所以我们需要一些建模软 ...
Shader第十三讲 Alpha混合
http://blog.sina.com.cn/s/blog_471132920101d8z5.html Alpha Blending,中文译作Alpha混合Blending就是控制透明的.处于光栅化 ...
【STM32H7教程】第56章 STM32H7的DMA2D应用之刷色块，位图和Alpha混合
完整教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=86980 第56章 STM32H7的DMA2D应用之刷色块, ...
深度排序与alpha混合
原文: https://blogs.msdn.microsoft.com/shawnhar/2009/02/18/depth-sorting-alpha-blended-objects/ 翻译:李现民 ...

随机推荐

ndk的一些概念
什么场景应用ndk 1.代码的包含,apk的java层代码容易被反编译,c/c++被反编译难度非常大 2.NDK中调用第三方C/C++库,因为大部分的开源库都是c/c++编写,比如opencv,op ...
html table单双行颜色间隔（转载）
直接上代码: <html> <head> <meta http-equiv="Content-Type" content="text/htm ...
Android使用KSOAP2调用WebService及正确导入jar包的问题（转）
Android使用KSOAP2调用WebService及正确导入jar包的问题(转) 错误信息最近在学Android使用KSOAP2调用现有的Webservice的方法,期间在网上找了很多代 ...
Java日期时间使用总结
一.Java中的日期概述日期在Java中是一块非常复杂的内容,对于一个日期在不同的语言国别环境中,日期的国际化,日期和时间之间的转换,日期的加减运算,日期的展示格式都是非常复杂的问题. 在J ...
Liferay 6开发学习（二十六）：数据库连接相关问题
Liferay中怎么更换数据库? 常碰到有人问Liferay怎么更换数据库,怎么修改数据库连接.在我们第一次启动Liferay的时候,会有一个配置向导,在此配置向导我们可以选择数据库,并配置数据库连接 ...
oracle10g如何配置客户端
http://jingyan.baidu.com/article/4d58d541c108939dd4e9c0f5.html 不行的话: 对tnsnames.ora进行编辑:ORCL = (DESCR ...
服务器返回数组，data[0]得到的总是不对？如何处理？
我用asp.net MVC 写了服务器代码,返回数组,ajax怎么处理返回的数组内容? 您好,首先用eval将获得的ajax数据转化成json对象并赋值给一个变量. 比如: var obj=eval( ...
九度OJ1207
题目给你了一个很大的n,然后让你去计算它的质因数.对N进行开方得到的是一个大约在32000左右的数,我们可以用埃氏筛法进行素数打表.对所有prime[i]<=sqrt(n),分别看prime[i ...
[技巧]如何清除VS2008的最近打开项目
)删除最近打开的文件运行regedit,打开HKEY_CURRENT_USER\Software\Microsoft\VisualStudio\9.0\FileMRUList 之后,在右边删除相应键 ...
List<Object>和List<String>
下面的代码在JAVA中是不可以的: import java.util.*; public class Test { public static void main(String[] args) { L ...

DirectDraw打造极速图形引擎(Alpha混合)

DirectDraw打造极速图形引擎(Alpha混合)的更多相关文章

随机推荐

热门专题