微软数学库XNAMATH(DirectXMath)
这篇文章只是对着MSDN文档的一些吐槽和总结记录,个人笔记之类的
运行库与头文件
老实说,这个数学库微软还是更像蛮频繁的,我这里有的最早版本是伴随DX9的,在这个头文件里面
最近在使用DXUT,顺便也就使用了下这个库,不过没有测试过效率,我不知道怎么测试效率好……
没有升级到Win8.1的时候,用的是XNAMATH.h
现在在用DirectXMath.h,这个可真是对C++程序员口味,用namepsace包起来了,这样要少了很多名字上的污染,没当看到windows.h就有种淡淡的忧伤
这三个头文件里面的内容基本一致,我尝试过不同头文件但是存储同样东西可以转型也不会崩溃什么的,不过最好还是别这样干吧,搞不好出问题了,按理来说是不会
CPU特性检测:
XMVerifyCPUSupport();z这个函数比较有意思,基本上是恒定返回true的,因为现在的CPU基本都支持了,在XNAMTAH.h比较保守,是用宏来做,有对应的宏直接返回true,没有调用API检测
#if
defined(_XM_X86_)
||
defined(_XM_X64_)
#define
_XM_SSE_INTRINSICS_
XMINLINE
BOOL
XMVerifyCPUSupport()
{
#if
defined(_XM_NO_INTRINSICS_)
||
!defined(_XM_SSE_INTRINSICS_)
return TRUE;
#else
// _XM_SSE_INTRINSICS_
// Note that on Windows 2000 or older, SSE2 detection is not supported so this will always fail
// Detecting SSE2 on older versions of Windows would require using cpuid directly
return
(
IsProcessorFeaturePresent(
PF_XMMI_INSTRUCTIONS_AVAILABLE
)
&&
IsProcessorFeaturePresent(
PF_XMMI64_INSTRUCTIONS_AVAILABLE
)
);
#endif
}
到了DirectXMath.h,直接就是检测宏存不存在了,这个函数也就是个保留意义,兼容之前写的代码吧(最新的版本[3.06],我机子上这个8.0版本[3.02]还是有特性检测的)
http://msdn.microsoft.com/en-us/library/windows/desktop/hh855941(v=vs.85).aspx
使用这东西有对齐要求,在栈上能正确工作,在类或结构体里面,这类或结构体会出现分配到堆上的时候,就得注意了,x64不需要注意,16对齐的,但是x86是8对齐的,也许你需要重载对应的new,delete恩,你懂的,当然还有个pImpl手法,具体我也不懂,反正微软如此介绍,
代码优化注意事项和策略
- 减少单个数据读取,MSDN上说,读取单个数据要从SIMD寄存器转成标量的(单精度浮点数) 读之后还要回退操作(moving from the SIMD registers to the scalar ones and back again.)
- 使用正确的编译指令和最新的编译器…..X86使用/arch:SSE2,所有的WindowsTarget均允许/fp:fast(这个库的函数全部是内联SSE2指令的,但只是对于这个库来讲,超出DirectXMath的代码,不具备这点)
- 使用估算函数,带Est后缀的版本,实际上我用不带的,误差累积,个人觉得略大
- 使用对齐的数据类型和操作(因为库的实现有两种实现),对齐的带A后缀,比如XMFLOAT4X4A,对齐的比不对的快
- 内存对齐分配,栈上的数据对齐编译器保证,但是堆里面你new出来的数据就不一定了.64位Windows没有此烦恼,(我目测我得转移测试我的渣代码),X86请参考_aligned_malloc
- 注意,在STL中使用这些类型,请提供自定义的Allocator, See the Visual C++ Team blog,注意有些STL会修改对齐,如 make_shared<>
- 避免操作符重载,这个就是C++复制几百份的笑话了. XMVECTOR and XMMATRIX have operator overloads
- 非规格数,x86遗留的蛋疼玩意….. _controlfp_s( &control_word, _DN_FLUSH, _MCW_DN );
- Take Advantage of the Integer Floating Point Duality ,这个吗,注意一下特殊值,记到脑袋里面去
SIGN EXPONENT MANTISSA
X XXXXXXXX XXXXXXXXXXXXXXXXXXXXXXX
1 bit 8 bits 23 bits
•Positive zero is 0
•Negative zero is 0x80000000
•Q_NAN is 07FC0000
•+INF is 0x7F800000
•-INF is 0xFF800000
- Using DirectXMath with Direct3D 按理认为正确的那样用就行了,注意下矩阵,使用/Zpr编译可能会导致传到HLSL的矩阵被翻转了
传递参数的,自己去看MSDN吧,这个地方东西很多,下面贴几个例子就好
XMMATRIX XM_CALLCONV XMMatrixLookAtLH(FXMVECTOR EyePosition, FXMVECTOR FocusPosition, FXMVECTOR UpDirection);
XMMATRIX XM_CALLCONV XMMatrixTransformation2D(FXMVECTOR ScalingOrigin, float ScalingOrientation, FXMVECTOR Scaling, FXMVECTOR RotationOrigin, float Rotation, GXMVECTOR Translation);
void XM_CALLCONV XMVectorSinCos(XMVECTOR* pSin, XMVECTOR* pCos, FXMVECTOR V);
XMVECTOR XM_CALLCONV XMVectorHermiteV(FXMVECTOR Position0, FXMVECTOR Tangent0, FXMVECTOR Position1, GXMVECTOR Tangent1, HXMVECTOR T);
XMMATRIX(FXMVECTOR R0, FXMVECTOR R1, FXMVECTOR R2, CXMVECTOR R3)
XMVECTOR XM_CALLCONV XMVector2Transform(FXMVECTOR V, FXMMATRIX M);
XMMATRIX XM_CALLCONV XMMatrixMultiplyTranspose(FXMMATRIX M1, CXMMATRIX M2);
注意的是,传到SSE2寄存器里面,一定是以值来传递的
32bit:
__fastcall 传递前三个到寄存器里面(从左至右)
__vectorcall 传递前六个到寄存器里面
64bit:
__fastcall 通过栈,意思是叫你传递引用
__vectorcall同上的__vectorcall
http://msdn.microsoft.com/en-us/library/windows/desktop/ee418728(v=vs.85).aspx
微软数学库XNAMATH(DirectXMath)的更多相关文章
- DX11 Without DirectX SDK--06 DirectXMath数学库
回到 DirectX11--使用Windows SDK来进行开发 xnamath.h原本是位于DirectX SDK的一个数学库,但是现在Windows SDK包含的数学库已经抛弃掉原来的xnamat ...
- DirectX11 With Windows SDK--06 DirectXMath数学库
前言 xnamath.h原本是位于DirectX SDK的一个数学库,但是现在Windows SDK包含的数学库已经抛弃掉原来的xnamath.h,并演变成了现在的DirectXMath.h.其实本质 ...
- XNA数学库
XNA Math Vectors 在direct3D 9 和10中,包含3D数学库的D3DX库支持向量和其他核心类型的计算.在direct11中,D3DX库不在包含3D数学库,取而代之的是XNA数学库 ...
- DirectX11 学习笔记6 - 使用D3DXMATH数学库的一个样例
这个样例是在之前的样例基础上 .把之前d3dx10math数学库换成了最新的d3dxmath.长处就不说了.先上效果图 所有代码.以及效果文件 文件结构 所有代码: 依照上图的文件顺序 #pragma ...
- 在数据库访问项目中使用微软企业库Enterprise Library,实现多种数据库的支持
在我们开发很多项目中,数据访问都是必不可少的,有的需要访问Oracle.SQLServer.Mysql这些常规的数据库,也有可能访问SQLite.Access,或者一些我们可能不常用的PostgreS ...
- 【公开课】《奥威Power-BI基于微软示例库(MSSQL)快速制作管理驾驶舱》文字记录与反馈
本期分享的内容: <奥威Power-BI基于微软示例库(MSSQL)快速制作管理驾驶舱> 时间:2016年11月02日 课程主讲人:叶锡文 从事商业智能行业,有丰富的实施经验,擅长 ...
- 10月26日 奥威Power-BI基于微软示例库(MSOLAP)快速制作管理驾驶舱 腾讯课堂开课啦
本次课是基于olap数据源的案例实操课,以微软olap示例库Adventure Works为数据基础. AdventureWorks示例数据库为一家虚拟公司的数据,公司背景为大型跨国生产 ...
- 微软企业库5.0学习-Security.Cryptography模块
一.微软企业库加密应用模块提供了两种加密: 1.Hash providers :离散加密,即数据加密后无法解密 2.Symmetric Cryptography Providers:密钥(对称)加密法 ...
- [EntLib]微软企业库5.0 学习之路——第一步、基本入门
话说在大学的时候帮老师做项目的时候就已经接触过企业库了但是当初一直没明白为什么要用这个,只觉得好麻烦啊,竟然有那么多的乱七八糟的配置(原来我不知道有配置工具可以进行配置,请原谅我的小白). 直到去年在 ...
随机推荐
- Hbase笔记——RowKey设计
一).什么情况下使用Hbase 1)传统数据库无法承载高速插入.大量读取. 2)Hbase适合海量,但同时也是简单的操作. 3)成熟的数据分析主题,查询模式确立不轻易改变. 二).现实场景 1.电商浏 ...
- 从Search Sort到Join
发表于<程序员>2015年4月B的一篇文章,在博客归档下.根据杂志社要求,在自己博客发表该文章亦须注明:本文为CSDN编译整理,未经允许不得转载,如需转载请联系market#csdn.ne ...
- iOS WebServiceFramework网络服务框架浅解
网络服务几乎是每一款成功APP的必备条件,打开你手机你会发现里面不用联网的应用数量十只手指可以数出来,就算是一些以独特技术切入市场的APP如美颜相机,都至少加入了分享功能.下面我先做下简单的回顾兼扫盲 ...
- Session.Abandon, Session.Clear和Session.Remove的区别
Session.Clear()就是把Session对象中的所有项目都删除了, Session对象里面啥都没有.但是Session对象还保留. Session.Abandon()就是把当前Session ...
- Java常用类(String、StringBuffer、Math、Arrays)
1.String 操作对象时会重新分配堆内存,栈内存的引用会重新指向新的堆内存 2.StringBuffer(字符串缓存区) 操作的对象一直都是一个 3.Math Math.max(xx,xx); M ...
- MES系统的有用存储过程
USE [ChiefmesNEW]GO/****** Object: StoredProcedure [dbo].[st_WMS_ImportStockInBill] Script Date: 10/ ...
- MFC中常用的内容
在程序中更改静态文本内容. GetDlgItem(IDC_STATIC)->SetWindowText("欢迎"); 不用UpdateData(false); 如果提示con ...
- MFC实现数独(2)
主要功能描述: 运行程序后对话框会显示一个9x9的待输入数独区域,并提供随机生成数独和生成数独按钮,生成数独按钮后会创建数独并随机显示其中一个至数独区域,随机生成数独会从已生成的数独中随机获取一个并显 ...
- 配置 Spring 的声明式事务
<!-- 1. 配置事务管理器 --> <bean id="transactionManager" class="org.springframework ...
- jsp验证码点击刷新
<img src="<%=basePath%>manage/code" alt="验证码" height="20" ali ...