字符集(编码)转换_Qt532

1、网上的资料：

　　1.1、参考网址：http://blog.csdn.net/changsheng230/article/details/6588447

　　1.2、网页内容：

“

Qt 使用Unicode编码来存储操作字符串，但很多情况下，我们不得不处理采用其他编码格式的数据，举例来说，中文多采用GBK和Big5编码，而日本则多采用Shift-JIS or ISO2022编码。本文将讨论如何将其他编码格式的字符串转化成采用Unicode编码的QString

// Method 1
    QString str = QString::fro mLocal8Bit("本地文本");
    QString str2 = QString("本地文本");  // 乱码
// Method 2
    QTextCodec *codec = QTextCodec::codecForName("GBK"); // get the codec for KOI8-R
    QString locallyEncoded = codec->toUnicode( "显示中文" );
    qDebug() << locallyEncoded << endl;

//更多细节请参见：

http://www.kuqin.com/qtdocument/qtextcodec.html

http://blog.csdn.net/catamout/article/details/5675878

”

2、我的理解

　　QString在底层是使用Unicode来存储字符串的(Java的String也是这样)，Unicode 也是一种编码的方式且它是用2个字节来存储一个字符的(宽字符)，不管是英文的一个单词/中文的一个汉字/等它都是使用 2个字节来存储。

　　Unicode作为一种中间状态存储在QString中，不同编码方式(如 GBK/utf-8/等)的字符串先通过它们的编码方式转码成Unicode(也就是QString)，然后我们需要什么编码方式再从Unicode转为目标的编码方式的字节数组。

　　ZC: 使用中，与Java不同之处：(需要注意)
　　　　我的理解是这样的：

3、我的测试代码：(该cpp文件编码方式为"UTF-8 + BOM")

// http://blog.csdn.net/changsheng230/article/details/6588447
 
    wchar_t *pwc = L"我是中国人";　　// ZC: 这里是使用的 编码方式为"UTF-8 + BOM"
    qDebug() << "(1) ==>";
    for (size_t i=; i<wcslen(pwc); i++)
    {
        ushort us = pwc[i];
        qDebug() << "\t" << QString::number(us, ).leftJustified(, '');
    }

　　// ZC: QString 默认还是使用GBK
    QTextCodec *codec = QTextCodec::codecForName("GBK"); // get the codec for KOI8-R
    QString locallyEncoded = codec->toUnicode( "我是中国人" );
    qDebug() << locallyEncoded << endl;
 
    QChar *pcs = (QChar*)locallyEncoded.unicode();
    qDebug() << "(2) ==>";
    for (int i=; i<locallyEncoded.length(); i++)
    {
        QChar c = pcs[i];
        ushort us = c.unicode();
        qDebug() << "\t" << QString::number(us, ).leftJustified(, '');
    }
 
    pcs = (QChar*)locallyEncoded.data();
    qDebug() << "(3) ==>";
    for (int i=; i<locallyEncoded.length(); i++)
    {
        QChar c = pcs[i];
        ushort us = c.unicode();
        qDebug() << "\t" << QString::number(us, ).leftJustified(, '');
    }
 
    QTextCodec *codecUtf8 = QTextCodec::codecForName("utf-8");
    QByteArray ba = codecUtf8->fromUnicode(locallyEncoded);
 
    qDebug() << "(4) ==>";
    for (int i=; i<ba.length(); i++)
    {
        ushort us = ba[i];
        us &= 0xFF;
        qDebug() << "\t("<< QString::number(i).rightJustified(, '') <<")"
                 << QString::number(us, ).leftJustified(, '');
    }
 
    ba = locallyEncoded.toUtf8();
    qDebug() << "(5) ==>";
    for (int i=; i<ba.length(); i++)
    {
        ushort us = ba[i];
        us &= 0xFF;
        qDebug() << "\t("<< QString::number(i).rightJustified(, '') <<")"
                 << QString::number(us, ).leftJustified(, '');
    }

　　3.1、打印的信息：

() ==>
     ""
     "662f"
     "4e2d"
     "56fd"
     "4eba"
"我是中国人" 
 
() ==>
     ""
     "662f"
     "4e2d"
     "56fd"
     "4eba"
() ==>
     ""
     "662f"
     "4e2d"
     "56fd"
     "4eba"
() ==>
    ( "" ) "e6"
    ( "" ) ""
    ( "" ) ""
    ( "" ) "e6"
    ( "" ) ""
    ( "" ) "af"
    ( "" ) "e4"
    ( "" ) "b8"
    ( "" ) "ad"
    ( "" ) "e5"
    ( "" ) "9b"
    ( "" ) "bd"
    ( "" ) "e4"
    ( "" ) "ba"
    ( "" ) "ba"
() ==>
    ( "" ) "e6"
    ( "" ) ""
    ( "" ) ""
    ( "" ) "e6"
    ( "" ) ""
    ( "" ) "af"
    ( "" ) "e4"
    ( "" ) "b8"
    ( "" ) "ad"
    ( "" ) "e5"
    ( "" ) "9b"
    ( "" ) "bd"
    ( "" ) "e4"
    ( "" ) "ba"
    ( "" ) "ba"

4、

5、

字符集(编码)转换_Qt532_QString的更多相关文章

字符集(编码)转换_Linux
ZC: 来自我的项目 czgj 1.代码: #include <stdio.h> #include <iconv.h> #include <string.h> / ...
字符集(编码)转换_Windows
ZC: 来自我的项目 czgj ZC: (1).经过测试 MultiByteToWideChar(...) 返回的是 (需要的)WideChar[宽字符]的个数:(2).WideCharToMult ...
关于JS的编码转换问题
在进行JS开发过程中,尤其是在开发报表时,报表已集成到Web页面中,通过在页面传递参数至报表中时,会发现有时某些参数值,传递到报表中是显示为问号或乱码等等一系列不能正常显示的情况. 这是由于浏览器和报 ...
帆软报表FineReport数据库连接编码转换
1. 问题描述数据库会以某种编码方式保存与读取数据,FineReport解析时默认使用GBK字符集,若数据库端编码与设计器端编码不一致时,就会导致中文及特殊字符的乱码. FineReport在定义数 ...
java Unicode、ISO-8859-1、GBK、UTF-8编码转换深入浅出
参考文献:搞懂ASCII, ISO8859-1, ANSI和Unicode Unicode百度文献 ISO-8859-1百度文献注: 1.utf-8虽然是国际编码,对不同范围的字符使用不同长度的编码 ...
Base64的编码转换方式
下面,详细介绍Base64的编码转换方式. 所谓Base64,就是说选出64个字符----小写字母a-z.大写字母A-Z.数字0-9.符号"+"."/"(再加上 ...
各种编码中汉字所占字节数；中文字符集编码Unicode ,gb2312 , cp936 ,GBK，GB18030
vim settings set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936,latin1set termencoding=utf-8se ...
理解perl的编码转换——utf8以及乱码
工作需要,闲暇之余,仔细研究了一下脚本乱码的问题 1. vim新建的文件 1)在linux命令行 vim命令建立的文件,如果内容中不出现中文,默认是ASCII.那么用notepad++打开的时候,就是 ...
iconv字符编码转换
转自 http://blog.csdn.net/langresser_king/article/details/7459367 iconv(http://www.gnu.org/software/li ...

随机推荐

html10
1.动画fadeIn() - 淡入fadeOut() - 淡出 -通过改变透明度(opacity隐藏之后依旧占着位置)实现节点的显示和隐藏show() - 显示hide() - 隐藏 -同时改变节点的 ...
js五星好评2
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
【Java】系统漏洞：关于用户登录后操作的注意事项
项目背景: SpringMVC + Mybatis + MySql数据库(javaWeb项目开发) 相关模块:登录,个人详细信息修改,订单详情查询相关漏洞介绍: 1.登录的验证码:登录的验证码一定 ...
STA分析(五) parastics
互联线的寄生参数一般一个cell或者block的连接pin就叫做一个net.在物理实现的时候,一条net可能会穿过几层metal,因为每个metal层的电阻,电容值都不一样.所以,在分析 net的寄 ...
Baidu 推荐技术平台（offer）
一面: 1 自我介绍项目介绍. 2 RNN 原理,LSTM原理,GBDT原理,XGB与GBDT的改进. 3 多模匹配,字典树,链表环找入口. 4 c++ static 关键字 5 多线程,线程安全 ...
redis windows版本下载
https://github.com/dmajkic/redis/downloads http://windows.php.net/downloads/pecl/snaps/redis/3.1.4rc ...
CodeForces - 946D Timetable (分组背包+思维)
题意 n天的课程,每天有m个时间单位.若时间i和j都有课,那么要在学校待\(j-i+1\)个时间.现在最多能翘k节课,问最少能在学校待多少时间. 分析将一天的内容视作一个背包的组,可以预处理出该天内 ...
VMWare中桥接、NAT、Host-only
1.概述 2.bridged(桥接模式) 3.NAT(网络地址转换模式) 4.host-only(主机模式) 5.replicate physical network connection state ...
让nodepad++编辑时链接能双击打开
让nodepad++编辑时链接能双击打开,Notepad++自动把代码或编辑状态里的链接或URL地址转成可点击的链接,当你双击该URL会打开相应的网页地址,不用复制地址到浏览器打开了,非常方便好用. ...
容器技术与DevOps
容器技术的使用支撑了目前 DevOps 三大主要实践:工作流.及时反馈.持续学习. 有人说容器技术与 DevOps 二者在发展的过程中是互相促进的关系.得益于 DevOps 设计理念的流行,容器生态系 ...

字符集(编码)转换_Qt532_QString

字符集(编码)转换_Qt532_QString的更多相关文章

随机推荐

热门专题