qt中文编码(好多方法)
qt中文编码
来源:http://www.cublog.cn/u1/59481/showart_1947231.html
前些日子,被编码折磨了一段时间,总结一下Qt中的编码。
【Qt 编码简单实验】
首先,Qt中得QString 类对字符串进行了封装,其内部使用Unicode对传入的串进行编码。这样一来,QString就可以处理绝大多数的国际语言。将QString中的字符根据语言翻译的过程,也就是Qt 的Translater针对程序中使用含有的tr("XXXXX"),进行翻译的过程。由于QString的Unicode编码,和本地系统的编码不一定是一致的(比如系统采用的GB2312的编码)。这样的话,就不能直接使用类似QString str("汉字")这样的方法来存储本地的汉字,是有问题的。
<系统是使用GB2312编码的>
【试验1】
QString str("汉字");
std::cout << "Straight Output:" << str << endl;
std::cout << "Local Output:" << str.local8Bit() << endl;
std::cout << "Unicode Output:" << str.unicode() << endl;
结果如下:
汉字 (正确)
@#$% (乱码)
@#$% (乱码)
【试验2】
QString str = QString::fromLocal8Bit("汉字");
std::cout << "Straight Output:" << str << endl;
std::cout << "Local Output:" << str.local8Bit() << endl;
std::cout << "Unicode Output:" << str.unicode() << endl;
结果如下:
@#$% (乱码)
汉字 (正确)
@#$% (乱码)
首先说试验1,因为str采用Unicode编码,中文实际上没有经过任何的编码转换直接存到str中,所以存入的Unicode已经是错误的(GB编码的字符按照Unicode存的)。但是为什么第一个会正常显示呢?因为标准输入输出是不进行任何的编码解码工作的,字符串由本地系统读取时使用本地的字符集GB2312进行解码,因为存入的字符串“汉字”正好是GB2312编码的,正好得到了正确地结果!这有点负负得正的味道!QString只是充当了一个容器,里面存的是不正确的值。
对于试验2来说,使用fromLocal8Bit()函数,实现了从本地字符集GB到Unicode的转换,所以存在QString中的字符串是经过转换的正确编码。输出的时候,要正确显示,只能是再转为本地的字符编码,也就是使用local8Bit()转换。由于存入QString的是正确的值,就可以进行包括国际化在内的许多工作!( 注意本地LANGUAGE环境变量!)
【Qt国际化的问题】
在文本显示上,Qt 使用了Unicode 作为内部编码,为了程序的国际化,通常我们在文本显示的地方不直接输入本地字符,用英文代替,比如要编写一中文界面的 Qt 程序,应该在程序中使用英文,程序编写完成后,把文本提取出来翻译。对于需要翻译的地方,首先是在该文本处用tr()函数标识,同时制作出.qm信息文件,并在程序中加入QTranslator即可。
比如我们在某一程序中有如下语句: setCaption(tr(“main window”)) 为了显示中文,有两种方法:
方法一:
1. 修改工程文件,加上TRANSLATIONS = xxx.ts
2. lupdate 工程文件名
3. 用linguist编辑刚生成的xxx.ts文件并保存
4. lrelease 工程文件名 xxx.qm
5. 在main.cpp中加入QFont font1(“unifont”,16,50,FALSE,QFont::Unicode);
6. qApp->setFont(font1);
7. QTranslator *translator = new QTranslator(0);
8. translator->load("xxx.qm",".");
9. qApp->installTranslator(translator);
方法二:
1. findtr 文件名(通常为CPP文件) > xxx.po
2. 编辑po文件,其中charset需由iso-8859-1改为GB2312,然后将“main window”翻译成“主窗口”
3. msg2qm –scope zh_CN.GB2312 xxx.po xxx.qm
4. 在main.cpp中加入QFont font1(“unifont”,16,50,FALSE,QFont::Unicode);
5. qApp->setFont(font1);
6. QTranslator *translator = new QTranslator(0);
7. translator->load("xxx.qm",".");
8. qApp->installTranslator(translator);
方法三:
有时我们只是提供给本地用户使用,无需国际化,QT提供这一支持,在QT中有许多本地字符集同unicode的转换引擎,他们皆为QTextCodec的派生类,如QGbkCodec、QJisCodec, QHebrewCodec等。如:
QFont font1(“unifont”,16,50,FALSE,QFont::Unicode);
qApp->setFont(font1);
QString caption=“主窗口“;
QTextCodec *gk_codec=QTextCodec::codecForName(“GBK”);
setCaption(gk_codec->toUnicode(caption));
从上面可以看出,使用转换引擎可以轻松实现中文显示,简要步骤如下:
1. 修改main.cpp文件,将字体改为unifont
QFont font1(“unifont”,16,50,FALSE,QFont::Unicode);
qApp->setFont(font1);
2. 在想汉化的内的头文件中加入QTextCodec指针变量和转换函数QString mytr(char *)
#include <qtextcodec.h>
QTextCodec* gbk;
QString mytr(const char *);
3. 在想汉化的类的实现文件中,修改类构造函数,加入:
gbk=QTextCodec::codecForName(“GBK”);
4. 在想汉化的类的实现文件中,添加mytr函数代码
QString Form1::mytr(const char* chars) {
return gbk->toUnicode(chars,strlen(chars));
}
5. 在想汉化的类的实现文件中,用“mytr”替换“tr”
注:如果将codec成员变量改成QTextCodec派生类变量,编译将通不过,比如将QTextCodec* gbk;改成QGbkCodec* gbk;编译将报告此处有语法错误。
下面是相似的用法:
1. 修改***.cpp文件,在顶部加入codec头文件
#include <qgbkcodec.h>
2. 在***.h文件中,加入mytr()函数声明
QString mytr(char* buffer,int size);
3. 在***.cpp文件中,加入mytr()定义
QString mytr(char* buffer,int size) {
QGbkCodec* gbk=QTextCodec::codeForName(“GBK”);
return gbk->toUnicode(buffer,size);
}
4. 在需要显示中文的地方,使用mytr函数即可
5. 修改main.cpp文件,将字体改为unifont
QFont font1(“unifont”,16,50,FALSE,QFont::Unicode);
qApp->setFont(font1);
备注1:在翻译或转换之前必须将Unicode字体调入,否则显示不出中文,网上相关文章并未提及这一点,如果不显式装载该字体,系统默认的是Latin1,于是汉字显不出来。
备注2:在编译qt/embedded之前,必须修改qconfig-qpe.h配置文件的内容,将与TextCodec相关的宏定义给去掉,否则QTextCodec::codecForName(“GBK”)将返回NULL指针。
备注3:使用findtr命令时可同时查找多个文件的tr(),并将查找结果都放入一个文件内,源文件以空格隔开即可,另外,生成的.po和.qm文件的文件名最好与工程文件名相同!
备注4:如果要显示繁体中文,则需要使用QTextCodec::codecForName(“big5”)。获取本地的使用语言,用QTextCodec::locale(),它返回Qstring变量,通常如果是中文本地的话,通常其值为zh_CN.GB2312和zh_TW.Big5,根据这个返回字符串,可以加载相应的codec。如果程序只支持一种编码,也可以直接把整个应用程序的编码设置为一个默认的编码标准,比如系统只需要显示中文和英文,则可以直接设置应用程序的默认编码标准是GBK,如下使用方法:
qApp->setDefaultCodec( QTextCodec::codecForName("GBK") );
QLabel *label = new QLabel( tr("中文标签") );
备注5:如果使用本地的字符转换器,可以使用Qstring的静态函数Qstring::fromLocal8Bit(char* buffer,int size),将本地字符串转换成UNICODE字符串,不过要设置好LANGUAGE环境变量。
【QTOpia中文化 】
1) findtr 文件名 > xxx.po
2) 编辑xxx.po文件
3) msg2qm –scope zh_CN.GB2312 xxx.po xxx.qm
4) 拷贝可执行文件到QPEDIR/bin目录
5) 拷贝xxx.po和xxx.qm文件到QPEDIR/i18n/zh_CN目录
6) 进入QPEDIR/apps/Applications目录创建一新.desktop文件
7) iconv –f utf8 –t GB18030 xxx.desktop > xxx1.desktop
8) 编辑xxx1.desktop文件,主要是修改Exec、Icon、Name和Name[zh_CN]四项
9) iconv –f GB18030 –t utf8 xxx1.desktop > xxx.desktop
10) rm –f xxx1.desktop
11) qvfb –depth 16 &
12) cd $QPEDIR/bin
13) ./qpe
备注1:如果你的系统中有多个qtopia版本,要特别注意QTDIR、QPEDIR、LD_LIBRARY_PATH环境变量
备注2:可按照此方法汉化qtopia自带的应用程序
备注3:po文件是中间文件,程序真正需要的是qm文件。iconv是系统自带的内码转换工具,它能将utf8编码的文件转换成gb18030编码的文件,反之也能,转换这一步必不可少,因为desktop文件缺省是utf8编码的,而我们的redhat linux 7。3中文操作系统用的却是gb18030,所以在编辑器打开前需转换。
Linux教程-Linux下应用程序开发:QT国际化编程
Qt 目前的版本(2.2.4)对国际化的支持已经相当完善。 在文本显示上,Qt 使用了Unicode 作为内部编码,可以同时支持多种编码。 为 Qt 增加一种编码的支持也比较方便,只要 增加该编码和Unicode的转换编码便可以了。 Qt 目前支持ISO标准编码ISO 8859-1, ISO 8859-2,ISO 8859-3,ISO 8859-4,ISO 8859-5,ISO 8859-7,ISO 8859-9,和 ISO 8859-15(对于阿拉伯语和希伯来语的支持正在开发之中),中文GBK/Big5,日文 eucJP/JIS/ShiftJIS,韩文eucKR,俄文KOI8-R。 当然也可以直接使用UTF8编码。
Qt 使用了自己定义的Locale机制,在编码支持和信息文件(Message File)的翻译上弥补了目前Unix上所普遍采用Locale和gettext的不足之处。 Qt 的这种机制可以使 Qt 的同一组件(QWidget)上同时显示不同编码的文本。 比如,Qt 的标签上可以同时使用中文简体 和中文繁体文本。
在文本输入上,Qt 采用了XIM(X Input Method)标准协议,可以直接使用XIM输入服务器。由于目前的绝大多数输入服务器都是针对单一语言的,所以在 Qt 的标准输入组件( QLineEdit,QMultiLineEdit)中的输入受到单一编码的限制,Qt 还不支持动态切换编码 输入的支持,这是它的不足之处。
1. Qt 的文本显示
使用 Qt 编写国际化的程序,最好不要在程序中直接使用特殊编码的文本。 比如要 编写一中文界面的 Qt 程序,应该在程序中使用英文,程序编写完成后,把文本提取 出来翻译。 这样,程序还可以根据Locale的不同,支持多种语言。 下面介绍如何在 Qt 程序中标注字符串,如何提取并翻译文本。
像普通的国际化过程一样,Qt 使用了类似GNU gettext一样的函数 QObject::tr(),它 用于从Qt的信息文件 .qm 中取出信息,这些信息是经过 Qt 的工具处理的。 Qt在处理 编码时还使用了 QTranslator 类,可用于指定整个应用软件的 的信息文件。
下面是一段使用了 QObject::tr()的代码,它建立了一个弹出菜单,菜单项是"Quit", 它被放置在菜单条上,在菜单条上显示的是标签"File"。
QPopupMenu* popup;
popup = new QPopupMenu( this );
popup->insertItem( tr("&Quit"),qApp,SLOT(quit()) );
menubar->insertItem( tr("&File"),popup );
对于绝大多数情况,可以用上述方法处理。不过有时在定义某些变量中使用的字符 串,不能使用上述方法,但是为了让Qt提取并翻译该字符串,必须用某种方法标志出 来。Qt 定义了 QT_TR_NOOP() 和 QT_TRANSLATE_NOOP() 来标志它们。前者用于单个字符串,后者用于多个字符串。比如,
static const char* strings = {
QT_TR_NOOP( "Hello" ),
QT_TR_NOOP( "World" )
};
有时需要使用printf/sprintf之类的函数动态生成字符串,比如,
QStings s;
s.sprintf( "Button %d",i );
but->setText( s );
对这种使用方式的国际化是使用 arg() 函数。
QString s = tr( "Button %1" ).arg(i);
but->setText( s );
提取上述信息的方法是使用 Qt 提供的工具 findtr 命令:
findtr .cpp > i18n.po
它类似于GNU的 xgettext,上述文件的提取信息文件内包含,
....
"Content-Type: text/plain; charset=iso-8859-1\n"
#: i18n.cpp:34
msgid "ExampleWidget::&File"
msgstr ""
...
接下来是文本翻译过程。 在Qt中翻译信息文件时应该注意以下事项: (1) 提取的信息文件的编码是iso-8859-1,在翻译成某种语言(编码)时应该 注意改动它的 字符集,比如对中文GB2312和Big5编码,应该是, "Content-Type: text/plain; charset=gb2312\n"或者"Content-Type: text/plain; charset=big5\n"。 (2) 提取的信息有一个范围,比如上面的文件指定的范围是 ExampleWidget, 在翻译 前应该把它去掉,变成 msgid "::&File"。(3) 被翻译的字符串可能含有加速键符号,如 "&File"中的"F",如果翻译成中文最好保留该信息,它可以翻译成 "文件(&F)"。
对于翻译后的文件(比如上面的翻译文件存为 i18n_gb.po),必须使用 Qt 提供的 工具 msg2qm 把它转换为 .qm 文件才能使用,
> msg2qm i18n_gb.po i18n_gb.qm
它类似于GNU的 msgfmt 命令。翻译后的文件可以用Qt程序直接调用。
QTranslator *translator = new QTranslator(0);
translator->load("i18n_gb.qm",".");
qApp->installTranslator(translator);
此外,Qt 还提供了类似于 msgmerge 的工具 mergetr,它用于把新提取的信息 文件和已经翻译过的信息文件融合起来,在此不再赘述。
在 Qt 中也可以直接使用 QTextCodec 来转换字符串的编码,这为在Qt下开发纯 中文软件带来了便利条件,不过这种方法不符和国际化/本地化的习惯,
char *string = "中文和English混和字符串!"
QTextCodec* gbk_codec = QTextCodec::codecByName("GBK");
QString gbk_string = codec->toUnicode(string);
QLabel *label = new QLabel(gbk_string);
如果使程序只支持一种编码,也可以直接把整个应用程序的编码设置为GBK编码, 然后在字符串之前 加tr(QObject::tr),
qApp->setDefaultCodec( QTextCodec::codecForName("GBK") );
QLabel *label = new QLabel( tr("中文标签") );
如果使Qt根据Locale的环境变量取得字符集,可以使用
QString::fromLocal8Bit(str)。
本节的例子请参见 qt-i18n-example.tar.gz
2. Qt 的文本输入
在输入方面,Qt 的输入条(QLineEdit)和编辑区(QMultiLineEdit)都支持 XIM,只要配合相应的输入服务器,便可以输入中文/日文/韩文。目前有许多支持XIM的软件,比如 中文: Chinput/xcin/rfinput/q9,日文: kinput2/skkinput,韩文: ami/hanIM。
Qt程序的缺省输入风格是OverTheSpot风格,它也支持 OffTheSpot风格和 Root风格。 用户可以在起动程序时在命令行指定输入风格,比如对程序app,
./app -inputstyle overthespot #缺省风格,光标跟随
./app -inputstyle offthespot
./app -inputstyle root
经过 MiziLinux 补丁的Qt-2.2.0 支持 OnTheSpot 输入风格,并且把它作为 缺省的输 入风格。请参见 http://www.mizi.com/ko/kde/doc/onthespot/onthespot.html。
Qt 中的任何一个 Widget 都可以接受输入,只要它可以有键盘聚焦(Keyboard Focus)。所以对特殊 Widget 的输入处理只需要截获键盘输入,获取从XIM服务器 来的字符串。 对于OverTheSport风格的支持,刷新XIM输入服务器的位置即可。
3. Qt 的打印
在打印方面,XWindow下的 Qt 生成PostScript并使用lpr打印。 它含有QPrinter类, 可以方便地支持输出页面的控制。 对于中文打印,必须修正PostScript文件的输出 部分。
http://blog.csdn.net/liuguangzhou123/article/details/7474102
qt中文编码(好多方法)的更多相关文章
- Qt 调用 Java 方法笔记
Qt 调用 Java 方法笔记 假设遇到相似的错误: error: undefined reference to '_jstring* QAndroidJniObject::callStaticMet ...
- QT 调用 DLL 方法(三种方法)
Qt调用DLL方法一:使用Win32 API 在显式链接下,应用程序必须进行函数 调用以在运行时显式加载 DLL.为显式链接到 DLL,应用程序必须:? 调用 LoadLibrary(或相似的函 数) ...
- qt QAbstractItemModel一些方法介绍
一. virtual bool setData(const QModelIndex &index, const QVariant &value, int role = Qt::Edit ...
- Qt 格式转换问题 记录(好多方法)
用Qt经常头痛于一些格式不能通用的问题 在此记录备用 1 (20120112)QString转为Char * QString *str; char *a; str="hello word ! ...
- Unknown module(s) in QT: xlsx解决方法
解决方法在此: https://github.com/dbzhang800/QtXlsxWriter Documentation: http://qtxlsx.debao.me QtXlsx is a ...
- 用事件队列解决GUI的操作顺序问题(Qt中处理方法)
GUI操作顺序问题引发异常: 有时候我们使用写GUI程序的时候会遇到这样的问题:比如在程序中,建立了一个列表的GUI.这个列表是随着时间不断更新的,而且操作也会读取这个列表GUI的内容. 如果这个程序 ...
- python 文件中的中文编码解决方法
# -*- coding: utf-8 -*- #查看安装的SDK默认的编码字符集在脚本中可以修改你的编码格式, 方法如下:#sys.getdefaultencoding()#reload(sys)# ...
- JS创建类和对象(好多方法哟!)
http://www.cnblogs.com/tiwlin/archive/2009/08/06/1540161.html 这是别人写的~~~我借来看看 JavaScript 创建类/对象的几种方式 ...
- 树莓派.Qt.Creator安装方法
树莓派硬件: Raspberry Pi 3 B 树莓派系统: Linux version 4.9.59-v7+ (32位) Qt版本(x86版本--32位): 安装过程 可以查看软件仓库支持的版本: ...
随机推荐
- sparksql dataset
java /** *2.0之后使用sparksession即可,不需要再去创建sqlcontext *@author Tele * */ public class Demo { private sta ...
- TensorFlow 实战(一)—— 交叉熵(cross entropy)的定义
对多分类问题(multi-class),通常使用 cross-entropy 作为 loss function.cross entropy 最早是信息论(information theory)中的概念 ...
- 【38.24%】【codeforces 621E】 Wet Shark and Blocks
time limit per test2 seconds memory limit per test256 megabytes inputstandard input outputstandard o ...
- GridLayout网格布局
网格布局特点: l 使容器中的各组件呈M行×N列的网格状分布. l 网格每列宽度相同,等于容器的宽度除以网格的列数. l 网格每行高度相同,等于容器的高度除以网格的行数. l 各组件的排列方式 ...
- Android 开发新方向 Android Wear ——概述
2014 谷歌 I/O大会正式公布的Android Wear 开发理念,从而能够更系统的提供开发人员使用Android接口开发便携式可穿戴设备,以智能手表为例,通过Android提供的接口,能够方便的 ...
- End-to end provisioning of storage clouds
Embodiments discussed in this disclosure provide an integrated provisioning framework that automates ...
- JavaScript取出字符串和尾随空格
书写JavaScript性能trim()之前和之后删除空字符串格,的功能的应用String物replace()方法去除空字符串端到端格.trim()例如,对于功能键下面的代码: <script ...
- python reversed
reversed()函数是返回序列seq的反向访问的迭代子.参数可以是列表,元组,字符串,不改变原对象. 例题: 牛客最近来了一个新员工Fish,每天早晨总是会拿着一本英文杂志,写些句子在本子上.同事 ...
- Leetcode 226 Invert Binary Tree 二叉树
交换左右叶子节点 /** * Definition for a binary tree node. * struct TreeNode { * int val; * TreeNode *left; * ...
- Python 爬虫 —— BeautifulSoup
from bs4 import BeautifulSoup % 首字母大写,显然这是一个类 1. BeautifulSoup 类 HTML 解析类(parser) r = requests.get(. ...