PyQt的QString和python的string的区别
python string和PyQt的QString的区别
以下在 Python2.6和PyQt4.4.4 for Python2,6环境下讨论:
Python中有两种有关字符的类型:Python string object和Python Unicode object。主要使用Python string object进行数据输入输出。
PyQt中与之相对应的字符有关类型是:QByteArray和QString。主要使用QString操作数据。
1. Python和PyQt中的类型对应
注意是类型相似,不是相等。
需要先了解编码:ascii、gb2312、big5,这些是各国自己文字不同的编码;unicode,国际通用编码,就是穷尽这个世界上所有的文字,给
每个文字编一个,又分utf-8方案--最常使用的128个英文字母用一个字节来表示,而中文使用三个字节来表示,utf-16方案--其中英文和中文都
使用两个字节来表示,而其它字符采用四个字节,utf-32方案--所有的文字都用四个字节来表示。
unicode就可用来作为各种独立编码如ascii、gb2312、big5的转换中介。
Python中gkb == gb2312。
1)Python string object可以理解为一个接一个字节(byte,8位)的字节组,至于表示什么编码,与表示文字有关,如:"python string","中文"。注意它是有不同编码区分的!
PyQt中与之相当的是QByteArray,注意不是QString!
A
built-in string object (plain or Unicode) is a sequence of characters
used to store and represent text-based information (plain strings are
also sometimes used to store and represent arbitrary sequences of binary
bytes). (摘自《Python in a NutShell》)
QByteArray can be used to store both raw bytes (including '0's) and traditional 8-bit '0'-terminated.(摘自《PyQt手册》)
2)Python Unicode object可以理解为固定使用utf-16编码的字节组,其中英文和中文都使用两个字节(16位)来表示,如:u"Python Unicode object"、u"中文"。
PyQt中与之对应的就是QString了。
Unicode
string literals have the same syntax as other string literals, with a u
or U immediately before the leading quote. (摘自《Python in a NutShell》)
Qt
also provides the QString class to store string data. It stores 16-bit
Unicode characters, making it easy to store non-ASCII/non-Latin-1
characters in your application.(摘自《PyQt手册》)
QString stores a string of 16-bit QChars, where each QChar corresponds one Unicode 4.0 character.(摘自《PyQt手册》)
2. PyQt内部类型转换
QString有
toAscii()、toUtf8()函数转换为QByteArray类型,(这个基本不用,因为很少直接用QByteArray类型)有
__init__ (self, QByteArray a)函数将QByteArray类型转为QString。
3. Python string object和Python Unicode object相互转换
1)Python string object是原始编码是有区分的,通过 decode('原始编码') 函数解码得到通用utf16编码即Python Unicode object。
>>>"python string".decode('ascii')
或者
>>>"python string".decode()
得到 u"python string"
因为默认按ascii解码。
>>>"中文".decode('gbk')
得到 u"u4e2du6587" ,打印出来就是 中文 二字。(注意结果是2字节一组,共两组,对应两个汉字)
又:"python string".decode('gkb') ,即按汉字来解码,也可以得到 u"python string",因为gbk编码也支持英文字母;
但是"中文".decode('ascii') 即按ascii解码是错误的,因为ascii编码不支持汉字!
>>> "dfdf".decode()
u'dfdf'
>>> "dfdf".decode("ascii")
u'dfdf'
>>> "dfdf".decode("gbk")
u'dfdf'
>>> "中文".decode("gbk")
u'u4e2du6587'
>>>print "中文".decode("gbk")
中文
>>> "中文".decode("gb2312")
u'u4e2du6587'
>>> "中文".decode("ascii")
Traceback (most recent call last):
File "<interactive input>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd6 in position 0: ordinal not in range(128)
2)Python Unicode object原始编码固定是utf16,通过 encode('目的编码') 编码来得到Python string object。
>>>u"unicode string".encode()
或者
>>>u"unicode string".encode('ascii')
得到
'unicode string',默认目的编码为ascii。
>>>u"中文".encode("gbk")
得到'xd4xd0xcexc4',打印出来就是 中文。(注意结果是1字节一组,共4组)
>>> u"sdff".encode()
'sdff'
>>> u"sdff".encode('ascii')
'sdff'
>>> u"sdff".encode('gbk')
'sdff'
>>> u"sdff".encode('gb2312')
'sdff'
>>> u"中文".encode('gbk')
'xd6xd0xcexc4'
>>> print u"中文".encode('gbk')
中文
>>> u"中文".encode('ascii')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordin
al not in range(128)
注意:执行>>> u"中文".encode('gbk')命令需要你的IDE支持gbk编码,在官方shell下执行肯定没问题,但如果你的IDE比如PyWin中文输入 异常,则可能报错。
4. Python string object和Python Unicode object向QString的转换。
Qt一般不直接操作QByteArray,只需关注Python string object和Python Unicode object向QString的转换。
很多关于PyQt4的英文书籍说:PyQt函数需要QString参数的地方都可以直接用Python string object或者Python
Unicode object,如果非要转换可以直接用QtCore.QString()构造。比如《GUI Programming with
PyQt》,再如《PyQt手册》:
Whenever
PyQt expects a QString as a function argument, a Python string object
or a Python Unicode object can be provided instead, and PyQt will do the
necessary conversion automatically.
You
may also manually convert Python string and Unicode objects to QString
instances by using the QString constructor as demonstrated in the
following code fragment:
qs1 = QtCore.QString("Converted Python string object")
qs2 = QtCore.QString(u"Converted Python Unicode object")
但可惜这只适用于英文 即ascii编码,对于中文则行不通!
直接的 QString:
>>> QtCore.QString('中文')
PyQt4.QtCore.QString(u'xd6xd0xcexc4')
>>> print QtCore.QString('中文')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-3: ordin
al not in range(128)
>>>
>>> QtCore.QString(u'中文')
PyQt4.QtCore.QString(u'u4e2du6587')
>>> print QtCore.QString(u'中文')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordin
al not in range(128)
>>>
因为它们都是默认按ascii编码转换!
GUI编程:
可以创建一个QTextEdit对象myTextEdit, 检验:
myTextEdit.append("中文")
或者
myTextEdit.append(u"中文")
或者
myTextEdit.append(QtCore.QString('中文'))
或者
myTextEdit.append(QtCore.QString(u'中文'))
你会发现显示都是乱码...因为它们都是默认按ascii编码进行内部转换得到QString相应utf16编码的。
解决方法是:
利用unicode()函数显示指定gb2312编码进行中文编码转换,转换后的Python Unicode object则是可以直接作为QString参数代入用的:
>>> unicode('中文', 'gb2312', 'ignore')
u'u4e2du6587'
>>> print unicode('中文', 'gb2312', 'ignore')
中文
>>>
myTextEdit.append(unicode(' 中文', 'gb2312', 'ignore'))
#用以替代myTextEdit.append(u"中文")
或者多此一举下:
myTextEdit.append(QtCore.QString(unicode('中文', 'gb2312', 'ignore')))
#用以替代myTextEdit.append(QtCore.QString(u'中文'))
5. QString向Python string object和Python Unicode object的转换。
Python中需要用Python string object和Python Unicode object的地方可就不一定可以直接用QString了!!!
QString向Python string object转换可以理解,因为编码不同。
QString向Python Unicode object的转换?需要转换吗?不都是utf16编码吗?
QString是tuf16编码,但是它的实现并非Python Unicode object那样直接的utf16码,而实际是一个QChar串,每个QChar才对应unicode符,所以地位相当但并不相同。
许多英文书籍写到:可以使用str()函数直接将QString转换为Python string object,可以使用unicode()直接将QString转换为Python Unicode object。如《PyQt手册》:
In
order to convert a QString to a Python string object use the Python
str() builtin. Applying str() to a null QString and an empty QString
both result in an empty Python string object.
In
order to convert a QString to a Python Unicode object use the Python
unicode() builtin. Applying unicode() to a null QString and an empty
QString both result in an empty Python Unicode object.
但同样只适用于英文, 具体见下面分别分析。
1)QString向Python Unicode object的转换。
>>> from PyQt4 import QtGui, QtCore
>>> unicode(QtCore.QString('def'))
u'def'
>>> print unicode(QtCore.QString('def'))
def
对于中 文,unicode()必须要指定编码后有效。(这样也只针对直接的QString有效?对于Qt GUI编程中,从QWidget取得的QString无效?)
>>> from PyQt4 import QtGui, QtCore
>>> unicode(QtCore.QString('中文'))
u'xd6xd0xcexc4'
>>> print unicode(QtCore.QString('中文'))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'gbk' codec can't encode character u'xd6' in position 0: il
legal multibyte sequence
指定原始编码后:
>>> unicode(QtCore.QString('中文'),'gbk','ignore')
u'u4e2du6587'
>>> print unicode(QtCore.QString('中文'),'gbk','ignore')
中文
>>>
GUI编程中:
但这种方法在GUI编程中似乎无效?
比如创建一个QLineEdit对象myLineEdit,写入汉字,则:
myText = unicode(self.myLineEdit.text(),'gb2312','ignore')
myText = unicode(QtCore.QString(self.myLineEdit.text()),'gb2312','ignore')
print myText都是乱码.
尝试将 unicode()的参数改为QByteArray,但QString没有toGbk()或toGb2312()函数,只有toUtf8()和 toAsciii()函数,利用下试试:
myText = unicode(self.myLineEdit.text().toUtf8(),'utf8', 'ignore')
myText = unicode(self.myLineEdit.text().toAscii(),'ascii', 'ignore')
因为不是gbk编码,所以打印都还是乱码。
不
过python中一 般从文件、终端、网络数据流或者其它外部输入中读取的都是Python string
object类型,而且向文件、终端、网络也只能输出Python string
object类型。所以这个问题可以跳过,通过下面讲的内容,发现可以在此基础上转为Python string object使用。
2)QString向 Python string object的转换。
A. 第一种方法:
可以直接借助上一步得到的Python Unicode object和encode()函数获得Python string object。
>>> unicode(QtCore.QString('dfd')).encode('gb2312')
'dfd'
>>> unicode(QtCore.QString('dfd')).encode('ascii')
'dfd'
>>>
>>> unicode(QtCore.QString('中文'),'gbk','ignore').encode('gbk')
'xd6xd0xcexc4'
>>> print unicode(QtCore.QString('中文'),'gbk','ignore').encode('gbk')
中文
>>>
B. 第二种方法:
也可利用str():
>>> str(QtCore.QString('def'))
'def'
>>> print str(QtCore.QString('def'))
def
>>>
但是对于中文,直接调 用str()是无效的!
>>> str(QtCore.QString('中文'))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-3: ordin
al not in range(128)
对于str()函数默认以ascii编码转换,而str()函数又只能接受一个参数,改不了别的编码,所以对汉字自然不行。
先用unicode()指定gb2312解码再利用str()呢?:
>>> str(unicode(QtCore.QString('中文'), 'gb2312', 'ignore'))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordin
al not in range(128)
还是----str()函数默认以ascii编码转换!
C. 对于中文考虑第一种方法:
>>> unicode(QtCore.QString('中文'),'gbk','ignore').encode('gbk')
'xd6xd0xcexc4'
>>> unicode(QtCore.QString('中文'),'gbk','ignore').encode('gb2312')
'xd6xd0xcexc4'
>>> print unicode(QtCore.QString('中文'),'gbk','ignore').encode('gb2312')
中文
>>> print unicode(QtCore.QString('中文'),'gbk','ignore')
中文
>>>
GUI编程中:
但是对于前面myLineEdit的情况怎么处理呢?
myText = unicode(self.myLineEdit.text(),'gb2312','ignore')是乱码,encode('gb2312')之后 呢?
myText = unicode(self.myLineEdit.text(),'gb2312','ignore').encode('gb2312')
打印依然是乱码!?
后面尝试将unicode()的参数改为QByteArray、利用QString的toUtf8()得到的虽然不是gbk编码,但是进一步 encode('gb2312')又如何呢:
myText = unicode(self.myLineEdit.text().toUtf8(),'utf8', 'ignore').encode('gb2312')
发现print myText显示正常!!!:
中文
且python方式打开文件后查找该字符串也正常,证明myText是转换成功的Python string object!!!
注意:1)借助 toAscii()函数(除了toUtf8只有这个...)不行?!
myText = unicode(self.myLineEdit.text().toAscii(),'ascii', 'ignore').encode('gb2312')
打印是乱码。
难道PyQt的Ascii和Python的ascii不一样?
2)这种借助utf8码的方式对于直接的QString反而不行!?
>>> unicode(QtCore.QString('中文').toUtf8(),'utf8','ignore').encode('gb2312')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'gb2312' codec can't encode character u'xd6' in position 0:
illegal multibyte sequence
>>> unicode(QtCore.QString('中文 ').toAscii(),'ascii','ignore').encode('gb2312')
''
>>> print unicode(QtCore.QString('中文').toAscii(),'ascii','ignore').encode('gb2
312')
>>>
D. 对于中文考虑第二种方法:
利用QString的toAscii()函数后再使用str()函数:
>>> str(QtCore.QString('中文').toAscii())
'xd6xd0xcexc4'
>>> print str(QtCore.QString('中文').toAscii())
中文
>>>
str(QtCore.QString('中文').toAscii())得到的是ascii编码?尝试将其转为unicode?
>>> unicode(str(QtCore.QString('中文').toAscii())).encode('gbk')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd6 in position 0: ordinal
not in range(128)
>>> unicode(str(QtCore.QString('中文').toAscii()),'ascii').encode('gbk')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd6 in position 0: ordinal
not in range(128)
>>> unicode(str(QtCore.QString('中文 ').toAscii()),'ascii','ignore').encode('gbk'
)
''
>>>
>>> unicode(str(QtCore.QString('中文').toAscii()))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd6 in position 0: ordinal
not in range(128)
难道PyQt的Ascii和Python的ascii不一样?
GUI编程中:
myText = str(self.myLineEdit.text().toAscii())
打印发现还是乱码!?
myText = unicode(str(self.myLineEdit.text().toAscii())).encode('gb2312')
打印发现还是乱码!?
6. 总结:
1)Python string object是原始编码是有区分的,通过 decode('原始编码') 解码得到utf16类型即Python
Unicode object。Python Unicode object原始编码固定是utf16,通过 encode('目的编码')
编码来得到Python string object。
2)
对于英 文,PyQt函数需要QString参数的地方都可以直接用Python string object或者Python Unicode
object。对于中文,利用unicode()函数显示指定gb2312编码进行中文编码转换,转换后的Python Unicode
object可以直接作为QString参数代入。
unicode('中 文', 'gb2312', 'ignore')
3)
对于英文,可以使 用unicode()直接将QString转换为Python Unicode
object,并进一步encode()得到Python string
object,也可以使用str()函数直接将QString转换为Python string
object。对于中文,利用unicode()指定原始编码gbk来解决QString转换为Python Unicode
object问题,但对于GUI使用仍有缺陷,不过无碍;进一步利用encode('gb2
312')得到Python string object,或者结合QString的toUtf8()再利用str()函数;但对于GUI编程str()方法还是不行,只可结合QString的 toUtf8()进行unicode()转换后再利用encode('gb2
312')。
str(QtCore.QString(' 中文').toAscii())
unicode(QtCore.QString('中文'),'gbk','ignore').encode('gb2312')
myText = unicode(self.myLineEdit.text().toUtf8(),'utf8', 'ignore').encode('gb2312')
7. 中文?为什么不用类似C++中Qt的方法解决上面中文的使用?
C++中Qt一般是利用tr()方法翻译(便于国际化),或者简单设置:
QTextCodec::setCodecForTr(QTextCodec::codecForName("GB2312"));
QTextCodec::setCodecForCStrings(QTextCodec::codecForName("GB2312"));
QTextCodec::setCodecForLocale(QTextCodec::codecForName("GB2312"));
1)前者PyQt4中对应是QCoreApplication.translate(),比如pyuic4自动生成的.py文件中可以看到:
def retranslateUi(self, mainWindow):
mainWindow.setWindowTitle(QtGui.QApplication.translate("mainWindow", "名称", None, QtGui.QApplication.UnicodeUTF8))
QtGui.QApplication.UnicodeUTF8继承自QCoreApplication的
enum Encoding { CodecForTr, UnicodeUTF8, DefaultCodec }
但这需保证写入的汉字是UnicodeUTF8编码,比如前面myLineEdit读入的ini文件中汉字就需用utf8表示?CodecForTr是使
用QTextCodec.codecForTr() (Latin-1 if none has been
set).但后面可看到PyQt4中无code包?
PyQt4手册说明如下:
Unfortunately, because of the way Qt implements tr() (and trUtf8())
it is not possible for PyQt to exactly reproduce its behaviour. The PyQt
implementation of tr() (and trUtf8()) uses the class name of the
instance as the context. The key difference, and the source of potential
problems, is that the context is determined dynamically in PyQt, but is
hardcoded in Qt. In other words, the context of a translation may
change depending on an instance's class hierarchy.
The PyQt behaviour is unsatisfactory and may be changed in the future.
It is recommended that QCoreApplication.translate() be used in
preference to tr() (and trUtf8()). This is guaranteed to work with
current and future versions of PyQt and makes it much easier to share
message files between Python and C++ code. Below is the alternative
implementation of A that uses QCoreApplication.translate():
class A(QtCore.QObject):
def hello(self):
return QtCore.QCoreApplication.translate("A", "Hello")
2) 但后者方法在PyQt中未能成功:
QtCore.QTextCodec.setCodecForTr(QtCore.QTextCodec.codecForName("gb2312"))
QtCore.QTextCodec.setCodecForCStrings(QtCore.QTextCodec.codecForName("gb2312"))
QtCore.QTextCodec.setCodecForLocale(QtCore.QTextCodec.codecForName("gb2312"))
后证实PyQt4中无code包?ascii也没有?...
if not QtCore.QTextCodec.codecForName("gb2312"):
print 'no code'
PyQt的QString和python的string的区别的更多相关文章
- python的string用法
s.strip().lstrip().rstrip(',') S.lower() #小写 S.upper() #大写 S.swapcase() #大小写互换 S.capitalize() #首字母大写 ...
- Python 常用string函数
Python 常用string函数 字符串中字符大小写的变换 1. str.lower() //小写>>> 'SkatE'.lower()'skate' 2. str.upper ...
- python中string.casefold和string.lower区别
string.casefold和string.lower 区别 python 3.3 引入了string.casefold 方法,其效果和 string.lower 非常类似,都可以把字符串变成小写, ...
- python中string模块各属性以及函数的用法
任何语言都离不开字符,那就会涉及对字符的操作,尤其是脚本语言更是频繁,不管是生产环境还是面试考验都要面对字符串的操作. python的字符串操作通过2部分的方法函数基本上就可以解决所有的字符串 ...
- python中string格式化
python中可以对string, int, float等数据类型进行格式化操作.下面举例来说明一些常用操作. 先贴出 python 对 String Formatting Operations 讲解 ...
- Qstring和String的区别
QString qTest; std::string sTest = qTest.toStdString(); qTest = QString::fromStdString(sTest); //进入两 ...
- python2/3中 将base64数据写成图片,并将图片数据转为16进制数据的方法、bytes/string的区别
1.python2将base64数据写成图片,并将数据转为16进制字符串的方法 import binascii img = u'R0lGODlhagAeAIcAAAAAAAAARAAAiAAAzABE ...
- C字符串和C++中string的区别 &&&&C++中int型与string型互相转换
在C++中则把字符串封装成了一种数据类型string,可以直接声明变量并进行赋值等字符串操作.以下是C字符串和C++中string的区别: C字符串 string对象(C++) 所需的头文件名称 ...
- java基础知识回顾之---java StringBuffer,Stringbuilder与String的区别
public class StringBuilderTest { /** * StringBuffer和Stringbuilder :使用与内容可以被修改的字符串 * 与String的区别:Strin ...
随机推荐
- EF Ccore 主从配置 最简化
业务需要 配置一主多从数据库 读写分离 orm用的ef core , 把思路和代码写下 1. 配置2个数据库上下文 ETMasterContext ETSlaveContext(把增删改功能禁用掉 ...
- HDU 1180 诡异的楼梯(超级经典的bfs之一,需多回顾)
传送门: http://acm.hdu.edu.cn/showproblem.php?pid=1180 诡异的楼梯 Time Limit: 2000/1000 MS (Java/Others) ...
- AngularJS 表格(带有CSS样式)
<!DOCTYPE html><html><head><meta http-equiv="Content-Type" content=&q ...
- 关于ProjectServer调用PSI 报Error GeneralReadOnlyColumn (20005) - column TS_ACT_FINISH_DATE错的解决方案
TimesheetDataSet Table Actuals Row: TS_LINE_UID='f4b970f8-fb03-44d1-9997-cd31da42cb09' TS_ACT_START_ ...
- ATK系列库介绍
1.一个完整支持分布式服务框架: 2.代码生成工具,可快速生成基于服务框架的应用: 3.其他支持库 4.完整代码见https://github.com/azthinker 目标:使应用开发,低代码.高 ...
- 零基础Python知识点回顾(二)
开始了,继续说!字符串替换,就是预留着空间,后边再定义要填上什么,这种叫字符串格式化,其有两种方法: % 和 format %s 就是一个占位符,这个占位符可以被其它的字符串代替 >&g ...
- oracle删除一个表内的重复数据,
查询以及删除一个数据库表内的重复数据. 1.查询表中的多余的重复记录,重复记录是根据单个字段来判断的. select * from biao where id in (select id from b ...
- 插入排序_C语言_数组
插入排序_C语言_数组 #include <stdio.h> void insertSort(int *); int main(int argc, const char * argv[]) ...
- c#常用数据库封装再次升级
c#封装的几类数据库操作: 1.sqilte 2.berkeleydb 3.一般数据库 4.redis 包含其他项目: 1.序列化 2.通信 3.自定义数据库连接池 再次升级内容: 1.新增redis ...
- 揭开redux,react-redux的神秘面纱
16年开始使用react-redux,迄今也已两年多.这时候再来阅读和读懂redux/react-redux源码,虽已没有当初的新鲜感,但依然觉得略有收获.把要点简单写下来,一方面供感兴趣的读者参考, ...