Unicode基本概念】的更多相关文章

Unicode 编码概念 Unicode 编码可能是我们日常开发中接触最多的字符编码方式之一,其它常见的中文编码方式还包括 GB2132-80 / GB13000 / GBK / GB18030 .在大部分的开发中,最常见.最常用的还是 Unicode ,它在各种编程语言中的支持相对比较完善,现在的网站和BS架构的应用,基本上都使用 Unicode .因此,除非是特定的国际化需要, Unicode 能满足大部分的开发需要. 但要注意,Unicode 这个名称本身只是一个笼统的称呼.更深入细节来说…
Unicode是计算机可以支持这个星球上多种语言的秘密武器.通过使用一个或者多个字节来表示一个字符的方法突破了ASCII的限制.Unicode可以表示超过90000个字符. 使用方式:a=u'hello' #Unicode String String的内建函数str()和chr()并没有升级来处理Unicode,新的内建函数unicode()和unichar()可以看做是Unicode版本的str()和chr(). Codec是什么? codec是COder/DECoder的首字母组合.他定义了…
说到编码,得先从ASCII编码讲起.ASCII编码是由美国人发明,美国的字符不超过255个,所以ASCII编码使用了8bit 即一个字节来存储字符.由于汉字的数量远超255个,所以中国自己发明了一个GB2312编码来表示汉字,一般的汉字使用2个字节,对于一些生僻的汉字则使用更多的字节来表示,当然,GB2313编码是可以兼容ASCII码的. 然后,日本,韩国等等国家也自己发明了一套编码方法,这时候又出现了一个新的问题.如果一篇文章里面,即有中文,又有日文的话,无论使用中文的编码方法还是使用日文的编…
英文原文标题:what-every-javascript-developer-should-know-about-unicode (译者注:本文含有Unicode辅助平面的特殊字符,部分浏览器可能无法正确显示,但并不影响理解文章内容.) 在动笔写这篇文章之前,我得先忏悔一下:在很长一段时间里我对Unicode充满了恐惧. 每次遇到需要Unicode知识的编程问题时,我总是找一个hack方案来解决,但解决方案的原理我也不懂. 直到遇见一个需要深入了解Unicode知识才能解决的问题,我才停止了这种…
前面<字符集编码(上):Unicode 之前>我们讲了在二十世纪九十年代 Unicode 出现之前各厂商和标准化组织为了应对不同语言文字的编码需求而设计了各种互不兼容的字符集编码标准,这使得软硬件开发商在处理多语言环境时相当棘手.为了解决字符集编码各自为政的乱象,一些利益相关公司开始凑到一起试图设计一种新型的.可囊括全世界所有字符的统一编码标准. 开端 1987 年,苹果(Apple)和施乐(Xerox)两家公司的三个技术人员凑到一起,着手研究开发通用字符集的可行性.在 1987 年末到 19…
一提到C语言,在偶这个始终的C语言菜鸟眼里,是个神奇的语言.经过了近半世纪的历史,多少技术湮灭在信息时代的长河中,C语言却依然在TIBOE排行榜中笑傲群雄. 本文是谈.NET开发者看来,C语言有什么特点,我们能从C语言中了解些什么.个人觉得,C++过于复杂了,和.NET走的完全是两条路,对我们没有多大可借鉴启发之处. 操作系统和硬件驱动主要都是C语言编写的,比如Windows系统.C语言可以自由地通过嵌入系统头文件,调用Windows函数,创建窗口,画图操作文件等等.而.NET要调用这些函数,必…
    面向初学者介绍Python相关的一些工具,以及可能遇到的常见问题. 原文出处 原文作者:八八年出生的男性,互联网上常用id是 jagttt .目前正从事 IT 行业的工作.业余爱好是动漫游加电影音乐. 引言 在这里我假设你已经看完了一篇Python教程,基本熟悉了Python的结构和语法,在命令行下的Python互动环境中尝试过大部分Python的语句,觉得Python是个不错的语言准备继续下去.那么本篇文章会就Python实际运用中相关工具的选择,包括IDE,调试套件,第三方库管理工具…
BOM——Byte Order Mark,就是字节序标记   在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF.而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中.UCS规范建议我们在传输字节流前,先传输 字符"ZERO WIDTH NO-BREAK SPACE".这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的:如果收到FFFE,就表明这个字节流是Little- Endian…
彻底解密C++宽字符(一) 转:http://club.topsage.com/thread-2227977-1-1.html 1.从char到wchar_t “这个问题比你想象中复杂” 从字符到整数 char 是一种整数类型,这句话的含义是,char所能表示的字符在C/C++中都是整数类型.好,接下来,很多文章就会举出一个典型例子,比如,'a'的数值就是0x61.这种说法对吗?如果你细心的读过K&R和BS对于C和C++描述的原著,你就会马上反驳道,0x61只是'a'的ASCII值,并没有任何规…
对C++ Local的经典分析 本贴转载自:再别流年的技术实验室 文章地址: http://kittsoft.xp3.biz/?p=86 “这个问题比你想象中复杂”(我也学下BS的风格,虽然这句话是我自己临时想说的.^^)从字符到整数char是一种整数类型,这句话的含义是,char所能表示的字符在C/C++中都是整数类型.好,接下来,很多文章就会举出一个典型例子,比如,’a' 的数值就是0×61.这种说法对吗?如果你细心的读过K&R和BS对于C和C++描述的原著,你就会马上反驳道,0×61只是’…