GNU-libiconv编码转换库的使用举例

继GDAL库.PROJ库.HDF5库.TINYXML库之后,手上进行的项目又让我碰到了ICONV库.之前花了2天时间没有搞定,在甲方一直催促下,今天又捡起来搞搞,搞了一天最终搞定了.相关心得记录例如以下: ICONV库的主要作用是进行各个国家不同编码方式之间的转换. 仅仅要支持的有:Unicode[utf8.utf16等].中国标准[GBK.GB18030.BIG5.EUC-CN等].欧洲标准[ASCLL.CP.Mac等].我这个项目中涉及到的就是utf8与GBK之间的转换. 早期的ICONV库…

libiconv字符集转换库在C#中的使用

<libiconv字符集转换库用法>一文中说到了libiconv能够实现不同字符集的转换. 比方GBK转BIG5等.在项目中由于须要,找到这个库.但是这个库在C#中没有非常好的支持.只是,想着既然是C++的库.那仅仅要动态载入DLL的接口就好了.但是调用并不顺利.传进去的IntPtr或者byte数组总是拿不到数据.后面回到了C++的方式去调用.几经调试,总算找到了原因. 是iconv接口在转换完毕后.指针的位置往后移了.而在C#中调用DLL后回来的指针,已经是移动后的,所以拿不到所要的数据.…

PHP字符编码转换库iconv的一个细节

先来看代码 <?php $charset = 'GBK'; $str = '中华人民共和国中华人民共和国中华人民共和国中华人民共和国'; ; $str2 = iconv('UTF-8', $charset, $str); $str3 = substr($str2, 0, $size);//.$str2; $s = iconv($charset, 'UTF-8//IGNORE', $str3); var_dump($s); 这里GBK因为一个汉字字符算2个英文字符所以当长度为17的时候会有字符…

iconv字符编码转换

转自 http://blog.csdn.net/langresser_king/article/details/7459367 iconv(http://www.gnu.org/software/libiconv/)是一个开源的字符编码转换库,可以“方便”的完成几乎所有的编码转换工作.说简单是因为,它常用的接口就三个,iconv_open iconv iconv_close,但是即便是只有三个接口,要想使用正确也不容易.这里把一些基本概念和使用细节记录下来,希望能成为一篇最实用的入门教程.…

[NodeJS] Node.js 编码转换

Node.js 自带的 toString() 方法不支持 gbk,因此中文转换的时候需要加载第三方库,推荐以下两个编码转换库,iconv-lite 和 encoding. iconv, iconv-lite 和 encoding 是什么? iconv:是在类 Unix 系统中一种标准字符集转换接口,用于在不同字符集编码之间进行转换,最早出现在 HP-UX 系统中. iconv-lite:是 iconv 的纯 js 实现,支持的编码包括 node.js 原生编码:utf8, ucs2, ascii…

Node.js 编码转换

Node.js自带的toString()方法不支持gbk,因此中文转换的时候需要加载第三方库,推荐以下两个编码转换库,iconv-lite和encoding. iconv, iconv-lite和encoding是什么? iconv:是在类Unix系统中一种标准字符集转换接口,用于在不同字符集编码之间进行转换,最早出现在HP-UX系统中. iconv-lite:是iconv的纯js实现,支持的编码包括node.js原生编码:utf8, ucs2, ascii, bin…

erlang中字符编码转换(转)

转自:http://www.thinksaas.cn/group/topic/244329/ 功能说明: erlang中对各种语言的编码支持不足,此代码是使用erlang驱动了著名的iconv编码库来对字符进行编码转换处理. 文件说明: iconv_erl.c和iconv.h 是erlang字符编码模块的driver,作用是对iconv进行封装.编译后生成iconv_erl.dll,供iconv.erl使用. iconv_makefile.win32 windows上编译iconv_erl.dl…

关于JS的编码转换问题

在进行JS开发过程中,尤其是在开发报表时,报表已集成到Web页面中,通过在页面传递参数至报表中时,会发现有时某些参数值,传递到报表中是显示为问号或乱码等等一系列不能正常显示的情况. 这是由于浏览器和报表服务器的编码不同,字符多次进行编码转换时出现错误导致字符的显示出现乱码,尤其是中日韩文和特殊字符更容易出现乱码问题. 以开发报表软件FineReport为例,在给报表服务器发送请求之前,对URL或者只对URL里面的参数名字和参数值,进行cjkEncode的编码,该方式兼容了各种不同的字符集,如IS…

golang编码转换

在网上搜索golang编码转化时,我们经常看到的文章是使用下面一些第三方库: https://github.com/djimenez/iconv-go https://github.com/qiniu/iconv 如果我们在windows下使用这个库,会看到错误: iconv.go:6:20: fatal error: iconv.h: No such file or directory compilation terminated. 这是因为需要系统有 iconv.h 文件. linux.ma…

理解perl的编码转换——utf8以及乱码

工作需要,闲暇之余,仔细研究了一下脚本乱码的问题 1. vim新建的文件 1)在linux命令行 vim命令建立的文件,如果内容中不出现中文,默认是ASCII.那么用notepad++打开的时候,就是“以ASC格式编码”.如下面的: 99.txt2) 如果vim在建立文件的时候,故意在文件中插入中文(我的secureCRT是utf8的),此时文件内容不会乱码,而且vim保存文件后,再用vim打开也会看到中文,没有乱码.我猜测应该是Linux碰到中文,自动就转换成文档应该用utf8而不是asc保存…

（转）PHP下编码转换函数mb_convert_encoding与iconv的使用说明

之--http://www.jb51.net/article/21451.htm mb_convert_encoding这个函数是用来转换编码的.原来一直对程序编码这一概念不理解,不过现在好像有点开窍了. 不过英文一般不会存在编码问题,只有中文数据才会有这个问题.比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码. mb_convert_encoding的用法…

PHP下编码转换函数mb_convert_encoding与iconv的使用说明

mb_convert_encoding这个函数是用来转换编码的. 不过英文一般不会存在编码问题,只有中文数据才会有这个问题.比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码. mb_convert_encoding的用法见官方: http://cn.php.net/manual/zh/function.mb-convert-encoding.php 做一个GBK T…

lua编码转换

lua编码转换, 这个要记录下:http://www.lpfrx.com/archives/4918/ ,总是觉得lua没python甘方便,应该说没这么顺手吧,可能先入为主吧,python库多, 编码转换方便,但可能是刚学lua不久吧,总觉得lua编程没这么舒服.…

python 编码转换(转)

主要介绍了python的编码机制,unicode, utf-8, utf-16, GBK, GB2312,ISO-8859-1 等编码之间的转换. 常见的编码转换分为以下几种情况: 自动识别字符串编码可以使用 chardet 模块自动识别字符创编码 chardet 使用方法 unicode 转换为其它编码(GBK, GB2312等) 例如:a为unicode编码要转为gb2312.a.encode('gb2312') # -*- coding=gb2312 -*- a = u"中文&qu…

php字符编码转换之gb2312转为utf8（转）

在php中字符编码转换我们一般会用到iconv与mb_convert_encoding进行操作,但是mb_convert_encoding在转换性能上比iconv要差很多哦.string iconv ( string in_charset, string out_charset, string str ) 注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符…

windows下go编码转换问题

github上有两个package做编码转换,都是基于iconv,用到了cgo,在linux下没有问题,在windows下用,非常麻烦.采用mingw安装libiconv也不行,一直提示找不到libiconv方法. 最终找到一个官方实现(纯go实现):https://code.google.com/p/go/source/checkout?repo=text gbk转utf-8示例: func gbk2utf8(str byte[]) ([]byte, error) { return iouti…

java 自定义实现base64编码转换

1.base64编码转换所谓base64编码,即按照规则把字符转化为"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"这个字符集中的字符.具体规则如下: a.把每3个字节为一组,共24bit.每6bit一小组,每组前面加00,变为32bit.这样3个字节被扩展成了4个节,按照上面字符集编码. b.如果字节数不足3: 1)当字节数为2时,共16bit.每6bit一小组,最后一组即只有4bit,则不止前面加…

python 编码转换专题

使用vbs脚本进行批量编码转换

使用vbs脚本进行批量编码转换最近需要使用SourceInsight查看分析在Linux系统下开发的项目代码,我们知道Linux系统中文本文件默认编码格式是UTF-8,而Windows中文系统中的默认编码格式是Gb2312.系统内的编码格式有所区别倒无伤大雅,关键的是SourceInsight竟不支持UTF-8,导致项目代码内的中文注释全部乱码! 既然SourceInsight不支持UTF-8编码的文件,那我们就得想办法将UTF-8的代码文件转化为GB2312编码的.首先想到的是到网上搜一下“…

帆软报表FineReport数据库连接编码转换

1. 问题描述数据库会以某种编码方式保存与读取数据,FineReport解析时默认使用GBK字符集,若数据库端编码与设计器端编码不一致时,就会导致中文及特殊字符的乱码. FineReport在定义数据连接时可以进行编码转换,将数据库编码(数据库中数据表的编码方式)转换成我们想要的编码方式,编码中包含了基本的数据库编码,如:GBK.BIG5.ISO-8859-1.UTF-8.UTF-16.EUC-JP.EUC-KR. 2. 编码转换示例 2.1 问题描述若使用的是Oracle9i或者更低版本的…

编码转换的处理 DreamWeaver SC6 打开会出现javacsript出现问题的处理

编码转换的处理: 打开DW后,修改里面有个"页面属性": 点击页面属性,会弹出一个窗口,点击"标题/编码",在"编码"里面选择你要转换的编码,在小方框里打上√,点击"确定"结束. DreamWeaver SC6 打开会出现javacsript出现问题的处理: 打开C盘,找到这个路径下的 WinFileCache-961714FC.dat 文件,把这个文件删除,如图:…

C++ 字符编码转换类

记录一下C++ 编码转换的函数: #pragma once #include "afx.h" #define DEFAULT_CODE 0 #define CHINESE_SIMPLIFIED 1 #define CHINESE_TRADITIONAL 2 class CChineseConvertor: //public CObject { public: CChineseConvertor(void); ~CChineseConvertor(void); LPSTR Big52GB…

[2015.02.02]文本编码转换专家 v2.6

软件名称:文本编码转换专家最新版本:v2.6操作系统:XP/2003/Win7/Win2008软件介绍:文本编码转换专家,界面简洁易用,功能强大实用.自动识别文件编码,有效转换成目标编码.真正的多线程管理,效率更高,可控性更好. 下载地址: http://www.onlinedown.net/soft/573823.htmhttp://www.crsky.com/soft/69051.html 淘宝购买地址:http://item.taobao.com/item.htm?spm=a1z10.1.…

python 字符编码转换

#!/bin/env python#-*- encoding=utf8 -*-# 文件头指定utf8编码还是乱码时,使用下面方式指定# fix encoding problem import sys reload(sys) sys.setdefaultencoding('utf8') # 设置编码sys.getdefaultencoding() # 获取编码-------------------------------------------------------sys.path.append…