环境:Ubuntu, Python 2.7 基础知识 这个程序涉及到的知识点有几个,在这里列出来,不详细讲,有疑问的直接百度会有一堆的. 1.urllib2 模块的 request 对像来设置 HTTP 请求,包括抓取的 url,和伪装浏览器的代理.然后就是 urlopen 和 read 方法,都很好理解. 2.chardet 模块,用于检测网页的编码.在网页上抓取数据很容易遇到乱码的问题,为了判断网页是 gtk 编码还是 utf-8 ,所以用 chardet 的 detect 函数进行检测.没…
json_encode($data, JSON_UNESCAPED_UNICODE)在创建微信卡券,发送数据时需要这个…
JavaScript中,使用Unicode 需要 \u 进行转义,格式 "\u十六进制" console.log(\u0031); console.log(\u0041); // A console.log(\u0061); // a console.log(\u2620); // 骷髅 console.log(\u2630); // 卦象 console.log(\u2640); // 性别符号 html中,使用Unicode 需要使用十进制编码,格式 "&#十进制…
python encode和decode函数说明 字符串编码常用类型:utf-8,gb2312,cp936,gbk等. python中,我们使用decode()和encode()来进行解码和编码 在python中,使用unicode类型作为编码的基础类型.即 decode              encode str ---------> unicode --------->str u = u'中文' #显示指定unicode类型对象u str = u.encode('gb2312') #以…
ord()函数:字符串——>ascll编码 chr()函数:ascll编码——>字符串 #函数 for i in range(ord('d'),ord('f')+1):#拿到d和f对应的ascll编码值:range(100,102+1) print(i)#打印100,101,102 print(chr(i))#chr将数字转换为字母,打印d,e,f 实例: 有a,b,c三个人,d,e,f三款苹果手机!a说:我的手机不是d款:b说:我的手机不是d款和f款 问:三人各持有的是哪款手机 for i…
EXE或者DLL写好了,要开始写函数说明文档了,可是有时里面的函数太多,怎么能自动列出来呢?在DSAPI中提供了该功能(目前没有做参数类型导出,以后有时间会添加). 先准备一个已经写好的EXE或DLL,注意,EXE或DLL必须是.NET编写的,EXE不能加壳,两者均可以是经混淆处理过的.注意,确保你的程序当前.net framework版本高于或等于目标EXE/DLL的.net framework版本. 如 调用函数 DSAPI.反射.导出EXEDLL函数到字符串(EXE/DLL路径(或程序集)…
今天使PHP开发用到了Unicode的编码与解码,将unicode转为中文,再将中文转Unicode这样的操作是非常常见的,所以小编将这两个unicode中文互转函数给作为一个笔记保存起来,非常的简单,会用就行了. 1:下面来看PHP Unicode编码方法,将中文转为Unicode字符,例如将新浪微博转换为unicode字符串,代码如下: function UnicodeEncode($str){ //split word preg_match_all('/./u',$str,$matches…
原文:http://my.oschina.net/leejun2005/blog/343353 目录[-] 1.问题:mysql 遇到某些中文插入异常 2.原因:此 utf8 非彼 utf8 3.解决方案 3.1 升级 mysql 版本,并将utf8字符集升级到utf8mb4 3.1.1 直接修改表结构 3.1.2 修改数据库默认配置 3.2 强行过滤掉生僻字符串 3.2.1 shell 过滤 3.2.2 java 中的过滤操作 3.3 避开客户端乱码:二进制存储与查询 4.应用.系统对 utf…
昨天晚上在整理hashlib和hmac模块的时候,又看到了编码这块的内容.越看越觉得之前的理解不对,然后想研究一下自己想出来,但是越陷越深..总之把昨晚+今天一个上午的这些自己想到的东西写下来 ● 几个概念(あくまで是我为了统一本篇中的术语,至于业界是不是这么说我不敢保证..) 编码: 计算机认识的其实只有二进制数据,而我们之所以能够在计算机上处理自然语言和自然字符主要是因为有一种对应关系可以映射二进制数据和自然字符.这种映射就是广义上的编码.具体到中文上来,计算机发展源于英美,最开始的编码只要…
python比较坑的一个点:意义完全变了的两个函数 首先 常用的编码方式有3种,utf-8:  常用的传输和存储格式,Unicode的一种简化 Unicode:包括了所有可能字符的国际统一编码 GBK:中文的一种编码标准,包括中文和英文 在python2中  解码函数decode是 其他编码(utf-8或GBK或其他)——>Unicode编码   用法:u=str.decode('utf-8') 括号里是原编码格式 encode是 Unicode编码——>其他编码(utf-8或GBK或其他) …