两个"�"="锟斤拷"?】的更多相关文章

关于作者:程序猿石头(ID: tangleithu),现任阿里巴巴技术专家,清华学渣,前大疆后端 Leader.欢迎关注,交流和指导! 本文首发于微信公众号,原文链接,转载请全文保留. 以一首七言绝句作为开篇: 手持两把锟斤拷 口中疾呼烫烫烫 脚踏千朵屯屯屯 笑看万物锘锘锘 � 为何物? 在上次石头哥发的这篇文章中 -- 你可能也会掉进这个简单的 String 的坑,讲述了因字符编码问题而连续踩坑的经历,文中有一个神奇的字符 "�". 其实,这个 "�" 真是无处不…
漫话:如何给女朋友解释什么是"锟斤拷"? ​ 周末女朋友出去逛街了,我自己一个人在家看综艺节目,突然,女朋友给我打来电话. 过了一会,女朋友回来了,她拿出手机,给我看了她在超市拍的照片:  要想知道什么是乱码,需要先从计算机编码说起. 字符编码和ASCII 我们经常看一些谍战剧,谍战剧里敌特.地下党员以及八路军各部间发送情报的时候,一般都是通过电报发送的,电报在传递的过程中,需要发报员用电键发出长短不一的电码,收报员就会听到电报机发出的滴滴滴答答答的声音.其实电报发出的声音都是&qu…
编译tesseract - ocr时 各种不通过 也很疑惑,完全按照官方指导来的啊 首先以为是vs的编码问题,随切换选项-切换Unicode或多编码字符集,但仍无效. 定位到乱码的文件,用notepad++ 打开,查看编码,是“”“以UTF-8无BOM格式编码”,切换成utf-8编码,将所有有中文的编码都切换了(还好只有两个),然后编译既然成功了. 然后新建了一个工程,一路默认创建.打开默认创建的cpp文件,是ANSI编码,没有任何文件头信息.可能是vs对于无bom的utf8不认识吧,默认把它当…
首先要知道\xef\xbf\xbd是啥东西 >>> u'\uFFFD'.encode('utf-8') '\xef\xbf\xbd' 由此我们可以知道\xef\xbf\xbd是utf8编码的'\uFFFD',那么这个'\uFFFD'是啥东西呢? 原来是因为Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER. >>> "…
以前一直是在服务器上tar打包压缩,下载到本地电脑上,再上传到另外一台服务器上,再解压. 其实使用scp命令就可以直接对拷文件或者文件夹了. scp就是secure copy,是用来进行远程文件拷贝的.数据传输使用ssh1,并且和ssh1使用相同的认证方式,提供相同的安全保证.与rcp不同的是,scp会要求你输入密码如果需要的话. 最简单的应用如下:  scp  本地用户名@IP地址:文件名1   远程用户名@IP地址:文件名2 [本地用户名@IP地址:] 可以不输入,可能需要输入远程用户名所对…
经验一,将几个页面公用的数据,和方法进行封装,形成一个baseActivity的类: package com.ctbri.weather.control; import java.util.ArrayList; import java.util.HashMap; import com.ctbri.weather.domain.AirInfo; import com.ctbri.weather.domain.AlertInfos; import com.ctbri.weather.domain.L…
目录 Python2.7字符编码详解 声明 一. 字符编码基础 1.1 抽象字符清单(ACR) 1.2 已编码字符集(CCS) 1.3 字符编码格式(CEF) 1.3.1 ASCII(初创) 1.3.2 MBCS/DBCS/ANSI(本地化) 1.3.3 Unicode(国际化) 1.4 字符编码方案(CES) 1.5 中文字符乱码(Mojibake) 1.5.1 未指定编码格式 1.5.2 错误指定编码格式 1.5.3 过度指定编码格式 1.5.4 解决方案 二. Python2.7字符编码…
#encoding=utf-8 ''' 一家商场在降价促销.如果购买金额50-100元(包含50元和100元)之间,会给10%的折扣,如果购买金额大于100元会给20%折扣.编写一程序,询问购买价格,再显示出折扣(10%或20%)和最终价格 ''' def print_zekou(): aount = int(input("请输入你购买的金额:")) if aount < 50: print("不好意思你购买的金额没有折扣,需要支付的金额为:",aount)…
Python27字符编码详解 声明 一 字符编码基础 1 抽象字符清单ACR 2 已编码字符集CCS 3 字符编码格式CEF 31 ASCII初创 311 ASCII 312 EASCII 32 MBCSDBCSANSI本地化 321 GB2312 322 GBK 323 GB18030 33 Unicode国际化 331 UTF-8 332 UTF-16 333 UTF-32 334 字节序问题 335 编码适用场景 4 字符编码方案CES 5 中文字符乱码Mojibake 51 未指定编码格…
这里记录过去一周,我看到的值得分享的东西. 一方面是整理记录一下自己一周的学习,另一方面也是期待自己有更多的输出,有更多的价值. 周刊开源(Github:wmyskxz/weekly),欢迎提交 issue,投稿或推荐精彩内容. 题图故事:"世纪逼空大战" 前段时间,美股 GameStop 游戏驿站上演了一场 "世纪逼空大战". 美股的散户们疯狂抱团,活活把一支行将退市的垃圾股,从 3 美元拉到 300 多美元,暴涨 100 倍,把华尔街的资本家们彻底按在地上反复摩…