1.什么是编码 ,为什么要编码

先前从没有思考这么深入的问题,觉得一切理所当然,直到有一天java的乱码让我跪了,他不在听我的话,到处是乱码,这次我不打算放过它,我要收拾了它。

大家都知道,文本文件,存储在硬盘上,都是一串二进制  ,01的组合,它本身是不携带不论什么,哪怕一丁点,信息告诉文本编辑器 hi哥们儿,我是GBK编码,我是UTF-8编

码,我是。。。。。。。

它很easy,就是01的组合,他不知道自己是什么,所以我们仅仅有知道他是什么然后才干正确的编辑合适用它,首先看个小样例。

这是一个文本文件,他的二进制形式就是一串01

当我我用的终端的编码是GBK显示时(第一次)

当我用UTF-8时(第二次)

他就是这么简单 有是这么无常,非常幸运,这一串01不管是在GBK编码,还是在UTF-8中都是有效字符也就是说按UTF-8的编码规则它代表

”汉“   而假设依照GBK编码规则来解析呢他又是    ” 姹 “  ,这就是根源了,编码和解码用的不是一种码。所以大多数情况下你都搞不懂 好端端的文档怎么就乱了码。 这就是需

要编码的原因了。 二进制文件一串01电脑认得可是对他来说就是01没有意义。所以要把它翻译成大家能识别的东西。一种编码编码在我看来就是一种映射, 也就是向刚才所说

的GBK环

境下 它映射成一种东西,UTF-8,环境下它映射成还有一种东西,可是本质他俩有是一个东西,那客官又问了 ,明明再UTF-8和GBK环境下都一样,比方说a,这就说的到了,编

码与编码之间的兼容问题了,

想探索的朋友自己能够探索下,各个编码的规则及兼容性,这里就不多说了。

2. 上手编码

写java文件,就先来个helloworld

这是同一个文件 我在不同编码环境下查看,看到的东西是不一样的我的系统是Ubuntu 12.04 默认编码UTF-8  但是提前声明,我这个文件但是GBK编码的所以以GBK形式的编

码查看才有意义,张三 又立了功,下边来编译我的这个HelloWorld 文件,看看有什吗奇迹?

我去,不活啦 helloWorld 都搞不定,这都能出错,这日子没法过了。只是别着急,看错误, 这个字符(当然这里不是张三代表的字符找不到,而是再GBK里代表张三的0101

二进制串在UTF-8里找不到映射所以它没法解析,大家能够了解一下UTF-8的编码规则)UTF-8里找不着,没错  找不着就对了,你不是一次编译到处执行吗?编译都过不去怎么

搞,别着急 javac 里有一个參数,-encoding <encoding>       Specify character encoding used by source files  也就是说你告诉javac 你这个java源文件是什么样的编码,你别给

搞错了,你要是搞错了,幸运的,编译只是去告诉你哪里有问题,要是不幸的      汉  就变成了    姹 啦 想想就可怕   所以不报错并不代表程序没有问题 ,不信你试试,我刚才说

过,我的系统默认是UTF-8 所以没有编译过去这个是GBK编码的源文件,大多数人用的还是windows,并且又安装了中文语言包,所以默认编码大都GBK所以也就行正常编译

GBK编码的源文件,所以一般没有问题,但大多数程序终于上线执行的环境但是linux啊 ,全部大家设置虚拟机參数是-Dfile.encoding=GBK 这个是谁也不敢偷懒的。

(只是这里说这个还有点早)

当我加上这个參数 编译顺利通过。

感觉到非常神圣,执行我的helloWord

UTF-8环境下为

好兴奋啊  最终出来了

GBK环境下执行(这是大多数产生乱码的原因)

这不科学,怎么又乱了 神啊

大家肯定没有忘 java的class文件是什么编码的啊 Unicode对吧 所以张三这个字符串 所以编译完了 ,他就不是GBK了 全部的无论是什么编码的源文件,变成class文件编码都一样,你没告诉JVM使用什么编码,所以它默认UTF-8,所以张三被解析成UTF-8编码相应的一串二进制,但你的输出环境又是GBK所以。。。。

所以我老老实实的加上了 (这个命令行环境仍然是GBK)

System.out中的这个out是什么?PrintStream  是个输出流啊(默认是流向控制台当然你可已通过 System.setOut(PrintStream out)来让他流向别处,比方文本,然后用editplus打

开看下,通过设置不同的解码,来看不同的显示,当然不是必需这样)  打印到控制台,这个流你打算以什么编码来展示它,GBK环境下肯定是以GBK的形式展示吧,但是第一次是乱码为

什么,JVM是这样想

得,我有一个Unicode编码的张三在这里,我在说一下我的系统UTF-8在我没告诉JVM以什么编码规则编码时,它肯定使用UTF-8来编 你就会得到一个输入流 这个输入流是一串

00111二进制代表UTF-8下的张三,而到了输出到屏幕这里 屏幕(这里就是输出流流向的地方)不吃这一套 这一串00001111不代表张三,代表上边的那三个我也不太认识的字

(汗颜啊),所以咱得告诉虚拟

机,我要的张三是GBK编码的张三,我要的一串二进制相应GBK里的张三,所以加上个这个就好了。先写到这里吧!再晚赶不上二路汽车了。

下次再写个关于IO的编码的那个我感觉比这个简单点。(配合学习java的一些和编码相关的类效果更加)

先写到这里 ,祝大家 国庆节玩好。不要忘了 撸两行代码 怡怡情,由于几天不见,她没准就把你忘了。

深入解析java乱码的更多相关文章

  1. Atitit 表达式原理 语法分析 原理与实践 解析java的dsl  递归下降是现阶段主流的语法分析方法

    Atitit 表达式原理 语法分析 原理与实践 解析java的dsl  递归下降是现阶段主流的语法分析方法 于是我们可以把上面的语法改写成如下形式:1 合并前缀1 语法分析有自上而下和自下而上两种分析 ...

  2. 转:二十一、详细解析Java中抽象类和接口的区别

    转:二十一.详细解析Java中抽象类和接口的区别 http://blog.csdn.net/liujun13579/article/details/7737670 在Java语言中, abstract ...

  3. java 乱码详解_jsp中pageEncoding、charset=UTF -8"、request.setCharacterEncoding("UTF-8")

    http://blog.csdn.net/qinysong/article/details/1179480 java 乱码详解__jsp中pageEncoding.charset=UTF -8&quo ...

  4. 聊聊高并发(二十五)解析java.util.concurrent各个组件(七) 理解Semaphore

    前几篇分析了一下AQS的原理和实现.这篇拿Semaphore信号量做样例看看AQS实际是怎样使用的. Semaphore表示了一种能够同一时候有多个线程进入临界区的同步器,它维护了一个状态表示可用的票 ...

  5. 聊聊高并发(二十九)解析java.util.concurrent各个组件(十一) 再看看ReentrantReadWriteLock可重入读-写锁

    上一篇聊聊高并发(二十八)解析java.util.concurrent各个组件(十) 理解ReentrantReadWriteLock可重入读-写锁 讲了可重入读写锁的基本情况和基本的方法,显示了怎样 ...

  6. java乱码问题处理

    java乱码问题处理 java乱码出现的问题有很多,这里主要解释tomcat,jsp,html,http(get,post请求乱码处理).常见的问题可能是tomcat,http请求乱码问题,对于jsp ...

  7. 转 : 深入解析Java锁机制

    深入解析Java锁机制 https://mp.weixin.qq.com/s?__biz=MzU0OTE4MzYzMw%3D%3D&mid=2247485524&idx=1&s ...

  8. 两道面试题,带你解析Java类加载机制

    文章首发于[博客园-陈树义],点击跳转到原文<两道面试题,带你解析Java类加载机制> 在许多Java面试中,我们经常会看到关于Java类加载机制的考察,例如下面这道题: class Gr ...

  9. 【转】两道面试题,带你解析Java类加载机制(类初始化方法 和 对象初始化方法)

    本文转自 https://www.cnblogs.com/chanshuyi/p/the_java_class_load_mechamism.html 关键语句 我们只知道有一个构造方法,但实际上Ja ...

随机推荐

  1. jqm视频播放器,html5视频播放器,html5音乐播放器,html5媒体播放器,video开展demo,html5视频播放演示示例,html5移动视频播放器

    最近看到很多有用的论坛html5视频播放的发展,音乐播放功能,大多数都在寻找答案.所以,我在这里做一个demo.对于大家互相学习.html5开发越来越流行,至于这也是一个不可缺少的一部分的视频. 如何 ...

  2. 安装numpy、nltk问题汇总

    系统环境是win7(64bit)+python3.4(64bit)+numpy1.82+vs2012 1.假设用sourceforge上编译好的32bit的exe安装,会提示'python versi ...

  3. 使用mysqlbinlog工具的基础上及时恢复数据的位置或点

    使用mysqlbinlog工具的基础上及时恢复的位置或点 MySQL备份一般采取完全备份的形式加日志备份.让我们运行一个完整备份,每天.每小时运行二进制日志备份. 这样在MySQL Server故障后 ...

  4. 介绍一款替代SSMS的sqlserver管理工具 toad for sqlserver5.7

    原文:介绍一款替代SSMS的sqlserver管理工具 toad for sqlserver5.7 toad for sqlserver5.7 虽然SSMS很好很强大,不过有时候使用一些第三方工具可以 ...

  5. Web层的搭建

    Web层的搭建 前言:好久没更新博客了,每天被该死的业务缠身,今天正好一个模块完成了,继续来完善我们的代码.之前的六篇完成了领域层.应用层.以及基础结构层的部分代码,这篇打算搭建下UI层的代码. DD ...

  6. 云梯vpn

    刚和大饼合买了一个云梯的vpn 表示可以把俺的优惠连接放出来了 貌似必须是新注册用户才能够享用优惠 http://protizi.com/?r=5e3fecd7eae558ec 把云梯推荐给朋友们 让 ...

  7. SpringMVC源代码深度分析DispatcherServlet核心的控制器(初始化)

    SpringMVC是非常优秀的MVC框架,每一个框架都是为了我们提高开发效率,我们试图通过对SpringMVC的源码去了解这个框架,了解整个设计思想,框架要有扩展性,这里用的比較多是接口和抽象,是框架 ...

  8. 2年SQL Server DBA调优方面总结

    原文:2年SQL Server DBA调优方面总结 2年SQL Server DBA调优方面总结 当2年dba 我觉得,有些东西需要和大家分享探讨,先书单. 书单 1.<深入解析SQL Serv ...

  9. 分布式中使用Redis实现Session共享(转)

    上一篇介绍了如何使用nginx+iis部署一个简单的分布式系统,文章结尾留下了几个问题,其中一个是"如何解决多站点下Session共享".这篇文章将会介绍如何使用Redis,下一篇 ...

  10. ER模型

    一.什么是ER模型 实体-联系图(Entity-RelationDiagram)用来建立数据模型,在数据库系统概论中属于概念设计阶段,形成一个独立于机器.独立于DBMS的ER图模型.通常将它简称为ER ...