java Character类源码分析

一、使用

构建Character对象：

 public class CharTest {

     public static void main(String[] args) {

         Character c1 = new Character('A');

         Character c2 = Character.valueOf('a');

         System.out.println(c1); // A

         System.out.println(c2); // a

     }

 }

构造函数源码：

 @Deprecated(since="")

     public Character(char value) {

         this.value = value;

     }

可见，构造函数的形式不建议使用了。

另一种方式 Character.valueOf()，其源码：

  @HotSpotIntrinsicCandidate

     public static Character valueOf(char c) {

         if (c <= 127) { // must cache

             return CharacterCache.cache[(int)c];

         }

         return new Character(c);

     }

valueOf()方法使用了注解 @HotSpotIntrinsicCandidate，在jvm层面会有比较高效的实现。字符的十进制值小于等于127的话，将返回CharacterCache.cache[(int)c]，返回事先缓存的内容。

CharacterCache是个内部类，初始化CharacterCache的时候会缓存十进制0-127这128个字符（Character对象）。

 private static class CharacterCache {

         private CharacterCache(){}

         static final Character cache[] = new Character[127 + 1];

         static {

             for (int i = 0; i < cache.length; i++)

                 cache[i] = new Character((char)i);

         }

     }

二、其他方法：

1、public char charValue() 返回此 Character 对象的值。

　源码：

  @HotSpotIntrinsicCandidate

     public char charValue() {

         return value;

     }

　使用：

　System.out.println(c1.charValue());　// A

2、public int hashCode() 返回此 Character 的哈希码。

　源码：

 @Override

     public int hashCode() {

         return Character.hashCode(value);

     }

     public static int hashCode(char value) {

         // char 转为 int

         return (int)value;

     }

　　使用：

　　System.out.println(c1.hashCode()); // 65

3、public String toString() 返回表示此 Character 值的 String 对象。结果是一个长度为 1 的字符串，其唯一组件是此 Character 对象表示的基本 char 值。

　源码：

 public String toString() {

         char buf[] = {value};

         return String.valueOf(buf);

     }

　使用：

　System.out.println(c1.toString()); // A

4、public static String toString(char c) 返回一个表示指定 char 值的 String 对象。结果是长度为 1 的字符串，仅由指定的 char 组成。

　　源码：　　

 public static String toString(char c) {

         return String.valueOf(c);

     }

使用：

　System.out.println(Character.toString('A')); // A

5、public static boolean isValidCodePoint(int codePoint)

确定指定的代码点是否为从 0x0000 到 0x10FFFF 范围之内的有效 Unicode 代码点值。该方法等效于以下表达式：codePoint >= 0x0000 && codePoint <= 0x10FFFF

　　源码：

 public static final int MIN_CODE_POINT = 0x000000;

 public static final int MAX_CODE_POINT = 0X10FFFF;

 public static boolean isValidCodePoint(int codePoint) {

         // Optimized form of:

         //     codePoint >= MIN_CODE_POINT && codePoint <= MAX_CODE_POINT

         int plane = codePoint >>> 16;

         return plane < ((MAX_CODE_POINT + 1) >>> 16);

     }

有效的Unicode代码点的范围是['\U+0000','\U+10FFFF']，即[0x000000,0x10FFFF]，即[0000000, 10000 11111111 11111111]，即[0, 1114111]

(MAX_CODE_POINT + 1) >>> 16, 即 0b00000000 00010001 00000000 00000000 >>> 16，等于00000000 00010001

如果codePoint大于MAX_CODE_POINT，则 (codePoint>>>16) 大于00000000 00010000。故大于MAX_CODE_POINT的值是无效的Unicode代码点

如果codePoint小于0，即codePoint为十进制负数，则
-1
原码：10000000 00000000 00000000 00000001
反码：11111111 11111111 11111111 11111110
补码：11111111 11111111 11111111 11111111
-1 >>> 16 即 11111111 11111111 11111111 11111111 >>> 16，等于11111111 11111111

-2147483648（带符号int类型最小值）
原码：10000000 00000000 00000000 00000000
反码：11111111 11111111 11111111 11111111
补码：10000000 00000000 00000000 00000000
-2147483648 >>> 16 即 10000000 00000000 00000000 00000000 >>> 16，等于 10000000 00000000

因为>>>是无符号右移动，所以如果负数（int类型），其保存值的为该负数的补码，最高位（第16位）为符号位1，
无符号右移16位之后，得到高16位，大于00000000 00010001。故十进制负数是无效的Unicode 代码点。

确定指定的代码点是否为从 0x0000 到 0x10FFFF 范围之内的有效 Unicode 代码点值。该方法等效于以下表达式：codePoint >= 0x0000 && codePoint <= 0x10FFFF

　　使用：　

　　System.out.println(Character.isValidCodePoint(79)); // true
　　System.out.println(Character.isValidCodePoint(-79)); // false

6、public static boolean isSupplementaryCodePoint(int codePoint) 确定指定字符（Unicode 代码点）是否在增补字符范围内。该方法调用以下表达式：codePoint >= 0x10000 && codePoint <= 0x10FFFF

　　源码：

 public static final int MIN_SUPPLEMENTARY_CODE_POINT = 0x010000;

 public static final int MAX_CODE_POINT = 0X10FFFF;

 public static boolean isSupplementaryCodePoint(int codePoint) {

         return codePoint >= MIN_SUPPLEMENTARY_CODE_POINT

             && codePoint <  MAX_CODE_POINT + 1;

     }

Unicode增补字符范围：0x010000至0x10FFFF

　　使用：

　　System.out.println(Character.isSupplementaryCodePoint(65536)); // true
　　System.out.println(Character.isSupplementaryCodePoint(65535)); // false

7、

public static boolean isHighSurrogate(char ch) 确定给出的 char 值是否为一个高代理项代码单元（也称为 前导代理项代码单元）。这类值并不表示它们本身的字符，而被用来表示 UTF-16 编码中的 增补字符。

public static boolean isLowSurrogate(char ch) 确定给定 char 值是否一个低代理项代码单元（也称为 尾部代理项代码单元）。这类值并不表示它们本身的字符，而被用来表示 UTF-16 编码中的 增补字符。

源码：

public static final char MIN_HIGH_SURROGATE = '\uD800';

public static final char MAX_HIGH_SURROGATE = '\uDBFF';

public static boolean isHighSurrogate(char ch) {

    // Help VM constant-fold; MAX_HIGH_SURROGATE + 1 == MIN_LOW_SURROGATE

    return ch >= MIN_HIGH_SURROGATE && ch < (MAX_HIGH_SURROGATE + 1);

}

public static final char MIN_LOW_SURROGATE  = '\uDC00';

public static final char MAX_LOW_SURROGATE  = '\uDFFF';

public static boolean isLowSurrogate(char ch) {

    return ch >= MIN_LOW_SURROGATE && ch < (MAX_LOW_SURROGATE + 1);

}

高代理项范围['\uD800', '\uDBFF']；
低代理项范围['\uDC00', '\uDFFF']。

8、public static boolean isSurrogatePair(char high, char low) 确定指定的 char 值对是否为有效的代理项对。该方法等效于以下表达式：

源码：

 public static boolean isSurrogatePair(char high, char low) {

     return isHighSurrogate(high) && isLowSurrogate(low);

 }

9、

public static int charCount(int codePoint)

确定表示指定字符（Unicode 代码点）所需的 char 值的数量。如果指定字符等于或大于 0x10000，则该方法返回的值为 2。否则，该方法返回的值为 1。

该方法没有验证指定的字符是否为一个有效的 Unicode 代码点。如有必要，调用者必须使用 isValidCodePoint 验证字符值。

源码：

public static final int MIN_SUPPLEMENTARY_CODE_POINT = 0x010000;

public static int charCount(int codePoint) {

    return codePoint >= MIN_SUPPLEMENTARY_CODE_POINT ? 2 : 1;

}

　　只判断是否大于0x010000。

10、public static int toCodePoint(char high,char low) 将指定的代理项对转换为其增补代码点值。该方法没有验证指定的代理项对。如有必要，调用者必须使用 isSurrogatePair 验证它。

源码：

public static final int MIN_SUPPLEMENTARY_CODE_POINT = 0x010000;

public static final char MIN_LOW_SURROGATE  = '\uDC00';

public static final char MAX_HIGH_SURROGATE = '\uDBFF';

public static int toCodePoint(char high, char low) {

    // Optimized form of:

    // return ((high - MIN_HIGH_SURROGATE) << 10)

    //         + (low - MIN_LOW_SURROGATE)

    //         + MIN_SUPPLEMENTARY_CODE_POINT;

    return ((high << 10) + low) + (MIN_SUPPLEMENTARY_CODE_POINT - (MIN_HIGH_SURROGATE << 10) - MIN_LOW_SURROGATE);

}

优化细节：
(high - MIN_HIGH_SURROGATE) << 10 ==> (high << 10) - (MIN_HIGH_SURROGATE << 10)

待续......................

java Character类源码分析的更多相关文章

Java Properties类源码分析
一.Properties类介绍 java.util.Properties继承自java.util.Hashtable,从jdk1.1版本开始,Properties的实现基本上就没有什么大的变动.从ht ...
【JAVA】ThreadLocal源码分析
ThreadLocal内部是用一张哈希表来存储: static class ThreadLocalMap { static class Entry extends WeakReference<T ...
细说并发5：Java 阻塞队列源码分析（下）
上一篇细说并发4:Java 阻塞队列源码分析(上) 我们了解了 ArrayBlockingQueue, LinkedBlockingQueue 和 PriorityBlockingQueue,这篇文 ...
List 接口以及实现类和相关类源码分析
List 接口以及实现类和相关类源码分析 List接口分析接口描述用户可以对列表进行随机的读取(get),插入(add),删除(remove),修改(set),也可批量增加(addAll),删除( ...
Java split方法源码分析
Java split方法源码分析 public String[] split(CharSequence input [, int limit]) { int index = 0; // 指针 bool ...
【Java】HashMap源码分析——常用方法详解
上一篇介绍了HashMap的基本概念,这一篇着重介绍HasHMap中的一些常用方法:put()get()**resize()** 首先介绍resize()这个方法,在我看来这是HashMap中一个非常 ...
【Java】HashMap源码分析——基本概念
在JDK1.8后,对HashMap源码进行了更改,引入了红黑树.在这之前,HashMap实际上就是就是数组+链表的结构,由于HashMap是一张哈希表,其会产生哈希冲突,为了解决哈希冲突,HashMa ...
java中List接口的实现类 ArrayList，LinkedList，Vector 的区别 list实现类源码分析
java面试中经常被问到list常用的类以及内部实现机制,平时开发也经常用到list集合类,因此做一个源码级别的分析和比较之间的差异. 首先看一下List接口的的继承关系: list接口继承Colle ...
Java并发编程笔记之Unsafe类和LockSupport类源码分析
一.Unsafe类的源码分析 JDK的rt.jar包中的Unsafe类提供了硬件级别的原子操作,Unsafe里面的方法都是native方法,通过使用JNI的方式来访问本地C++实现库. rt.jar ...

随机推荐

Oracle Mysql MSSql 三种数据库随机查询条语句
1. Oracle,随机查询查询语句-20条 select * from ( select * from 表名 order by dbms_random.value ) where rownum ...
【C++进阶：atoi()与itoa()】
两种函数: atoi 把字符串转为整形: itoa 整形转为字符串: https://www.cnblogs.com/bluestorm/p/3168719.html
用 Python 解答两道来自阿里伯乐系统的笔试题
目录目录前言题目一分析实现题目二分析实现前言朋友到阿里面试,分享两道小题,博主比较闲就试着用 Python 解答一下,实现方式肯定是多种多样的,优劣也会各有不同,欢迎交流. 题目一 ...
阶段3 1.Mybatis_02.Mybatis入门案例_1.mybatis的入门
H:\BaiDu\黑马传智JavaEE57期 2019最新基础+就业+在职加薪\讲义+笔记+资料\主流框架\31.会员版(2.0)-就业课(2.0)-Mybatis\mybatis\mybatis_d ...
如何复制CSDN上他人的博客文章到自己博客下
原作者:hello_world!(CSDN) 原文地址:https://jingyan.baidu.com/article/0964eca24e159c8285f53618.html</a> ...
web可拖动控件js
先下载:http://code.jquery.com/ui/1.10.3/jquery-ui.js $('.i-i-yuan').draggable({ containment: '#app'//可通 ...
java版微信支付/查询/撤销
最近公司接入微信刷卡支付,网上根本没见到很直接的教程(可能眼拙),一直摸滚打爬,加班加点才走通,忍不了必须写一写微信刷卡支付/查询/撤销... 必须要有公众号然后去申请,申请自己去看文档,这里主要 ...
win10远程桌面报出现身份验证错误，要求的函数不受支持
win10远程桌面报出现身份验证错误,要求的函数不受支持编写人:左丘文 2019-6-6 公司换了一台新笔记本电脑,是win10操作系统,刚想远程连接一下服务器,发现以前很正常的功能,发现不行了.网 ...
解决ie低版本不认识html5标签
在不支持HTML5新标签的浏览器里,会将这些新的标签解析成行内元素(inline)对待,所以我们只需要将其转换成块元素(block)即可使用,但是在IE9版本以下,并不能正常解析这些新标签,但是却可以 ...
Python作图包含type3字体解决方案
1. 解决方案 matplotlib.rcParams[‘text.usetex’] = True

java Character类源码分析

java Character类源码分析的更多相关文章

随机推荐

热门专题