Unsafe类在jdk 源码的多个类中用到,这个类的提供了一些绕开JVM的更底层功能,基于它的实现可以提高效率。但是,它是一把双刃剑:正如它的名字所预示的那样,它是Unsafe的,它所分配的内存需要手动free(不被GC回收)。Unsafe类,提供了JNI某些功能的简单替代:确保高效性的同时,使事情变得更简单。

这篇文章主要是以下文章的整理、翻译。

http://mishadoff.com/blog/java-magic-part-4-sun-dot-misc-dot-unsafe/

1. Unsafe API的大部分方法都是native实现,它由105个方法组成,主要包括以下几类:

(1)Info相关。主要返回某些低级别的内存信息:addressSize(), pageSize()

(2)Objects相关。主要提供Object和它的域操纵方法:allocateInstance(),objectFieldOffset()

(3)Class相关。主要提供Class和它的静态域操纵方法:staticFieldOffset(),defineClass(),defineAnonymousClass(),ensureClassInitialized()

(4)Arrays相关。数组操纵方法:arrayBaseOffset(),arrayIndexScale()

(5)Synchronization相关。主要提供低级别同步原语(如基于CPU的CAS(Compare-And-Swap)原语):monitorEnter(),tryMonitorEnter(),monitorExit(),compareAndSwapInt(),putOrderedInt()

(6)Memory相关。直接内存访问方法(绕过JVM堆直接操纵本地内存):allocateMemory(),copyMemory(),freeMemory(),getAddress(),getInt(),putInt()

2. Unsafe类实例的获取

Unsafe类设计只提供给JVM信任的启动类加载器所使用,是一个典型的单例模式类。它的实例获取方法如下:

  1. public static Unsafe getUnsafe() {
  2. Class cc = sun.reflect.Reflection.getCallerClass();
  3. if (cc.getClassLoader() != null)
  4. throw new SecurityException("Unsafe");
  5. return theUnsafe;
  6. }

非启动类加载器直接调用Unsafe.getUnsafe()方法会抛出SecurityException(具体原因涉及JVM类的双亲加载机制)。

解决办法有两个,其一是通过JVM参数-Xbootclasspath指定要使用的类为启动类,另外一个办法就是java反射了。

  1. Field f = Unsafe.class.getDeclaredField("theUnsafe");
  2. f.setAccessible(true);
  3. Unsafe unsafe = (Unsafe) f.get(null);

通过将private单例实例暴力设置accessible为true,然后通过Field的get方法,直接获取一个Object强制转换为Unsafe。在IDE中,这些方法会被标志为Error,可以通过以下设置解决:

Preferences -> Java -> Compiler -> Errors/Warnings ->
Deprecated and restricted API -> Forbidden reference -> Warning
3. Unsafe类“有趣”的应用场景

(1)绕过类初始化方法。当你想要绕过对象构造方法、安全检查器或者没有public的构造方法时,allocateInstance()方法变得非常有用。

  1. class A {
  2. private long a; // not initialized value
  3.  
  4. public A() {
  5. this.a = ; // initialization
  6. }
  7.  
  8. public long a() { return this.a; }
  9. }

以下是构造方法、反射方法和allocateInstance()的对照

  1. A o1 = new A(); // constructor
  2. o1.a(); // prints 1
  3.  
  4. A o2 = A.class.newInstance(); // reflection
  5. o2.a(); // prints 1
  6.  
  7. A o3 = (A) unsafe.allocateInstance(A.class); // unsafe
  8. o3.a(); // prints 0

allocateInstance()根本没有进入构造方法,在单例模式时,我们似乎看到了危机。

(2)内存修改

内存修改在c语言中是比较常见的,在Java中,可以用它绕过安全检查器。

考虑以下简单准入检查规则:

  1. class Guard {
  2. private int ACCESS_ALLOWED = ;
  3.  
  4. public boolean giveAccess() {
  5. return == ACCESS_ALLOWED;
  6. }
  7. }

在正常情况下,giveAccess总会返回false,但事情不总是这样

  1. Guard guard = new Guard();
  2. guard.giveAccess(); // false, no access
  3.  
  4. // bypass
  5. Unsafe unsafe = getUnsafe();
  6. Field f = guard.getClass().getDeclaredField("ACCESS_ALLOWED");
  7. unsafe.putInt(guard, unsafe.objectFieldOffset(f), ); // memory corruption
  8.  
  9. guard.giveAccess(); // true, access granted

通过计算内存偏移,并使用putInt()方法,类的ACCESS_ALLOWED被修改。在已知类结构的时候,数据的偏移总是可以计算出来(与c++中的类中数据的偏移计算是一致的)。

(3)实现类似C语言的sizeOf()函数

通过结合Java反射和objectFieldOffset()函数实现一个C-like sizeOf()函数。

  1. public static long sizeOf(Object o) {
  2. Unsafe u = getUnsafe();
  3. HashSet fields = new HashSet();
  4. Class c = o.getClass();
  5. while (c != Object.class) {
  6. for (Field f : c.getDeclaredFields()) {
  7. if ((f.getModifiers() & Modifier.STATIC) == ) {
  8. fields.add(f);
  9. }
  10. }
  11. c = c.getSuperclass();
  12. }
  13.  
  14. // get offset
  15. long maxSize = ;
  16. for (Field f : fields) {
  17. long offset = u.objectFieldOffset(f);
  18. if (offset > maxSize) {
  19. maxSize = offset;
  20. }
  21. }
  22.  
  23. return ((maxSize/) + ) * ; // padding
  24. }

算法的思路非常清晰:从底层子类开始,依次取出它自己和它的所有超类的非静态域,放置到一个HashSet中(重复的只计算一次,Java是单继承),然后使用objectFieldOffset()获得一个最大偏移,最后还考虑了对齐。

在32位的JVM中,可以通过读取class文件偏移为12的long来获取size。

  1. public static long sizeOf(Object object){
  2. return getUnsafe().getAddress(
  3. normalize(getUnsafe().getInt(object, 4L)) + 12L);
  4. }

其中normalize()函数是一个将有符号int转为无符号long的方法

  1. private static long normalize(int value) {
  2. if(value >= ) return value;
  3. return (0L >>> ) & value;
  4. }

两个sizeOf()计算的类的尺寸是一致的。最标准的sizeOf()实现是使用java.lang.instrument,但是,它需要指定命令行参数-javaagent。

(4)实现Java浅复制

标准的浅复制方案是实现Cloneable接口或者自己实现的复制函数,它们都不是多用途的函数。通过结合sizeOf()方法,可以实现浅复制。

  1. static Object shallowCopy(Object obj) {
  2. long size = sizeOf(obj);
  3. long start = toAddress(obj);
  4. long address = getUnsafe().allocateMemory(size);
  5. getUnsafe().copyMemory(start, address, size);
  6. return fromAddress(address);
  7. }

以下的toAddress()和fromAddress()分别将对象转换到它的地址以及相反操作。

  1. static long toAddress(Object obj) {
  2. Object[] array = new Object[] {obj};
  3. long baseOffset = getUnsafe().arrayBaseOffset(Object[].class);
  4. return normalize(getUnsafe().getInt(array, baseOffset));
  5. }
  6.  
  7. static Object fromAddress(long address) {
  8. Object[] array = new Object[] {null};
  9. long baseOffset = getUnsafe().arrayBaseOffset(Object[].class);
  10. getUnsafe().putLong(array, baseOffset, address);
  11. return array[];
  12. }

以上的浅复制函数可以应用于任意java对象,它的尺寸是动态计算的。

(5)消去内存中的密码

密码字段存储在String中,但是,String的回收是受到JVM管理的。最安全的做法是,在密码字段使用完之后,将它的值覆盖。

  1. Field stringValue = String.class.getDeclaredField("value");
  2. stringValue.setAccessible(true);
  3. char[] mem = (char[]) stringValue.get(password);
  4. for (int i=; i < mem.length; i++) {
  5. mem[i] = '?';
  6. }

(6)动态加载类

标准的动态加载类的方法是Class.forName()(在编写jdbc程序时,记忆深刻),使用Unsafe也可以动态加载java 的class文件。

  1. byte[] classContents = getClassContent();
  2. Class c = getUnsafe().defineClass(
  3. null, classContents, , classContents.length);
  4. c.getMethod("a").invoke(c.newInstance(), null); // 1
  5. getClassContent()方法,将一个class文件,读取到一个byte数组。
  6.  
  7. private static byte[] getClassContent() throws Exception {
  8. File f = new File("/home/mishadoff/tmp/A.class");
  9. FileInputStream input = new FileInputStream(f);
  10. byte[] content = new byte[(int)f.length()];
  11. input.read(content);
  12. input.close();
  13. return content;
  14. }

动态加载、代理、切片等功能中可以应用。

(7)包装受检异常为运行时异常。

  1. getUnsafe().throwException(new IOException());

当你不希望捕获受检异常时,可以这样做(并不推荐)。

(8)快速序列化

标准的java Serializable速度很慢,它还限制类必须有public无参构造函数。Externalizable好些,它需要为要序列化的类指定模式。流行的高效序列化库,比如kryo依赖于第三方库,会增加内存的消耗。可以通过getInt(),getLong(),getObject()等方法获取类中的域的实际值,将类名称等信息一起持久化到文件。kryo有使用Unsafe的尝试,但是没有具体的性能提升的数据。(http://code.google.com/p/kryo/issues/detail?id=75)

(9)在非Java堆中分配内存

使用java 的new会在堆中为对象分配内存,并且对象的生命周期内,会被JVM GC管理。

  1. class SuperArray {
  2. private final static int BYTE = ;
  3.  
  4. private long size;
  5. private long address;
  6.  
  7. public SuperArray(long size) {
  8. this.size = size;
  9. address = getUnsafe().allocateMemory(size * BYTE);
  10. }
  11.  
  12. public void set(long i, byte value) {
  13. getUnsafe().putByte(address + i * BYTE, value);
  14. }
  15.  
  16. public int get(long idx) {
  17. return getUnsafe().getByte(address + idx * BYTE);
  18. }
  19.  
  20. public long size() {
  21. return size;
  22. }
  23. }

Unsafe分配的内存,不受Integer.MAX_VALUE的限制,并且分配在非堆内存,使用它时,需要非常谨慎:忘记手动回收时,会产生内存泄露;非法的地址访问时,会导致JVM崩溃。在需要分配大的连续区域、实时编程(不能容忍JVM延迟)时,可以使用它。java.nio使用这一技术。

(10)Java并发中的应用

通过使用Unsafe.compareAndSwap()可以用来实现高效的无锁数据结构。

  1. class CASCounter implements Counter {
  2. private volatile long counter = ;
  3. private Unsafe unsafe;
  4. private long offset;
  5.  
  6. public CASCounter() throws Exception {
  7. unsafe = getUnsafe();
  8. offset = unsafe.objectFieldOffset(CASCounter.class.getDeclaredField("counter"));
  9. }
  10.  
  11. @Override
  12. public void increment() {
  13. long before = counter;
  14. while (!unsafe.compareAndSwapLong(this, offset, before, before + )) {
  15. before = counter;
  16. }
  17. }
  18.  
  19. @Override
  20. public long getCounter() {
  21. return counter;
  22. }
  23. }

通过测试,以上数据结构与java的原子变量的效率基本一致,Java原子变量也使用Unsafe的compareAndSwap()方法,而这个方法最终会对应到cpu的对应原语,因此,它的效率非常高。这里有一个实现无锁HashMap的方案(http://www.azulsystems.com/about_us/presentations/lock-free-hash ,这个方案的思路是:分析各个状态,创建拷贝,修改拷贝,使用CAS原语,自旋锁),在普通的服务器机器(核心<32),使用ConcurrentHashMap(JDK8以前,默认16路分离锁实现,JDK8中ConcurrentHashMap已经使用无锁实现)明显已经够用。

Java魔法类:sun.misc.Unsafe的更多相关文章

  1. Java中的sun.misc.Unsafe包

    chronicle项目:https://github.com/peter-lawrey/Java-Chronicle 这个项目是利用mmap机制来实现高效的读写数据,号称每秒写入5到20百万条数据. ...

  2. 死磕 java魔法类之Unsafe解析

    问题 (1)Unsafe是什么? (2)Unsafe只有CAS的功能吗? (3)Unsafe为什么是不安全的? (4)怎么使用Unsafe? 简介 本章是java并发包专题的第一章,但是第一篇写的却不 ...

  3. Java魔法类:Unsafe应用解析

    本文转载自Java魔法类:Unsafe应用解析 前言 Unsafe是位于sun.misc包下的一个类,主要提供一些用于执行低级别.不安全操作的方法,如直接访问系统内存资源.自主管理内存资源等,这些方法 ...

  4. 【java编程】Java魔法类:Unsafe应用解析

    转载来源:https://tech.meituan.com/2019/02/14/talk-about-java-magic-class-unsafe.html 前言 Unsafe是位于sun.mis ...

  5. 一文了解sun.misc.Unsafe

    Java语言和JVM平台已经度过了20岁的生日.它最初起源于机顶盒.移动设备和Java-Card,同时也应用在了各种服务器系统中,Java已成为物联网(Internet of Things)的通用语言 ...

  6. Java sun.misc.Unsafe类的学习笔记

    Java未开源的Unsafe类 Unsafe类可以为我们提供高效并且线程安全方式操作变量,直接和内存数据打交道. 获取Unsafe实体的方法 private static Unsafe getUnsa ...

  7. java对象的内存布局(二):利用sun.misc.Unsafe获取类字段的偏移地址和读取字段的值

    在上一篇文章中.我们列出了计算java对象大小的几个结论以及jol工具的使用,jol工具的源代码有兴趣的能够去看下.如今我们利用JDK中的sun.misc.Unsafe来计算下字段的偏移地址,一则验证 ...

  8. Java sun.misc.unsafe类

    Java是一个安全的开发工具,它阻止开发人员犯很多低级的错误,而大部份的错误都是基于内存管理方面的.如果你想搞破坏,可以使用Unsafe这个类.这个类是属于sun.*API中的类,并且它不是J2SE中 ...

  9. Java的sun.misc.Unsafe类

    阅读目录 前言 Unsafe类的作用 获取Unsafe对象 Unsafe类中的API 前言 以下sun.misc.Unsafe源码和demo基于jdk1.7: 最近在看J.U.C里的源码,很多都用到了 ...

  10. JDK 1.8 sun.misc.Unsafe类CAS底层实现

    在java.util.concurrent包下面的很多类为了追求性能都采用了sun.misc.Unsafe类中的CAS操作,从而避免使用synchronized等加锁方式带来性能上的不足. 在sun. ...

随机推荐

  1. QWidget的六个刷新函数(居然有QWidget::erase函数,且并不产生绘制事件)

    Qt paintevent事件   一.主要理解一下几个方法和属性: 1.QWidget * QScrollView::viewport () const 2.void QWidget::paintE ...

  2. sublime 支持PHP语法提示

    下载插件phpcs>> https://github.com/benmatselby/sublime-phpcs 解压后修改文件夹名字为:Phpcs 把文件夹放到packages目录下 c ...

  3. CentOS软件安装目录查找

    注:一般的软件的默认安装目录在/usr/local或者/opt里,可以到那里去找找. 指令名称:whereis 功能介绍:在特定目录中查找符合条件的文件.这些文件的烈性应属于原始代码,二进制文件,或是 ...

  4. Ubuntu 12.04 SSH 安装

    By default Ubuntu Desktop OS comes with ssh clientpackage. It does not include ssh server package wh ...

  5. 大型web系统架构详解

    (如果感觉有帮助,请帮忙点推荐,添加关注,谢谢!你的支持是我不断更新文章的动力.本博客会逐步推出一系列的关于大型网站架构.分布式应用.设计模式.架构模式等方面的系列文章) 动态应用,是相对于网站静态内 ...

  6. [原]poj-2524(裸并查集)

    题目链接: http://poj.org/problem?id=2524 题意: n个人,m对人宗教相同,输出一共有多少个不同的宗教. 代码如下: #include<iostream> # ...

  7. git使用ssh协议,生成公钥和私钥,并指定私钥

    http://superuser.com/questions/232373/how-to-tell-git-which-private-key-to-use In ~/.ssh/config, add ...

  8. 漫游Kafka设计篇之性能优化

    Kafka在提高效率方面做了很大努力.Kafka的一个主要使用场景是处理网站活动日志,吞吐量是非常大的,每个页面都会产生好多次写操作.读方面,假设每个消息只被消费一次,读的量的也是很大的,Kafka也 ...

  9. Using unique option prefix myisam-recover instead of myisam-recover-option

    [转载]关于mysql error.log报"Using unique option prefix myisam-recover instead of myisam-recover-opti ...

  10. find命令下的atime,ctime,mtime

    Linux下的find命令在目录结构中搜索文件,并执行指定的操作.linux下的find命令提供了相当多的查找条件,功能很强大,由于find的功能很强大,所以他的选项也很多,今天我们来细说一下find ...