1、什么是序列化和系列化DE-

神马是序列化它，序列化是内存中的对象状态信息，兑换字节序列以便于存储（持久化）和网络传输。（网络传输和硬盘持久化，你没有一定的手段来进行辨别这些字节序列是什么东西，有什么信息，这些字节序列就是垃圾）。

反序列化就是将收到字节序列或者是硬盘的持久化数据。转换成内存中的对象。

2、JDK的序列化

JDK的序列化仅仅有实现了serializable接口就能实现序列化与反序列化，可是记得一定要加上序列化版本号ID serialVersionUID

这个是识别序列化的之前那个类的究竟是哪一个？我们显示这个序列化版本号ID的目的就是为了：

1）在某些场合，希望类的不同版本号对序列化兼容。因此须要确保类的不同版本号具有同样的serialVersionUID；

2）在某些场合，不希望类的不同版本号对序列化兼容。因此须要确保类的不同版本号具有不同的serialVersionUID。

java的序列化算法要考虑到以下这些东西：

◆将对象实例相关的类元数据输出。

◆递归地输出类的超类描写叙述直到不再有超类。

◆类元数据完了以后。開始从最顶层的超类開始输出对象实例的实际数据值。

◆从上至下递归输出实例的数据

所以java的序列化确实非常强大，序列化后得到的信息也非常具体。所以反序列化就so easy.

可是这样做也有它的坏处，序列化后非常占内存，所以不一定具体就是优点。简单有时也是不错的。

在hadoop中，hadoop实现了一套自己的序列化框架。hadoop的序列化相对于JDK的序列化来说是比較简洁的。在集群中信息的传递主要就是靠这些序列化的字节序列来传递的所以更高速度更小的容量就变得很地重要了。

说了太多的废话。还是扯回JDK的序列化吧。以下我们看一下在JDK中式怎样实现序列化的。

首先我们有一个须要序列化的类例如以下（必须实现serializable接口）

import java.io.Serializable;

public class Block implements Serializable{

	/**

	 *

	 */

	private static final long serialVersionUID = 1L;

	private int id;

	private String name;

	public int getId() {

		return id;

	}

	public void setId(int id) {

		this.id = id;

	}

	public String getName() {

		return name;

	}

	public void setName(String name) {

		this.name = name;

	}

	public Block(int id, String name) {

		this.id = id;

		this.name = name;

	}

}

以下我们来測试一下序列化的结果：

import java.io.ByteArrayInputStream;

import java.io.ByteArrayOutputStream;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.ObjectInputStream;

import java.io.ObjectOutputStream;

public class TestSerializable {

	public static void main(String[] args) throws IOException,

			ClassNotFoundException {

		//将序列化化的数据写到文件out里面（持久化）

		FileOutputStream fos = new FileOutputStream("./out");

		ObjectOutputStream oos = new ObjectOutputStream(fos);

		for (int i = 0; i < 100; i++) {

			Block b = new Block(i, "B"+i);

			oos.writeObject(b);

		}

		oos.flush();

		oos.close();

		//读出一个序列化的对象的字节序列（^..^）就是反序列化

		FileInputStream fis = new FileInputStream("./out");

		ObjectInputStream ois = new ObjectInputStream(fis);

		Block b2 = (Block) ois.readObject();

		ois.close();

		System.out.println(b2.getName());

	}

}

測试的结果：（取出第一个对象的name）

B0

生成一百个对象的持久化数据的大小是：1.60 KB (1,643 字节)一个对象平均16个字节,该类仅仅有两个字段一个是int,一个字符串可是字符串的长度为2，所以我们能够感受到这冗余还是挺大的。

3、hadoop的序列化

hadoop的序列化的特点是：

1、紧凑：因为带宽是集群中信息传递的最宝贵的资源所以我们必须想法设法缩小传递信息的大小，hadoop的序列化就为了更好地坐到这一点而设计的。

2、对象可重用：JDK的反序列化会不断地创建对象，这肯定会造成一定的系统开销。可是在hadoop的反序列化中。能反复的利用一个对象的readField方法来又一次产生不同的对象。

3、可扩展性：当前hadoop的序列化有多中选择

*能够利用实现hadoop的Writable接口。

*使用开源的序列化框架protocol Buffers，Avro等框架。

我们能够注意到的是hadoop2.X之后是实现一个叫YARN的云操作系统。全部应用（如mapreduce。或者其它spark实时或者离线的计算框架都能够执行在YARN上）。YARN还负责对资源的调度等等。

YARN的序列化就是用Google开发的序列化框架protocol Buffers。proto眼下支持支持三种语言C++，java，Python所以RPC这一层我们就能够利用其它语言来做文章，满足其它语言开发人员的需求。

我屮艸芔茻，扯得有点远。

回到hadoop原生的序列化。hadoop原生的序列化类须要实现一个叫Writeable的接口。类似于serializable接口。

还有hadoop也为我们提供了几个序列化类，他们都直接或者间接地实现了Writable接口。如：IntWritable。LongWritable，Text等等。

实现Writable接口必须实现两个方法：write(DataOutputStream out);readField(DataInputStream in)方法。

以下是一个hadoop的序列化样例：

package hadoop;

import java.io.ByteArrayOutputStream;

import java.io.DataInput;

import java.io.DataInputStream;

import java.io.DataOutput;

import java.io.DataOutputStream;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.io.Writable;

import org.junit.Test;

public class Testhadoop_serializable_writable {

	@Test

	public void serializable() throws IOException {

		ByteArrayOutputStream out = new ByteArrayOutputStream();

		DataOutputStream dataOut = new DataOutputStream(out);

		FileOutputStream fos = new FileOutputStream("./hadoop_out");

		for (int i = 0; i < 10; i++) {

			Text t1 = new Text(String.valueOf(i));

			Text t2 = new Text("mw");

			MyWritable mw = new MyWritable(t1,t2);

			mw.write(dataOut);

		}

		dataOut.close();

		fos.write(out.toByteArray());

		fos.flush();

		fos.close();

		FileInputStream fis = new FileInputStream("./hadoop_out");

		DataInputStream dis = new DataInputStream(fis);

		for (int i = 0; i < 10; i++) {

			MyWritable mw = new MyWritable(new Text(), new Text());

			mw.readFields(dis);

			System.out.println(mw.getId() + " " + mw.getName());

		}

	}

}

class MyWritable implements Writable {

	private Text id;

	private Text name;

	public MyWritable(Text id, Text name) {

		super();

		this.id = id;

		this.name = name;

	}

	public synchronized Text getId() {

		return id;

	}

	public synchronized void setId(Text id) {

		this.id = id;

	}

	public synchronized Text getName() {

		return name;

	}

	public synchronized void setName(Text name) {

		this.name = name;

	}

	@Override

	public void write(DataOutput out) throws IOException {

		id.write(out);

		name.write(out);

	}

	@Override

	public void readFields(DataInput in) throws IOException {

		id.readFields(in);

		name.readFields(in);

	}

}

我们能够看到我们实现的自己序列化类MyWritable。他有两个字段都是Text，Text是hadoop自带的序列化类，能够看做字符串（类似吧）吧？！

write()和readField()用到的是回调函数，将流（DataOutputStream DataInputStream）写出。或者读出，都是用到回调函数（hook(钩子)）。

上面的执行结果例如以下：

生成的字节序列：

命令行结果：

完！

java序列化是什么和反序列化和hadoop序列化的更多相关文章

hadoop序列化机制与java序列化机制对比
1.采用的方法: java序列化机制采用的ObjectOutputStream 对象上调用writeObject() 方法: Hadoop 序列化机制调用对象的write() 方法,带一个DataOu ...
Hadoop序列化与Java序列化
序列化就是把内存中的对象的状态信息转换成字节序列,以便于存储(持久化)和网络传输反序列化就是就将收到的字节序列或者是硬盘的持久化数据,转换成内存中的对象. 1.JDK的序列化只要实现了serial ...
Hadoop序列化和反序列化
1. 序列化从头说在面向对象程序设计中,类是个很重要的概念.所谓“类”,可以将它想像成建筑图纸,而对象就是根据图纸盖的大楼.类,规定了对象的一切.根据建筑图纸造房子,盖出来的就是大楼,等同于将 ...
Hadoop Serialization hadoop序列化详解(最新版) (1)【java和hadoop序列化比较和writable接口】
初学java的人肯定对java序列化记忆犹新.最开始很多人并不会一下子理解序列化的意义所在.这样子是因为很多人还是对java最底层的特性不是特别理解,当你经验丰富,对java理解更加深刻之后,你就会发 ...
Java序列化的作用和反序列化
1.序列化是干什么的? 简单说就是为了保存在内存中的各种对象的状态(也就是实例变量,不是方法),并且可以把保存的对象状态再读出来.虽然你可以用你自己的各种各样的方法来保存object states,但 ...
第12讲-Java中的IO操作及对象的序列化与反序列化
1.知识点 1.1.课程回顾 1.2.本章重点 1.2.1 io操作 1.2.2 对象的序列化与反序列化 2.具体内容 2.1.Java IO 2.1.1.什么是IO IO其实就是输入.输出 I ...
【Java面试】简单说一下你对序列化和反序列化的理解
Hi,大家好,我是Mic 一个工作4年的粉丝,投了很多简历好不容易接到一个互联网公司的面试邀约. 在面试第一轮就被干掉了,原因是对主流互联网技术理解太浅了. 其中就有一个这样的问题:"简单 ...
Hadoop阅读笔记（六）——洞悉Hadoop序列化机制Writable
酒,是个好东西,前提要适量.今天参加了公司的年会,主题就是吃.喝.吹,除了那些天生话唠外,大部分人需要加点酒来作催化剂,让一个平时沉默寡言的码农也能成为一个喷子!在大家推杯换盏之际,难免一些画面浮现脑 ...
Hadoop序列化
遗留问题: Hadoop序列化可以复用对象,是在哪里复用的? 介绍Hadoop序列化机制 Hadoop序列化机制详解 Hadoop序列化的核心 Hadoop序列化的比较接口 ObjectWrita ...

随机推荐

casio 手表北京维修网络
http://www.casio.com.cn/support/service/wat/28.html 手表北京维修网络号新东安广场2座11层1103室电话:010-65157818/8391585 ...
ISO-8859-1乱码恢复
为兼容较旧的jQuery插件,我把jQuery版本号从2.1.x降到了1.8.x,这比加入jquery-migration插件要来得干脆. 我没把这两个版本号的的区别一一记下来,而是直接改个版本号号. ...
html浏览器兼容性的 JavaScript语法
1. 在FireFox中能够使用与HTML节点对象ID属性值同样的JS变量名称.可是IE中不行. 解决的方法:在命名上区分HTML节点对象ID属性值和JS变量 2. IE不支持JS ...
OCA读书笔记(12) - 数据库维护
查询优化器统计信息搜集统计信息: 不是实时的: SQL> conn /as sysdbaConnected.SQL> grant select on dba_objects to sco ...
java matlab混合编程之返回值Struct类型
java matlab混合编程的时候当返回值是Struct类型(matlab中的返回类型)如何来取得(java中)其值? 上网找,看到这个网页:http://www.mathworks.cn/cn/h ...
事件总线帧---Otto
我们如果这样一种业务场景.如今在做一款及时聊天应用,我们在聊天页面进行收发信息.同一时候也要实时更新前一页面的聊天记录,这时我们该怎样去实现?说说我曾经的实现策略.我使用的是广播接收器BroadCas ...
[LeetCode]Swap Nodes in Pairs 成对交换
Given a linked list, swap every two adjacent nodes and return its head. For example, Given 1->2-& ...
使用SVN clang: error: linker command failed with exit code 1 (use -v to see invocation)
然后上传到该项目SVN仓库上,例如,下面的错误再次发生再拉到本地编译 ld: library not found for -lxxxxxxxxxxxx clang: error: linker com ...
SVNKIT的low api应用之修改库中文件内容(File modification)
最近在做一个仓库管理系统,架构在svn之上.要求每一项操作要记录在log文件中,弄了很久起初感觉无法向库中的文本文件添加东西,就是修改库中的文本文件.于是采用了一个很笨的办法: 现将库中的log ...
tomcat开始批量——setclasspath.bat
除了上述两批,另一个重要的脚本,那是,setclasspath.bat.它主要负责查找.检查JAVA_HOME和JRE_HOME两个变量. ****************************** ...

java序列化是什么和反序列化和hadoop序列化

1、什么是序列化和系列化DE-

2、JDK的序列化

3、hadoop的序列化

java序列化是什么和反序列化和hadoop序列化的更多相关文章

随机推荐

热门专题