python中的数据类型与json的数据类型之间的转化

什么是json：

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一个子集。JSON采用完全独立于语言的文本格式，但是也使用了类似于C语言家族的习惯（包括C, C++, C#, Java, JavaScript, Perl, Python等）。这些特性使JSON成为理想的数据交换语言。

JSON建构于两种结构：

“名称/值”对的集合（A collection of name/value pairs）。不同的语言中，它被理解为对象（object），纪录（record），结构（struct），字典（dictionary），哈希表（hash table），有键列表（keyed list），或者关联数组（associative array）。
值的有序列表（An ordered list of values）。在大部分语言中，它被理解为数组（array）。
这些都是常见的数据结构。事实上大部分现代计算机语言都以某种形式支持它们。这使得一种数据格式在同样基于这些结构的编程语言之间交换成为可能。

jso官方说明参见：http://json.org/

Python操作json的标准api库参考：http://docs.python.org/library/json.html

对简单数据类型的encoding 和 decoding：

使用简单的json.dumps方法对简单数据类型进行编码，例如：

import json

obj

= [[1,2,3],123,123.123,'abc',{'key1':(1,2,3),'key2':(4,5,6)}]

encodedjson

= json.dumps(obj)

print repr(obj)

print encodedjson

输出：

[[1, 2, 3], 123, 123.123, 'abc', {'key2': (4, 5, 6), 'key1': (1, 2, 3)}]
[[1, 2, 3], 123, 123.123, "abc", {"key2": [4, 5, 6], "key1": [1, 2, 3]}]

通过输出的结果可以看出，简单类型通过encode之后跟其原始的repr()输出结果非常相似，但是有些数据类型进行了改变，例如上例中的元组则转换为了列表。在json的编码过程中，会存在从python原始类型向json类型的转化过程，具体的转化对照如下：

json.dumps()方法返回了一个str对象encodedjson，我们接下来在对encodedjson进行decode，得到原始数据，需要使用的json.loads()函数：

decodejson

= json.loads(encodedjson)

print type(decodejson)

print decodejson[4]['key1']

print decodejson

输出：

<type 'list'>
[1, 2, 3]

[[1, 2, 3], 123, 123.123, u'abc', {u'key2': [4, 5, 6], u'key1': [1, 2, 3]}]

loads方法返回了原始的对象，但是仍然发生了一些数据类型的转化。比如，上例中‘abc’转化为了unicode类型。从json到python的类型转化对照如下：

json.dumps方法提供了很多好用的参数可供选择，比较常用的有sort_keys（对dict对象进行排序，我们知道默认dict是无序存放的），separators，indent等参数。

排序功能使得存储的数据更加有利于观察，也使得对json输出的对象进行比较，例如：

data1

= {'b':789,'c':456,'a':123}

data2

= {'a':123,'b':789,'c':456}

d1

= json.dumps(data1,sort_keys=True)

d2

= json.dumps(data2)

d3

= json.dumps(data2,sort_keys=True)

print d1

print d2

print d3

print d1==d2

print d1==d3

输出：

{"a": 123, "b": 789, "c": 456}
{"a": 123, "c": 456, "b": 789}
{"a": 123, "b": 789, "c": 456}
False
True

上例中，本来data1和data2数据应该是一样的，但是由于dict存储的无序特性，造成两者无法比较。因此两者可以通过排序后的结果进行存储就避免了数据比较不一致的情况发生，但是排序后再进行存储，系统必定要多做一些事情，也一定会因此造成一定的性能消耗，所以适当排序是很重要的。

indent参数是缩进的意思，它可以使得数据存储的格式变得更加优雅。

data1

= {'b':789,'c':456,'a':123}

d1

= json.dumps(data1,sort_keys=True,indent=4)

print d1

输出：

{
    "a": 123,
    "b": 789,
    "c": 456
}

输出的数据被格式化之后，变得可读性更强，但是却是通过增加一些冗余的空白格来进行填充的。json主要是作为一种数据通信的格式存在的，而网络通信是很在乎数据的大小的，无用的空格会占据很多通信带宽，所以适当时候也要对数据进行压缩。separator参数可以起到这样的作用，该参数传递是一个元组，包含分割对象的字符串。

print 'DATA:'

repr(data)

print

'repr(data)            

 :'

len(repr(data))

print

'dumps(data)           

 :'

len(json.dumps(data))

print

'dumps(data,

 indent=2)  :'

len

(json.dumps(data,

 indent

=4))

print

'dumps(data,

 separators):'

len

(json.dumps(data,

 separators

=(',',':')))

输出：

DATA: {'a': 123, 'c': 456, 'b': 789}
repr(data) : 30
dumps(data) : 30
dumps(data, indent=2) : 46
dumps(data, separators): 25

通过移除多余的空白符，达到了压缩数据的目的，而且效果还是比较明显的。

另一个比较有用的dumps参数是skipkeys，默认为False。 dumps方法存储dict对象时，key必须是str类型，如果出现了其他类型的话，那么会产生TypeError异常，如果开启该参数，设为True的话，则会比较优雅的过度。

1 2	`data=` `{'b':789,'c':456,(1,2):123}` `print` `json.dumps(data,skipkeys=True)`

输出：

{"c": 456, "b": 789}

处理自己的数据类型

json模块不仅可以处理普通的python内置类型，也可以处理我们自定义的数据类型，而往往处理自定义的对象是很常用的。

首先，我们定义一个类Person。

class Person(object):

def __init__(self,name,age):

self

.name

= name

self

.age

= age

def __repr__(self):

return

'Person

 Object name : %s , age : %d'

% (self.name,self.age)

if

__name__

== '__main__':

= Person('Peter',22)

print p

如果直接通过json.dumps方法对Person的实例进行处理的话，会报错，因为json无法支持这样的自动转化。通过上面所提到的json和python的类型转化对照表，可以发现，object类型是和dict相关联的，所以我们需要把我们自定义的类型转化为dict，然后再进行处理。这里，有两种方法可以使用。

方法一：自己写转化函数

'''

Created

 on 2011-12-14

@author:

 Peter

'''

import Person

import json

= Person.Person('Peter',22)

def object2dict(obj):

#convert

 object to a dict

= {}

d['__class__'

= obj.__class__.__name__

d['__module__'

= obj.__module__

d.update(obj.__dict__)

return d

def dict2object(d):

#convert

 dict to object

if'__class__' in d:

class_name

= d.pop('__class__')

module_name

= d.pop('__module__')

module

= __import__(module_name)

class_ = getattr(module,class_name)

args

= dict((key.encode('ascii'

),

 value)

for

key,

 value

in

d.items())

#get

 args

inst

= class_(**

args)

#create

 new instance

else:

inst

= d

return inst

= object2dict(p)

print d

#{'age':

 22, '__module__': 'Person', '__class__': 'Person', 'name': 'Peter'}

= dict2object(d)

print type(o),o

#<class

 'Person.Person'> Person Object name : Peter , age : 22

dump

= json.dumps(p,default=object2dict)

print dump

#{"age":

 22, "__module__": "Person", "__class__": "Person", "name": "Peter"}

load

=

json.loads(dump,object_hook

= dict2object)

print load

#Person

 Object name : Peter , age : 22

上面代码已经写的很清楚了，实质就是自定义object类型和dict类型进行转化。object2dict函数将对象模块名、类名以及__dict__存储在dict对象里，并返回。dict2object函数则是反解出模块名、类名、参数，创建新的对象并返回。在json.dumps

方法中增加default参数，该参数表示在转化过程中调用指定的函数，同样在decode过程中json.loads方法增加object_hook,指定转化函数。

方法二：继承JSONEncoder和JSONDecoder类，覆写相关方法

JSONEncoder类负责编码，主要是通过其default函数进行转化，我们可以override该方法。同理对于JSONDecoder。

'''

Created

 on 2011-12-14

@author:

 Peter

'''

import Person

import json

= Person.Person('Peter',22)

class MyEncoder(json.JSONEncoder):

def default(self,obj):

#convert

 object to a dict

= {}

d['__class__'

= obj.__class__.__name__

d['__module__'

= obj.__module__

d.update(obj.__dict__)

return d

class MyDecoder(json.JSONDecoder):

def __init__(self):

json.JSONDecoder.__init__(self,object_hook=self.dict2object)

def dict2object(self,d):

#convert

 dict to object

if'__class__' in d:

class_name

= d.pop('__class__')

module_name

= d.pop('__module__')

module

= __import__(module_name)

class_ = getattr(module,class_name)

args

= dict((key.encode('ascii'

),

 value)

for

key,

 value

in

d.items())

#get

 args

inst

= class_(**

args)

#create

 new instance

else:

inst

= d

return inst

= MyEncoder().encode(p)

= MyDecoder().decode(d)

print d

print type

(o),

 o

python中的数据类型与json的数据类型之间的转化的更多相关文章

简单谈谈Python中的几种常见的数据类型
简单谈谈Python中的几种常见的数据类型计算机顾名思义就是可以做数学计算的机器,因此,计算机程序理所当然地可以处理各种数值.但是,计算机能处理的远不止数值,还可以处理文本.图形.音频.视频.网页等 ...
Python中比较特殊的几种数据类型list、tuple、dict、set
list list(列表)是Python内置的一种数据类型,它是一种有序.可变的集合,可以随时添加和删除其中的元素. >>> classmates = ['Li', 'Tom', ' ...
（数据科学学习手札137）orjson：Python中最好用的json库
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介大家好我是费老师,我们在日常使用Pytho ...
python中对象、类型和元类之间的关系
在python中对象.类型和元类构成了一个微妙的世界. 他们有在这个世界里和平共处,相辅相成.它们遵循着几条亘古不变的定律: 1.python中无处不对象 2.所有对象都有三种特性:id.类型.值 3 ...
Python中的列表，元组，字符串之间的相互转化
Python中的列表元组和字符串之间的相互转化需要利用,tuple(),list(),str(). 示例如下: >>> the_string = "hello I'am x ...
json与javabean之间的转化
接着上一个http://www.cnblogs.com/ya-qiang/p/9009134.html随笔,继续介绍json与java对象之间的转化一.java普通对象和json字符串的互转 jav ...
python中使用join()方法对各种数据类型中元的素进行合并拼接
"连接符".join(列表或元组或字符串或字典) 返回的是一个使用连接符进行拼接的字符串如果对象是列表,元组,就是以一个下标元素为单位进行拼接如果对象是字符串,就是一个单词元素 ...
python中自定义类对象json字符串化的方法
1. 用 json 或者simplejson 就可以 2.定义转换函数: def convert_to_builtin_type(obj): print 'default(', repr(obj), ...
python中True，False与0,1之间的关系
demo1 >>> print(True == 1) >>> print(True == 2) >>> print(False == 0) > ...

随机推荐

mac下配置android环境变量
下面我将一下mac环境下的配置步骤: 1.在本地目录(home directory)中创建文件.bash_profile2.在文件中写入以下内容:export PATH=${PATH}:/Users/ ...
【5】JVM-垃圾收集器
通过学习了解到现在商用的JVM中的垃圾收集采用的是分代收集算法,即针对不同年代采用不同的收集算法.在JVM中,GC主要作用于堆内存中,堆内存又被划分为新生代和老年代,由于新生代对象绝大多数是朝生夕死, ...
SAP Process Integration - High Level ERP/Integration Process --- Cargill Process Concept Design
Customer Industry: Commercial off-the-shelf (COTS) application ,, Food Ingredients or Agricultural S ...
C# ?? 运算符是什么？
?? 运算符定义在将可空类型分配给非可空类型时返回的默认值. int? c = null; //若 c 为 null,则 d 为 -1,否则把 c 值赋予 dint d = c ?? -1;
linux 下 vi 文本编辑如何复制一行粘贴删除一行数据
在使用vi有时会想直接复制一行数据,然后粘贴一行或者直接删除一行数据复制一行数据的方法把光标放到要复制的一行前面,然后按两下yy字母键然后把光标放到要复制到的地方去,按键盘的p字母键删除一行是 ...
jQuery Validation让验证变得如此easy(二)
上一个样例我们是统一引用jquery.validate.js这样全部必填字段的提示信息都将是This field is required. 如今要改成动态提示,比方姓名假设为空则提示姓名不能为空,密码 ...
Java处理JSON的工具类（List、Map和JSON之间的转换)——依赖jsonlib支持Map嵌套
原文链接:http://www.itjhwd.com/java_json/ 代码 package com.itjh.mmp.util; import java.io.BufferedReader; i ...
mysql 字段区分大小写
默认情况下, mysql中的字段是不区分大小写的,所以"aa"与"AA"被认为是一样的. 那么有些特殊情况下,我们希望它区分大小写呢,这时应该怎么办,说出来其实 ...
使用w查看系统负载 vmstat命令 top命令 sar命令 nload命令
w/uptime 查看系统负载 w查看系统负载,uptime跟w一样. [root@centos7 ~]# w 22:34:10 up 6 days, 23:10, 4 users, load a ...
Microsoft VBScript 运行时错误错误 '800a0046' 没有权限解决方法
首先看看是不是scrrun.dll 设置了拒绝权限(在windows/system32目录,右键文件,添加 IUSR+机器名账户).... 一.如果您的系统提示"没有找到scrrun.dl ...

python中的数据类型与json的数据类型之间的转化

python中的数据类型与json的数据类型之间的转化的更多相关文章

随机推荐

热门专题