标准库(8)
最后更新于:2022-04-01 11:36:25
## json
就传递数据而言,xml是一种选择,还有另外一种,就是json,它是一种轻量级的数据交换格式,如果读者要做web编程,是会用到它的。根据维基百科的相关内容,对json了解一二:
> JSON(JavaScript Object Notation)是一種由道格拉斯·克羅克福特構想設計、輕量級的資料交換語言,以文字為基礎,且易於讓人閱讀。儘管JSON是Javascript的一個子集,但JSON是獨立於語言的文本格式,並且採用了類似於C語言家族的一些習慣。
关于json更为详细的内容,可以参考其官方网站:[http://www.json.org](http://www.json.org/)
从官方网站上摘取部分,了解一下json的结构:
> JSON建构于两种结构:
* “名称/值”对的集合(A collection of name/value pairs)。不同的语言中,它被理解为对象(object),纪录(record),结构(struct),字典(dictionary),哈希表(hash table),有键列表(keyed list),或者关联数组 (associative array)。
* 值的有序列表(An ordered list of values)。在大部分语言中,它被理解为数组(array)。
python标准库中有json模块,主要是执行序列化和反序列化功能:
* 序列化:encoding,把一个python对象编码转化成json字符串
* 反序列化:decoding,把json格式字符串解码转换为python数据对象
### [](https://github.com/qiwsir/StarterLearningPython/blob/master/227.md#基本操作)基本操作
json模块相对xml单纯了很多:
~~~
>>> import json
>>> json.__all__
['dump', 'dumps', 'load', 'loads', 'JSONDecoder', 'JSONEncoder']
~~~
**encoding: dumps()**
~~~
>>> data = [{"name":"qiwsir", "lang":("python", "english"), "age":40}]
>>> print data
[{'lang': ('python', 'english'), 'age': 40, 'name': 'qiwsir'}]
>>> data_json = json.dumps(data)
>>> print data_json
[{"lang": ["python", "english"], "age": 40, "name": "qiwsir"}]
~~~
encoding的操作是比较简单的,请注意观察data和data_json的不同——lang的值从元组编程了列表,还有不同:
~~~
>>> type(data_json)
<type 'str'>
>>> type(data)
<type 'list'>
~~~
将python对象转化为json类型,是按照下表所示对照关系转化的:
| python==> | json |
| --- | --- |
| dict | object |
| list, tuple | array |
| str, unicode | string |
| int, long, float | number |
| True | true |
| False | false |
| None | null |
**decoding: loads()**
decoding的过程也像上面一样简单:
~~~
>>> new_data = json.loads(data_json)
>>> new_data
[{u'lang': [u'python', u'english'], u'age': 40, u'name': u'qiwsir'}]
~~~
需要注意的是,解码之后,并没有将元组还原。
解码的数据类型对应关系:
| json==> | python |
| --- | --- |
| object | dict |
| array | list |
| string | unicode |
| number(int) | int, long |
| number(real) | float |
| true | True |
| false | False |
| null | None |
**对人友好**
上面的data都不是很长,还能凑合阅读,如果很长了,阅读就有难度了。所以,json的dumps()提供了可选参数,利用它们能在输出上对人更友好(这对机器是无所谓的)。
~~~
>>> data_j = json.dumps(data, sort_keys=True, indent=2)
>>> print data_j
[
{
"age": 40,
"lang": [
"python",
"english"
],
"name": "qiwsir"
}
]
~~~
`sort_keys=True`意思是按照键的字典顺序排序,`indent=2`是让每个键值对显示的时候,以缩进两个字符对齐。这样的视觉效果好多了。
### [](https://github.com/qiwsir/StarterLearningPython/blob/master/227.md#大json字符串)大json字符串
如果数据不是很大,上面的操作足够了。但是,上面操作是将数据都读入内存,如果太大就不行了。怎么办?json提供了`load()`和`dump()`函数解决这个问题,注意,跟上面已经用过的函数相比,是不同的,请仔细观察。
~~~
>>> import tempfile #临时文件模块
>>> data
[{'lang': ('python', 'english'), 'age': 40, 'name': 'qiwsir'}]
>>> f = tempfile.NamedTemporaryFile(mode='w+')
>>> json.dump(data, f)
>>> f.flush()
>>> print open(f.name, "r").read()
[{"lang": ["python", "english"], "age": 40, "name": "qiwsir"}]
~~~
### [](https://github.com/qiwsir/StarterLearningPython/blob/master/227.md#自定义数据类型)自定义数据类型
一般情况下,用的数据类型都是python默认的。但是,我们学习过类后,就知道,自己可以定义对象类型的。比如:
以下代码参考:[Json概述以及python对json的相关操作](http://www.cnblogs.com/coser/archive/2011/12/14/2287739.html)
~~~
#!/usr/bin/env python
# coding=utf-8
import json
class Person(object):
def __init__(self,name,age):
self.name = name
self.age = age
def __repr__(self):
return 'Person Object name : %s , age : %d' % (self.name,self.age)
def object2dict(obj): #convert Person to dict
d = {}
d['__class__'] = obj.__class__.__name__
d['__module__'] = obj.__module__
d.update(obj.__dict__)
return d
def dict2object(d): #convert dict ot Person
if '__class__' in d:
class_name = d.pop('__class__')
module_name = d.pop('__module__')
module = __import__(module_name)
class_ = getattr(module, class_name)
args = dict((key.encode('ascii'), value) for key,value in d.items()) #get args
inst = class_(**args) #create new instance
else:
inst = d
return inst
if __name__ == '__main__':
p = Person('Peter',40)
print p
d = object2dict(p)
print d
o = dict2object(d)
print type(o), o
dump = json.dumps(p, default=object2dict)
print dump
load = json.loads(dump, object_hook=dict2object)
print load
~~~