Python内存数据序列化到硬盘上哪家强-伙伴云

网友投稿 898 2022-05-28

1. 闲扯一下：文件

磁盘上的数据，我们一般称为 “文件” ，一般不同的文件都有各自的后缀名，比如 .txt .docx .xlsx .jpg .mp3 .avi 。这些不同类型的文件一般分为两大类：

文本文件：用记事本打开看到的是英文、发文、中文等字符；

二进制文件：用记事本打开看到的可能就是一堆乱码；

平日里，大家接触到的更多的是二进制文件，比如word文档，图片，视频，音频等。为了保存和读取这些不同文件，各自都规定了各自的文件格式，这些格式是各自存储的规范。同时为了让保存的文件更小便于传输（比如，视频通过网络传输），各自还通过一些算法对文件数据进行压缩，尤其是图片、视频和音频都各自有很多压缩算法，比如图片的jpg，音频的mp3，视频的mkv这些即代表了相应的文件格式，还代表了其背后的压缩算法。这些多媒体数据的压缩算法的原则是，在保证媒体质量的前提下尽量使得数据存储量小。

除了文件本身的一些压缩算法，我们还经常使用一些通用的压缩软件对文件进行打包和压缩，比如zip，WinRAR等。

2. 回到原题：Python序列化

我们使用python时，经常用到的数据就是int，float，string，list， dict，tuple这些内置的数据类型和结构。写程序时，我们很可能希望把这些基本数据存储到硬盘，即保存存储结果。这个过程，我们称之为“序列化”

Python里面常用的序列化工具有：

json

pickle

marshal

cPickle是pickle的C语言实现，速度更快，但Python3里面的pickle就是C语言实现的，因此不再包含cPickle模块。

json在web中使用更为广泛，是各种web API的首选数据格式。

Python内存数据序列化到硬盘上哪家强

以上三种工具，哪一个更快呢？

#!/usr/bin/env pythonimport timeimport jsonimport pickleimport marshaldef test(data, method): if method == 'json': dumps = json.dumps loads = json.loads elif method == 'pickle': dumps = pickle.dumps loads = pickle.loads elif method == 'marshal': dumps = marshal.dumps loads = marshal.loads b = time.time() s = '' loop = 10000 for i in range(loop): s = dumps(data) print('{} dumps time cost: {}'.format(method, time.time() - b)) b = time.time() for i in range(loop): loads(s) print('{} loads time cost: {}'.format(method, time.time() - b)) def main(): # generate test data data = {} count = 80 for i in range(10000): k = '%05d' % (i % count) if k in data: data[k].append(i / count) else: data[k] = [i/count] print('data:', len(data)) # test test(data, 'json') test(data, 'pickle') test(data, 'marshal')if __name__ == '__main__': main()

以上代码的测试过程是，对一个有80个key的字典进行序列化和反序列化操作，每个模块各循环10000次，统计各自的耗时。用Python3.6跑出的结果如下：

json dumps time cost: 30.436348915100098json loads time cost: 10.900368928909302pickle dumps time cost: 1.7617356777191162pickle loads time cost: 2.8096134662628174marshal dumps time cost: 1.8232548236846924marshal loads time cost: 1.991441011428833

由此看出，pickle的性能最好，json最慢。

版权申明:若没有特殊说明，文章皆是猿人学原创，没有猿人学授权，请勿以任何形式转载。

Python 存储

销售报表分析的秘密，掌握数据让业绩飞跃

898 2022-05-28

Python 内存 数据 序列化到硬盘上哪家强

选择适合你的库存盘点软件指南

电商ERP解决方案助力企业实现业务飞跃

销售报表分析的秘密，掌握数据让业绩飞跃

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

智能定制家居管理系统：重新定义家庭生活方式

定制家居数字化管理模式：提升品质、智能化和个性化的未

友情链接

Python内存数据序列化到硬盘上哪家强

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接

Python 内存数据序列化到硬盘上哪家强