Python小数据保存分类种类有多少？-伙伴云

Python小数据保存分类种类有多少？

网友投稿 905 2025-04-04

一个扎心的观点

最近项目上的事情比较多，搞得人头昏脑涨，好不容易下班了，想着怎么缓解下压力。于是刷刷抖音，逛逛微博，再一看时间额11点了…

忘记了之前在哪看过的一篇文章，世界上90%的财富，掌握在10%的人手中，那么如何稳定那90%的人成了一个问题。然后，这10%的人想到了一个办法，为大众提供轻易就能获取快乐、消磨时光的事物，让他们觉得自己其实幸福指数爆棚。乍一听觉得可笑，大众那么容易糊弄吗？可是，仔细想想貌似还挺有道理的，生活已经如此苦逼了，我们刷刷社交平台，缓解了一天搬砖的苦逼心情，看看时间也该睡觉了，养足精神迎接明天的苦难…

不知道为什么要说这么一堆话，只是觉得思细恐极，也想听听大家是什么感受，哈哈….

小数据存储

我们在编写代码的时候，经常会涉及到数据存储的情况，如果是爬虫得到的大数据，我们会选择使用数据库，或者excel存储。但如果只是一些小数据，或者说关联性较强且存在存储后复用的数据，我们该如何存储呢？

open保存文本

最简单、粗暴+无脑的存储方式就是保存成一个文本文档了。

使用open函数，将结果一行行的保存成文本,这里涉及的知识点只有简单的几条：

文件读写模式，r 、w、a、b、+ ,掌握这几种即可。

使用单独的open打开文件时，需要注意结尾时的调用close()函数关闭文档

推荐使用上下文管理器的with open操作

Python小数据保存分类种类有多少？

csv文件

之所以将csv与excel分开说，首先需要扫盲下，csv属于特定格式的文本文件(使用逗号分隔)，而excel是二进制文件。

csv可以直接使用文本编辑器打开，excel不行…

其实csv文件，完全可以使用open函数进行保存，只要你将每行数据都使用,分隔开即可。

另外，python自带csv库，可以很方便的操作与保存该数据

xml文件

xml文件的方式，已经逐渐被淘汰了，为什么这么说？因为它繁琐的树形结构，导致了在传输过程中，占用了更多的内存。所以，除非必要，真的不推荐以xml的形式存储你的数据…

configparser

python模块中configparser是一个专门用来保存配置文件的模块库，它非常适合保存一些具有关联性的数据内容，尤其是配置文件。通过定义section的方式，在section中添加key:value的方式，可以直观明了的数据内容。我之前专门写了一篇关于它的文章，会附在公众号的字文章中，喜欢的朋友可以去看看。

pyyaml

yaml类型的文件已经成为很多Linux下的主流配置文件类型，比如Docker、Ansible等等都在使用yaml，但它依然不是一个主流的数据存储方式，因为yaml本身的格式要求太过严苛，比结构化的Python格式更为严格，喜欢的朋友可以去研究下…

pickle

pickle模块的使用面很窄，但不得不说还是有些人会使用，所以简单说些它的优劣:

优势：接口简单(与json相似)；存储格式通用型，及在Windows、Linux等平台下通用；二进制存储，效率高

劣势：pickle是python特定的协议，其他语言无法使用；pickle存在安全性，这个要着重说下，看下图

Json

说了上面那么多，压轴的还是Json

首先相对于xml，现在更多的网站在数据传输中使用json格式，因为同等的字节下，json传输数据的效率要更高于xml

对于configparser，configparser有一个巨大的劣势，在于配置文件只能支持二维，section下定义option(key:value)，如果想在option的value中再次定义列表、字典等数据类型，它只能识别为字符串，你需要将str手动再转化为对应的数据类型

而针对ymal，json没有那么严格的格式要求，写做一行还是换行展示都随你，没有那么严苛的要求。

最后对比pickle，json格式是各种编程语言通用的数据格式，切由于是key value的键值对，不存在loads之后的安全问题。

三分钟学会Json

简介

JSON(JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式。它基于 ECMAScript (欧洲计算机协会制定的js规范)的一个子集，采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。易于人阅读和编写，同时也易于机器解析和生成，并有效地提升网络传输效率。

至于推荐使用Json的理由：

Json格式是一种通用的数据类型

Python内置json模块，便于操作

json格式类似与python的dict

json的保存与读取极为方便

学习成本低，3分钟包教包会

类型、语法说明

看到上图的Python与json对比关系，其实差异并不大，我们只需要注意几点即可：

json的数据为key：value，且以逗号分隔，但注意json使用双引号包裹键值对

花括号中保存为对象，而方括号保存的是数组，不论python是list还是tuple，最终都会转化为数组

json由于是js引申的数据类型，所以在布尔表达式与空值上，使用与python不同，需要注意

json的方法

.dump():将python对象序列化到一个文件，是文本文件，相当于将序列化后的json字符写到一个文件

.load():从文件反序列表出python对象

json和pickle相同，都只有四个方法：

.dumps()：将python对象编码为json的字符串

.loads():将字符串编码为一个python对象

即：带s的方法是数据类型间的转化str <—> dict，不带s的都是数据与文件的转化

实例

在演示前，我们需要先定义一个初始化数据：

data = { "in_use": True, "info": { "name_cn": '清风Python', "name_en": "BreezePython", }, "contents": ["Python", "Java", "Linux"] } .dumps() .loads() import json json.dumps(data) >>> '{"in_use": true, "info": {"name_cn": "\\u6e05\\u98cePython", "name_en": "BreezePython"}, "contents": ["Python", "Java", "Linux"]}'

这里大家看到一个问题，中文异常，此时我们需要添加参数ensure_ascii=False

json.dumps(data,ensure_ascii=False)

>>> '{"in_use": true, "info": {"name_cn": "清风Python", "name_en": "BreezePython"}, "contents": ["Python", "Java", "Linux"]}'

# 当然我们可以美观的打印它

json_data = json.dumps(data, sort_keys=True, indent=4, separators=(',', ': '),ensure_ascii=False) print(json_data) >>> { "contents": [ "Python", "Java", "Linux" ], "in_use": true, "info": { "name_cn": "清风Python", "name_en": "BreezePython" } }

# 了解了dumps，loads就比较简单了...

json.loads(json_data) {'contents': ['Python', 'Java', 'Linux'], 'in_use': True, 'info': {'name_cn': '清风Python', 'name_en': 'BreezePython'}} .dump() .load() import json # 先来看看dump将数据保存至文本 with open('data.json', 'w', encoding='utf-8') as f: json.dump(data, f, indent=4) # 同理我们还可以使用dumps完成写入操作 # f.write(json.dumps(data, indent=4)) # 保存了文本，我们在通过load读取出来 with open('data.json', 'r', encoding='utf-8') as f: data = json.load(f) # 同理我们还可以使用loads完成读取操作 # data = json.loads(f.read()) print(data) >>> {'in_use': True, 'info': {'name_cn': '清风Python', 'name_en': 'BreezePython'}, 'contents': ['Python', 'Java', 'Linux']}

看到这里，你是否发现，即便不会dump和load我们一样可以使用dumps和loads替换前两者，完成读写操作。三分钟学会了json的操作，并且买一送一附带学会了pickle的操作。你是否get到？

The End

本文来自“清风Python”公众号

智能数据 python

[华为云在线课程][Shell脚本编程基础][第二章Shell脚本语言的基本用法][1基本结构][学习笔记]

905 2025-04-04

Python小数据保存分类种类有多少？

奇安信校招面试题来啦，兄弟们赶紧收藏进大厂！！！

[华为云在线课程][Shell脚本编程基础][第二章Shell脚本语言的基本用法][1基本结构][学习笔记]

Linux之whereis命令

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

电子表格，居家办公更轻松">用在线电子表格，居家办公更轻松

系统的功能有哪些？餐饮服务系统的构成及工作程序">连锁餐饮管理系统的功能有哪些？餐饮服务系统的构成及工

友情链接

Python小数据保存分类种类有多少？

微信扫一扫：分享

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

电子表格，居家办公更轻松">用在线电子表格，居家办公更轻松

系统的功能有哪些？餐饮服务系统的构成及工作程序">连锁餐饮管理系统的功能有哪些？餐饮服务系统的构成及工

友情链接