Python glom包初探-伙伴云

Python glom包初探

网友投稿 763 2022-05-30

大家好，我是四毛。

这一篇是关于glom的一个介绍与初步使用，后期会将里面的各种API再给大家介绍下，。

因为是边看，边练习，然后翻译，所以个人理解可能有偏差，有错误的地方，请大家指正。

视频地址：https://www.youtube.com/watch?v=bTAFl8P2DkE&t=18m07s

1. 官方文档地址

文档地址

2. 安装方法

pip install glom

3. 正式开始

glom，官方的说法是用PYTHONIC的方式来处理内嵌的数据。对于现实世界中的数据处理更加给力，现实世界中的数据，我的理解就是AJAX越来越流行了，处理这类数据会越来越频繁。有如下特点：

对于嵌套数据结构的基于路径式的访问

可读，有意义的错误消息

声明性数据转换，使用轻量级，Pythonic规范

内置数据探索和调试功能

3.1 原始处理嵌套数据

下面的脚本包导入

from glom import glom

下面的data就是个简单的嵌套数据，一般都可以用下面几种方法进行处理

data = {'a': {'b': {'c': 'd'}}} data['a']['b']['c'] data.get('a').get('b').get('c') data.get('a', {}).get('b',{}).get('c')

但是当我们的数据改变成下面的这样时：

data2 = {'a': {'b': None}} data2['a']['b']['c'] Traceback (most recent call last): ... TypeError: 'NoneType' object has no attribute '__getitem__'

会报错，而且由于是嵌套数据，从错误信息里我们只知道有个None值，但是到底谁是呢，是a，是b呢，反正肯定不是我们的朋友小哪吒。

3.2 glom出场

那么glom怎么处理上面的数据呢？如其所言，路径式：

data = {'a': {'b': {'c': 'd'}}} print glom(data, 'a.b.c') # d

看起来还是很优雅，很Pythonic。

data2 = {'a': {'b': None}} glom(data2, 'a.b.c')

错误信息如下：

glom.core.PathAccessError: could not access 'c', part 2 of Path('a', 'b', 'c'), got error: AttributeError("'NoneType' object has no attribute 'c'",)

很明显，这个错误就很直观。难道仅仅只有这个？当然不是

3.2.1 Going Beyond Access

上面的是原标题，我的理解是不仅仅获取数据，还有别的呢。首先，介绍两个基本的术语

target 目标数据，可以是字典，列表，或其他任意的对象 spec 我们想要的输出格式【specifications】，定义你自己所需要的格式

现在让我们跟随宇航员的脚步，探索太阳系吧。

获取某个行星的名字：

target = {'galaxy': {'system': {'planet': 'jupiter'}}} # 这个格式就是需要个字段值，所以输出的就是个字段值 spec = 'galaxy.system.planet' glom(target, spec) # 'jupyter'

Python glom包初探

现在，宇航员们想把行星的名字放进一个列表中，数据是这样：

target = {'system': {'planets': [{'name': 'earth'}, {'name': 'jupiter'}]}}

通常，处理这样的话，都要写个循环，或者搞个列表解析式，那么glom怎么处理呢？

glom(target, ('system.planets', ['name'])) print glom(target, spec) # ['earth', 'jupiter']

是不是很简单。那么现在新需求又来了，宇航员想得到下面这个数据里面的行星的卫星的数:

target = {'system': {'planets': [{'name': 'earth', 'moons': 1}, {'name': 'jupiter', 'moons': 69}]}}

glom解决方法：

# 自定义的格式 spec = {'names': ('system.planets', ['name']), 'moons': ('system.planets', ['moons'])} print glom(target, spec) # {'moons': [1, 69], 'names': ['earth', 'jupiter']}

3.2.2 Changing Requirements

Coalesce 是glom定义的一种结构，允许我们对于spec中的子spec进行进一步的处理，你只要在子spec中将可能存在的值定义好就行了，听起来有点绕，现在来梳理一下。

首先，子spec是什么？

spec = {'names': ('system.planets', ['name']), 'moons': ('system.planets', ['moons'])} # 以这个为例，这里面的system.planets就是个子spec

然后，使用其解析数据：

target = {'system': { 'planets': [{'name': 'earth', 'moons': 1}, {'name': 'jupiter', 'moons': 69}], } } spec = {'names': (Coalesce('system.planets', 'system.dwarf_planets'), ['name']), 'moons': (Coalesce('system.planets', 'system.dwarf_planets'), ['moons'])} print glom(target, spec) # {'moons': [1, 69], 'names': ['earth', 'jupiter']}

接着当我们的数据变成了这个以后

target = {'system': {'dwarf_planets': [{'name': 'pluto', 'moons': 5}, {'name': 'ceres', 'moons': 0}]}} spec = {'names': (Coalesce('system.planets', 'system.dwarf_planets'), ['name']), 'moons': (Coalesce('system.planets', 'system.dwarf_planets'), ['moons'])} print glom(target, spec) # {'moons': [5, 0], 'names': ['pluto', 'ceres']}

可以看到，依然可以使用相同的spec来解析不同的目标数据。有意思的是，你可以在target里面同时写入plantes和dwarf_plants数据试试看，会返回什么数据。【这里应该是个惰性的匹配，只要匹配到一个，后面的就不再去匹配了】

3.2.3 True Python Native

真正的原生python 在glom里面，你可以传值给python里面的任意的函数举例：

求和

target = {'system': {'planets': [{'name': 'earth', 'moons': 1}, {'name': 'jupiter', 'moons': 69}]}} print glom(target, {'moon_count': ('system.planets', ['moons'], sum)}) # {'moon_count': 70}

原教程这里还有个案例，但是我还没有理解好，就不写出来了，大家可以点击链接自己看一下。

4. 结论

下一节，为大家带来其中一些重要的函数。最后，在用的过程中，一直有个疑问，数据如下：

target = { 'data': { 'name': 'just_test', 'likes': [{'ball': 'basketball'}, {'ball': 'football'}, {'water': 'swim'}] } }

现在，我想返回的数据格式为：

{'name': 'just_for_test', 'likes': ['basketball', 'football', 'water']}

一开始我以为可以这么用：

spec = { 'name': ('data.name'), 'likes': ('data.likes', ['ball', 'water'] ), }

但是不行，这样会报错。后来用了另外的方法：

spec = { 'name': ('data.name'), 'likes': ('data.likes', [lambda x: x.values()[0] if 'ball' or 'water' in x.keys() else ''] ), } print glom(target, spec) # {'name': 'just_test', 'likes': ['basketball', 'football', 'swim']}

这样感觉很不爽啊，还望会的同学不吝赐教啊。

python

数据结构的定义是什么（数据结构指的是什么）

763 2022-05-30

Python glom包初探

数据结构的定义是什么（数据结构指的是什么）

常用的数据结构有哪些呢（数据结构都有哪些主要结构）

Word2013中拆分和合并表格的方法

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

定制订单管理系统（为特定需求定制的订单管理系统）

友情链接

Python glom包初探

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接