【<a target="_blank" href="https://www.huoban.com/news/tags-124.html"style="font-weight:bold;">Python</a><a target="_blank" href="https://www.huoban.com/news/tags-2981.html"style="font-weight:bold;">成长之路</a>】词云图制作-伙伴云

网友投稿 615 2025-03-31

【写在前面】

以前看到过一些大神制作的词云图，觉得效果很有意思。如果有朋友不了解词云图的效果，可以看下面的几张图（图片都是网上找到的）；

网上找了找相关的软件，有些软件制作还要付费。结果前几天在大神的公众号里的文章中看到了python也能实现，而且效果也很不错。那还等什么，不赶紧盘它？

【示例代码】

# coding=utf-8 # @Auther : "鹏哥贼优秀" # @Date : 2019/7/31 # @Software : PyCharm import numpy as np import jieba from PIL import Image from wordcloud import WordCloud, STOPWORDS import matplotlib.pyplot as plt def draw_word_cloud(word): words = jieba.cut(word) wordstr = " ".join(words) sw = set(STOPWORDS) sw.add("ok") mask = np.array(Image.open('2.jpg')) wc = WordCloud( font_path='C:/Windows/Fonts/simhei.ttf', # 设置字体格式 mask=mask, max_words=200, max_font_size=100, stopwords=sw, scale=4, ).generate(wordstr) # 显示词云图 plt.imshow(wc) plt.axis("off") plt.show() # 保存词云图 wc.to_file('result.jpg') if __name__ == "__main__": with open("test2.txt", "rb") as f: word = f.read() draw_word_cloud(word)

【效果如下】

【知识点】

1、词云图制作前，需要先准备几个东西：

（1）下载python wordcloud库，也是词图库制作的关键库。我在下载这个库时，经常因为网络超时导致下载失败，怎么办呢？多试几次呗；

（2）numpy库，用于图片处理，将图片读取后解析成数组；

（3）如果要对中文句子进行分词，那么需要jieba库；如果是英文分词，那可以不下载；

（4）如果要在界面上直接展示词云图，那么需要matlplotlib来画图；

（5）要处理图片，根据少不了PIL，毕竟它可是官方的图像处理库；

2、接下来，就是准备要分析的内容。示例代码中的txt内容，是我上一篇文章。然后就是词云图的形状。示例代码中的图片2.jpg原图如下：

【Python成长之路】词云图制作

3、准备工作做完了，那自然就开始编码了。

（1）jieba.cut（）：就是对txt内容进行分词了，注意得到的是个generator，因此需要将其转成字符串；当然也可以使用jieba.lcut（），这样得到的就是列表了；

（2）STOPWORDS集合的设置：停用词有什么呢？主要是对一些你不想要的单词进行过滤，比如“好的”“可以”这类单词。另外，在对停用词进行过滤时，有两种方法，一种是像示例代码，将stopwords作为wordcloud方法的参数，这样最简单；也可以自己写段代码，人为过滤停用词；

（3）将你要的词云图形状图片打开，并作为参数传给wordcloud方法

（4）wordcloud方法各参数的意义，可以参考其他帖子：

https://blog.csdn.net/kouyi5627/article/details/80530569

里面我想着重讲的是regexp参数，即正则表达式。没错，就是正则表达式，有了这个参数，我们可以用正则表达式规则进一步实现自己的单词过滤，比如\d只显示数字。我之前遇到过这个坑，下面再讲。

另外，scale=4生成的图片一般是500KB左右，如果不填，默认只有10几KB；

（5）对内容进行生成词云图时，generate方法最简单，直接将字符串传进来就可以；generate_from_frequencies方法的话，需要传入字典，并自己统计好每个单词的次数；

（6）界面显示词云图的代码很简单，axis("off")是为了不显示坐标，这样更美观；

（7）即将生成的词云图保存到本地，也不多解释。

综上，大致就是示例代码的流程，是不是蛮简单的？那自己动手来玩一次吧。

4、下面我再讲讲自己在制作词云图遇到的坑。

一开始我是想对各期双色球号码进行词云图分析的，结果一直报错，错误如下：

ValueError: We need at least 1 word to plot a word cloud, got 0.

意思就是说我传入的wordstr是空的？怎么可能呢，我明明有数字呀？最后我在wordcloud方法的官方说明中找到了原因：

看到没？regexp参数如果不填写的话，默认是会自动过滤掉单个词的，因此数字就是因为这个原因一直被过滤了。怎么解决呢？有两个办法，第一就是传入regexp参数，比如regexp="\d*"；第二种方法就是用

generate_from_frequencies方法，这样因为有每个数字的频繁在，就不会自动被过滤掉了。从我自己的使用结果来看，还是用第二种方法的效果好看点。

如果大家觉得看了有所帮助或者喜欢的话，可以关注我的公众号“鹏哥贼优秀”，谢谢大家！

Python 正则表达式

办公 自动化(三) | 借助服务器定时爬数据发邮件">python办公 自动化(三) | 借助服务器定时爬数据发邮件

615 2025-03-31

Python3 网络爬虫开发实战] 1.4.3-Redis 的安装">[Python3 网络爬虫开发实战] 1.4.3-Redis 的安装

615 2025-03-31

Python 库的安装">Elasticsearch Python 库的安装

615 2025-03-31

【Python 成长之路】词云图制作

办公 自动化(三) | 借助服务器定时爬数据发邮件">python办公 自动化(三) | 借助服务器定时爬数据发邮件

Python3 网络爬虫开发实战] 1.4.3-Redis 的安装">[Python3 网络爬虫开发实战] 1.4.3-Redis 的安装

Python 库的安装">Elasticsearch Python 库的安装

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

进销存库存管理盘点">简单进销存库存管理盘点

客户管理工具是什么？">客户管理工具是什么？

友情链接

【Python成长之路】词云图制作

微信扫一扫：分享

办公自动化(三) | 借助服务器定时爬数据发邮件">python办公自动化(三) | 借助服务器定时爬数据发邮件

Python3 网络爬虫开发实战] 1.4.3-Redis 的安装">[Python3 网络爬虫开发实战] 1.4.3-Redis 的安装

Python 库的安装">Elasticsearch Python 库的安装

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

进销存库存管理盘点">简单进销存库存管理盘点

客户管理工具是什么？">客户管理工具是什么？

友情链接

【Python 成长之路】词云图制作