贝叶斯算法文本进行分类实例

网友投稿 546 2022-05-29

贝叶斯算法中最重要用的用的最广的是

使用多项式朴素贝叶斯的地方是文本分类,其中特征与待分类文档中的字数或频率有关。

将使用20个新闻组语料库中的稀疏字数功能来将这些短文档分类。

数据集的介绍

使用 sklearn.datasets中的 fetch_20newsgroups

该数据集介绍

20 newsgroups数据集18000篇新闻文章,一共涉及到20种话题,所以称作20 newsgroups text dataset,分文两部分:训练集和测试集,通常用来做文本分类.

详细可看

https://blog.csdn.net/imstudying/article/details/77876159

开始

from sklearn.datasets import fetch_20newsgroups data = fetch_20newsgroups() data.target_names

1

2

3

['alt.atheism', 'comp.graphics', 'comp.os.ms-windows.misc', 'comp.sys.ibm.pc.hardware', 'comp.sys.mac.hardware', 'comp.windows.x', 'misc.forsale', 'rec.autos', 'rec.motorcycles', 'rec.sport.baseball', 'rec.sport.hockey', 'sci.crypt', 'sci.electronics',

1

2

3

4

5

6

贝叶斯算法对文本进行分类实例

7

8

9

10

11

12

13

机器学习

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:css 选择符介绍
下一篇:cmd编程基础
相关文章