如何通过设置Excel行距提升工作表可读性和美观度
546
2022-05-29
贝叶斯算法中最重要用的用的最广的是
使用多项式朴素贝叶斯的地方是文本分类,其中特征与待分类文档中的字数或频率有关。
将使用20个新闻组语料库中的稀疏字数功能来将这些短文档分类。
数据集的介绍
使用 sklearn.datasets中的 fetch_20newsgroups
该数据集介绍
20 newsgroups数据集18000篇新闻文章,一共涉及到20种话题,所以称作20 newsgroups text dataset,分文两部分:训练集和测试集,通常用来做文本分类.
详细可看
https://blog.csdn.net/imstudying/article/details/77876159
开始
from sklearn.datasets import fetch_20newsgroups data = fetch_20newsgroups() data.target_names
1
2
3
['alt.atheism', 'comp.graphics', 'comp.os.ms-windows.misc', 'comp.sys.ibm.pc.hardware', 'comp.sys.mac.hardware', 'comp.windows.x', 'misc.forsale', 'rec.autos', 'rec.motorcycles', 'rec.sport.baseball', 'rec.sport.hockey', 'sci.crypt', 'sci.electronics',
1
2
3
4
5
6
7
8
9
10
11
12
13
机器学习
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。