Py之gensim:gensim的简介、安装、使用方法之详细攻略

网友投稿 1600 2022-05-29

Py之gensim:gensim的简介、安装、使用方法之详细攻略

目录

gensim的简介

gensim的安装

gensim的使用方法

gensim的简介

Gensim是一个用于主题建模、文档索引和大型语料库相似检索的Python库。目标受众是自然语言处理(NLP)和信息检索(IR)社区。

Py之gensim:gensim的简介、安装、使用方法之详细攻略

Gensim是一个免费的Python库,用于从文档中自动提取语义主题,尽可能高效(计算机方面)和无痛苦(人类方面)。GeNSIM被设计成处理原始的、非结构化的数字文本(“纯文本”)。Gensim中的算法,如Word2Vec、FastText、潜在语义分析(LSI、LSA、参见LsiModel)、潜在Dirichlet分配(LDA、参见LdaModel)等,通过检查训练文档语料库中的统计共现模式,自动发现文档的语义结构。NTS。这些算法是无监督的,这意味着没有人输入是必要的-你只需要一个纯文本文档的语料库。一旦找到这些统计模式,任何纯文本文档(语句、短语、单词…)都可以在新的语义表示中简洁地表达,并查询与其他文档(单词、短语…)的主题相似性。

pypi gensim

Gensim API Reference

gensim的安装

pip install gensim

gensim的使用方法

trained_model.most_similar(positive=['woman','king'], negative=['man'])

[('queen', 0.50882536), ...]

Python

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:【云小课】【第2课】文档数据库服务DDS如何实现跨可用区容灾部署
下一篇:Posix线程编程指南(3)
相关文章