ChemDataExtractor:从PDF、HTM、文本等中提取化学数据

网友投稿 670 2022-05-29

ChemDataExtractor简介

ChemDataExtractor是一种从科学文档中自动提取化学信息的工具。给它一篇期刊文章,它将从文本中提取化学名称、属性和光谱,以便将它们导入数据库或电子表格。

ChemDataExtractor官网

ChemDataExtractor特点

自然语言处理

ChemDataExtractor使用最先进的自然语言处理算法来解释构成大多数科学文档的英语语言文本。诸如条件随机字段的机器学习方法与自定义词典和基于规则的解析语法结合使用以从每个句子中提取有价值的信息。

化学智能

通过整体处理每个文档,ChemDataExtractor能够解析数据相互依赖性,例如确定不同的名称和标识符何时引用相同的化合物。因此,它生成一个完整的化合物记录,其中包含文档中每个唯一化学实体的标识符、属性和光谱。

表处理

ChemDataExtractor:从PDF、HTM、文本等中提取化学数据

自然语言处理基础

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:如何部署模型到ModelArts并远程调用 (四):导入模型
下一篇:了解线程
相关文章