RDKit | 从ChEMBL数据库提取大分子HELM单体(XML转换为DataFrame并搜索部分结构)

网友投稿 722 2022-05-29

研究大分子的HELM表示。HELM具有分层结构,并结合了单体来代表聚合物(例如肽)。

HELM的特征是其表达的可扩展性,还可以通过将原始单体添加到单体库中来表达不自然的结构。

另一方面,由于HELM表达式使用缩写(ID),所以如果不共享单体库,则存在指定具有相同ID的不同单体的风险,因此了解单体库很重要。

找出什么样的单体信息存储在ChEMBL中,这是HELM也处理的熟悉的数据库。

具体旨在读取XML文件中提供的单体库,并将其转换为Pandas DataFrame。

导入库

import xml.etree.ElementTree as ET

tree = ET.parse('chembl_27_monomer_library.xml')

RDKit | 从ChEMBL数据库提取大分子HELM单体(XML转换为DataFrame并搜索部分结构)

root = tree.getroo

XML 数据库

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:华为云会议超强音视频抗丢包
下一篇:etcd — Overview
相关文章