RDKit | 基于PCA探索化学空间

网友投稿 743 2022-05-29

基于主成分分析和聚类探索化学空间

PCA :Principal Component Analysis

分析化合物数据库,发现它们之间的共享描述符(物理化学特性)。

1. 导入库

import os

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

from matplotlib import gridspec

from rdkit import Chem, DataStructs

RDKit | 基于PCA探索化学空间

from rdkit.Chem import Descriptors,Crippen

from sklearn.decomposition import PCA

from sklearn.preprocessing import StandardScaler

import matplotlib.cm as cm

from sklearn.metrics import silhouette_samples, silhouette_score

from sklearn.cluster import KMeans

2. 载入分子数据

该库包含超过10 000 000个SMILES。 可以将.smiles文件作为文本文件读取,将10000个分子保存在pandas中。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:ORA-27102错误解决
下一篇:Google Earth Engine (GEE) ——代码编辑器
相关文章