RDKit | 基于PCA探索化学空间

网友投稿 674 2022-05-29

基于主成分分析和聚类探索化学空间

PCA :Principal Component Analysis

分析化合物数据库,发现它们之间的共享描述符(物理化学特性)。

1. 导入库

import os

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

from matplotlib import gridspec

from rdkit import Chem, DataStructs

from rdkit.Chem import Descriptors,Crippen

from sklearn.decomposition import PCA

from sklearn.preprocessing import StandardScaler

import matplotlib.cm as cm

from sklearn.metrics import silhouette_samples, silhouette_score

from sklearn.cluster import KMeans

RDKit | 基于PCA探索化学空间

2. 载入分子数据

该库包含超过10 000 000个SMILES。 可以将.smiles文件作为文本文件读取,将10000个分子保存在pandas中。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:ORA-27102错误解决
下一篇:Google Earth Engine (GEE) ——代码编辑器
相关文章