excel表格基于某条件进行求和的教程
674
2022-05-29
基于主成分分析和聚类探索化学空间
PCA :Principal Component Analysis
分析化合物数据库,发现它们之间的共享描述符(物理化学特性)。
1. 导入库
import os
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import gridspec
from rdkit import Chem, DataStructs
from rdkit.Chem import Descriptors,Crippen
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
import matplotlib.cm as cm
from sklearn.metrics import silhouette_samples, silhouette_score
from sklearn.cluster import KMeans
2. 载入分子数据
该库包含超过10 000 000个SMILES。 可以将.smiles文件作为文本文件读取,将10000个分子保存在pandas中。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。