プログラミング

フリーで公開されている化合物データセットで、化学構造に基づいた化合物空間(ケミカルスペース)の可視化をしてみます。フィンガープリント(MorganとRDkit)を算出し、PCAまたはUMAPで2次元空間にプロットできるようにします。プロットはクラスタリング結果と物性値でラベルします。

機械学習

分子記述子(molecular descriptor)とは

その分子の特徴を化学構造に基づいて、数値として表わした値。記述子計算の際に考慮する化合物空間よって、記述子のタイプは0-4次元に区別される。

次元数別の記述子一覧次元数記述子具体例0D構造記述子
カウント記述子分子量、結合数
C,H,O,N等の原子数1Dフラグメント数
Fingerprints特定の部分構 ...