分子記述子(molecular descriptor)の次元別一覧

2019年1月5日

分子記述子(molecular descriptor)とは

その分子の特徴を化学構造に基づいて、数値として表わした値。記述子計算の際に考慮する化合物空間よって、記述子のタイプは0-4次元に区別される。

次元数別の記述子一覧

次元数 記述子 具体例
0D 構成記述子
カウント記述子
分子量、結合数
C,H,O,N等の原子数
1D フラグメント数
Fingerprints
特定の部分構造のカウント数や有無(0か1)
-CH3, -OH, -NH2, -COOH
-CH2-, -CH2-CH2-…など
2D トポロジカル記述子
(Topological index、Connectivity index)
Balaban J index、Zagreb index, Wiener index,
Chi connectivity index, kappa shape index,
BCUT
3D 幾何学記述子
(Geometrical descriptor)
3D-MoRSE descriptors
WHIM descriptors
GETAWAY descriptors
Quantum-chemical descriptors
size, steric, surface and volume descriptorsなど
4D 相互作用エネルギー 3次元座標 + 立体配座のサンプリング。
Grid, CoMFA, Volsurf

0-3次元におけるイメージ

以下の画像がわかりやすいです。フランス ストラスブール大学の研究室 (Chemometrics and QSAR Research Group )のスライドです。

出典:http://infochim.u-strasbg.fr/CS3/program/material/Todeschini.pdf

0次元記述子

0Dの分子記述子は、構成記述子(Constitutional descriptors)やカウント記述子(Count descriptors)とも呼ばれる。

分子量をはじめ、分子中のある原子のカウント(C、H、O、N、 ハロゲン、環の数、重原子の合計等)や、回転可能な結合数、2(or3)重結合の数など、分子式から得られるような値が挙げらる。

1次元記述子

特定の官能基や部分構造をカウントしたり(=フラグメント数)、その有無を0と1で表現(=Fingerprint)した記述子群。
対象の官能基や部分構造としては、第1,2,3級炭素や末端&内部炭素、ヒドロキシ基、アミノ基、アミド基、イミノ基、カルボン酸、チオール、ベンゼン環、芳香環など。

水素結合ドナー&アクセプター原子の数や、各種LogP(AlogP, ClogP, SlogP, XlogP等)などの物性値も1次元記述子に含まれる。

2次元記述子

2次元の記述子としてはトポロジカル記述子が挙げられる。トポロジカル・インデックス(topological index)、コネクティビティ・インデックス(connectivity index)ともいう。お茶の水女子大学名誉教授の細矢治夫先生が発案者として知られている。

トポロジカル記述子化合物は、化合物をグラフ構造として捉えて、その分子グラフに対する不変量として算出される値です。

例:
Wiener index:分子内のある原子間をむすぶ最短距離の総和
トポロジカル極性表面積(TPSA):分子表面のうち極性をもつ部分の面積。3次元構造が必要なPSAを高速に近似計算した値。

TPSAのように2次元情報から3次元情報を近似計算したものは2.5次元記述子とも呼ばれ、3次元記述子の一部もこれに当てはまります。

3次元記述子

3次元記述子は化合物の立体構造に基づいて算出される値。3次元記述子を算出するためには正確な3D立体構造が必要になる。

量子化学計算から算出される値(HOMO/LUMOエネルギー準位など)や、x,y,zの3次元座標に各原子の特徴に応じて重み付けをした分子グラフを置いて、それに対応する分子行列から算出される固有値などが利用されます。

4次元記述子

相互作用エネルギーなど他の化合物との相互作用を通して定められる記述子。Grid, CoMFA, Volsurf法などから求められます。

記述子の次元別分類

この記述子の次元は英語版wikiで0-4次元では0-3次元、RDkitやPaDEL‐descriptorでは1&2と3次元に分類されており、分類の仕方も様々です(Grid, CoMFA, Volsurfを3次元としているところもありました)。出典やソフトにより違いがありますが、運用上はSMILESからも計算できる0-2次元以内の記述子と立体構造情報が必要な3次元以上に大別して考えればよいのではないかと思います。

参考
・英語wiki https://en.wikipedia.org/wiki/Molecular_descriptor
・ScienceDirect Topic  https://www.sciencedirect.com/topics/medicine-and-dentistry/molecular-descriptor
http://infochim.u-strasbg.fr/CS3/program/material/Todeschini.pdf