분자 기술자(molecular descriptor)의 차원별 일람

2019/1/5

분자 기술자(molecular descriptor)란

그 분자의 특징을 화학 구조에 근거하여 수치로서 나타낸 값.디스크립터 계산시 고려되는 화합물 공간에 따라 디스크립터 유형은 0-4 차원으로 구별됩니다.

차원 수별 설명자 목록

차원 수 설명자 구체적인 예
0D 구성 설명자
카운트 디스크립터
분자량, 결합수
C, H, O, N 등의 원자수
1D 조각 수
지문
특정 부분 구조의 카운트 수나 유무(0 또는 1)
-CH3, -OH, -NH2, -COOH
-CH2-, -CH2-CH2-… 등
2D 토폴로지컬 디스크립터
(Topological index, Connectivity index)
Balaban J index, Zagreb index, Wiener index,
Chi connectivity index, kappa shape index,
비컷
3D 기하학 설명자
(Geometrical descriptor)
3D-MoRSE descriptors
WHIM descriptors
GETAWAY descriptors
Quantum-chemical descriptors
size, steric, surface and volume descriptors 등
4D 상호작용 에너지 3차원 좌표 + 입체형태의 샘플링.
Grid, CoMFA, Volsurf

0-3차원의 이미지

다음 이미지를 이해하기 쉽습니다.프랑스 스트라스부르 대학의 연구실 (Chemometrics and QSAR Research Group )의 슬라이드입니다.

출처 :http://infochim.u-strasbg.fr/CS3/program/material/Todeschini.pdf

0차원 설명자

0D의 분자 디스크립터는 구성 디스크립터 (Constitutional descriptors) 또는 카운트 디스크립터 (Count descriptors)라고도 불린다.

분자량을 비롯하여 분자 중의 원자의 카운트(C, H, O, N, 할로겐, 고리의 수, 중원자의 합계 등)나, 회전 가능한 결합수, 2(or3) 중결합의 수 등, 분자식으로부터 얻어지는 값을 들 수 있다.

1차원 설명자

특정의 관능기나 부분 구조를 카운트하거나(=단편수), 그 유무를 0과 1로 표현(=Fingerprint)한 기술자군.
대상의 관능기나 부분 구조로서는, 제1,2,3급 탄소나 말단&내부 탄소, 히드록시기, 아미노기, 아미드기, 이미노기, 카르복실산, 티올, 벤젠환, 방향환 등.

수소 결합 도너 & 억셉터 원자의 수나 각종 LogP(AlogP, ClogP, SlogP, XlogP 등) 등의 물성값도 1차원 기술자에 포함된다.

2차원 설명자

2차원의 기술자로서는 토폴로지컬 기술자를 들 수 있다.토폴로지컬 인덱스(topological index), 커넥티비티 인덱스(connectivity index)라고도 한다.차의 물여자대학 명예교수인 호소야 치오 선생님이 발안자로 알려져 있다.

토폴로지컬 기술자 화합물은 화합물을 그래프 구조로 캡처하고 그 분자 그래프에 대한 불변량으로 계산되는 값입니다.

예 :
Wiener index : 분자 내의 원자 사이를 가로 지르는 최단 거리의 합
토폴로지컬 극성 표면적(TPSA): 분자 표면 중 극성을 갖는 부분의 면적. 3차원 구조가 필요한 PSA를 고속으로 근사 계산한 값.

TPSA와 같이 2차원 정보에서 3차원 정보를 근사적으로 계산한 것은 2.5차원 설명자라고도 하며, 3차원 설명자의 일부도 이에 적용됩니다.

3차원 설명자

3차원 기술자는 화합물의 입체구조에 기초하여 산출되는 값이다. 3차원 기술자를 산출하기 위해서는 정확한 3D 입체구조가 필요하다.

양자 화학 계산으로부터 산출되는 값(HOMO/LUMO 에너지 준위 등)이나 x, y, z의 3차원 좌표에 각 원자의 특징에 따라 가중을 한 분자 그래프를 놓고, 그것에 대응하는 분자 행렬 에서 산출되는 고유치 등이 이용됩니다.

4차원 설명자

상호 작용 에너지와 같은 다른 화합물과의 상호 작용을 통해 정의되는 기술자. Grid, CoMFA, Volsurf법 등에서 구할 수 있습니다.

설명자의 차원별 분류

この記述子の次元は英語版wikiで0-4次元では0-3次元、RDkitやPaDEL‐descriptorでは1&2と3次元に分類されており、分類の仕方も様々です(Grid, CoMFA, Volsurfを3次元としているところもありました)。出典やソフトにより違いがありますが、運用上はSMILESからも計算できる0-2次元以内の記述子と立体構造情報が必要な3次元以上に大別して考えればよいのではないかと思います。

참고
・영어 위키 https://en.wikipedia.org/wiki/Molecular_descriptor
· ScienceDirect Topic  https://www.sciencedirect.com/topics/medicine-and-dentistry/molecular-descriptor
·http://infochim.u-strasbg.fr/CS3/program/material/Todeschini.pdf