Liste dimensionnelle des descripteurs moléculaires

2019er mars 1

Qu'est-ce qu'un descripteur moléculaire?

Une valeur numérique qui exprime les caractéristiques de la molécule en fonction de sa structure chimique.Le type de descripteur est divisé en dimensions 0-4 en fonction de l'espace composé considéré lors du calcul du descripteur.

Liste des descripteurs par numéro de dimension

Nombre de dimensions descripteur Exemple concret
0D Descripteur de configuration
Descripteur de comptage
Poids moléculaire, nombre de liaisons
Numéro atomique de C, H, O, N, etc.
1D Nombre de fragments
Empreintes
Nombre de comptage et présence / absence (0 ou 1) d'une sous-structure spécifique
-CH3, -OH, -NH2, -COOH
-CH2-, -CH2-CH2-… etc.
2D Descripteur topologique
(Index topologique, indice de connectivité)
Indice Balaban J, indice Zagreb, indice Wiener,
Indice de connectivité Chi, indice de forme kappa,
BCUT
3D Descripteur de géométrie
(Descripteur géométrique)
Descripteurs 3D-MoRSE
Descripteurs WHIM
Descripteurs GETAWAY
Descripteurs quantiques-chimiques
descripteurs de taille, stérique, de surface et de volume, etc.
4D Énergie d'interaction Échantillonnage des coordonnées 3D + conformation.
Grille, CoMFA, Volsurf

Image en dimensions 0-3

L'image suivante est facile à comprendre.Il s'agit d'une diapositive du laboratoire (Groupe de recherche chimiométrie et QSAR) de l'Université de Strasbourg, France.

Source:http://infochim.u-strasbg.fr/CS3/program/material/Todeschini.pdf

Descripteur 0D

Les descripteurs moléculaires 0D sont également appelés descripteurs constitutionnels et descripteurs de comptage.

Y compris le poids moléculaire, le nombre de certains atomes de la molécule (C, H, O, N, halogène, le nombre de cycles, le nombre total d'atomes lourds, etc.), le nombre de liaisons rotatives, le nombre de 2 (ou 3) doubles liaisons, etc. Les valeurs qui peuvent être obtenues à partir de la formule moléculaire sont listées.

Descripteur 1D

Un groupe de descripteurs qui comptent des groupes fonctionnels et des sous-structures spécifiques (= nombre de fragments) et expriment leur présence ou leur absence par 0 et 1 (= empreinte digitale).
Les groupes fonctionnels et les structures partielles cibles comprennent les carbones primaires, secondaires et tertiaires, les carbones terminaux et internes, les groupes hydroxy, les groupes amino, les groupes amide, les groupes imino, les acides carboxyliques, les thiols, les cycles benzéniques, les cycles aromatiques, etc.

Le nombre d'atomes donneurs et accepteurs de liaisons hydrogène et les valeurs de propriétés physiques telles que divers LogP (AlogP, ClogP, SlogP, XlogP, etc.) sont également inclus dans le descripteur unidimensionnel.

Descripteur 2D

Un descripteur bidimensionnel comprend un descripteur topologique.Il est également appelé index topologique ou index de connectivité.Le professeur Haruo Hosoya, professeur émérite à l'Université d'Ochanomizu, est connu comme l'inventeur.

Un composé descripteur topologique est une valeur calculée comme un invariant d'un composé sous la forme d'une structure de graphe et de son graphe moléculaire.

Exemple:
Indice de Wiener: somme des distances les plus courtes entre certains atomes d'une molécule
Surface polaire topologique (TPSA): L'aire de la partie polaire de la surface moléculaire. Un calcul approximatif à grande vitesse de PSA qui nécessite une structure tridimensionnelle.

Le calcul approximatif des informations 2D à partir d'informations 3D telles que TPSA est également appelé descripteur 2.5D, et une partie du descripteur 3D s'applique également à cela.

Descripteur 3D

Le descripteur tridimensionnel est une valeur calculée sur la base de la structure tridimensionnelle du composé. Une structure 3D précise est nécessaire pour calculer le descripteur 3D.

Un graphe moléculaire qui pondère les valeurs calculées à partir de calculs de chimie quantique (niveaux d'énergie HOMO / LUMO, etc.) et les coordonnées tridimensionnelles de x, y et z en fonction des caractéristiques de chaque atome est placé, et le correspondant matrice moléculaire Les valeurs propres calculées à partir de sont utilisées.

Descripteur 4D

Un descripteur défini par l'interaction avec d'autres composés, comme l'énergie d'interaction. Il est obtenu à partir de la méthode Grid, CoMFA, Volsurf, etc.

Classification dimensionnelle des descripteurs

この記述子の次元は英語版wikiで0-4次元では0-3次元、RDkitやPaDEL‐descriptorでは1&2と3次元に分類されており、分類の仕方も様々です(Grid, CoMFA, Volsurfを3次元としているところもありました)。出典やソフトにより違いがありますが、運用上はSMILESからも計算できる0-2次元以内の記述子と立体構造情報が必要な3次元以上に大別して考えればよいのではないかと思います。

Référence
・ Wiki anglais https://en.wikipedia.org/wiki/Molecular_descriptor
・ Sujet ScienceDirect  https://www.sciencedirect.com/topics/medicine-and-dentistry/molecular-descriptor
·http://infochim.u-strasbg.fr/CS3/program/material/Todeschini.pdf