Cómo convertir una lista de números CAS y nombres IUPAC a SMILES a la vez [software gratuito]

2018/12/9

Hay muchos sitios que generan SMILES cuando ingresa el número CAS (No. CAS) o el nombre IUPAC para un compuesto, pero si hay muchas listas, ingréselos una por una para convertir. Es imposible.En este artículo, le mostraré cómo convertir por lotes una lista de notaciones compuestas contenidas en miles de unidades a SMILES o InChI Key.

¿Qué es ChemCell?

ChemCell es una macro que permite a Microsoft Excel convertir nombres químicos y números CAS en cadenas SMILES.Las notaciones compuestas convertibles son las siguientes.

  • No CAS.
  • Proyecto SMILES
  • Clave InChI
  • Nombre IUPAC

Descarga ChemCell

ChemCellVaya a la página de GitHub desde "descargar ChemCell" de, y puede obtenerlo desde "Clonar o descargar" → "Descargar zip".

 

使 い 方

Descomprima el archivo zip y abra chemcell.xls.Si la macro no está habilitada, haga clic en Centro de seguridad> Configuración del centro de seguridad> Configuración de macros para habilitar la macro.Todo lo que tiene que hacer es especificar la celda que contiene la notación compuesta que se va a convertir e ingresar la siguiente función.

= getSMILES ()

Emite SONRISAS del nombre IUPAC y el número CAS

= getInChIKey ()

InChIKey es una salida de IUPAC Name, CAS No. y SMILES.

Realmente convertir

Lo intentaré con benceno. En PubChem, la notación compuesta de benceno es la siguiente.

Nombre IUPAC: Benceno CAS: 27271-55-2 SONRISAS: c1ccccc1 InChIKey: UHOVQNZJYSORNB-UHFFFAOYSA-N

La siguiente salida se genera en chemcell.xls y la conversión es correcta.

Por cierto, al convertir una lista de miles de compuestos, tomó varias decenas de minutos debido al procesamiento.

Cómo funciona

https://cactus.nci.nih.gov/chemical/structure/ 「化合物の構造識別子」 / 「出力したい表現」

El mecanismo de ChemCell es simple, el servicio de conversión de notación de estructura compuesta en línea del Instituto Nacional del Cáncer "Solucionador de identificadores químicosSe utiliza. En Chemical Identifier Resolver, si ingresa el nombre IUPAC, el número CAS, etc. en una determinada parte de la URL, se devolverá la notación de la fórmula estructural correspondiente.Dado que es a través de un servicio operado por un instituto de investigación nacional regular, parece que el resultado de salida de ChemCell se puede utilizar con cierta fiabilidad.