Como converter uma lista de números CAS e nomes IUPAC para SMILES de uma só vez [software livre]

2018 ano 12 mês 9 dia

Existem muitos sites que geram SMILES quando você insere o número CAS (No. CAS) ou Nome IUPAC para um composto, mas se houver muitas listas, insira-as uma a uma para converter. É impossível.Neste artigo, mostrarei como converter em lote uma lista de notações compostas contidas em milhares de unidades para SMILES ou chave InChI.

O que é ChemCell?

ChemCell é uma macro que permite ao Microsoft Excel converter nomes químicos e números CAS em strings SMILES.As notações dos compostos conversíveis são as seguintes.

  • CAS No.
  • SMILES
  • Chave InChI
  • Nome IUPAC

Baixar ChemCell

Chem CellVá para a página do GitHub em "baixando ChemCell" de, e você pode obtê-lo em "Clonar ou baixar" → "Baixar zip".

 

Como usar

Descompacte o arquivo zip e abra chemcell.xls.Se a macro não estiver ativada, clique em Central de segurança> Configurações da Central de segurança> Configurações da macro para ativar a macro.Tudo o que você precisa fazer é especificar a célula que contém a notação composta a ser convertida e inserir a seguinte função.

= getSMILES ()

Emite SMILES a partir do nome IUPAC e do número CAS

= getInChIKey ()

InChIKey é gerado pelo nome IUPAC, número CAS e SMILES.

Na verdade, converter

Vou tentar com benzeno. No PubChem, a notação composta do benzeno é a seguinte.

Nome IUPAC: Benzeno CAS: 27271-55-2 SORRISOS: c1ccccc1 InChIKey: UHOVQNZJYSORNB-UHFFFAOYSA-N

A saída a seguir é emitida em chemcell.xls e a conversão está correta.

A propósito, ao converter uma lista de milhares de compostos, demorava várias dezenas de minutos devido ao processamento.

Como funciona

https://cactus.nci.nih.gov/chemical/structure/ 「化合物の構造識別子」 / 「出力したい表現」

O mecanismo da ChemCell é simples, o serviço de conversão de notação de estrutura composta on-line do National Cancer Institute "Resolvedor de identificador químicoÉ usado. No Resolvedor de identificador químico, se você inserir o nome IUPAC, o número do CAS, etc. em uma determinada parte da URL, a notação da fórmula estrutural correspondente será retornada.Como é por meio de um serviço operado por um instituto de pesquisa nacional regular, parece que o resultado de saída da ChemCell pode ser usado com alguma confiabilidade.