Een lijst met CAS-nummers en IUPAC-namen in één keer naar SMILES converteren [Gratis software]

2018 年 12 月 9 日

Er zijn veel sites die SMILES weergeven als je het CAS-nummer (CAS-nr.) Of IUPAC-naam voor één verbinding invoert, maar als er veel lijsten zijn, voer ze dan een voor een in om ze om te zetten. Is onmogelijk.In dit artikel laat ik je zien hoe je een lijst met samengestelde notaties in duizenden eenheden batchgewijs converteert naar SMILES of InChI Key.

Wat is ChemCell?

ChemCell is een macro waarmee Microsoft Excel chemische namen en CAS-nummers naar SMILES-strings kan converteren.De converteerbare samengestelde notaties zijn als volgt.

  • CAS-nr.
  • SMILES
  • InChI-sleutel
  • IUPAC-naam

Download ChemCell

ChemCellGa naar de GitHub-pagina van "Downloading ChemCell" van, en je kunt het krijgen van "Clone or Download" → "Download zip".

 

使い方

Pak het zip-bestand uit en open chemcell.xls.Als de macro niet is ingeschakeld, klikt u op Beveiligingscentrum> Instellingen Beveiligingscentrum> Macro-instellingen om de macro in te schakelen.Het enige dat u hoeft te doen, is de cel specificeren die de samengestelde notatie bevat die moet worden geconverteerd en de volgende functie invoeren.

= getSMILES ()

Voert SMILES uit van IUPAC-naam en CAS-nr.

= getInChIKey ()

InChIKey wordt uitgevoerd vanuit IUPAC-naam, CAS-nr. En SMILES.

Eigenlijk converteren

Ik zal het proberen met benzeen. In PubChem is de samengestelde notatie van benzeen als volgt.

IUPAC-naam: Benzeen CAS: 27271-55-2 SMILES: c1ccccc1 InChIKey: UHOVQNZJYSORNB-UHFFFAOYSA-N

De volgende uitvoer wordt uitgevoerd in chemcell.xls en wordt correct geconverteerd.

Bij het converteren van een lijst met duizenden verbindingen duurde het trouwens enkele tientallen minuten vanwege de verwerking.

Hoe het werkt

https://cactus.nci.nih.gov/chemical/structure/ 「化合物の構造識別子」 / 「出力したい表現」

Het mechanisme van ChemCell is eenvoudig, de online conversieservice voor samengestelde structuurnotaties van het National Cancer Institute "Chemische identificatie-oplosserIs gebruikt. Als u in Chemical Identifier Resolver de IUPAC-naam, CAS-nr. Enz. Invoert in een bepaald deel van de URL, wordt de overeenkomstige structuurformulenotatie geretourneerd.Omdat het via een dienst wordt beheerd door een regulier nationaal onderzoeksinstituut, lijkt het erop dat het outputresultaat van ChemCell met enige betrouwbaarheid kan worden gebruikt.