Как сразу преобразовать список номеров CAS и имен ИЮПАК в SMILES [Бесплатное программное обеспечение]

2018 год 12 месяц 9 день

Есть много сайтов, которые выводят УЛЫБКИ, когда вы вводите номер CAS (номер CAS) или имя IUPAC для одного соединения, но если списков много, введите их один за другим для преобразования.В этой статье я покажу вам, как пакетно преобразовать список составных обозначений, содержащихся в тысячах единиц, в SMILES или InChI Key.

Что такое ChemCell?

ChemCell - это макрос, который позволяет Microsoft Excel преобразовывать химические названия и номера CAS в строки SMILES.Преобразуемые составные обозначения следующие.

  • № CAS
  • УЛЫБКИ
  • Ключ InChI
  • Название ИЮПАК

Скачать ChemCell

ХимСеллПерейдите на страницу GitHub из раздела «Загрузка ChemCell» из, и вы можете получить его из «Клонировать или загрузить» → «Загрузить zip-архив».

 

Как использовать

Разархивируйте zip-файл и откройте файл chemcell.xls.Если макрос не включен, щелкните Центр обеспечения безопасности> Параметры центра обеспечения безопасности> Параметры макроса, чтобы включить макрос.Все, что вам нужно сделать, это указать ячейку, содержащую составную нотацию, которую нужно преобразовать, и ввести следующую функцию.

= getSMILES ()

Выводит УЛЫБКИ из имени ИЮПАК и номера КАС.

= getInChIKey ()

InChIKey выводится из имени IUPAC, номера CAS и SMILES.

Фактически конвертировать

Я попробую с бензолом. В PubChem составное обозначение бензола выглядит следующим образом.

Название ИЮПАК: Бензол CAS: 27271-55-2 УЛЫБКИ: c1ccccc1 InChIKey: UHOVQNZJYSORNB-UHFFFAOYSA-N

Следующий вывод выводится в Chemcell.xls, и преобразование правильное.

Кстати, при преобразовании списка из тысяч соединений из-за обработки потребовалось несколько десятков минут.

Как это работает

https://cactus.nci.nih.gov/chemical/structure/ 「化合物の構造識別子」 / 「出力したい表現」

Механизм ChemCell прост, онлайновая служба преобразования нотации структуры соединений Национального института рака "Резольвер химического идентификатораИспользуется. В сопоставлении химических идентификаторов, если вы введете имя IUPAC, номер CAS и т. Д. В определенной части URL-адреса, будет возвращено соответствующее обозначение структурной формулы.Поскольку это делается через службу, управляемую обычным национальным исследовательским институтом, кажется, что выходной результат ChemCell можно использовать с некоторой надежностью.