CAS 번호나 IUPAC명의 리스트를 일괄로 SMILES로 변환하는 방법 【프리 소프트】

2018/12/9

하나의 화합물에 대해 CAS 번호(CAS No.)나 IUPAC Name을 입력하면 SMILES를 출력해 주는 사이트는 다수 있습니다만, 많은 리스트가 되어 있는 경우를 1개 XNUMX개 입력해 변환한다 불가능합니다.이 기사에서는 수천 코 단위로 포함된 화합물 표기 목록을 SMILES 또는 InChI Key로 일괄 변환하는 방법을 소개합니다.

ChemCell이란?

ChemCell은 Microsoft Excel에서 화학 이름과 CAS 번호를 SMILES 문자열로 변환할 수 있는 매크로입니다.변환 가능한 화합물 표기법은 다음과 같습니다.

  • CAS 번호(CAS No.)
  • 미소
  • InChI 키
  • IUPAC 이름

ChemCell 다운로드

ChemCell의 "downloading ChemCell"에서 GitHub 페이지로 이동하여 "Clone or Download"→ "Download zip"에서 구할 수 있습니다.

 

사용법

zip 파일의 압축을 풀고 chemcell.xls를 엽니다.매크로가 활성화되어 있지 않으면 보안 센터→보안 센터 설정→매크로 설정을 클릭하여 매크로를 활성화합니다.그리고는 변환 대상의 화합물 표기가 포함되는 셀을 지정해, 다음의 함수를 입력하기만 하면 됩니다.

=getSMILES()

IUPAC Name, CAS No.에서 SMILES를 출력합니다.

=getInChIKey()

IUPAC Name, CAS No., SMILES에서 InChIKey를 출력합니다.

실제로 변환해보세요

벤젠에서 시도해보십시오. PubChem에서 벤젠의 화합물 표기는 다음과 같은 기재가 있습니다.

IUPAC Name:Benzene CAS:27271-55-2 SMILES :c1ccccc1 InChIKey:UHOVQNZJYSORNB-UHFFFAOYSA-N

chemcell.xls는 다음과 같은 출력을 가지며 올바르게 변환되었습니다.

덧붙여서 수천개 수준의 화합물의 리스트를 변환하는 경우는, 처리의 관계로 수 충분히 정도 걸렸습니다.

구조

https://cactus.nci.nih.gov/chemical/structure/ 「化合物の構造識別子」 / 「出力したい表現」

ChemCell의 구조는 간단하고 미국 국립암 연구소의 온라인 화합물 구조 표기 변환 서비스Chemical Identifier Resolver"을 이용하고 있습니다. Chemical Identifier Resolver는 URL의 어느 부분에 IUPAC Name, CAS No. 등을 입력하면 해당하는 다른 구조식 표기를 반환합니다.정규의 국립연구소 운영의 서비스 경유이기 때문에 ChemCell에 의한 출력 결과는 어느 정도 신뢰해 사용할 수 있을 것 같습니다.