sdf 다루기

앞의 글에서 이야기한 바와 같이 화합물의 구조와 이와 관련된 정보를 저장하는데 많이 사용되는 포맷이 MDL의 sdf 파일이다. 특히 많은 수의 화합물을 한 파일에 저장해야 할 필요가 있을 때는 sdf 파일이 유리한 점이 많이 있다. 기본적으로 sdf는 mol 파일의 포맷과 동일한 포맷이다. 다만 여러 개의 분자를 담고 있다보니 일반적으로 사용하는 chemical drawing program에서는 다루기가 어렵고 excel과 유사한 형태의 spreadsheet 형태의 인터페이스가 사용되어야 한다. 연구용으로 사용되는 상용 소프트웨어들은 많이 있지만 그런 소프트웨어들을 제외하고, 무료로 사용할 수 있는 소프트웨어들을 보면 다음과 같은 것들이 있다.
  1. ChemFileBrowser (link): sdf 파일을 보고 합치거나 나누기, csv 포맷의 데이터를 병합하기 등의 기능을 가지고 있는 소프트웨어이다. 간단한 분자표현자 계산 기능을 가지고 있다. 원래 0.2대의 버전들이 sdf를 여는데 문제가 있었는데, 최근에 발표된 0.2.8 버전에서는 이런 문제가 없다.

  2. PowerMV (link): 미국의 국립통계과학연구소의 Stan Young 박사가 개발한 소프트웨어이다. 일반에 배포하는 basic version은 0.6.1이고, 2005년 이후로는 업데이트되지 않고 있다. 그러나 affiliate version의 경우에는 0.7.1 버전이 나와 있고 더 많은 기능을 가지고 있다. 이 소프트웨어의 특징은 유명한 공개 통계 소프트웨어인 R을 붙여서 통계 기능을 수행할 수 있게 했다는 점이다. 이외에 간단한 similarity search, pharmacophore search 등을 할 수 있게 되어 있다 (실용적인 수준은 아닌 듯 하다).

  3. DS Visualizer (link): Accelrys사에서 무료로 배포하고 있는 소프트웨어로서 이전에는 DS Vierwer라는 이름을 가지고 있었다. 이전 글에서 언급을 한 바와 같이 리눅스와 윈도우용 버전을 모두 공개하고 있다. 원래 판매되는 소프트웨어였고, 화학 관련 소프트웨어 회사로서는 가장 다양한 소프트웨어를 보유하고 있는 Accelrys사의 제품답게 많은 기능과 편의성을 제공하고 있다. 사실 전에 DS Viewer Pro나 Lite에서는 sdf 파일에 대한 지원이 미약했었는데, 지금은 sdf를 매우 잘 지원하고 있으므로모델링 관련된 부분에서 이 소프트웨어로 볼 수 없는 것이 거의 없다고 말할 수 있을 정도이다.

  4. MayaChemTools (link): Manish Sud에 의해 개발되고 있는 perl 프로그램으로서 sdf를 다루기 위한 거의 모든 기능들을 가지고 있다. 이 이전 글에 관련 내용을 적어 놓았다.

Comments