철도파업

철도노조에서 파업을 했다.

서울메트로 노조는 협상이 타결되어서 1~4호선까지는 문제가 없게 되었는데 국철과 KTX, 새마을호 등은 운행에 큰 차질이 빚어지고 있다. 덕분에 오늘 아침에도 경인로는 차가 무지하게 막히는 모습이었고, 개봉역에서 전철을 탔는데, 전철은 완전히 사람으로 가득차서 기어가는 모습이었다. 그래도 다행히 생각보다 시간이 많이 걸리지는 않아서 평소보다 15분정도 빨리 나왔는데 5분 정도 지각을 했을 뿐(!)이었다.

이상한 것은, 왜 TV 뉴스들에서는 파업의 원인이나 이유에 대한 분석 뉴스가 없냐는 것이다. 내가 본 뉴스들에서는 파업을 한다 내지는 그래서 어떤 불편이 우려된다 정도의 이야기만 하고 있을 뿐, 시청자들에게 파업의 원인이 뭐고, 어떻게 해결될 것이며, 또 어느 쪽에 더 잘못이 있는지 등등에 관한 해�은 전혀 해 주고 있지 않다. 그러니 뉴스 시간이 길 수가 없고, 24시간 뉴스를 한다는 YTN에서도 별다를게 없는 똑같은 뉴스만이 나오고 있는 것이다. 신문은 그나마 조금 나아서, 약간의 분석을 곁들이고 있지만 부족한 것은 역시나 매한가지이다.

파업도 좋고 다 좋은데, 중간에 어떤 문제가 있어서 그런 일이 발생했는지를 국민들이 알아야 바람직한 여론이 형성될 것 아닌가… 최소한 판단할 수 있는 기준 정도는 마련을 해 주어야 하는데, 아무리 뉴스를 보고 신문을 봐도 구체적으로 어떤 문제가 있는건지, 그리고 어느 쪽에서 잘못을 하고 있는건지, 어떤 잘못을 하고 있는건지에 대한 최소한의 판단조차 할 수가 없다.

Being Drug Discoverer

신약 개발! 멋진 말이면서 한없이 어려운 말이기도 하다. 무슨 일이든 그렇지 않은 일이 없긴 하겠지만, 신약 개발이라는 일이야말로 학문적 배경과 경제적 배경을 포함해서 너무나 다른 사람들이 모여서 협력해야만 이룰 수 있는 일이기 때문이다. 그런 면에서 경험이 중요한 일이 분명하다.

오늘 전임상 및 임상과 관련된 외국 CRO의 manager로부터 견적과 관련된 이야기를 들을 수 있는 기회가 있었다. 개인적으로는 물론이고, 전임상 진입을 위한 모든 필요 데이터를 in silico prediction으로 제공하는 것을 목표로 하고 있는 우리 연구소로서는 매우 중요한 경험이 되는 시간이었다. 그동안 막연하게 논문으로만 알고 생각했던 이야기를 돈과 직접적으로 연관된 견적의 형태로 보고, 각각의 과정에 대한 상세한 설명을 듣는 일이었으니 말이다. 사실상 국내에서 전임상을 완벽하게 해 줄 수 있는 곳이 없는 것이나 마찬가지인 상황에서, 이런 경험은 돈을 주고서도 배울 수 없는 일이다.

csv – useful format

CSV – more useful than your average file format이라는 제목의 글을 읽었다. 많은 개발자들이 데이터를 어떻게 formatting 해서 보여주어야 하는지 고민을 많이 하지만, 실제로는 데이터를 csv 형식으로 주고, 보는 것은 유저가 알아서 보게 하는 것이 좋다 는 정도의 요지로 쓰여진 글이다.

이 글을 보면서 두 가지 생각을 했다.

  1. Graphviz 라는 프로그램을 배워봐야겠다. (꽤 많은 사람들이 이 프로그램을 쓰는 것 같고, 굉장히 파워풀하다는 생각이 든다. 이미 이 프로그램을 깔았다 지워버린 것이 한 서너번 된다. 쩝…)
  2. 모든 정보를 텍스트로 관리하는 것은 좋은 생각이다. sdf에 들어있는 많은 데이터들을 관리하는 것도 실질적으로는 csv 형식으로 하는 것이 좋을 것 같다는 생각이 든다. 물론 그렇게 하면 분자 구조를 못보는 문제가 있지만, 구조만 가진 sdf 파일 안에 csv의 데이터를 쉽게 넣을 수 있는 방법만 있다면 사실 굳이 sdf 파일 안에 데이터를 우겨넣을 필요가 없다는 생각이 든다. 사실 분자의 구조 자체도 InCHI code를 잘 활용하면 csv에 넣지 못할 이유도 없긴 한데…

산골 마을의 삶

DSC02431 우리 어머니는 산골마을에서 나서 자라신 분이다. 도대체 어느 정도인가 하면 학교를 가기 위해 그야말로 산을 넘고 물을 건너 1시간을 걸어야 하는 그런 산골에서 자라셨다. 강원도 횡성군 안흥면 송한리. 이게 바로 그 마을의 이름이다.

이 사진은 내가 2004년 8월에 찾아갔을 때 찍은 사진이다. 근처에 집이라고는 하나 없고, 그저 이 사진에서 보이는 집이 유일한 집이었다. 차를 타고 꼬불꼬불 좁은 산길, 그것도 차 두대가 중간에서 만나면 어떻게 해야할지 난감해지는 그런 길을 한참이나 올라서야 도착한 곳이었다. 사진에 보이는 집이 바로 우리 어머니가 사셨던 집 위치에 있는거라고 한다. 거기서 산골짜기를 따라 한참을 내려가서 학교를 다니셨다는 어머니의 말씀을 기억하고 아래를 내려다봤는데, 그야말로 지금은 아무도 다닐 수 없을 것처럼 보이는 완전한 첩첩산중이었다. 사람이 한 번도 밟은 적이 없는 하얀 눈을 밟아보는 것이 지금의 우리에게는 낭만일지 모르지만, 어린 시절의 우리 어머니에게는 그것이 가장 견디기 힘든 일 중의 하나였다고 한다.

지금은 안흥도 찐빵으로 유명해져서, 많은 사람들이 찐빵으로 경제적인 부를 창출하고 있다고 한다. 또, 주천강이 바로 옆에 있어서 휴양림이며 펜션 단지로 개발도 된다고 한다. 그러나 여전히 송한리는 옛날의 상태를 유지하고 있다. 아니, 오히려 옛날보다 사람이 더 줄어서 이제는 거의 사람이 없는 곳이 되어버렸다고 한다. 그러나, 이런 곳이 바로 우리의 고향이라는 사실은 잊어서는 안될 것 같다. 자연이 사람을 키우고 먹인다는 간단한 이치가 너무나 당연하게 받아들여지는 곳이 바로 이 곳이다.

MayaChemTools

MayaChemTools라는 이름의 프로그램이 있다. GNU LGPL에 의해 배포되는 무료 프로그램으로서 perl로 프로그래밍 되어있다. 원래 펄이라는 언어가 텍스트 프로세싱에 유용한 언어인데다 역사가 깊기 때문에 굉장히 많은 라이브러리가 존재하는 것이 큰 강점이다. 루비가 깔끔하고 좋은 언어적 특징을 가지고 있는데 비해 라이브러리가 많지 않다는 점은 분명히 약점 중의 하나이다. (물론 이 약점은 시간이 해결해 줄 수 있는 것이기는 하다)

이 mayachemtools라는 프로그램을 찬찬히 뜯어보면 굉장히 멋진 프로그램이라는 것을 쉽게 알 수 있다. 기본적으로 sdf 파일과 csv, tsv 파일을 처리할 수 있도록 되어 있는데, 실제로 아직까지 cheminformatics에서 할 수 있는 일이라는 것이 sdf 파일의 내용을 일관적으로 관리하고 그 정보를 가공하는 정도이기 때문에 sdf 파일을 쉽게 처리할 수 있다는 것은 매우 중요한 일 중의 하나이다. 게다가 cheminformatics 프로그램이 아닌 일반적인 실험 데이터들은 대부분 csv 형식으로 저장될 수 있기 때문에, 실험과 관련된 데이터를 처리하기 위해서는 csv 파일에 들어있는 정보를 처리하는 기술이 필요하다. 이런 측면에서 생각해볼 수 있는 거의 모든 기본적인 기능을 가지고 있는 것이 바로 mayachemtools 이다. 그리고 이런 기능이 거의 텍스트 프로세싱이라는 것을 감안하면 펄을 사용하는 것이 아주 적절한 선택이라는 것을 알 수 있다.

결국 모든 데이터는 텍스트로 관리되어야 한다. 최근에 MS 오피스도 자체 포맷을 xml 형태로 하기로 했다고 하는데, 이런 것도 결국은 호환성이나 실용성을 따져보았을 때 텍스트로 관리하는 것이 유용하기 때문이라고 생각할 수 있다. 특히 용량의 면에서도 텍스트 파일을 gzip같은 알려진 압축 포맷으로 압축하여 보관하고, 프로그램에서 읽을 때 압축을 해제하는 과정을 한 번 더 거치게 되면 문제될 것이 전혀 없다. 게다가 이런 압축과 압축 해제에 필요한 모든 루틴들은 거의 표준화되어 공개되고 있지 않은가…

최근에 ChIPS같은 cheminformatics database system 을 만드는 일에 참여를 하면서 이런 생각들을 하고 있다. 그리고 생각보다 좋은 프로그램들이 많이 만들어져 있기 때문에, 이런 것들을 적절하게 묶고 integration 함으로서 아주 좋은 어플리케이션을 제공하게 될 수 있을거라는 생각이 든다.