Tag: 검색 (page 1 of 2)

데이터 정리 방법

컴퓨터에 있는 데이터를 정리하는 가장 좋은 방법은 무엇일까? Hongiiv님의 블로그 포스트를 읽고 간단하게 댓글을 남기려다가, 간단하게 할 수 있는 이야기는 아닌 것 같아서 따로 포스팅을 한다.

첫째. 폴더 구조를 통한 정리법

파일 이름에 의미를 부여하고, 이것을 구조화된 폴더에 넣는 것은 가장 직관적인 방법 중의 하나이다. 이렇게 파일을 정리하게 되면, 누구보다도 파일을 관리하는 자신이 전체 데이터의 구조와 정렬 등을 책임지게 되기 때문에 누구보다 이 데이터를 잘 파악할 수 있다는 장점이 있다.

그러나 단점이 없을 수는 없는 법. 이렇게 의미를 기준으로 정리를 하다보면 정리 기준이 바뀌어야 하는 경우가 생긴다는 점이다. 이전에는 A라는 제목으로 분류를 하던 데이터인데, 이 쪽의 데이터를 많이 다루다보니 A만으로는 부족하게 되어 A-1, A-2, … 등으로 나누고 싶어지게 된다. 뭐 데이터 개수가 적을 때는 그런대로 이렇게 분류를 쪼개는 것으로도 유지를 할 수가 있다.

그런데, 더 큰 문제는 분류라는 것이 항상 hierachy를 정확하게 유지할 수 있는 것이 아니라는 점이다. 어떤 논문을 읽었는데, 이건 화학에도 들어가고 생물학에도 들어간다면 이건 "화학" 폴더에 넣어야 하는지 아니면 "생물학" 폴더에 넣어야 하는지 고민을 하게 되는 것이다. 이런 고민이 많아진다는 것은, 애초에 결정했던 분류 기준이 적절하지 않다는 것을 의미하기도 하지만, 애초에 데이터라는 것이 이렇게 정확하게 분류할 수 있는 것이 아니라는 사실을 의미한다고 보는 것이 더욱 정확한 해석일 것이다.

사소한 문제일 수도 있지만, 모든 파일에 내용을 반영한 적절한 이름을 붙이는 것도 그렇게 쉬운 일은 아니다. 게다가 파일의 종류에 따라 필요한 정보들이 달라지기 때문에, 특정한 종류의 파일에서는 이 전략이 적절하지만 다른 종류의 파일에 대해서는 이 전략이 통하지 않을 수 있다.

둘째. 태그+검색

최근에 많이 사용되는 방법이 태그와 검색을 사용하는 방법이다. 파일에 적절한 태그를 붙여놓고 이 태그를 기반으로 검색을 하는 것이다. 이것이 맥OS에서는 스마트폴더라는 이름으로 구현이 되어 있다.

사실 윈도우에서 가장 불편한 점 중의 하나가 바로 이런 태그+검색 기능을 잘 활용할 수 없다는데 있다.

물론 이 방법이 항상 좋은 것만은 아니다. 가장 큰 문제라면 역시 상황에 맞는 적절한 태그를 달아줘야 한다는 점이다. 그나마 태그는 서로 다른 수준의 표현을 동시에 쓸 수 있기 때문에 (예를 들어, 파일에 작성자, 내용, 출처, 날짜, 분류 등 상이한 수준의 정보를 태그로 넣을 수 있다) 폴더를 통한 분류보다는 더욱 현실적이다.

또 하나의 문제는, 이 전략을 효율적으로 수행하기 위해서는 태그를 다는 것이 편하고, 검색을 하는 것은 더욱 편해야 한다는 점이다. 검색을 염두에 두고 만들어진 파일 시스템이 아닌 경우라면, 전체 하드 디스크를 검색하는 것은 시스템에 큰 무리를 주는 일일 수 있다. 또, 검색 엔진이 내가 원하는 검색 결과를 얻어내지 못한다면 태그를 붙이나마나 한 일이 될 것이다. 다행히도, 최근에 나오고 있는 데스크탑 검색 엔진들은 일정 수준 이상의 동작을 보여주고 있기 때문에 (여전히 불편한 일이기는 하지만) 큰 어려움은 없을 것이다.

셋째. 나의 전략

맥을 구입하기 전에 사용하던 방식은 파일의 종류에 따라 서로 다른 방식을 사용하는 것이었다. 논문 관련 pdf는 Endnote에서, 그림 파일은 피카사에서, 문서 파일은 폴더에 나누어서 정리, 프리젠테이션 파일은 날짜와 제목을 적어서 한 폴더에 몰아넣기 뭐 이런 식이었다.

이제 맥으로 전향한 후에는 방법이 거의 완전히 바뀌었다.

내가 지금 사용하고 있는 프로그램은 EagleFiler이다. 이 프로그램은 모든 종류의 파일에 태그를 붙이고 이를 쉽게 검색할 수 있도록 도와주는 프로그램이다. 다른 사람들이 잘 사용하는 프로그램 중에는 DevonThink, Yojimbo, Evernote 같은 것들이 있다. (이 중에서 DevonThink같은 경우에는 추론 엔진을 가지고 있어서, 사용자가 인지하지 못하고 있던 데이터 간의 연관 관계까지 파악해준다고 한다) 내 컴퓨터의 문서 폴더에는 교회, 개인, 연구 정도의 폴더가 있고, 필요에 따라 많은 파일을 써야하는 프로젝트가 있으면 따로 폴더를 만들기도 한다. 바로 지울 수 있는 파일이 아니라면 다 EagleFiler에 넣고 간단한 태그들을 붙여놓는다. 이렇게 하면 EagleFiler는 파일을 자신의 디렉토리에 옮겨서 정리를 한다. 원본 데이터가 지워지더라도 백업본을 가지고 있을 수 있다는 장점도 있다. (대신 하드디스크를 더 쓰는거지만) 최근에는 Leap이라는 프로그램이 매우 좋을 것 같아서 구입을 해야 하는지 고민하고 있다.

이메일의 경우에는 이메일 파산을 경험하지 않기 위해 MailTags라는 프로그램을 사용해서 태그를 붙여놓고, 필요없는 메일은 Inbox에서 다른 폴더로 바로 옮겨놓는다.

논문의 경우에는 BibDesk + Yep의 조합으로 하고 있다. 좀더 자세한 내용은 이 포스트에서…

넷째. 진짜 중요한 데이터인가

이사를 하거나 회사에서 자리를 옮기거나 하는 경우에 물품들을 정리하게 된다. 많은 경우, 이럴 때 뭔가를 많이 버리지 않으면 온갖 짐들은 늘어나기만 하고 줄어들지 않는다. 이렇게 늘어난 잡동사니들은 일의 효율성을 떨어뜨리는 주범이다.

그래서 내가 관리하고 있는 파일이 정말 오랫동안 보존할만한 가치가 있는 것인지를 항상 물어봐야 한다. 그리고 이런 질문을 효율적으로 하려면, 끊임없이 해야 한다. 이런 생각을 하지 않는 경우와 하는 경우가 섞이게 되면 도리어 더욱 정신이 없어질 수 있기 때문이다. 따라서, 일이 진행되는 순서, 혹은 개인의 업무 플로우를 수정할 필요가 생긴다.

데이비드 알렌의 GTD는 이런 면에서도 큰 도움을 주는 방법이다. GTD에서 개인적으로 중요하다고 생각하는 부분은, 모든 stuff를 모으는 큰 수집함이 있어야 한다는 점, 그리고 이것이 바로 처리 가능한지를 판단해서 가능하면 바로 하고, 가능하지 않으면 미루거나 다른 사람에게 부탁하는 점이다. 파일도 마찬가지이다. 당장 뭔가를 해야 하는 일이라면 하고, 그렇지 않으면 미루어 두던지, 다른 사람에게 보내던지, 아니면 삭제를 하던지, 혹은 참고자료로 분류해서 깊숙이 넣어두던지를 결정해야 한다.

결국, 효율적인 데이터의 정리라는 것은 다음 요소들의 결합으로 가능하다고 본다.

  1. 일을 뒤로 미루지 않는 부지런함
  2. 빠짐없이 파일을 수집하고 분류할 수 있는 프로그램 (반드시 컴퓨터 프로그램일 필요는 없다!)
  3. 변화에 유연하게 대처할 수 있는 방법
  4. 일의 흐름을 일정하게 유지할 수 있는 끈기

이 네 가지 요소가 잘 결합된다면 파일(을 포함한 여러 업무들까지)을 잘 관리하게 될 수 있으리라고 생각한다.

 

EagleFiler

EagleFiler. 맥용 프로그램. 뭐라고 딱히 정의하기가 힘든 프로그램이다. 윈도우에서는 이런 기능을 하는 프로그램이 거의 없는 것 같다. 맥용 소프트웨어들과 비교를 하자면 YojimboDevonThink류의 프로그램이라고 할 수 있다. 맥에서 사용하는 모든 종류의 파일, 이메일 메시지, 노트, 웹 페이지 등을 저장하고 관리하는 기능을 가지고 있다. (세 종류의 프로그램을 모두 trial 기간 동안 사용해 보고 비교한 후에 EagleFiler를 구매하기로 결정하였다.)

이런 프로그램들의 기능은 대체로 세 가지로 볼 수 있다.

첫째는 수집 기능이다. 어떤 상황에서든 어떤 프로그램을 사용하고 있든 상관없이 즉각적으로 정보를 저장할 수 있어야 한다. 언뜻 생각하기에도 이것은 그렇게 간단한 일이 아니다. 우선은 시스템 전체에 걸쳐 사용할 수 있는 핫키가 있어야 하겠고, 많은 프로그램들의 다양한 포맷을 지원할 수 있어야 하기 때문이다. 이런 면에서 EagleFilerYojimboDevonThink에 비해 장단점을 가지고 있다. Journler의 drop box와 비슷한 Drop Pad라는 것을 지원하는데, 어떤 것이든 일단 끌어다 놓으면 바로 엔트리로 등록을 해 준다. Yojimbo의 경우에는 화면 오른쪽 중앙에 탭을 만들어줘서 이걸 클릭하면 drag&drop할 수 있는 공간이 나타나도록 되어 있다. 반면 Journler는 바탕화면에 폴더 링크를 만들어놓은 상태이다. EagleFiler의 Drop Pad는 별도의 작은 윈도우이기 때문에 위치 변경이 자유롭다는 장점이 있는 반면에 Cmd+H 키로 창을 숨기는 경우에는 함께 사라지기 때문에 불편한 점도 있다고 할 수 있다. 개인적으로는 Yojimbo의 방식이 가장 마음에 들지만, EagleFiler의 핫키인 F1이 대부분의 경우에 잘 동작하기 때문에 큰 문제는 아니라는 생각이 든다. 어쨌든 Drop Pad의 활용도는 좀 떨어지는 편이다.

정보 수집이라는 측면에서 보면 EagleFiler는 자체 노트 기능을 가지고 있지 않은 점이 좀 아쉽기는 하지만, 나는 Journler를 노트로 사용하고 있고, 여기에서 import는 아무 문제 없이 잘 되기 때문에 큰 문제는 없어보인다.

두번째는 정리 기능이다. 수집된 정보들을 분류하고 저장하고 직관적으로 정리할 수 있어야 한다. EagleFiler는 데이터의 정리를 위해 태그를 사용하고 있다. 맥에서 데이터 정리를 할 때 태그를 활용하는 것이 좋은 방법이기는 한데, spotlight comment를 이용하는 방식은 좀 입력이 불편하다는 단점이 있다. 이런 점을 개선하기 위해 TagBot, SpotMeta 등의 프로그램이 사용될 수 있는데, 이런 프로그램들을 사용해 본 결과 TagBot이 가장 마음에 들었었다. 그런데, TagBot은 무료 버전의 경우 6개까지만 태그를 쓸 수 있고 그 이상의 태그를 쓰려면 유료 버전을 구입해야 한다. 구입 방법이 오직 프로그램 내에서 제공하는 LicenseBot이라는 것을 이용할 수밖에 없는데, 내 경우에는 이것이 제대로 동작하지 않아서 구매를 할 수가 없었다. EagleFilerTagBot은 함께 잘 동작하는 것으로 알려져 있기 때문에 TagBot으로 태그를 붙여놓은 경우에 이것을 EagleFiler로 불러들이면 태그가 잘 보존된다. 그렇지 않은 경우에는 일단 EagleFiler에서 자체적으로 제공하는 태그 기능을 이용하면 자료 정리를 잘 할 수 있다.

아쉬운 점은 스마트 폴더를 아직 제공하지 않는다는 점인데, 이것은 거의 1년간 TODO 리스트에 올라있는 것인만큼 곧 제공이 될 것이라고 생각된다. 당분간은 여러 개의 태그를 선택하는 방법으로 스마트 폴더를 흉내낼 수는 있을 것이다.

세번째는 검색 기능이다. 사실 이런 류의 프로그램을 사용하는 이유는 바로 검색 때문이라고 할 수 있다. 내 컴퓨터에 저장된 파일의 용량과 갯수가 머리로 관리할 수 있는 정도를 한참 벗어나 있기 때문에, 모든 파일에 대해 쉽게 검색하고 찾을 수 있도록 하는 것이 중요한 가치를 지닌다. 데스크톱 검색이 유행하고 있는 것이 바로 그런 이유에서이다.

데스크톱 검색이 아무리 뛰어나다고 하더라도, 일부 형식의 파일을 기계적으로 파싱해서 정보를 가지고 있는 것과, 사용자가 직접 넣은 정보를 토대로 관리하는 것에는 근본적인 질적 차이가 존재한다. 어쨌든 사용자가 자신에게 가장 맞는 정보를 입력하고 그것을 이용해 검색하는 것이 가장 유용한 검색일 수 밖에 없기 때문이다. Spotlight, 그리고 구글 데스크톱 검색이 모두 유용한 검색법이지만 잘 정리된 EagleFiler 라이브러리에 비할 바는 아니다.

추가적으로, DevonThink의 경우에는 인공지능을 이용해서 자료 간의 관계를 찾아주는 기능이 있고, 이것이 많은 사람들에게 매력적으로 다가가는 것 같다. 다만, 이런 부분은 방대한 데이터가 축적된 상황에서야 힘을 발휘하는 것이니만큼 당장 효과를 볼 수 있는 부분은 아닐 것이다. EagleFiler는 그런 인공지능을 가지고 있지는 않지만 가격이 저렴한 편이고 인터페이스가 직관적이라는 장점을 가지고 있다. 또한, 개발자가 매우 빠르게 지원을 제공한다는 장점도 있다. 처음 EagleFiler를 사용할 때, 한글 상위에서 F1 키가 제대로 작동하지 않는 것으로 보이는 에러가 있었는데, 제작자에게 이메일을 보냈더니 바로 답장이 왔다. 몇 번의 테스트를 통해, 그것이 한글 상위에서만 발생하는 일이라는 사실을 알게 되었고, 지금은 영문 상위에서 아무런 문제 없이 사용하고 있다. 어떤 경우에는 EagleFiler가 여러 개의 라이브러리를 만들어 사용할 수 있다는 점이 장점이 될 수도 있을텐데, 나로서는 그냥 한 개의 라이브러리만을 사용하고 있는터라, 이것이 어떤 경우에 장점이 될 수 있을지는 잘 모르겠다.

또하나의 장점은, 이 프로그램이 이메일 저장 프로그램으로 활용될 수 있다는 점이다. 사실, 적절한 이메일 백업 프로그램을 찾고 있었지만, 적당한 것을 찾을 수 없었는데, 이 프로그램은 나름대로 이런 역할도 할 수 있다는 점에서 Yojimbo와의 차별성을 찾을 수 있었다. 또한 MailTags를 사용한다면 (이걸 구매해야 하는지 고민하고 있다) 여기에서 넣은 모든 태그들을 잘 보존해 주기 때문에 나름대로 꽤 의미가 있는 것 같다. 다만, 이메일 저장 형식은 mbox 이기 때문에 개별 메일을 가져오는 경우에는 나름대로의 방식으로 합쳐야 한다는 단점이 있기도 하다. 물론 저장이라는 측면에서는 표준적인 mbox 형식을 사용하는 것이 여러 가지 장점이 있는 것도 사실이다.

결론적으로, EagleFilerDevonThink의 강력한 기능은 필요하지 않으면서 유용한 자료 관리 툴이 필요한 경우에 요긴하게 사용할 수 있는 재주많은 프로그램이다. 별 다섯개 만점에 네개 반을 주고 싶다. (반개가 모자란 이유는 스마트 폴더를 지원하지 않기 때문이다. 스마트 폴더를 지원하는 순간 별 다섯개를 줄 것이다)

Powered by Qumana

Inline Search

내가 생각하기에 마이크로소프트의 인터넷 익스플로러(이하 IE)는 그렇게 잘 만든 소프트웨어가 아니다. 특히 짜증나는 부분은 검색 인터페이스이다. IE에서 검색을 하면 따로 검색 윈도우가 뜨게 되는데, 이 창이 내용을 가려서 문제가 되는 경우가 많이 있다. 최근에는 웹 검색에서도 타이핑을 할 때마다 검색을 실시간으로 하는 기능이 있는데, 이런 기능도 지원이 되지 않는다.

반면에 파이어폭스에서는 창 아래 쪽에 검색 바가 뜨고, 이걸 통해서 검색을 할 수 있기 때문에 내용을 가리지 않을 뿐더러 타이핑을 하는 동안 실시간으로 검색이 되어, 없는 단어를 입력한 경우에는 대상 단어가 존재하지 않는다는 것을 바로 알 수 있다는 장점이 있다.

오늘 소개하는 Inline Search는 이런 가려운데를 긁어주는 무료 소프트웨어이다.

백문이 불여일견! 다음의 스크린샷을 보면 이 프로그램의 모든 것을 이해할 수 있다.

Screenshot of Inline Search

모든 IE 사용자들에게 강력 추천!

NHN 제로보드 인수

NHN, 제로보드 인수

이런 기사가 떴다.

제로보드라는게 회사도 아닌데 뭘 인수한다는걸까 하는 의문이 들어서 제로보드 홈페이지를 방문해 봤다. 거기에서 제로보드의 개발자가 올린 글을 볼 수 있었다.

제로보드 개발자가 첫눈이라는 검색엔진 개발 회사에 들어가서 제로보드 5 작업을 했었고, 그 첫눈이 NHN으로 합병이 된 이후에는 제로보드에 신경을 쓰지 못하고 있다가, NHN 측에서 제로보드의 개발을 전폭적으로 지원을 해 주기로 한 모양이다. 그리고 지금은 <제로보드 XE>라는 이름으로 (약 80% 가량) 개발이 진행되고 있고, 이 버전은 제로보드 4와 5의 장점을 취합한 것이라고 한다.

제로보드 5가 처음 나올 때도 쓰긴 했지만 , 제로보드가 한국 인터넷 문화에 가지고 있던 영향력이 엄청난만큼, <제로보드 XE>에도 관심을 갖지 않을 수 없다. 제로보드 5의 모습을 보고 약간은 미심쩍은 것도 사실이긴 하지만, NHN이라고 하는 회사의 힘을 생각해 본다면 충분히 기대할만한 것 같다.

하지만, 나는 이미 metabbs로 전향을 했단 말이다!

롱테일 경제학

올해의 열 아홉번째 책은 롱테일 경제학이다.

롱테일의 개념은 이제 매우 익숙한 것이 되어서 대부분의 사람들은 이 개념을 별 어려움 없이 받아들이고 있는 것으로 보인다. 결국 중요한 것은, 이렇게 사례로부터 어떤 개념이 정립되고 나면, 그 개념의 정립을 통해서 새로운 적용 사례가 나타나는 것이다. 그리고 개인적으로는 내가 일하고 있는 분야에서 이런 종류의 새로운 개념의 적용을 할 수 있는가 하는 문제가 중요하다.

롱테일 현상을 일으키는 가장 중요한 동인은 전시 비용의 감소 라고 말할 수 있다. 상품의 진열에 (거의) 비용이 들지 않는 디지털 콘텐츠 분야에서 롱테일 현상이 두드러지게 나타나는 것은 바로 이런 이유이다. 물론 이렇게 제시된 수많은 선택의 가능성으로부터 자신이 원하는 내용을 찾기 위한 검색 엔진의 중요성 은 아무리 강조해도 지나치지 않다.

신약 개발 분야에서도 이런 종류의 논리가 적용될 수 있을까? 보건의료 분야라면 분명 가능성이 있어보인다. 물리적인 공간의 한계가 있기는 하지만, 원격 진료 라는 개념이 어느 정도는 이런 한계를 뛰어넘을 수 있는 가능성을 제시할 수 있기 때문이다. 이런 종류의 생각을 하고 있는 사람이 있는지 궁금해서 구글링을 해본 결과 이 블로그를 발견할 수 있었다. 이 블로그를 읽으면서 가만히 생각을 해 보니, 우리 나라의 한약, 혹은 건강보조식품 같은 것들이 이런 범주에 속할 수 있다는 생각이 들었다.

그렇지만, 신약이라는 규제가 심한 분야로 넘어가게 되면 좀 다른 문제가 되는 것 같다. 롱테일 경제학이 풍요 라고 하는 개념 위에 서있는 것인 반면 신약 개발은 유례없는 생산성 저하 의 문제로 고민하고 있기 때문이다. 이런 문제를 해결할 수 있는 방안으로서 필요한 Scientific innovation 은 쉽게 얻기 힘든 것이기는 하지만, 데이터의 폭발, 그리고 이런 데이터의 효율적인 관리를 도와주는 화학정보학의 발전은 분명 중요한 기반을 마련하고 있다. 어쩌면, 구글이 성공하기 이전에 검색이라는 분야가 한물 간 분야처럼 생각되었던 것을 되돌아보면, 지금 우리가 한물 간 것으로 생각하는 어떤 오래된 분야에서 이런 의외의 전기가 마련될지도 모르겠다.

(덧붙이는 글) long tail과 cheminformatics를 키워드로 해서 구글링을 해 봤더니 Depth-First 블로그가 맨 위에 나타난다. 클릭을 해 봤더니, 이 블로그에 롱테일 관련 내용은 없었다. 이전부터 주의깊게 보던 블로그였으니, 내가 안 보는 사이에 갑자기 글이 올라올 리는 없었다. 결국은, 자신의 글에 longtail 태그를 많이 붙여놔서 사람들이 자신의 블로그를 쉽게 방문할 수 있도록 유도한 것이 아닐까 하는 생각이 들었다. 확인할 방법은 없지만…