데이터 정리에 대한 흥미로운 생각들...
우선 The Case Against Everything Buckets라는 제목의 글을 보자. 여기서 Everything Bucket이라는 것은 Alex Payne의 정의에 의하면, 어떤 데이터든 일단 던져놓고 나중에 정리를 하든 검색을 하든 하는 생각을 가지고 만들어진 프로그램들을 말한다. 내가 쓰고 있는 EagleFiler를 비롯해서 Yojimbo, Together, ShoveBox, Evernote, DevonThink 같은 프로그램들이 이 부류에 속한다고 할 수 있다. (사실 내 생각에 Evernote는 이런 류의 프로그램은 아닌 것 같고, EagleFiler를 빼먹었기 때문에 제대로 된 정의인 것 같지는 않다. 뭐 중요한 문제는 아니니 패스!) Alex가 이런 프로그램들을 싫어하는 이유에 대해 적은 것을 요약하면 대강 다음과 같다.
- 컴퓨터는 조직화된 데이터를 좋아한다.
- 파일 시스템만으로도 이런 일은 충분히 할 수 있다.
- 검색을 잘 하려면 인덱싱을 해야 한다.
- 한 가지 기능이라도 잘 수행하는 프로그램을 쓰는 것이 (여러 가지 기능을 가졌지만 별로인 프로그램을 쓰는 것보다) 좋다.
이 내용에 대한 반박글을 Dan Grover의 글에서 찾을 수 있다. 긴 글이지만 정리해 보면 간단하다.
- 컴퓨터에게 쉬운 것보다는 사용자에게 쉬운게 낫다.
- 파일 시스템은 안 좋다.
내가 데이터를 정리하고 사용하는 방법에 대해서는 이미 데이터 정리 방법이라는 글에서 적은 바 있기 때문에 이 글에서 또 반복할 필요가 없을 것이고, 내 견해는 Dan의 의견에 동의하는 편이다. 사실, 모든 데이터가 충분한 메타데이터를 가지도록 강요하는 프로그램만을 사용하고 있다면, Alex의 말대로 데이터를 정리하는 것이 별 문제가 없을 것이다. 그리고 누구나 자신이 주로 다루는 데이터에 대해서야 노하우를 나름대로 가지고 있을 것이다. 내게 있어서 논문은 굉장히 중요한 자료이기 때문에 최소한 논문 데이터에 관해서는 나 나름대로 정리 방법을 가지고 있다. 논문을 읽고 나중에 보고 싶은 부분이 있어도 EagleFiler에 던져넣지 않는다는 뜻이다. 이건 이 데이터를 어떻게 다룰지에 대해 내가 소상히 알고 있기 때문이다.
정작 문제가 되는 것은 그 이외의 데이터들이다. 간단한 노트라던가 pdf 파일들, 웹 페이지 캡쳐들, 이런 데이터들은 명확한 방식을 가지고 정리하기에는 너무나 구조화하기 어려운 것들이 많다. 그래도 저장은 하고 나중에 참고라도 해야 하니 그냥 이것저것 태그를 붙여놓고 잊어버리는 것이다. 언젠가 필요해지면 그 때는 검색을 통해서 나타나게 될 것이라고 기대하고 말이다. 이런 방식은 사실 굉장히 심리적인 이점이 있다. 모든 데이터를 구조화해야 한다는 것은 상당한 심리적인 부감감을 줄 수 있고, 때로는 시간을 많이 잡아먹는 일일 수 있다. 적당히 어딘가에 던져놓고, '필요해지면 찾지 뭐'라고 쿨하게 생각해 버리면 마음이 편하다는거다. 사실 컴퓨터를 사용하는 것은 내가 편하자고 하는 것인데, 컴퓨터가 일을 잘 하게 해 주려고 내가 고생해야 할 필요는 없는거다. 내가 편하게 일을 하기 위해 컴퓨터가 고생하는 것이 더 이치에 맞다. 최소한 내게는 그렇다. 그런 이유로 인해서 나는 이른바 Everything Buckets라는 종류의 프로그램을 계속해서 즐겁게 사용할 것이다.