데이터 정리 방법

컴퓨터에 있는 데이터를 정리하는 가장 좋은 방법은 무엇일까? Hongiiv님의 블로그 포스트를 읽고 간단하게 댓글을 남기려다가, 간단하게 할 수 있는 이야기는 아닌 것 같아서 따로 포스팅을 한다.

첫째. 폴더 구조를 통한 정리법 파일 이름에 의미를 부여하고, 이것을 구조화된 폴더에 넣는 것은 가장 직관적인 방법 중의 하나이다. 이렇게 파일을 정리하게 되면, 누구보다도 파일을 관리하는 자신이 전체 데이터의 구조와 정렬 등을 책임지게 되기 때문에 누구보다 이 데이터를 잘 파악할 수 있다는 장점이 있다.

그러나 단점이 없을 수는 없는 법. 이렇게 의미를 기준으로 정리를 하다보면 정리 기준이 바뀌어야 하는 경우가 생긴다는 점이다. 이전에는 A라는 제목으로 분류를 하던 데이터인데, 이 쪽의 데이터를 많이 다루다보니 A만으로는 부족하게 되어 A-1, A-2, ... 등으로 나누고 싶어지게 된다. 뭐 데이터 개수가 적을 때는 그런대로 이렇게 분류를 쪼개는 것으로도 유지를 할 수가 있다. 그런데, 더 큰 문제는 분류라는 것이 항상 hierachy를 정확하게 유지할 수 있는 것이 아니라는 점이다. 어떤 논문을 읽었는데, 이건 화학에도 들어가고 생물학에도 들어간다면 이건 "화학" 폴더에 넣어야 하는지 아니면 "생물학" 폴더에 넣어야 하는지 고민을 하게 되는 것이다. 이런 고민이 많아진다는 것은, 애초에 결정했던 분류 기준이 적절하지 않다는 것을 의미하기도 하지만, 애초에 데이터라는 것이 이렇게 정확하게 분류할 수 있는 것이 아니라는 사실을 의미한다고 보는 것이 더욱 정확한 해석일 것이다. 사소한 문제일 수도 있지만, 모든 파일에 내용을 반영한 적절한 이름을 붙이는 것도 그렇게 쉬운 일은 아니다. 게다가 파일의 종류에 따라 필요한 정보들이 달라지기 때문에, 특정한 종류의 파일에서는 이 전략이 적절하지만 다른 종류의 파일에 대해서는 이 전략이 통하지 않을 수 있다.

둘째. 태그+검색 최근에 많이 사용되는 방법이 태그와 검색을 사용하는 방법이다. 파일에 적절한 태그를 붙여놓고 이 태그를 기반으로 검색을 하는 것이다. 이것이 맥OS에서는 스마트폴더라는 이름으로 구현이 되어 있다. 사실 윈도우에서 가장 불편한 점 중의 하나가 바로 이런 태그+검색 기능을 잘 활용할 수 없다는데 있다. 물론 이 방법이 항상 좋은 것만은 아니다.

가장 큰 문제라면 역시 상황에 맞는 적절한 태그를 달아줘야 한다는 점이다. 그나마 태그는 서로 다른 수준의 표현을 동시에 쓸 수 있기 때문에 (예를 들어, 파일에 작성자, 내용, 출처, 날짜, 분류 등 상이한 수준의 정보를 태그로 넣을 수 있다) 폴더를 통한 분류보다는 더욱 현실적이다.

또 하나의 문제는, 이 전략을 효율적으로 수행하기 위해서는 태그를 다는 것이 편하고, 검색을 하는 것은 더욱 편해야 한다는 점이다. 검색을 염두에 두고 만들어진 파일 시스템이 아닌 경우라면, 전체 하드 디스크를 검색하는 것은 시스템에 큰 무리를 주는 일일 수 있다. 또, 검색 엔진이 내가 원하는 검색 결과를 얻어내지 못한다면 태그를 붙이나마나 한 일이 될 것이다. 다행히도, 최근에 나오고 있는 데스크탑 검색 엔진들은 일정 수준 이상의 동작을 보여주고 있기 때문에 (여전히 불편한 일이기는 하지만) 큰 어려움은 없을 것이다.

셋째. 나의 전략 맥을 구입하기 전에 사용하던 방식은 파일의 종류에 따라 서로 다른 방식을 사용하는 것이었다. 논문 관련 pdf는 Endnote에서, 그림 파일은 피카사에서, 문서 파일은 폴더에 나누어서 정리, 프리젠테이션 파일은 날짜와 제목을 적어서 한 폴더에 몰아넣기 뭐 이런 식이었다.

이제 맥으로 전향한 후에는 방법이 거의 완전히 바뀌었다. 내가 지금 사용하고 있는 프로그램은 EagleFiler이다. 이 프로그램은 모든 종류의 파일에 태그를 붙이고 이를 쉽게 검색할 수 있도록 도와주는 프로그램이다. 다른 사람들이 잘 사용하는 프로그램 중에는 DevonThink, Yojimbo, Evernote 같은 것들이 있다. (이 중에서 DevonThink같은 경우에는 추론 엔진을 가지고 있어서, 사용자가 인지하지 못하고 있던 데이터 간의 연관 관계까지 파악해준다고 한다) 내 컴퓨터의 문서 폴더에는 교회, 개인, 연구 정도의 폴더가 있고, 필요에 따라 많은 파일을 써야하는 프로젝트가 있으면 따로 폴더를 만들기도 한다. 바로 지울 수 있는 파일이 아니라면 다 EagleFiler에 넣고 간단한 태그들을 붙여놓는다. 이렇게 하면 EagleFiler는 파일을 자신의 디렉토리에 옮겨서 정리를 한다. 원본 데이터가 지워지더라도 백업본을 가지고 있을 수 있다는 장점도 있다. (대신 하드디스크를 더 쓰는거지만) 최근에는 Leap이라는 프로그램이 매우 좋을 것 같아서 구입을 해야 하는지 고민하고 있다.

이메일의 경우에는 이메일 파산을 경험하지 않기 위해 MailTags라는 프로그램을 사용해서 태그를 붙여놓고, 필요없는 메일은 Inbox에서 다른 폴더로 바로 옮겨놓는다. 논문의 경우에는 BibDesk + Yep의 조합으로 하고 있다.

넷째. 진짜 중요한 데이터인가 이사를 하거나 회사에서 자리를 옮기거나 하는 경우에 물품들을 정리하게 된다. 많은 경우, 이럴 때 뭔가를 많이 버리지 않으면 온갖 짐들은 늘어나기만 하고 줄어들지 않는다. 이렇게 늘어난 잡동사니들은 일의 효율성을 떨어뜨리는 주범이다.

그래서 내가 관리하고 있는 파일이 정말 오랫동안 보존할만한 가치가 있는 것인지를 항상 물어봐야 한다. 그리고 이런 질문을 효율적으로 하려면, 끊임없이 해야 한다. 이런 생각을 하지 않는 경우와 하는 경우가 섞이게 되면 도리어 더욱 정신이 없어질 수 있기 때문이다. 따라서, 일이 진행되는 순서, 혹은 개인의 업무 플로우를 수정할 필요가 생긴다. 데이비드 알렌의 GTD는 이런 면에서도 큰 도움을 주는 방법이다. GTD에서 개인적으로 중요하다고 생각하는 부분은, 모든 stuff를 모으는 큰 수집함이 있어야 한다는 점, 그리고 이것이 바로 처리 가능한지를 판단해서 가능하면 바로 하고, 가능하지 않으면 미루거나 다른 사람에게 부탁하는 점이다.

파일도 마찬가지이다. 당장 뭔가를 해야 하는 일이라면 하고, 그렇지 않으면 미루어 두던지, 다른 사람에게 보내던지, 아니면 삭제를 하던지, 혹은 참고자료로 분류해서 깊숙이 넣어두던지를 결정해야 한다. 결국, 효율적인 데이터의 정리라는 것은 다음 요소들의 결합으로 가능하다고 본다.

  1. 일을 뒤로 미루지 않는 부지런함
  2. 빠짐없이 파일을 수집하고 분류할 수 있는 프로그램 (반드시 컴퓨터 프로그램일 필요는 없다!)
  3. 변화에 유연하게 대처할 수 있는 방법
  4. 일의 흐름을 일정하게 유지할 수 있는 끈기

이 네 가지 요소가 잘 결합된다면 파일(을 포함한 여러 업무들까지)을 잘 관리하게 될 수 있으리라고 생각한다.