brunch

You can make anything
by writing

C.S.Lewis

by 임송이 Aug 22. 2019

연애의 역사를 데이터로 풀다

데이터를 활용한 웨딩 굿즈 제작기

2012년 2월 11일부터 만난 우리가 7년 만에 드디어 결혼을 한다. 설렘도 잠시, 결혼에는 생각보다 많은 굿즈가 필요했다. 청첩장, 식전 영상, 웨딩 사진, 각종 소품 등.. 데이터를 만지고 무언가를 만드는 일을 하는 우리는 이 굿즈들을 평범하게 만들기가 아쉬웠다. 그래서 7년 동안 쌓인 데이터를 활용해보기로 했다.


먼저 어떤 데이터를 활용할 수 있을지 우리의 일상을 쪼개 봤다. 매일같이 주고받는 카톡, 특별한 날 또는 쓰고 싶을 때 쓰는 손편지, 카드, 포스트잇 메모 등 우리가 남기는 기록은 텍스트 데이터가 됐다. 그리고 맛집을 가거나, 영화를 보는 등 데이트를 할 때 사용한 카드 이력도 있었다. 그리고 함께 찍은 사진 중에 우리가 어디에서 사진을 찍었는지 위치정보가 기록된 사진들이 있었다.



01 편지 텍스트 분석


연애 초기부터 지금까지 우리는 손편지를 참 많이 썼다. 그 편지들이 차곡차곡 모였고, 남자 친구의 아이디어로 편지 텍스트를 분석해 청첩장에 활용하기로 했다. 텍스트 분석과 단어 추출은 전부 남자 친구가 하고, 나는 워드 클라우드만 시각화했다.

그동안 써왔던 편지들

먼저 손편지 글씨들을 일일이 입력해야 했다. 다행히도 예전에 편지로 책을 만들자는 아이디어가 떠올라 같이 입력해둔 텍스트가 있었다. 이 텍스트들과 최근 편지들을 바탕으로 분석했더니 6,653개 종류의 27,980개의 단어들이 나왔다.


아무래도 가장 많이 나온 단어는 서로에 대한 호칭이었다. 호칭을 제외하면 사람 271번, 사랑 189번, 생각/오늘 182번, 시간 137, 마음 122번 등의 단어가 많이 나왔다. 그리고 여행지에서 썼던 편지가 많아서 그런지 여행 관련 단어도 많이 나왔다. 같이 처음 여행했던 나라인 인도 112번, 바라나시 17번, 비행기 47번, 남자 친구의 고향인 부산 30번 등 우리가 어떤 이야기를 나눴는지가 고스란히 단어로 나타났다. 이렇게 추출한 단어들은 워드 클라우드 형태로 시각화해 청첩장에 활용했다.

인쇄한 청첩장. 실물이 훨씬 예쁘다



02 데이트 통장 카드 이력 분석


맛집을 가도, 산책을 하다가 커피를 마셔도, 데이트를 하면 돈을 쓴다. 우리는 만날 때부터 지금까지 데이트 통장 체크카드를 만들어 사용하고 있어서 이 카드 내역에 우리가 그동안 어디서 어떤 데이트를 했는지가 차곡차곡 기록돼있었다. 카드 이력은 은행 사이트에서 다운로드해 분석했다. 우리는 언제, 어디서, 어떤 데이트를 했을까?


분석한 데이터는 2012년 5월부터 2019년 6월까지 총 730건. 카드 이력에 찍힌 상호명을 바탕으로 카테고리를 분류하니 무려 식당이 88%였다. 마트/편의점 3%, 교통 2%, 영화 1%, 확인 안 됨/기타 6%였다. 우리는 영화 취향이 약간 달라서 같이 영화는 초기에만 보고, 맛있는 걸 먹고 근처 카페에서 커피 마시고 이야기하는 소소한 데이트를 위주로 했더니 이런 결과가... (같이 간 여행에서는 데이트 통장 말고 따로 돈을 모아서 썼다.) 카드를 가장 많이 사용한 시간대는 오후 1시에서 2시, 오후 7시에서 8시였다.

도대체 우리는 무엇을 이렇게 많이 먹었을까? 식당 카테고리로 분류된 데이터를 자세히 살펴봤다. 금액별로 보면 삼겹살, 소고기, 육회 등 '고기' 종류가 약 199만 원으로 가장 많았고 커피/디저트 175만 원, 일식 94만 원, 양식 93만 원 등의 순이었다. 하지만 빈도는 커피/디저트가 187회로 가장 많았고 한식 44회, 고기 43회 등이었다. 유형별로는 백화점은 현대백화점 디큐브시티점을 가장 많이 갔고, 커피/디저트는 이디야, 고기는 정육식당, 치킨은 교촌치킨을 많이 먹었다. 커피는 스타벅스 카드가 따로 있어서 스타벅스는 집계가 되지 않았다.  


카드 이력 데이터는 우리의 데이트 패턴과 섭취 패턴을 적나라하게 보여줬지만 웨딩 굿즈에 활용하기는 힘들어서 따로 무언가를 만들지는 않았다. 대신 앞으로 식생활을 좀 더 건강하게 개선하기로 했다.



03 사진 위치 데이터 지도


같이 있는 순간을 가장 잘 보여주는 건 역시 사진. 7년 동안 우리는 여행도 많이 가고 수많은 사진을 찍었다. 함께 찍었던 사진 중에서 위치 정보가 기록된 사진들을 정리해 데이터를 만들었다.


사진에 기록된 위치 정보는 어떻게 알 수 있을까? 아래 사진은 테스트 사진으로, 2018년 이탈리아 로마 트레비 분수 앞에서 찍었던 사진이다. 파일 기록에 따르면 사진을 찍은 위치는 위도 41° 54' 2.718" 북, 경도 12° 29' 0.75" 동. 구글 지도에 위치를 입력하니 사진을 찍었던 트레비 분수 앞으로 나왔다.

하지만 이렇게 일일이 확인하기에는 사진이 너무 많았다. 그래서 먼저 연도별로 사진을 정리하고, 파이썬으로 간단하게 코드를 짜서 사진 정보를 추출했다. 분석에는 python의 gpsphoto라는 패키지를 활용했는데 간단하게 코드 한 줄이면 사진에 기록된 gps 정보가 나온다. 연도별로 폴더를 만들고, 폴더 안의 사진 목록 리스트를 불러와 함수를 적용해 코드를 돌렸다.


그런데 오래전에 찍었거나, 일반 카메라로 찍은 사진들 등 여러 이유로 사진에 위치 정보가 없는 경우가 많았다. 그래서 사진을 보고 기억에 있는 위치를 더듬어 구글 지도에서 위치를 찾아 위/경도 값을 추가했다. 수만 장에 다다르는 사진 중 같은 위치에서 여러 장 찍은 사진, 위경도가 없는 사진 등등을 제외하고 총 00건의 위치정보를 지도 위에 표시했다.

연애 초기에 찍은 사진은 파란 계열, 최근으로 갈수록 빨간 계열의 색으로 점을 뿌렸다. 같이 여행을 갔던 인도, 베트남, 이탈리아, 일본 등 세계 곳곳에 점이 찍혔다.


가장 멀리서 본 지도

아무래도 같이 찍은 사진은 한국에서, 특히 서울에 많으니 서울만 확대해 봤다. 연애 초기 학교에서 찍은 사진들은 주로 학교가 있는 위치에, 최근에는 자주 만났던 신도림/구로 쪽에 점이 많이 찍혀 있다. 걸어서 이동할 수 있는 범위 내에서 사진을 여러 장 찍다 보니, 사진이 많아도 지도에 뿌렸을 때 멀리서 보면 점이 겹쳐서 하나로 보인다. 이렇게 만든 지도는 식전 영상에 활용할 예정이다.

 



우리가 7년 동안 보낸 시간과 일상이 데이터에 고스란히 스며들어 있었다. 그동안의 추억이 남아 있는 데이터를 보며 즐거웠고, 우리가 미처 몰랐던 부분까지 나타나 놀랍기도 했다. 지금까지 함께한 날보다 훨씬 더 많은 날을 앞으로 함께 할 우리. 연애를 지나 결혼이라는 새로운 길 위에서도 행복하고 멋진 여행을 하려고 한다. 먼 미래에 데이터가 30년치쯤 쌓이면 또 다른 재밌는 결과물도 만들 수 있지 않을까?

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari