brunch

You can make anything
by writing

C.S.Lewis

by 강한별 Jun 05. 2019

시우민의 식판에는 오징어가 정말 자주 나오나

궁금해서 간단히 플롯만 그려봄

웹 상에서 시우민의 식판이라는 것을 알게 되었다. 시우민이 입대한 이후로 군대에서 먹는 식단을 무려 합성해서 올리고 있었다. 이걸 보면서 나의 최애는 이런 식사를 하고 있구나... 하는 심정인 걸까. 애정이 대단하다. 시우민은 오징어를 싫어해서 오징어 반찬이 나올 때는 오징어를 제외한 웃긴 합성짤로 올리는데 그것도 웃겼다.

시우민의 식판 예시 | 출처 : https://twitter.com/xiumin_tray/status/1132489138878369794


보다보니 오징어가 왠지 많이 나오는 것 같다는 말이 있길래 실제로 그런가 궁금해서 찾아봤다(..) 놀랍게도 병영표준 식단(3군수지원사령부)라는 군대 식단 api가 있었다! 내가 정말 궁금했던 건 시우민의 식단이지만 시우민이 입대를 한 지 그리 오래 되지도 않은 터라(2019.05.07 입대) 주어진 데이터를 보기로 했다. 어차피 식단이 확 바뀔 것 같지도 않다. 그나저나 3군수지원사령부란 뭘 의미하는지도 모르겠는데 아시는 분은 알려주세요.


아이디어는 간단하다. 메뉴는 대부분 복합명사이고, 복합명사를 이루는 명사는 주 재료이기 때문에 메뉴를 단순히 토큰으로 나눠서 세기만 해도 되겠네..! 빠르게 나누고 플롯만 그려보면 되겠다 싶었다.


 api라고는 하지만 데이터는 그리 많지도 않고 csv로 전체를 다 받을 수 있어서 csv를 다운 받았다. 최초 날짜는 2016년 1월 2일이고 최종 날짜는 2018년 12월 31일이다. 이 이후로는 갱신이 없다; 내 생각엔 이걸 담당하던 사람도 군인이었고 그 분이 제대를 하지 않았을까 싶다.


원본 데이터는 이런 식으로 되어 있었다. 대체 밥1이란 뭔지, 김장김치(12~2월)에서 12~2월이 의미하는 바가 뭔지 궁금했지만 별 의미 없는 것 같아서 괄호와 이상한 숫자는 모두 삭제했다.


구조도 쫌 이상함..


원본 데이터에서 describe 했을 때이다. 조식, 중식, 석식의 개수가 다르다. 물론 조식은 가짓수가 적고 석식으로 갈수록 음식 가짓수가 많아질 수도 있지만 unique 개수에서도 차이가 난다. 설마 조식을 안 준 건 아닐테고-_-;; 기록이 빠진 듯하다. 날짜의 unique 개수도 3년치에서 빠지는 것이 보인다.



그 다음 과정도 별 게 없다. konlpy에서 nouns 추출이 끝. 형태소 처리기에 Kkma, Hannanum, Komoran, Mecab, Twitter 중에서 어떤 걸 골라 쓸지는 조금 고민했다. 나는 이 작업을 google colab에서 했는데, 동의어 처리나 신규 단어 추가가 귀찮게 느껴져서 형태소 처리기는 여러 개로 바꿔서 시도해보았다. 하지만 크게 결과가 달라지지는 않길래 Twitter로 처리하였다.


Counter로 명사당 출현 빈도를 세서 플롯 그리면 끝.. 결과는 다음과 같다.


밥도 빼야 맞지만 비교를 위해서 놔둠


놀랍게도 김치가 1등이다. 저 김치 안에는 배추김치, 갓김치, 총각김치 기타 등등 여러 종류의 김치가 합쳐져 있다;; 밥보다 많이 나온 게 놀랍다. 한국인은 역시 김치인 걸까. 이게 3년치 데이터이고 조식, 중식, 석식 3끼로 이루어져 있으니 가장 많이 출현하면 365*3*3 =3,285회 출현할 수 있는데 김치가 3,053번이라니. 김치는 그냥 매끼마다 나오는 것이다.


몸에도 좋고 피부에도 좋은 김치


쇠고기가 의외로 많아서 이상했는데 쇠고기가 포함된 메뉴는 '쇠고기미역국', '쇠고기육개장', '쇠고기무국', '쇠고기감자국', '쇠고기국밥', '버섯쇠고기찌개' 등 대다수 국 종류였다. 엄밀하게 반찬만 따진다면 쇠고기의 순위는 더 내려갈 것이다. 반찬만 봤을 때 1등은 맛김, 그 다음을 깍두기, 오징어는 3위라고 할 수 있겠다. 반찬 순위로만 보면 꽤 높은 순위다. 기분 상 많이 나오는 게 아니라 실제로도 많이 나왔던 것이다. 


꾸준하게 등장하는 오징어. 힘내라 시우민..!


추가로 쿼터별로도 찍어봤다. 데이터가 많진 않지만 이렇게만 보면 꽤 꾸준히 오징어가 등장한다.  2Q에 가장일년 중 가장 많이 나오는 패턴(오징어는 7월부터 11월까지 잡히는데 그중에서도 여름이 제철이라고 함)인데, 2018년에는 감소했다. 줄어든 이유가 궁금해서 뉴스를 찾아봤더니 동해안 수온 상승과 중국어선의 불법 조업으로 오징어 수확량이 27년만에 1990년 이후로 최저치를 찍었다고 한다. 어쩌면 오징어의 출현은 점점 줄어들지도 모른다..! 과거 데이터는 이렇지만 앞으로도 이렇다는 건 장담할 수 없으니 미래에는 오징어가 덜 나오기를 기원합니다. 저도 오징어가 싫어요!




매거진의 이전글 다른 나라에서

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari