아이와 함께 원서 읽기
R 프로그램을 돌리기도 귀찮으니, 원서 한 권을 한꺼번에 돌려서 영어 단어를 추출하면 귀찮은 일을 한 번만 하면 된다는 장점이 있지만...
추출된 수 천 개의 단어가 들어있는 엑셀 화면을 보면 멀미가...-.-;
굳이 이런 작업을 해야 하나 싶어서 '단어 추출'이라는 검색어를 구글에 돌려보니 눈에 띄는 블로그가 나온다.
텍스트 관련 블로그인데, 여기서 단어구름(WORDCLOUD)를 작성해주는 페이지가 있고, 더불어 단어 추출도 해주는 페이지가 있다.
단어 추출 페이지로 가면 귀찮게 R 프로그램을 돌리지 않아도 단어를 빈도순으로 정리해서 보여준다.
저번에 사용했던 '두 도시 이야기' 원서를 테스트해보자.
두 도시 이야기의 Book I - chapter 1 부분을 복사한 후에 단어 추출 페이지에 붙여 넣고 분석해보자.
377개의 단어가 빈도순으로 추출되어 나온다.
R 프로그램보다 좋은 점은 'the', 'and', 'a', 'an', 'but' 이런 쓸데없는 단어도 알아서 제거해준다.(뭐... R 프로그램을 잘 쓰면 코드에 다 넣어둘 수 있었겠지만, 어떻게 하는지 모름...-.-;)
9600개의 단어를 정리하는 것보다는 훨씬 할만한 상태가 되었다.
원서 한 권을 하루 만에 다 읽을 것도 아니고, 책 읽기 전후로 챕터별로 '단어 추출 페이지'를 적용해 모르는 단어를 골라서 공부하면 훨씬 수월하지 않을까 싶다.
그래도, 사전 찾기와 공부는 내 몫이라는...ㅠ.ㅠ
P.S.
모르는 단어 찾기라는 닭짓은 2년 전에 시작했으나... 저 좋은 페이지를 알게 된 것은 최근이라는 것이 함정...-.-;
(2년이라는 시간 동안 단어 찾기에 별 노력을 안 했다는 것이 큰 위안!)