공무원 국비유학 16. 중간 결산

by CH

공무원 국비유학

1. 국외장기훈련 선발

2. KDI국제정책대학원

3. 해외 대학 선택

4. 해외 대학 지원(1)

5. 해외 대학 지원(2)

6. 영국 비자 발급

7. 영국 거주 준비

8. 케임브리지 정착

9. 케임브리지 학기 시작

10. 케임브리지 적응과 몰랐던 것들

11. 케임브리지 생활과 칼리지

12. 케임브리지의 겨울

13. 케임브리지의 수업

14. 케임브리지의 두번째 학기

15. AI에 대한 단상



필자는 석사 과정에 맞춰 10개월 가량의 파견기간을 받아 영국에 왔다.

오늘 날짜로 영국 거주기간의 절반이 지나, 뭘 하고 있는지 간략히 적어두려 한다.


1. 언어


영어는 여전히 가장 큰 장벽이다. 본래 목표는 언어 실력을 향상하여 여러 학생, 전문가와 교류하는 것이었으나, 수업 내용과 일상 대화를 간신히 따라가는 데 그치고 있다. 큰 실력 변화 없는 정체기에 있는 것 같다. 외국에 거주하면 외국어에 노출된 환경 속에 있어 언어를 훨씬 빠르게 배울 수 있지만, 지금과 같은 정체기에 있으면 별도 시간을 확보해서 언어 학습을 해야 한다. 필자의 경우에는 가장 부족한 부분은 어휘(vocabulary)이다. 단어와 숙어를 더 많이 배우고 외우는 수밖에 없다.


귀국 후 KDI국제정책대학원에서 마지막 학기를 다니는 12월까지가 실생활에서 영어를 사용하며 학습할 수 있는 기회다. 직장 복귀 전에는 어학 시험을 한번 더 보아 1년 동안 점수가 얼마나 높아졌는지도 확인하려 한다.


2. 전공 학습


매 강의 전까지 여러 편의 권장 논문을 모두 읽는 것은 포기했다. 교수가 중요도를 높게 표기한 것들은 초록과 서론, 결론만이라도 본다. 첫 학기와 달리 supervision과 essay보다 성적에 들어가는 학기말 최종 평가와 졸업논문(dissertation)에 주로 시간을 쓰고 있다. 첫 학기를 다니면서는 일부 과목에서 과락 점수(60/100점)를 받아서 졸업을 못 하는 것에 대한 걱정이 있었으나, 얼마 전에 통지받은 성적을 보니 다행히 기대보다 점수가 잘 나와서 두려움은 사라졌다.


성적에 대한 간략한 평가도 있었는데, 정보전달 목적으로서의 내용들은 괜찮지만 논의(discussion)나 평가 부분이 다소 부실하고 독창성(novelty)가 부족하다는 게 공통점이었다. 깊이 있는 고찰이 부족했기에 이미 예상했던 지적이었다. 두번째 학기 종료 후에도 방학기간에 과제 제출과 시험 등 평가가 예정되어 있다. 과제는 3월 중에 미리 시작하고, 시험은 미리 쓸만한 paragraph chunk를 만들어두려 한다.


3. 졸업 논문


KDIS와 케임브리지 논문을 병행하고 있다. KDIS 논문은 지도교수께 송구스럽게도 반년째 연락을 드리지 못 하고 있다. 논문 주제를 요약하면 '자율주행차 관련 정책문서 텍스트 빅데이터를 AI 분석해서 토픽을 분류하고 해석'하는 것인데, 데이터 노이즈가 많아서 전처리에만 반년 넘게 시간을 쓰고 있다. 예를 들면 autonomous vehicle을 쿼리로 데이터를 추출했기 때문에 분석 대상이 아닌 농업, 군용, 해상, 공중, 우주 자율주행체에 관한 텍스트가 추출되어 나온다. AI를 사용해서 패턴을 찾고 이를 분류하는 규칙을 추가하며 샘플링하여 제대로 작동하는지 검정하고 있다. automated car washing(자동세차), automated vehicle dispatch(자동화된 차량 배차) 등의 노이즈도 분석 대상인 자율주행차 문서와 구분하여 세심하게 제거해야 한다.


또 하나의 골치아픈 문제는 문서의 생산 국가나 기관 등이 토픽으로 잡혀버리는 메타데이터 누수이다. 예를 들면, 스웨덴 정부가 생산한 문서는 필연적으로 문서 내에 스웨덴이나 자국 도시를 많이 언급하고 있고, 이로 인해 문서를 클러스터링할 때 안전, 인프라 구축, AI 윤리 등의 보편적 글로벌 주제로 분류되는 게 아니라 국가나 기관별로 문서가 분류되는 경우가 있다. 로데이터를 최대한 건드리지 않는 게 내가 사용하는 BERTopic 방법론의 미학이지만, 특정 국가나 기관에서만 지배적으로 사용하는 용어는 제거한 후에 분석하고 있다 (제거하지 않은 원본을 분석한 baseline과 비교하는 민감도 분석을 포함).


전처리와 노이즈 제거 규칙이 덕지덕지 붙어서 이에 대한 지적을 방어할 수 있을지 걱정이지만, 어쨌든 수개월의 노가다를 통해 이제는 대부분의 노이즈 패턴을 찾았다고 믿고 있고, 연구 초기에 기대한 그림이 어느 정도 나오기 시작했으니 3월 둘째주에는 연락을 드릴 수 있을 것 같다 (부디 그럴 수 있기를).


토픽 분류(정책문서 2.4만 건 내 10만 건의 snippet 텍스트 임베딩을 2차원 UMAP으로 축소), 국가별 토픽 비율 히트맵
(좌) 국가별 토픽 분포 – 전처리 본격 적용 전이라 어수선하다. (우) 토픽별 대표 키워드(c-TF-IDF로 도출 – BERTopic 기본 설정)


케임브리지 논문은 미궁에 빠져있다. 첫 관심사항은 자율주행차 도입 후 도시 환경 변화 시나리오를 작성하거나 시뮬레이션하는 것이었다. 기존문헌을 탐색하며 연구 계획을 짜다가 데이터 실증을 불가하고 자의적, 임의적인 작업이라 느껴 노선을 틀었다. 우버 등 ride hailing service가 자율주행차와 유사한 특성을 지닌다고 생각하고(여기서부터 잘못됐다.) 우버가 도시에 미친 영향을 분석하는 연구계획을 짰으나, 가용 데이터로는 novelty가 있는 연구 가설을 세울 수 없었다. ride hailing service와 자율주행차 간의 연결고리를 설득하는 것도 쉽지 않았다. 쓸만한 실증 데이터가 없는 자율주행차를 주제에서 빼고 주거(housing) 관련 계량적 분석을 하는 연구계획도 짜봤으나, 주거를 다루려면 셀 수 없이 많은 변수를 고려해야 함을 깨달았을 뿐이다.


결론적으로 논문 중간 발표를 얼마 남기지 않은 현 시점에는 다시 원점으로 돌아와서 자율주행차 도입 후를 상정한 시뮬레이션 쪽으로 방향을 잡고 있다 (Cellular Automata, Land-use Transportation Interaction, Agent Based Modelling 등 기법을 활용). 의사결정에 큰 영향을 미친 것은 AI agent(OpenAI Codex 등)의 활용이다. 작년에는 시뮬레이션에 필요한 스크립트 작성에 시간이 너무 오래 걸려서 pilot test도 못 해보고 문헌만 읽다 노선을 변경했다. 이제는 코딩에 대한 부담이 없어 내가 뭘 하려는지만 알면 쉽게 구현할 수 있다. 이외에도 유리한 점은 유사한 접근 방식의 기존연구들이 있고, 통계적 검정이나 현실과의 비교 등 실증에 대한 부담이 적다는 것이다. 다만, 자의적이고 자기실현적인 연구라는 지적을 피하려면 좋은 문헌을 참고해서 설득력 있는 모델을 만들어 보여주어야 할 것이다.


ABM 기법을 예로 들어 만든 생성형 이미지. 실제로는 자원 한계를 고려해서 단순화하고 분석 스케일도 많이 낮춰야 한다.

※ 초기 탐색에 도움을 준 논문(KAIST 교수가 수행): https://ieeexplore.ieee.org/abstract/document/8766096



직장에서 벗어나 영국에서 한국을 바라보니 전에 생각하지 않았던 많은 것들이 느껴진다. 영국은 물가만 빼면 너무나도 살기 좋지만, 국가 차원에서 한국에 대한 필자의 기대는 전보다도 커졌다. 전과 달리 필자는 미·중·러·일 세계 최강의 4개국 사이에 낀 한국의 지정학적 조건에 단점보다 장점이 훨씬 많다고 생각한다. 다른 글에서 밝힐 기회가 있을 것이다.


짧은 영국 거주 동안 벌써 두번이나 한국을 오갔다. 작년말 외조모 상, 그리고 2월 동생 결혼에 참석하기 위함이다. 영국은 만 3세 이상 유아가 어린이집 새 학기를 등록하는 경우에 주 15시간을 보조한다. 필자의 가족은 이에 해당되지 않아서 자비로 어린이집 비용을 충당하고 있다. 역대급으로 높은 환율도 빼놓을 수 없다. 필자는 원화 대비 파운드화 환율은 2,000원 즈음이 역사적 고점이라 생각한다. 앞으로 1,900원 아래로 내려갈 것이라 믿는다. 여러모로 이 시기에 영국에 거주함으로 인한 추가비용을 지출하고 있는 셈이다.


그럼에도 불구하고 이 시간을 선사한 한국의 국력, 제도, 문화에 감사한다 (공짜 점심은 없다지만). 아직 영국 유학기간이 반이나 남았고, KDI 학기까지 합치면 연말까지 시간이 주어졌다는 게 행복하다. 직장에 돌아가면 더 효율적이고 스마트하게 일을 할 수 있을 것 같다.

매거진의 이전글공무원 국비유학 15. AI에 대한 단상