나는 2018년 이전 한국과 이후 영국에서 주로 프로그래밍을 배우면서 데이터 사이언티스트 직업 관련 기술들을 얻었다. 한국에서 공과대학 학부 과정까지, 영국에서 컴퓨터 공학 대학원을 다니며 수학과 통계 그리고 데이터 분석을 전공하였다. 석사 학위를 취득하는 것으로 정규과정을 졸업한 후에는 온종일 컴퓨터에게 더 많은 명령을 효율적으로 내리는 방법을 고민하고, 기계의 언어를 모르는 이들에게 결과번역본을 전달하는 것으로 밥벌이를 하고 있다.
대부분 프로그래밍 언어를 배울 때는 "Hello, World!"를 입력하고 바르게 출력되는지 확인하는 것으로 시작한다. 단순한 문장 입력절차에 우리가 얼마나 진지한가하면 50개가 넘는 프로그래밍 언어 각각에서 "Hello, World!"를 입력하는 방법만 따로 정리된 통합 문서 페이지가 있을 정도다. 일종의 정례 의식으로 자리잡은 -느낌표까지 꼭 붙여야 제대로 한 것 같은- 인삿말 출력하기 문화는 1970년대 C 프로그래밍 언어 교과서에 수록된 실습 예제로부터 알려져 있다. 사용자가 마치 놀이를 하는 것처럼 다양한 버전의 인삿말 들을 입력하고 컴퓨터의 '반응'을 확인하는 것으로 기계와 어떻게 소통을 이어갈 수 있는지 요령을 익혀가는 것이다.
데이터사이언스 또한 컴퓨터와 첫 인사를 주고받고 공부를 더해가면서 점점 복잡한 구조의 스크립트(script)를 작성하는 법을 배워야 하는 컴퓨터 기술 전공이다. 내가 데이터사이언티스트 커리어를 결심하고 파이썬(Python) 프로그래밍에 입문할 때도 "Hello, World!"를 출력하는 과제는 다르지 않았다.
한국에서 영국으로 공부 환경을 바뀌었다고 하여, 오늘 내가 런던에서 주니어 데이터사이언티스트로 일하기까지 얻어야한 스킬셋(skillset) 내용이 달라질거라 생각하지 않았고 그 생각은 현재까지도 유효하다. 그것은 주 도구인 컴퓨터를 다루는 방법이 국제 표준으로 통일되어 있기 때문이다. Science, Technology, Engineering, and Mathematics (STEM)에서 속한 다른 여느 전공 분야 연구자들 또한 국외대학으로 떠난다고 해서 전공 과목 내용이 크게 다를거라 생각하지 않는다. 오히려 어느 도메인(domain)을 택하더라도 전문 용어(terminology)와 용례(glossary) 정의를 정확히 알고있다면 언어장벽을 뛰어넘어 같은 문제를 공유하고 함께 고민할 수 있는 매력적인 특성을 가지고 있는 것이 STEM field의 장점이라 생각한다. 예를 들어 참과 거짓을 증명하는 수학 명제는 아무 말 없이도 써내려간 기호들로 정답을 전달할 수 있는 것처럼 말이다.컴퓨터와 소통하는 것 또한 정해진 언어를 문법에 맞게 입력하는 것으로 가능하다. 내가 비록 소리내어 발음하지 못하더라도 말이다.
그런데 이처럼 '무엇을' 가르친다는 강의 내용의 동일성은 그것을 '어떻게' 가르치는가와 동일하지 않았다. 내가 영국 대학(원)에서 수강신청할 수 있었던 커리큘럼에는 기술 연구와 관련해 그동안 내가 한국의 이공계 고등교육과정에서 다뤄보지 못했던 논의 범위들이 다수 있었다. Academic year 1년 동안 필수로 수강해야 한다. 등록 단과대학 안에서 운영되는 수업을 참여하는 것만으로 나의 기술 연구 전문분야에 직접적 연관이 있는 많은 것들을 배웠다. 인공지능 도덕(AI ethics), 소프트웨어 지적 재산권(intellectual property), 특허(patent) 등 professional issues 뿐만 아니라 국제법 준수를 위한 기본 법률 상식 등에 이르는 범위다. 폭넓은 사례를 통해 학생 개인이 연구 도덕과 윤리에 대한 철학적 사고를 발전시킬 수 있도록 이끌어준다.
해당 수업들은 대학이 양성하는 (프로그래밍)기술자가 기계적으로 모델을 만들고 보다 수치 결과를 추구하게 되지 않도록 경계하라는 목적으로 이뤄진다. 예를 들어 수업 도중 소개된 주제 중에는, 어느 제약회사의 의뢰를 받고 무료 퀴즈 풀이를 제공하는 웹페이지를 만든 개발자 이야기가 있었다. 여가 시간에 흥미삼아 풀어볼 법한 문제들 속에 모든 가능한 답변 시나리오를 해당 제약사 신제품을 언급하도록 하는 일종의 마케팅 전략이었다. 그런데 이를 통해 신제품을 구매한 고객 중 상당수가 심각한 우울 증상을 보이며 급기야 자살에 이르기까지하는 사건이 발생한다. 어느 문제를 풀더라도 지정된 제품 추천으로 연결되게끔 한 개발자의 행동은 옳았을까? 퀴즈 페이지를 만든 개발자는 피해자의 죽음에 대한 책임에서 얼마나 자유로운가? 질문에 이어지는 세미나 시간에서는 토론이 이뤄지고 교수는 학생들에게 윤리강령에 어긋나는 의뢰를 거절할 책임을 강조한다. 또한 만약 해당상황이 불가피하게 발생했을 경우, 지적 상품에 대한 권리는 의뢰자(제약회사)와 수임자(개발자)가 어느 정도 비율로 책정되는지? 계약법에 따른 관리와 파생되는 문제상황에 대한 책임은 누구에게 있는지를 따져보며 수업을 마친다. 이런 방식으로 특정 시나리오들에 노출된 학생들은 수업활동을 통해 강제로 현실 직업 이면에 이뤄지는 의사 결정들을 생각해보게 되면서 도덕적 사고 확장의 이득을 얻는다.
정규과정에서 영국의 강의방법은 최소한 우리가 다루는 데이터가 실제 현실에서 발생한 '우리 사람들'의 기록이라는 것을 주기적으로 환기시킨다. 예를 들어 나의 석사 어느 수업 중에는, 분석 데이터 저장소인 캐글(Kaggle)에서 머신러닝(Machine Learning) 입문자를 대상으로 타이나닉 생존자 데이터 분석 경연대회를 활용한 적 있었다.
담당 교수님께서는 수업 시작 전 타이타닉 생존자 인터뷰 영상을 공유하고 이러한 비극적 사건의 데이터가 공개된 배경에는 같은 일이 재발하지 않도록 대책을 수립하는 것에 있음을 분명히 하였다. 단순히 머신러닝 프로그래밍의 결과로 누가 생존자인지 알아맞추는, 누구의 모델이 점수가 더 높은지에 몰두하기 쉬운 학생들의 주의를 환기시키고 실제 영국 남부지역 Southampton 마을에서 당시 한 명 이상의 가족을 잃은 집이 500가구 이상이었다는 휴머니즘 관점을 경연대회 분석 과제와 함께 전한다.그런 강의를 듣고나면 별도 공간에 기록으로 정리하며 잊지 않으려는 노력을 했다.
정규 수업 밖에서도 영국 고등교육기관들(Universities and higher education institutions)에서 운영하는 각종 프로그램 소개를 접했다. 많은 청강을 통해서 같은 기술을 가르치고 연구하는데 다양한 도덕적 윤리적 사고 기회를 높일 수 있는 기회를 얻곤 했다.
개인적으로 기술 연구자 커리어의 큰 이점 중 하나는, 예를 들어 프로그래밍이라면 내가 명령 체계 순서만 잘 익히는 것으로 그것에 대한 지식이 없는 사람과 대비해 우위를 차지한다는 것을 손꼽고 있다. 만약 내가 화가였다면 연필을 들어 밑그림을 그리고 붓을 들어 채색하는 능력만 가지고 존중받기 힘들 뿐 아니라 정량적 잣대로 내 성과를 평가할 근거를 찾기 힘들다. 하지만 기술 분야는, 다시 예를 들어 프로그래밍은 어느 정도 수준까지 수치로 달성레벨 구분이 가능한 영역이기에 종종 기술자들이 수치 향상에 몰입하는 경우가 많다. 내가 한국을 떠나 얻은 소득 중에는 프로덕트(product) 개발이 되고 안되고의 영역을 넘어선 이후에도 기술 연구자의 도덕과 윤리 의식을 바르게 유지해야 한다는 진지한 생각을 유학과정에서 배움을 통해 시작한 것이 크게 존재한다.