brunch

You can make anything
by writing

C.S.Lewis

by 김기영 Jan 14. 2019

통계나 프로그래밍 분야의 한자식 표현에 대해

이번 글은 영어 자체에 대한 글은 아니다. 

대신 우리나라의 통계나 프로그래밍 분야에서 쓰이는 한자식 표현에 대해 말해보려고 한다. 


(이 글은 한자식 통계 용어의 잘못을 지적하는 글이 아닌 한자식 통계 용어가 영어보다 이해하기 어렵다는, 즉 지극히 개인적인 감상을 밝히는 글이니 오해 없으시길 바랍니다) 


국내에서 배우는 통계 용어는 대부분 한자식 표현이다. 선형회귀, 의사결정나무, 과적합, 지도학습 등의 표현이 그렇다. 


미국에서 공부하는 분야가 컴퓨터 쪽이나 보니, 통계나 프로그래밍에 대한 영문 자료를 많이 보게 되는데 

한국에서 배웠던 개념을 영어로 배우니 더 쉽다는 느낌을 개인적으로 자주 받는다. 


대표적으로 선형회귀라는 개념을 예로 들어보자. 

선형회귀는 종속변수 y와 한 개 이상의 독립변수 x와의 선형 상관 관계를 나타내는 통계 방법이다. 

즉 종속변수와 독립변수를 4사분면에 그려 둘의 관계가 선형적인지, 선형적이면 그 관계가 어느 정도인지를 밝혀준다. 선형회귀를 처음 배우는 사람 입장에서 선형회귀라는 단어를 처음 봤을 때, 바로 이해하기는 쉽지 않은 게 사실이다. 


그러나 선형회귀를 영어로 보면 어떻게 될까. 

선형회귀는 영어로 linear regression이라고 하는데, 말 그대로 linear(선형) regression(회귀)이다. 

linear 의 뜻을 알고 있다면, 한자식 표현보다 영어식 표현이 좀 더 직관적이라는 것을 알 수 있다. 


통계에 한자식 표현이 많은 것은 과거 일본을 거쳐 들어온 자료가 많기 때문에 그렇다고 알고 있다. 

그래서 그런지 한국 사람 입장에서 봤을 때, 한자식 용어는 어색하고, 개념의 핵심을 제대로 전달하지 못한다는 느낌이다. 


반대로 영어 표현은 그렇지 않다. 용어 자체만 놓고 봤을 때 대략 어떤 개념를 가리키는지 비교적 선명하게 알 수 있다. 나의 이런 느낌은 아무래도 통계 이론이 영어권 국가에서 만들어진 것이다 보니 그런 것 같다. 

한국에서 탄생한 통계 이론이라면 한국식 이름을 가졌겠지만, 영어권 국가에서 탄생한 용어가 일본을 거쳐 들어오다 보니 어색하고 어려운 단어가 되는 게 아닌가 싶다. 


통계나 컴퓨터 프로그래밍이 좀 더 많은 사람들에게 인기를 얻으려면 한자식 표현을 그대로 받아들이기 보다, 좀 더 직관적이고 선명한 표현을 찾으려는 노력이 필요하다는 생각이다. 

매거진의 이전글 자연스럽고 매끈하게 대화 끝내기
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari