brunch

You can make anything
by writing

C.S.Lewis

by 삼더하기일 Jan 29. 2023

진짜 데이터 과학자라면 겪는 고충 ④ 牛耳讀經

우이독경 - 쇠귀에 경 읽기

[시리즈 이전 글]

https://brunch.co.kr/@8d1b089f514b4d5/73

https://brunch.co.kr/@8d1b089f514b4d5/74

https://brunch.co.kr/@8d1b089f514b4d5/75


진짜 데이터 과학자라면 겪는 고충


지난 진짜 데이터 과학자라면 겪는 고충 3편에서는 대실소망, 바라던 것이 아주 허사가 되어 크게 실망하는 고충에 대해서 알아보았습니다. 어쩌면 일반 사람들이 빅데이터와 인공지능 기술에 대해 전문적인 지식이 없기에 더욱더 데이터 과학 분야에 대해 높은 기대치를 가지게 되고 불가능한 목표를 제시함에 따라 생기는 어쩔 수 없는 고충이었다고 이해할 수 있습니다. 다만, 사람들이 빅데이터와 인공지능 기술에 대해 전문적인 지식이 없음으로 인해 데이터 과학자에게 생기는 고충은 비단 대실소망과 관련한 내용만 있는 것은 아닙니다. 홀로 관련 지식을 가지고 있는 진짜 데이터 과학자는 커뮤니케이션에 있어 늘 부담을 느낄 수밖에 없습니다.


그 대표적인 사례가 데이터 과학과 관련된 어떠한 업무를 진행하거나, 연관된 기술 요소를 사용할 때면 언제나 데이터 과학자는 이것이 무엇인지에 대해 설명을 해주어야 한다는 점입니다. 데이터 과학자가 일반 사람들에게 설명을 해주는 내용은 때로는 빅데이터나 인공지능의 기술적인 측면이 될 수 있으며 때로는 데이터 분석을 진행한 전체적인 로직이나 활용 가이드에 대한 내용일 수도 있습니다. 물론 이에 대해 잘 설명을 한다면 잘 이해를 하고 데이터 과학자의 분석 결과에 대해 정확한 평가를 내리는 사람도 있습니다. 하지만 아직까지는 데이터 과학자가 설명을 하는 작업 내용에 대해 높은 이해도를 지니는 사람이 많지는 않습니다.


어려운 내용을 쉽게 설명하기


비단 데이터 과학이 아니더라도 전문적인 지식을 학습한 적이 없는 사람에게 이를 쉽게 설명하는 것은 정말 어려운 일 중 하나입니다. 이는 수학, 영어, 개발, 운동 등 그 어떤 영역을 막론하고 적용되는 이야기입니다. 그리고 일반적으로 빅데이터와 인공지능 기술 등 데이터 과학을 이루고 있는 기술 요소는 일반 사람들에게 어렵다는 인식이 팽배합니다. 그래서 열심히 설명을 하더라도 그 내용이 너무 어렵다는 반응이 오거나, 애초에 어려울 내용이기 때문에 이해를 포기하는 사람들도 많습니다. 이러한 상황 속에서 데이터 과학자는 늘 사용자 혹은 일반인으로 하여금 데이터 분석 결과에 대한 내용을 잘 이해시켜야 하는 고충이 있습니다.


전문 용어에 대한 이해도



여타 다른 분야와 마찬가지로 데이터 과학 분야 역시 많은 전문 용어를 사용합니다. 물론 조금만 데이터 과학에 대해 공부한다면 전문 용어라 부르기도 민망한 수준인 단어가 많지만 분명 한 번도 이에 대해 공부를 해본 적 없는 사람들에게는 낯선 단어가 많이 등장합니다. 그렇기에 사람들은 데이터 과학에 대해 데이터 과학자가 설명을 해주더라도 이해를 하는 데 기본적인 어려움이 있을 수밖에 없습니다. 이는 전문적인 지식이 조금이라도 필요한 영역이라면 그 어떤 분야든 마찬가지일 것입니다. 알고 보면 너무도 쉬운 개념이지만 이를 사람들에게 낯선 단어로 표현하다 보면 분명 이해에 어려움이 뒤따를 수밖에 없습니다.


데이터 과학 분야에서는 특히 통계적인 용어나 머신러닝, 딥러닝 등 인공지능 모델과 관련된 용어가 어쩔 수 없이 많이 등장할 수밖에 없습니다. 이 때문에 모집단, 모수, 표본, 대표성 등 알고 보면 그리 어렵지 않고 통계학 분야에서는 너무도 자주 쓰이는 단어이지만 다른 사람들에게는 설명이 더 필요한 단어들을 많이 사용할 수밖에 없습니다. 이러한 상황에서 데이터 과학자는 고충을 겪을 수밖에 없습니다. 분명 빅데이터는 누구든 활용할 수 있도록 쉬운 결과물을 제공해야 하지만 그 결과물을 설명하는 것이 너무도 어렵습니다. 하나하나의 개념까지 설명하다 보면 어느덧 데이터 분석에 대한 설명은 설명이 아닌 강의로 바뀌는 경우가 많습니다.


인공지능 알고리즘에 대한 이해도


추가적으로 사람들이 이해하기 힘든 데이터 과학 분야에 대해 이야기를 할 때 머신러닝, 딥러닝과 같은 인공지능 기술에 대한 이야기를 빼놓을 수 없습니다. 최근 데이터 과학에 트렌드를 살펴보면 특정 데이터 과학 프로젝트를 진행할 때 머신러닝이나 딥러닝과 같은 인공지능 기술이 등장하지 않는 경우는 거의 없습니다. 이 말은 즉, 데이터 과학 프로젝트가 종료되고 난 후 해당 프로젝트에서 어떤 작업을 진행했는지 설명할 때 인공지능 기술에 대한 이야기를 피할 수 없다는 것을 의미합니다. 하지만 인공지능 알고리즘은 너무도 어렵습니다. 심지어 데이터 과학자들 역시 모든 인공지능 모델의 상세한 알고리즘 작동 원리를 알고 있지 않습니다. 이를 일반인에게 설명한다는 것이 어려운 일이 아닐 수 없습니다.


물론 데이터 과학자가 인공지능 기술의 원리에 대해서 이야기를 하는 경우는 그리 많지 않습니다. 다만 인공지능 기술은 그 상세 원리가 아닌 기본적인 개념조차 일반 사람들이 잘 알지 못하는 경우가 많습니다. 기본적으로 최신 인공지능은 대부분 미래에 일어날 일을 사전에 예측하여 그 결과를 제공하는 기능을 할 때가 많습니다. 이를 말로 표현하면 참 쉽지만 실제로 인공지능 모델을 만들어보지 않는다면 상세하게 이해하기 힘든 숨은 요소들이 많습니다. 학습/검증 데이터를 나누는 것, 정확한 정답 데이터가 필요한 것, 과적합 이슈를 피해야 하는 것 등은 모두 인공지능 모델을 만들 때 매우 기초적인 이야기이지만 공부 경험이 없는 사람들이 이 내용을 체감하기란 어려울 수밖에 없습니다.


이해할 의지가 없는 사람들에게 설명을 하는 것



애초에 이해를 포기한 사람들


사람들에게 데이터 과학 프로젝트의 결과를 설명하거나 그 원리를 설명하는 것은 분명 어려운 일입니다. 하지만 이는 비단 데이터 과학 분야에만 국한된 이야기는 아닐 것입니다. 그리고 때로는 정말 이해도가 높아 어려운 개념을 을 척척 알아듣는 사람들도 있습니다. 하지만 데이터 과학자 입장에서 정말 큰 고충인 상황은 설명을 해야 할 상대방이 애초에 이해를 포기하는 경우가 많다는 점입니다. 이는 앞서 이야기했듯 데이터 과학의 기술 요소들이 너무도 어렵다는 인식이 팽배하기 때문에 그럴 수도 있고, 스스로 해당 내용을 이해해보았자 쓸모가 없다는 인식이 생기는 것에 기인하는 현상일 수도 있습니다.


만약 빅데이터나 인공지능 프로젝트를 진행했을 때 이 결과를 전달해주어야 하는 사람이 애초에 이해를 포기한 사람이라면 데이터 과학자 입장에서는 정말 답답할 수밖에 없습니다. 말 그대로 쇠귀에 경 읽기, 혼자만 의미 없는 내용을 계속 떠들어야 할 수도 있습니다. 소통을 해야 하지만 상대방이 소통을 포기한 경우를 경험한 사람이라면 모두 그 답답함에 대해 공감할 것입니다. 아무리 쉽게 설명하려고 노력한들 상대방은 들을 의사가 없고, 설명이 모두 끝난 뒤에는 이미 설명한 내용에 대해 다시 질문을 하곤 합니다. 데이터 과학자는 결국 상대방이 이해하지 못하는 말을 다시 반복해야 합니다. 진짜 데이터 과학자라면 반드시 한 번은 겪게 될 고충입니다.


So What에 대한 설명을 원하는 사람들



다만, 데이터 과학자가 상대방에게 쇠귀에 경 읽기와 같은 느낌을 주는 것에 데이터 과학자의 책임이 없다고는 말할 수 없습니다. 그 대표적인 사례가 설명을 듣는 사람은 So what 즉, 이 데이터 과학 프로젝트의 결론의 의의나 활용 방법에 대해 궁금해하지만 데이터 과학자는 기술 요소에 대한 설명만 늘어놓는 경우입니다. 애초에 대부분의 데이터 과학자들은 처음 데이터 과학을 공부할 때부터 기술 요소에 대해 공부하는 것에 많은 시간을 할애할 수밖에 없습니다. 기술 요소가 뒷받침되지 않는다면 데이터 과학 프로젝트를 진행하는 것이 아예 불가능하기 때문입니다. 하지만 냉정하게 생각했을 때, 설명을 듣는 사람의 입장에서 빅데이터, 인공지능 기술의 개념이나 원리를 꼭 완벽히 이해하고 있을 필요는 없습니다.


그렇기 때문에 더더욱 데이터 과학자는 데이터 과학 프로젝트의 결과와 의미, 향후 활용 방안에 대해 집중하여 그 결과를 설명할 줄 알아야 합니다. 만약 이 원칙을 지키지 못하고 지루한 기술 요소의 이야기로만 모든 장표를 구성한다면 쇠귀의 경 읽기를 자초할 수밖에 없습니다. 물론 듣는 사람의 입장에서도 이해해야 할 기술 요소는 정확히 이해하고 그다음 So what에 대해 묻는 합리적인 태도가 필요합니다. 적어도 합리적인 태도로 빅데이터/인공지능 활용 결과를 듣고자 하는 사람에게는 데이터 과학자 역시 합리적인 태도를 보여주어야 합니다. 데이터 과학자는 늘 빅데이터나 인공지능 기술이 실제 활용이 될 때 그 가치가 높아짐을 명심하고 있어야 합니다.


혼자만의 세계에 빠질 확률이 높은 데이터 과학자


이번 진짜 데이터 과학자라면 겪는 고충 4편에서는 우이독경, 쇠귀에 경 읽기에 대해서 이야기해 보았습니다. 결국 데이터 과학자라면 사람들이 이해하기 힘든 빅데이터, 인공지능에 대한 내용을 알기 쉽게 설명해 주어야 할 의무가 있습니다. 또한 동시에 프로젝트의 결과의 의미나 활용 방법에 대해서도 잘 가이드해주어야 합니다. 이를 잘 지키지 못한다면 데이터 과학자는 듣는 사람으로 하여금 아무런 의미가 없는 문장을 반복해서 말하고 있을 수밖에 없습니다. 데이터 과학자는 많은 전문 영역을 지녀야 합니다. 그렇기 때문에 데이터 과학자는 늘 혼자만의 세계에 빠질 확률이 높습니다. 본인의 기술력에 도취되지 않고 데이터 기반의 의사결정 혹은 인공지능 모델을 더욱 활발하게 이용할 수 있는 안내 방법에 대해 늘 고민해야 합니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari