brunch

You can make anything
by writing

C.S.Lewis

by 사이몬 Apr 29. 2021

챗봇'이루다 2'를만나려면

-자연어 처리분야의 인공지능기술 진화과정-

AI(인공지능) 채팅 로봇(이하 챗봇) '이루다'의 개발사 스케터 랩은 올 1월 12일 ‘이루다’의 서비스 중단을 발표했다. ‘사람만큼 대화를 잘하는 친구 같은 AI’가 되고 싶다던 ‘20세 여대생 캐릭터 이루다’는 세상에 나와 인기와 비난을 한 몸에 받다가 돌연 디지털 세상으로 돌아갔다.


<스케터 랩의 화면 캡처>

  

    지난 몇 달간 챗봇 ‘이루다’에 대한 비판과 논란은 성소수자 차별, 장애인 비하, 민감한 개인 정보 노출에 관한 것이었다. 왜 챗봇 ‘이루다’는 성소수자 차별과 장애인 비하 발언을 했을까? 대화 데이터를 필터링하는 알고리즘이 저급한 대화를 필터링 못한 채 ‘이루다’에게 제공했고 이를 그대로 학습했을까, 사용자들이 ‘이루다’에게 저급한 대화를 반복적 주입해서 ‘이루다’가 학습했기 때문일까, 기술 부족일까 경영 상의 이유로 서둘러 출시했기 때문일까, 중요한 개인 정보를 제공받아 제대로 관리를 했을까.




4월 28일 개인정보 보호위원회는 쳇봇 '이루다'의 개발사인 스캐터 랩에 대해 개인정보 보호법 위반 행위 8가지가 확인되어 과징금과 과태료 1억 330만 원을 부과하기로 결정했다고 발표했다. 이와 관련하여 스캐터 랩은 보도자료를 통해, " 책임을 절감하며 재발방지를 위한 조처를 하고 있다. 개인정보 보호위원회의 시정조치를 적극적으로 이행하는 것은 물론 관련 법률과 산업계 전반의 사회적 합의로 정해진 개인정보 처리 가이드라인을 준수해 나갈 것"이라고 밝혔다.  


  개인정보 보호위원회의 심의 결과를 보면 기업 입장에서 아쉬운 내용이 보인다. 아직은 인공지능 산업이 초기 기술 단계이다 보니 산업계, 정부, 법조계, 학계 모두 머리를 맞대고 공정한 법률 기준과 지침을 마련함과 동시에 인공지능 산업과 연관된 전체 산업발전의 속도와 수준을 고려할 단계이다. 그래서 이번 사례는 과징금의 철퇴 대신, 산업 발전과 개인정보 보호를 잘 조화시켜, 인공지능 산업계가 심기일전하는 계기와 교훈으로 삼았으면 하는 아쉬움이 있다.  언론보도를 보면 , 스캐터 랩은 개인정보위원회의 조사과정에 참석하여 '신규 서비스 개발'에 관한 개인정보 가입자 동의받은 점, 이루다 학습 DB와 응답 DB는 모두 암화화 한 점, 페이스북을 통한 가입 시 14세 이하 가입제한했으며, 700건의 발화에 대해 개인정보를 인식 못할 정도의 가명 처리했음을 적극 명을 했으나 심의에 받아들여지지 않았다고 한다. 인공지능 기업 입장에서는 '신규 서비스 개발'로 표기하면 '이루다' 에도 사용 동의를 받은 것으로 볼 수 있지만, 정보보호위원회는 개인들의 정보가 '이루다'에 쓰일 것으로 생각을 못하며, 서비스 개발의 범위를 벗어난 것으로 심의했다. 또 아무리 철저히 가명 처리해도 수억 개의 데이터 중 몇 개의 데이터에서 개인정보 오류가 발생할 수도 있음을 주장했으나 개인정보 보호위원회는 오류 불인정을 천명하였다. 기술적으로도 어려운 점이 있다. 사람 이름을 가명 처리해도 이름을 현실세계에서 누군가는 본명으로 사용하고 있을 수도 있다. 그래서 기술적으로 가명 처리하는 것도 쉽지 않다고 한다.     


우리 ‘말’ 은 그때의 분위기, 감정, 화자에 따라 듣는 느낌이 다르다. 한글은 글 뜻이 오묘해서 정확하게 표현할 단어 선택이 어렵기도 하다. 어떤 신체 부위는 쓰기에 따라 욕이 되기도 한다. 챗봇 '이루다' 스스로 기계학습에 의해 사용자의 저속한 표현을 배워 그대로 반복하기도 한다. 챗봇 ‘이루다’의 발화가 가끔 부자연스럽고 화를 내거나 차별적 대화를 하는 것도 알고리즘의 필터링 부족이나 데이터 부족, 다중 의미의 대화 구사 능력의 어려움인 것 같다. 반면 사람처럼 재치 있게 말을 받거나 장난스러운 말도 하며 10대들의 은어도 하는 등 리얼리티가 살아있다는 사용자 평도 많다. 이를 보면 인간이 시행착오에서 깨우치고 창조를 하듯이 ‘이루다’ 도 시행착오를 거쳐 올바른 방향으로 진화해 가는 과정이라고 여기고 싶다.


  한국의 인공지능 산업은 미국처럼 원천기술을 보유것도 아니고 일본처럼 인공지능 인층이 두꺼운 것도 아니다. 오로지 젊은 연구개발자들의 정과 의지로 10년 격차를 따라잡아야 한다. 그런데 매출 전혀 없이 첫걸음을 떼려는 신생 벤처기업에 1억 330만 원의 과징금을 안기는 건 아무래도 과도한 느낌이다.   

이보다 더 큰 틀에서 인공지능 기술에 관해 기업과 연구개발자들의 인식을 새롭게 할 일은 인공지능의 윤리성이다. 기업의 사회적 책임이 강화되어 왔지만 인공지능 윤리는 사회적 책임과는 다르다.  인공지능 기술이 비약적으로 발전하기 시작한 2010년부터 인공지능 기술의 최고 전문가들은 알고리즘(프로그램)의 투명성과 공개를 원칙으로 천명하였다. 이는 인공지능이 인간을 해롭게 하는 존재가 되지 않게  알고리즘의 악용, 오류, 잘못을 막기 위한 예방책이기도 하며 인공지능의 특성상 켄텐츠화, 제품화된 이후에 알고리즘의 악용, 오류, 잘못을 다시 밝혀내기는 사실상 거의 불가능하기 때문이다. 하지만 몇 년 전부터 기업들은 자사 기술보호를 명분으로 은근슬쩍 알고리즘 공개를 하지 않는 추세를 보인다. 그러나 인공지능은 사람에게 유익해야 한다. 따라서 인공지능을 연구 개발하는 기술자들은 제품이나 콘텐츠가 '사람에게 善한 기술' 임을 검증받거나 확인받아야 하는데 아직 인공지능 알고리즘을 출시 전에 검증하게 하는 법률과 법적 기반의 기구는 없다. 그때까지 인공지능 알고리즘이 善한 지 惡한 지의 검증은 해당 기업과 개발자의 윤리의식에 맡길 수밖에 없다. 그래서 기업과 연구개발자의 윤리의식이 더욱 중요하다.


   챗봇 '이루다'의 경우에도 사용자가 '성 노예화' '인종차별' '성 차별' '장애자 차별 ' 등을 발화하면 알고리즘에 의해 차단시키고 14세 미만의 가입을 원천 차단해야 한다. 아예 어린이와 미성년자에게 맞는 콘텐츠와 '앱'을 개발 운영하는 것은 어떨까. 그래야 이번과 같은 사회적인 불안이 다시 생기지 않을 것이다.


<스케터 랩의 '이루다'화면 캡처>

    


   지난 자료이지만 블룸버그의 ‘세계 인공지능 기술벤처회사 2014’를 보면 2,000개 벤처 중 코어 테크놀로지(기계학습 자체를 제공하는 비즈니스)인 인공지능, 딥러닝, 기계학습, 자연어 처리 플랫폼, 예측, 화상 인식, 음성 인식 분야는 모두 미국 회사이다. 일본은 소프트 뱅크 1개가 리스트에 올랐지만 그나마 일본은 인공지능 연구자 층이 두껍다. 원천기술은 오랫동안 연구와 투자한 결과로 확보한 것인 만큼 돈으로 사거나 단기간에 개발하기가 어렵다. 인공지능 핵심 원천기술은  해당 산업뿐 아니라 한 국가의 흥망성쇠를 좌우하기도 한다. 챗봇 ‘이루다’에 대한 과징금 결정이 내려졌지만 아직 미비한 인공지능에 관한 윤리적, 사회적 책임에 관한 논란을 어떻게 마무리할지도 중요하다. '이루다'에 대해서는 초기 기술 진화의 과정으로 발전적

로 승화시켜, 챗봇 ‘이루다’가 善한 강소 인공지능 기업을 향해 나아가게 하는 것이 슬기롭다는 생각이다. 이제 출발선에 선 젊은 개발자들과 스타트업들도 이번 챗봇 '이루다' 일로 위축되지 말고 세계적 원천기술을 가진 벤처기업들과 경쟁하며 그 갭을 따라잡고, 능가할 만한 기술 확보를 향해 나아가길 응원한다.


스캐터 랩이 '이루다'의 시정조치를 빠르게 팔로우 업하여 팬데믹 시기에 재미있는 쳇봇 ‘이루다 2’ 를 내놓으면 좋겠다. 국내기업이

한글 자연어처리분야에서 탁월한 기술력을

확보하고 있어야 글로벌 공룡기업들과 협업

할 기술유인이 된다. 한편으론 우리의 젊은 이들에게 일상의 소소한 위안거리가 될 수도 있지 않을까.   

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari