자연어 처리기술: 동시통역으로 외국어를 배울 필요가 없는 시대가 된다.
국제회의장에서 각국의 대표들이 모여 회의를 진행할 때 세계 공용어인 영어를 사용한다. 그러나 앞으로는 그 모습이 달라질 것이다. 각국 대표들은 자신의 모국어로 발언하고, 자신의 모국어로 경청할 것이다. 국제회의에서 애매하거나 이중적인 의미의 언어를 사용하지 않고 뜻이 명확한 언어만을 사용하기에 의사소통에 전혀 문제가 없다. 앞으로 자연어 처리기술이 더 발전하면 각 나라의 언어가 가진 뉘앙스까지도 정확히 통역하는 시대가 올 것이다.
사람과 의사소통할 수 있는 기술을 자연어 처리NLP,Natural Language Processing라고 한다. 자연어 처리기술의 첫 번째는 자연어 이해 부분이다. 이는 사람의 언어를 분석하여 구조화하는 기술이다. 두 번째는 자연어 생성이다. 분석된 언어를 기계 번역Machine Translation 과정을 통해 다른 나라 언어로 새롭게 생성하는 기술이다. 세 번째는 음성 인식 기술이다. 텍스트를 음성으로, 음성을 다시 텍스트로 변환할 수 있는 기술까지 갖추면 서로 다른 나라 사람들의 의사소통이 기술을 통해 원활하게 된다.
SNS를 통해 주고받는 수없이 많은 글과 대화 내용은 클라우딩 컴퓨터에 끊임없이 전송된다. 이는 인공지능의 방대한 학습 자료가 된다. 이와 함께 머신러닝의 등장은 자연어 처리기술을 급진적으로 발전시켰다. 스스로 학습하는 머신러닝은 빅데이터에서 자연어를 생성하는데 필요한 규칙이나 알고리즘을 만드는 역할을 한다. 수많은 사람들이 주고받는 수다들이 자연어 알고리즘을 개발하는 주요 재료가 되고 머신러닝이 알고리즘을 강화한다.
전 세계적으로 인공지능 연구로 유명한 오픈AIOpenAI는 GPT-3을 공개했다. GPT-3은 4,990억 개 데이터 세트 중에서 샘플링 한 3,000억 개의 데이터 세트로 구성되어 있다. 매개 변수는 1,750억 개에 달한다. GPT-3은 몇 개 핵심어만 입력하면 작문을 해주는 혁신적인 인공지능 언어생성 모델이자 알고리즘이다.
https://www.aitimes.kr/news/articleView.html?idxno=17370
구글은 NLP 모델인 버트BERT를 개발하고 이를 검색 엔진에 적용하자 검색 엔진의 정확도가 크게 올라간 것으로 알려졌다. 네이버는 슈퍼컴퓨터를 이용해 한국어와 일본어 부문에서 최고의 자연어 처리기술을 개발하겠다는 의지를 보였다. 700페타플롭스PetaFlops 이상의 고성능 슈퍼컴퓨터를 사용하여 한국어와 일본어 부문에서 초 거대 언어모델을 구축할 계획이다.
이처럼 자연어 처리기술 분야에 관한 연구가 활발하다. 자연어 처리기술 자체 연구가 진행되고 있으며, 이를 응용한 음성 및 챗봇 서비스 개발도 활발하다. 영화에서처럼 기계와 자연스럽게 대화할 날이 곧 다가올 것이다. 일본총무성 정보통신연구기구NICT에서 개발한 자동 번역 앱 ‘보이스트라VoiceTra’는 중국어와 포르투갈어의 방언을 포함하여 일본어, 영어, 한국어 등 세계 31개 언어의 통역을 음성 및 텍스트로 지원하고 있다.
https://voicetra.nict.go.jp/ko
창세기 11장에는 ‘바벨탑 이야기’가 나온다. 온 땅에 언어가 하나요, 말도 하나였다. 여호와께서 언어를 혼잡하게 하여 그들이 서로 알아듣지 못하게 되었다. 바벨탑을 짓던 사람들은 의사소통이 안 되자 제각각 흩어졌다. 바벨탑 이야기는 신학 이야기이지만 인류학이나 문화사적인 면에서도 크게 의미가 있다. 언어의 혼잡으로 사람들이 온 지면에 흩어져 살게 되었다는 이 이야기는 다양한 언어의 기원을 설명해주고 있다. 그런데 이제 인공지능 자연어 처리기술이 언어를 하나로 통합해주고 있다. 전 세계인이 각자의 언어로 의사소통이 가능한 시대가 도래한다.
인공지능 시대를 살아갈 다음 세대를 위한 도서입니다.
누구나 인공지능을 배워야 하고
누구나 인공지능을 사용해야 합니다.
그래서,
누구나 쉽게 이해할 수 있습니다.
예스24 https://url.kr/dqtmwi
교보문고 https://url.kr/x3s7kr
알라딘 https://url.kr/uiemct