음성(Voice), 영상(Image, Video), 텍스트(Text)
인공지능은 크게 3가지 분야, '음성(Voice)', '이미지를 포함한 영상(Image+Video)', '문자(Text)'로 나뉩니다. 각 분야에서 주로 사용하는 기술들이 조금씩 다른데요,
큰 흐름을 잡기 위한 것으로, 각 분야의 인공지능에서는 주로 어떤 기술들이 쓰이는지 '간략히' 공유드리겠습니다.
#STT #NLP
Voice AI(음성 인공지능)은 자동 음성인식과 텍스트-음성 변환 기술을 활용한 인공지능입니다. 지금은 비교적 익숙해진 Voice AI는 문법과 구문, 구조 그리고 음성신호의 구성을 통합하여 사람의 음성을 이해하고 처리합니다. Text AI에도 빠질 수 없는 자연어처리는 물론, 텍스트를 음성으로 바꾸어주는 (TTS; Text to Speech)와 음성을 텍스트로 바꾸어주는 (STT; Speech to Text)기술이 주로 사용됩니다.
#CNN #RNN
현재 AI를 활용한 이미지를 생성이 활발히 이루어지고 있는데요, Image AI는 합성곱신경망(CNN; Convolutional Neural Network)와 순환신경망(RNN; Recurrent Neural Network)라는 기술이 주로 사용됩니다.
!!! 잠시만요 !!!
AI처리 기술이 꼭 음성분야에서만 쓰인다, 영상분야에서만 쓰인다는 건 아니에요. 이미지(영상)뿐만 아니라 음성분야에서도 순환신경망(RNN)기술이 쓰이고, 문자뿐만 아니라 음성분야에서도 자연어처리(NLP)기술이 쓰입니다.
합성곱 신경망이라는 이름조차 많이 어렵긴 합니다만 조금 더 쉽게 말씀을 드려보면,
데이터의 특징을 추출하여 특징들의 패턴을 파악하는 구조라고 할 수 있습니다. 예를들면, Color에는 3가지 요소가 있는데요, 색상/명도/채도에 따라 비슷한 성분들을 조사하여 특징을 파악한 후, 불필요한 요소들을 제거해 데이터의 크기를 줄여 일관된 특징을 제공하는 것이라 할 수 있습니다.
#NLP #NLU #NLG
'자연어처리', '자연어이해'등이 모두 문자와 관련된 인공지능 기술입니다. 여기서 자연어란 사람들이 일상적으로 쓰는 언어를 말합니다. 언어란, 문화권에 따라 오랜시간 굳어져 사용되기도 하고, 시대적으로 변하기에 음성이나 영상에 비해 상대적으로 기술의 발전이 더딘 편이었습니다. 자연어와 관련된 인공지능 기술은 아주 크게 3가지로 나뉩니다.
NLP(Natural Language Processing, 자연어처리)
자연어처리란, 인간의 언어현상을 컴퓨터와 같은 기계를 활용해 묘사할 수 있도록 연구하고 이를 구현하는 인공지능 분야 중 하나입니다. 형태소 분석 등 텍스트를 사전에 처리하는(텍스트 전처리)과정을 통해 자연어를 분석하여 컴퓨터가 처리할 수 있도록 하는 기술이라고 할 수 있습니다.
NLU(Natural Language Understanding, 자연어이해)
자연어이해란, 인공지능 분야에서 자연어로 된 입력을 이해하고, 처리하는 과정을 말합니다. 문맥이나 의도, 개체, 관계등을 파악하여 사용자의 요구나 질문의 의미를 정확하게 이해하는데에 목적이 있습니다. 언어의 다양성과 모호성, 복잡성을 처리할 수 있는 능력이 중요합니다.
NLG(Natural Language Generation, 자연어생성)
자연어처리, 자연어이해를 거쳐 비로소 컴퓨터 프로그램이 자연어 텍스트를 생성하는 과정을 말합니다. 자연어이해(NLU)는 기계독해, 감정분석 등 모호하거나 잘못된 사용자의 입력을 처리하는 것이 중점이라고 한다면, 자연어생성(NLG)은 기계의 처리결과를 보다 정확한 표현을 통해 구체적이고 일관된 문자(혹은 문장)로 생성하는 것이 중점이라고 할 수 있습니다.
[참고자료]
1. NBDIA, 가장 쉬운 음성 AI이해: https://developer.nvidia.com/ko-kr/blog/an-easy-introduction-to-speech-ai/
2. IBM, 음성인식이란?: https://www.ibm.com/kr-ko/topics/speech-recognition
3. 위키백과, 합성곱신경망: https://ko.wikipedia.org/wiki/%ED%95%A9%EC%84%B1%EA%B3%B1_%EC%8B%A0%EA%B2%BD%EB%A7%9D
4. 위키독스, 딥 러닝을 이용한 자연어 처리 입문: https://wikidocs.net/64066
5. 위키독스, 인공지능(AI) & 머신러닝(ML)사전: https://wikidocs.net/222499
6. LG AI Research, Language: https://www.lgresearch.ai/ourwork/research?tab=PB