brunch

You can make anything
by writing

C.S.Lewis

by Jue Apr 10. 2022

인공지능, 딥러닝, 머신러닝 그게 대체 뭔데?

쌩초보가 알아보는 AI 기술

 인공지능 기반 추천시스템, 자율주행차량 등 AI 기술은 이미 우리 생활에서 많이 활용되고 있고 어디선가 계속해서 발전하고 있습니다. 그렇다면 세상의 변화를 통해 가치를 창출하는 PM이라면 해당 기술에 대한 기본적인 동작 원리와 배경, 응용할 수 있는 영역에 대해 알고있어야 활용할 수도 있겠죠? 어렵더라도 부딪혀보겠습니다. 


 오늘 포스팅의 학습 목표는 아래와 같습니다.

1. 인공지능(AI), 머신러닝, 딥러닝의 기본적인 개념

2. AI 기술을 토대로 응용할 수 있는 영역

3. AI Product의 구성요소와 팀구성



1. 인공지능, 머신러닝, 딥러닝의 기본적인 개념


인공지능(Artificial Intelligence)

 먼저 인공지능은 영어로 Artificial Intelligence = AI컴퓨터를 인간과 같이 생각할 수 있도록 만드는 기법으로 머신러닝과 딥러닝을 포함하는 가장 큰 개념입니다. 아래의 그림처럼 인공지능에는 머신러닝, 딥러닝 기법 이외에도 다른 기법들이 있지만 가장 많이 언급되는 머신러닝과 딥러닝에 대해서만 알아보도록 하겠습니다.

출처: AI School의 'AI로 돈 버는 법 - 사례로 알아보는 AI Transformation'



머신러닝(Machine Learning)

 머신러닝(Machine Learning)은 인공지능 기법 중의 하나로, 명시적인 프로그래밍 없이 데이터에 기반한 학습을 통해 인공지능을 구현하는 기법을 뜻합니다. 어떤 문제(Task)에 관련된 경험(Experience)으로부터 성과 측정 지표(Performance)를 가지고 학습을 진행합니다. 즉, 문제 T에 대한 성과는 P로 측정되고 경험 E에 따라 개선이 진행되어 점점 발전되는 것입니다.


머신러닝 알고리즘

(알고리즘; 주어진 문제를 논리적으로 해결하기 위해 필요한 절차, 방법, 명령어들을 모아놓은 것)

1. 지도 학습(Supervised Learning)은 input 데이터와 정답 쌍(x,y)를 이용하여 학습하는 방법론으로, 머신러닝에서 가장 보편적으로 사용되는 학습 방법론입니다. 


2. 비지도 학습(Unsupervised Learning)은 input 데이터 (x)만 이용하여 데이터의 숨겨진 특징을 학습하는 방법론으로, 이를 통해 파악한 데이터의 숨겨진 특징을 지도 학습의 input 데이터로 활용하여 지도 학습의 성능을 높이는 용도로 많이 활용됩니다.


3. 강화 학습(Reinforcement Learning)은 에이전트(agent)가 주어진 환경(state)에서 어떤 행동(action)을 취하고 이에 대한 보상(reward)을 얻으며 학습하는 방법론입니다. 보상을 최대화하도록 학습하여 성능이 발전되는 것으로, 저희가 잘 알고있는 '알파고'의 핵심 알고리즘입니다!



딥러닝(Deep Learning)

 딥러닝(Deep Learning)은 머신러닝 기법 중 하나로, 인공신경망(Artificial Neural Networks) 기법의 은닉층(Hidden Layer)을 깊게 쌓은 구조를 이용해 학습하는 기법을 뜻합니다. 인간의 신경망 원리와 구조를 모방하여 만든 알고리즘으로, 데이터의 특징을 단계별로 높여가며 학습하므로 더 고차원적인 인지활동을 수행할 수 있습니다. 특히 이미지나 자연어(NLP; Natural Language Processing = 사람이 사용하는 언어), 음성 등의 비정형화된 대량의 데이터로부터 인식을 수행하는 문제 영역에서 잘 작동합니다. 하지만 데이터의 양이 부족하거나 정형화된 데이터(;이미 특징이 추출된 데이터)로는 잘 작동하지 않으므로, 이경우에는 다른 알고리즘이 적합할 수 있습니다. (아무리 최신 기술이더라도 장단점은 있는 것 같습니다!!)

사진 출처: https://hongong.hanbit.co.kr/ 




2. AI 기술을 통한 응용분야


컴퓨터 비전(Computer Vision) 기술

 컴퓨터 비전은 컴퓨터가 인간의 시각 기능을 모방할 수 있는 기술로, 아래의 문제 영역과 더불어 다양한 문제 영역들이 연구되고 활용되고 있습니다.

Image Classification  
- input 이미지가 어떤 라벨에 대응하는지 알 수 있는 문제 영역으로 데이터 분류 가능.
Face Detection
- 얼굴이 있는 영역의 위치정보를 Boundind Box로 찾는 문제 영역
Super Resolution
- 저해상도의 이미지를 고해상도 이미지로 변경할 수 있는 문제 영역
Object Detection
- 물체가 있는 영역의 위치정보를 Bounding Box로 찾고 박스 내에 존재하는 Object의 라벨을
  분류하는 문제영역
Neural Style Transfer
- 콘텐츠 이미지에 스타일 이미지를 덧씌워 합성 이미지를 생성하는 문제영역으로, 필터앱에 활용됨.
Face Recognition
- Face Detection을 통한 Bounding Box 위치에 존재하는 얼굴의 신원을 식별하는 문제 영역으로,    cctv에서 범죄자의 신원을 식별하거나 회사에서 직원 얼굴 인식에 활용됨.


자연어(NLP, Natural Language) 처리 기술

자연어 처리 기술은 컴퓨터를 이용해 사람이 사용하는 연어를 분석하고 처리하는 기술로, 아래의 문제 영역과 더불어 다양한 문제 영역들이 연구되고 활용되고 있습니다.

Machine Translation
- 하나의 언어를 다른 언어로 번역하는 문제 영역
Sentiment Analysis
- 문장의 감정상태를 분석하는 문제 영역으로, 고객 리뷰의 감정상태를 판단할 때 활용됨.
Text Summarization
- 텍스트에 대한 요약문을 자동으로 생성하는 문제 영역으로, 기사에 대한 요약문을 생성할 때 활용될   수 있음.
Question Answering
- 질문에 대한 정답 텍스트를 찾아내는 문제 영역으로, 고객 상담용 챗봇에 활용됨.
Dialogue Generation
- 봇이 자동으로 텍스트를 생성하는 문제 영역으로, 채팅봇이 사람과 자연스럽게 대화하는데 활용됨.

  이러한 자연어 처리 기술은 챗봇, 자동 번역, 고객 리뷰 텍스트의 감정 식별, 고객 텍스트 로그를 토대로 고객에게 최적화된 품목을 추천해주는 등 다양하게 활용될 수 있습니다.


 또한 다양한 컴퓨터 비전, 자연어 처리 문제 영역을 기반으로 Retail/Commerce 산업군, Autopilot /Transportation 산업군, Business Intelligence 산업군 등 많은 분야에서 이용되기 위해 많은 기업들이 노력하고 있습니다. 예를 들어 'Amazon Go'는 컴퓨터 비전 기술을 이용하여 고객이 매장에 들어와 물품을 쇼핑하고 매장에 나가면 자동으로 결제가 이루 'Tesla'는 8개의 카메라와 12개의 초음파 센서를 통해 주변 물체를 감지하고 자체 제작한 하드웨어로 빠른 딥러닝 연산을 수행하는 자율주행차량을 출시하여 계속해서 발전시키고 있습니다.

출처: AI School의 'AI로 돈 버는 법 - 사례로 알아보는 AI Transformation'




3. AI Product의 구성요소와 팀구성

 마지막으로 AI Product를 만들기 위한 구성요소와 팀구성원은 어떻게 되는지 알아보겠습니다. 


AI Product의 구성요소

1. DataAI 모델을 학습시키기 위한 트레이닝 데이터

    a. Training Data: 알고리즘의 학습에 사용되는 데이터

    b. Validation Data: 검증용 데이터. Training error와 Validation error를 이용하여 어느 시점에 멈춰야                                Overfitting(하나의 특징에 치우쳐 학습된)을 방지할 수 있을지 결정하는 데이터

    c. Test Data: AI 모델의 일반화 성능을 측정하기 위한 데이터로, 학습 과정에서 한번도 보지 못한 데이터

                      로 구성됨.

2. AI Model트레이닝 데이터를 이용하여 특정 문제 영역에 잘 동작하는 AI 모델 개발 및 선택

    ex) Object detection에는 YoLo, SSD 등의 모델이 유명

3. Product Deploy배포를 위한 AI 모델의 제품화 (API로)


예시) GCP (Google Cloud Platform) Face Detection API

얼굴이 포함된 이미지를 전송하면 얼굴 검출(Face Detection) 결과를 반환해주는 제품

Data: 얼굴 검출을 위해 얼굴 위치가 라벨링된 대량의 얼굴데이터 필요

AI Model: Face Detection을 잘 수행할 수 있는 AI 모델 필요

Product Deploy: AI 모델을 API화해서 통신을 주고 받을 수 있는 인프라 개발



AI Product를 위한 팀구성

1. AI Product Manager: AI 기술을 이용하여 고객에게 어떤 가치를 제공할 수 있을지를 기획.

요구되는 능력 

고객과 시장에 대한 이해력 

AI 기술에 대한 기본적인 이해를 토대로 엔지니어와 소통할 수 있는 능력  

데이터 문해력(Data Literacy): AI 기술 구현을 위해 어떤 데이터가 필요한지 파악하고, 해당 데이터를 구하려면 어떤 과정을 거쳐야하는지를 인지하여 데이터를 구할 수 있는 환경 조성.    


2. Data Scientist: AI 프로덕트를 위해 데이터에 대한 가설을 설정하고, 데이터 분석한 데이터로 파악한 특징

                         을 시각화하여 공유. 

요구되는 역량

비즈니스에 대한 이해력: 어떤 데이터를 분석할지, 데이터 인사이트가 회사의 비즈니스에 어떤 도움이 될 수 있는지를 고민. 

통계지식에 기반한 데이터 분석 능력: 데이터의 중요 특징 파악, 가설 및 가설 검증을 통해 데이터로부터 유의미한 결론 도출.

데이터 시각화 능력: 데이터 분석 결과를 그래프와 대시보드 등으로 명확히 시각화하여 공유.


3. AI Engineer: AI 모델의 성능을 높이기 위한 데이터 수집 및 전처리, 학습된 모델의 안정적인 배포를 위한 인프라 등 개발.

Data Engineer 요구되는 능력 

데이터 크롤링 및 정제를 위한 프로그래밍 능력: 크롤링을 통한 데이터 수집, 필요한 부분만 추출하여 정제할 수 있는 프로그래밍 능력 

모델 배포 및 API 구축을 위한 인프라 구성 엔지니어링 능력 

Database 및 SQL 활용능력: 데이터를 효율적으로 저장하는 Database 활용 능력과 저장된 데이터를 분석하기 위한 SQL 활용능력    

Machine Learning Engineer 요구되는 능력

AI 프로덕트의 성능을 개선하기 위한 새로운 머신러닝 모델 개발.

최신 논문을 읽을 수 있는 능력: 새로운 머신러닝 모델은 보통 최신 논문을 통해 공개됨. 

머신러닝 프레임워크를 이용한 모델 구현.

프로그래밍 능력: TensorFlow나 PyTorch 등의 프레임워크       모델 성능 측정 및 개선 능력 




혹시라도 틀린 부분이나 보완할 점이 있다면, 편하게 댓글남겨주세요! 읽어주셔서 감사합니다.


*본 내용은 AI School의 'AI로 돈 버는 법 - 사례로 알아보는 AI Transformation'을 직접 수강한 후 일부 내용을 짧게 요약한 것입니다. 더 자세히 알아보고자 하시는 분은 아래의 강의를 참고해주세요!

https://www.inflearn.com/course/ai-%EA%B8%B0%EC%97%85%EB%A6%AC%EB%B7%B0#reviews


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari