brunch

You can make anything
by writing

C.S.Lewis

by 글쓰는개미핥기 Jun 06. 2022

� AI 기본 이해하기

#AI기본 #알고리즘 #CNN #RNN #RBM #MLP


� 한 줄 요약

- 장중호 서울과학종합대학원 교수님이 말해주는 인공신경망의 구조와 주요 비지도형 기계학습 알고리즘


✔️ 처음에 본 기사를 접했을 때, '무슨 말이지?'라는 생각이 먼저 떠올랐어요. 다시 한 번 읽어봤죠. 여전히 무슨 말을 하는지 모르겠어요. 인공지능이고 AI고 내가 다 아는 단어들인데, 이를 설명하는 용어를 이해 못하겠더라고요.


✔️ 그래도 포기하지 않고 몇 번이고 반복해서 읽었어요. 반복해서 읽다보니 전체적인 틀이 보이네요. 이 틀을 정리해서 함께 보고자 제가 정리를 해봤네요. 도움이 조금이라도 됐으면 하는 마음이에요. 


__________________


✅ 뉴럴 네트워크


✔️ 뉴렐 네트워크는 사람의 뇌신경이다. 즉, 뉴런이라고 불리는 뇌세포와 뇌신경이 서로 얽히고 설켜 있는 복잡한 구조를 네트워크 형태로 모방해, 컴퓨터에서 사람이 학습하고 판단하는 것을 알고리즘으로 구현하는 것을 의미한다.


 ✔️ 사람의 뇌에는 약 860억개 정도의 뇌세포고 있고, 이를 연결해주는 것을 시냅스라고 불린다. 시늡새 연결은 약 100조개가 있으며, 100조개의 시냅스에는 인간인 우리가 보고 듣고 느끼고, 경험하고, 배우고 기억하는 모든 것들이 저장되어 있다. (이 시냅스가 많고, 복잡하고 효율적으로 반응하면 소위 지능이 높다고 한다. 저는 아닌 듯 하네요.�)


✔️ 이러한 인간의 뇌구조를 컴퓨터로 옮기면?


뇌세포 = 노드

노드가 연결되는 값을 조정하는 방식 = 가중치 (학습에 따른 무게를 줌으로써, 예측치를 확대하기 위한 값의 조절)

뇌세포와 시냅스가 학습과 기억을 이루어 내는 구조 = 퍼셉트론


✔️ 처음에 가중치 조절은 이론에 불과했으나, 1974년 폴 워보스란 사람이 오류역전파라는 알고리즘을 고안하여, 가중치 값 조정에 대한 실마리를 풀어냈다. 이를 통해 인간의 학습 방식을 모방한 인공신경망의 학습 모델이 완성되었다.


✔️ 하지만 이론적인 논문들만 있었고, 실제로 적용할 수 있는 방법이 없었다. 또한, 지도학습이라는 이미 정답이 정해져 있는 학습데이터를 가지고 반복적으로 인공신경망에 학습시키는 것이 다였다. 그 결과 1996년부터 2000년대 초반까지 뉴럴윈터가 왔다.  


✅ 비지도형 기계학습 알고리즘


✔️ 그러던 중 2006년 새로운 인공지능의 시대가 열리기 시작했다. 제프리 힌트 교수가 '제한된 볼츠만 머신(RBM)'이라는 획기적인 비지도형 기계학습 알고리즘을 고안한 덕분이다.


✔️ RBM 방식은 정답이 없는 학습데이터들을 가지고 먼저 학습을 시킨 후, 그 결과를 오차역전파 알고리즘으로 학습을 시키는 구조다. 전처리 과정이 줄어들기 때문에 획기적인 방식이었다. 또한, 인공신경망의 구조도 달라 여러 단의 MLP를 쌓아서 하꺼번에 학습을 시킬 수 있었다. 


✔️ 이후 딥러닝이라 불리는 알고리즘들이 나오기 시작하는데, 합성곱 신경망(CNN), 순환 신경망(RNN), 생성적 대립 신경망(GAN)이 가장 대표적이다.


✅ 합성곱 신경망(CNN)


✔️ CNN은 딥러닝 알고리즘의 대표주자로, 주로 이미지나 영상 인식과 처리에 쓰인다. MLP 구조의 인공신경망을 다층 구조로 쌓아 컨볼루션 과정과 서브샘플링 가정을 진행한다. 

*컨볼루션 과정: 데이터를 특징으로 추출하여 패턴을 파악

*서브샘플링 과정: 풀링과정이라 불리며, 차원축소 과정으로 컨볼루션 과정을 거친 층의 사이즈를 줄여주는 방식


✔️ CNN은 이미지 인식에 필요한 복잡한 특징 추출 과정을 생략하고 이미지 자체를 CNN 신경망에 입력하기만 하면 자동적으로 학습의 과정을 거쳐 원하는 결과들을 얻을 수 있다.


✔️ CNN은 개와 고양이의 사진을 구분하거나, 자율주행차의 카메라를 통해 주변의 사람과 자동차 등을 인식한 후 피하는 등 이미지를 인식하는 기능에 기본으로 장착되어 있다. 

*대표적인 예: 핸드폰 얼굴인식 기능


✅ 순환 신경망(RNN)


✔️ 시계열적으로 변하는 데이터에 대한 기억이나 인식에 쓰이는 특화된 알고리즘이다. 주로 음성, IOT 센서 데이터들처럼 시간 흐름에 따라 변화하는 데이터를 처리하는데 특화된 신경망이다.


✔️ 여러 개의 신경망을 순차적으로 거치는 순환구조로 구성돼 있어, 과거 정보를 기억하는 동적시스템이다. 이에 따라 다양한 길이의 순차적인 데이터를 처리한다. 다른 신경망처럼 경사하강을 이용한 오류역전파 알고리즘을 사용하는데 시간이 지날수록 신호가 급변하거나 사라지는 장기적 의존성 문제가 발생하는 문제들에 쓰인다.

*경사하강법 알고리즘: Gradient Descent

*오류역전파 알고리즘: Backpropagation 


✔️ RNN은 음성 인식, 언어 모델링, 번역, 이미지 주석 생성 등에서 굉장한 성공을 거두었다. 또한, RNN의 기억을 오래 가도록 만들기 위한 알고리즘으로 LSTM(Long-Short Term Momery)가 고안되어 RNN의 성능을 대폭 증가시켰다.


________________________


✔️ 전체적인 내용 요약은 위와 같아요. 하지만 군데군데 들어가 있는 전문적인 용어들에 대해서는 저도 온전히 이해하지 못해, 더 공부할 필요가 있다고 느껴지네요. 이것저거 자료를 찾아보면서 재밌다는 생각도 드네요. 


✔️ 역시 어떤 것을 배움에 있어 공부한다는 것은 재미가 있는 거 같아요. 물론, 본격적으로 하면 분명 싫어하겠죠? 역시 제가 하던 방식 그대로, 아주 넓고 얕게 하는 것이 좋을 듯해요.� 전문적으로 해야한다면 배워야겠지만요... 


*참고자료

http://solarisailab.com/archives/2112

https://blog.naver.com/get1ucky/222235712195

https://blog.naver.com/dilector/222610285064






https://zdnet.co.kr/view/?no=20220530181623


매거진의 이전글 ? 퇴직면담은 왜 필요할까요?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari