brunch

You can make anything
by writing

C.S.Lewis

by 루나 Jul 24. 2021

1등보다 빛나는 2등, VGG-16

[야만인] 인공지능 발전의 뒷이야기

세상에는 많은 대회가 있습니다.

이미지를 정확히 맞추는 알고리즘 대회도 존재하죠.

바로 ILSVRC(ImageNet Large Scale Visual Recognition Challenge), 일명 '이미지넷 대회'입니다.

2014년 이 대회에서 2등을 한 VGG넷(VGGNET)이

1등을 한 구글넷(GoogLeNET)보다 각광을 받고 있는데요.

VGG넷이 CNN(Convolutional Neural Network) 학습의 표준모델로까지 자리 잡을 수 있었던 이유는

CNN의 기본 아키텍처인 Convolution Layer, Pooling Layer, Fully Connected Layer만을 사용해서 만들었기 때문입니다.

다른 모델에 비해 배우기 쉬운 것이죠.

VGG-16 모델은 아래와 같이 구성되어 있습니다.

앞의 그림을 부연 설명하자면

VGG 모델을 만든 곳은 옥스포드 대학 연구팀(Visual Geometry Group)입니다.

엔드류 지세르만 Andrew Zisserman 과 카렌 시몬얀 Karen Simonyan 이 주축이 되어 만들었습니다.


VGG팀의 지도교수 엔드류 지세르만 Andrew Zisserman 은

컴퓨터비전 분야의 대가입니다.

컴퓨터비전 연구원에게 부여하는 최고의 영예인 마아 프라이즈 Marr Prize 를 3회나 수상한 유일한 인물이죠.

지세르만 교수는

이미지만을 보고 3D로 구현하는 MVG(Multiple View Geometry) 기법 등

인간이 풀지 못하는 문제를 '컴퓨터비전'으로 풀 수 있음을 보여주었습니다.

리차드 하틀리 Richard Hartley 와 함께 저술한 책은 컴퓨터비전계의 교과서처럼 여겨지고 있습니다.

2012년 이미지넷 대회에서 딥러닝을 활용한 알렉스넷 AlexNet 이 우승하면서 딥러닝이 인기를 얻자

지세르만 Andrew Zisserman 교수는 제자인 카렌 시몬얀 Karen Simonyan 과 컴퓨터비전에 딥러닝을 결합해보자는 아이디어를 냅니다.

그렇게 그들은 알렉스넷과 유사한 VGG-F(Fast), VGG-M(Middle), VGG-S(Slow)라는 초기모델을 만들어 냈고,

이를 더 발전시킨 VGG넷으로 2014년 이미지넷 대회 준우승이라는 쾌거를 이루어낸 것이랍니다.

2014년 이미지넷 대회 준우승 이후 지세르만 교수는 구글 딥마인드 DeepMind 에 스카웃되었고,

카렌 시몬얀 역시 구글 딥마인드에 들어가 알파고 제로 프로젝트에 참여하는 등

활발한 연구를 계속하고 있습니다.

한편 VGG팀은 지속적인 연구를 통해 2015년 VGG-Face를 개발했는데

4대 얼굴인식 알고리즘 중 하나로 인정받고 있답니다.


3권이 나왔습니다. 많은 사랑 부탁드리겠습니다.

http://m.yes24.com/Goods/Detail/102821360


(참고)

https://bskyvision.com/504

https://en.m.wikipedia.org/wiki/Andrew_Zisserman https://ichi.pro/ko/eolgul-insig-paipeu-lain-i-myeonghwaghage-seolmyeong-doem-269929031411536

https://towardsdatascience.com/cnn-architectures-a-deep-dive-a99441d18049

https://towardsdatascience.com/step-by-step-vgg16-implementation-in-keras-for-beginnersa833c686ae6c

https://www.chessprogramming.org/Karen_Simonyan

https://www.iammercedes.com/2020/07/13/vgg-16-image-classification/

https://www.robots.ox.ac.uk/~vgg/

https://www.robots.ox.ac.uk/~vgg/data/

Simonyan, Karen and Zisserman, Andrew. Very deep convolutional networks for large-scale image recognition. CoRR, abs/1409.1556,2014



적송 권건우 redpine71@wedatalab.com

http://blog.naver.com/redpine71

공무원을 꿈꾸며 대학에 들어갔으나 동서양문화에 심취하여 수많은 사부님들을 찾아다녔고 기나긴 갈구 끝에 서울 인사동과 중국 하남성 황토벌판 그리고 실리콘밸리에서 스승을 만났다. 지금은 산에서 내려와 많은 친구들과 동서문명을 융합시키는 새로운 도전의 여정에 있다.

前 삼성SDS technical architect

現 위데이터랩 대표이사 http://www.wedatalab.com

現 디랩아카데미 원장

現 성균관대, 한양대 겸임교수

現 세계진소왕태극권총회 서울분회장 http://www.chenxiaowang.kr

#야만인 #동서양문화연구 #위데이터랩 #서예 #진소왕태극권


김가인

https://www.instagram.com/ga_casso/

세상에 알려지지 않은 면을 밝히자는 마음으로 방송PD를 꿈꾸며 신문방송학과에 진학했다. 항상 '한다면 한다'는 마인드로 새로운 것에 도전하며 꿈을 찾아가는 중이다.


전준혁

https://www.instagram.com/wjswnsgur456/

각종 기초학문을 공부하여 장점들을 융합하고 단점들을 극복할 방법을 찾기 위해 여러가지 학문으로 갈 수 있는 경영학과를 선택한 학생. 코딩과 알고리즘을 공부하는 것이 사고과정을 길러준다고 판단하여 공부를 시작했고, 나아가 인공지능의 역사를 탐구하고 있다.


루나 허령

https://brunch.co.kr/@hvnpoet

컴퓨터과학과 소프트웨어공학을 전공하고, 지금은 금융회사의 상품과 서비스를 분석, 설계, 구현하는 일을 하고 있다. 대학 초년생 시절 마인드맵을 접한 이후 즐겁게 생각하는 방법을 깨달았고, 소프트웨어공학의 모델링 사상을 이해하고부터는 마인드맵과 모델링을 아우르는 마인드맵모델링을 연구 중이다. 세상에 대한 공학적인 접근 이외에도 마음공부와 서예, 태극권 등으로 자신과 세상의 경계를 넘어 진리를 탐구하고 있다.

#야만인 #마음공부 #마인드맵 #모델링 #서예 #진소왕태극권 #천상병

매거진의 이전글 빅데이터 분석으로 전 세계를 장악한 리드 헤이스팅스
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari