180. 사진과 AI
인공지능(AI)이 여러 분야에 적용되고 있고, 그중 미디어에서도 데이터 분석과 기사 작성은 물론 가짜 기사도 판별한다고 한다. 텍스트 정보의 AI와 이미지 정보의 AI는 어디까지 발전할 것인가. 뉴스통신사 AP에서 분사한 오토메이티드 인사이츠는 기사를 자동으로 작성하는 것을 넘어 아마존의 음성인식 인공지능 ‘알렉사(Alexa)’와 결합, 음성으로 인간과 대화할 수 있는 서비스도 개발 중이라고 한다. 구글, 페이스북, 트위터 알고리즘(기술)은 이제 각 개인의 취향과 구매력 등을 기계가 파악하고 내가 좋아할 만한 기사를 추천하고, 내가 좋아할 만한 영화를 추천해준다. 이러한 알고리즘은 그가 촬영한 사진에서도 적용된다. 핸드폰의 사진촬영기술은 이제 얼굴인식이 보편화되었고, 페이스북에 인물사진은 관련 인물이 누구인지, 바로 알려주게 된다. 심지어 내가 찍어논 사진을 컴퓨터가 이미지를 보고 시로 바꿔준다. 최근에 Microsoft는 중국어 전용 AI인 Xiaolce 챗봇에게 사진 및 이미지를 보고 중국어시를 생성할 수 있는 최초의 인공지능을 개발하고 있다.
인간이 사진을 보게 되면 이를 통해 여러 가지 정보를 유추하게 되고, 이것을 머신러닝에서 몇가지 규칙을 입력후 뉴럴 네트워크를 ‘시를 생성하는 측면’과 ‘시를 판단하는 측면’으로 분리하여 판단하여 언어를 만들어낸다. 아직 복잡하고 정교한 언어는 만들지 못하지만, 시간이 지나 학습된 데이터는 발전을 할 것이다. 카카오 AI리포트에서도 마찬가지로 연구중이다. 로드뷰로 촬영된 사진 소스에는 많은 정보를 담고 있다. 이것을 객체 검출(object detection) 기술로 사진속의 얼굴과 차량번호판, 건물, 주변정보 등 90여개 이상이 확인되고 이것이 컴퓨터에서 영상처리(image processiong) 되어 진다. 객체 검출의 수준을 대폭 개선시킨 딥러닝(deep learning)은 여러 클래스의 객체의 특징들을 잡아내고 학습되어진다. 네이버에서 실험적으로 하고 있는 것이 포토기능이다. 잘 알지 못하는 식물을 찍으면 이 식물의 꽃의 이름등을 관련 이미지 추출로서 가능해진다. 내가 알지 못하는 건물의 이력 또한 사진을 찍으면 그것의 역사를 알수 있게 해준다.
음성인식 및 머신러닝 기반 AI 번역 프로그램 ‘파파고’는 이미 구글 번역과 경쟁을 벌이고 있다. 통신사는 5G시대와 함께 유무선 데이터통신-IPTV-음성 기반 AI 서비스-콘텐츠-디바이스의 생태계는 요동치고 있다. 검색 능력과 양질의 컨텐츠인지 판단의 몫은 아직 사람에게 달려있지만, 이것 또한 기술의 진보는 AI의 진보는 어디까지 발전할지. AI들은 시간이 흐르면 흐를수록 더 강력해지고 있기 때문이다. TTS(Text To Speech), 텍스트를 음성으로, SST(Speech To Text), 음성을 텍스트로 바꿔주는 기술이외에 미디어는 고도의 변화를 예고하고 있다.
1.기술은 변화하는데 사람의 생각은 변하지 않고 있다.
2.AI도 인간처럼 편견과 실수를 저지를 수 있다..
3.AI는 도덕적이고 윤리적으로 고려해야 할 것들이 있다.
4.AI를 가장 잘 활용할수 있는 건 사람의 이해에 달려있다.