머쉰러닝 사용법

기술보다는 사업에 대한 이해, 그 사례들

Dec 2. 2021

최근 아이폰에 저장된 음식 사진에서 “잘 먹겠습니다!”라는 문구를 보았다. 음식이라고 태그를 달아 놓지 않았는데, 아이클라우드에 연동되어 음식이라고 인공지능이 판정내렸나 보다. 카테고리가 생성되어 음식 사진들이 분류되어 있었다. (사진참조)

3,4년 전에 이미지 머쉰러닝 소프트웨어를 접한 적이 있다. 장소는 기업N사가 지원하는 대학 연구소였다. 노트북에 설치된 이미지 머쉰러닝 소프트웨어에, 구글에서 찾은 고양이 사진 10개 정도를 업로드하고 고양이라고 텍스트로 입력한다. 또 도시락 사진도 10개 정도 업로드하고 도시락이라고 입력하면 소프트웨어가 한 10분 정도 분석하고 학습한다. 그 다음에 임의로 다른 고양이 사진이나, 도시락 사진을 업로드하면 그 이미지가 고양이인지, 도시락인지를 판정한다. 70-75% 정도 맞추었다. 최초에 사진을 10개가 아니라, 100개, 1000개, 10,000개 올리면, 분석 시간이 무척 걸리는데 반해, 맞출 확률이 많이 올라간다고 한다.

그래서 이 소프트웨어로 뭘 하고 있느냐고 물었더니, 그거 찾고 있다고 한다. 뭔가 이룰 목적이 있어 이미지 머쉰러닝 소프트웨어를 만는게 아니라, 일단 만들어 놓고 어디에다 쓸 수 있을 지를 찾고 있었다. 가끔 그럴 때가 있다 기술 개발에 몰두해 어디에 쓸 지를 잊어버리는 상황, 기술 개발 그 자체가 목적이 되는 상황이 있다. 어느 방송 인터뷰에서 초정밀 원자 시계, 수백억년에 1초의 오차가 발생하는 시계를 만든 연구자에게 질문했다. “이 시계가 어디에 쓰이나요?” 연구자의 대답은 “이제부터 찾아볼 생각이다”였다.

기업N사가 개발한 이미지 머쉰러닝 소프트웨어는 대학 교양수업에 쓰였는데, 1,2학년생들이 엑셀 배우듯이, 머쉰러닝 소프트웨어 조작법을 배웠다. 수업 과제(기말고사)가 이미지 머쉰러닝 소프트웨어 활용 사례를 만들어 오는 것이었다. 가르치는 사람도 사례가 필요했나 보다.

상업적 이용을 위한 이미지 머쉰러닝 소프트웨어 가격은 그 당시 500만엔(5,000만원)이었다. 이미지 머쉰러닝 사용의 성공 사례로서 기억에 남는 게, 2가지가 있는데, 하나는 남미 B국의 날치기 범죄 판별 사례와 생선알 품은 생선 구별이다. 남미 B국에서는 오토바이에 2명이 타고 있으면 오토바이 날치기 범죄자일 확률이 90% 이상이어서, 교통관제소 같은데에서 CCTV를 보다가 2명이 타고 있는 오토바이를 발견하면 가까이에 있는 경찰에게 통보를 한다고 한다. 그런데 사람이 계속 CCTV를 보고 있어야 하는 한계가 있다. 이걸 머쉰러닝이 대신했다. 한 명이 탄 오토바이와 두 명이 탄 오토바이의 이미지를 학습시킨 다음에 머쉰러닝 소프트웨어가 CCTV 이미지를 판별하면서 두 명이 탄 오토바이를 발견하면 자동으로 가까운 경찰에 통보하는 시스템을 구축했다. 날치기 범죄율이 크게 떨어졌다고 한다.

두 번째 사례는 알을 품은 생선을 판별하는 거였다. 특정 생선의 경우, 생선 고기는 먹지 않고 알만 먹는다고 한다. 어선이 잡은 생선을 공장으로 옮기면 사람이 그냥 생선과 알이 있는 생선을 구별해 알이 있는 생선에서 알만 빼고 나머지는 버린다. 구별을 사람이 하는데, 단순 노동이고 일손도 부족해서 해외에서 산업연수생 명목으로 온 노동자를 고용해서 작업을 해 왔다. 이 작업을 머쉰러닝을 통해 대체했다.

위의 두 사례는 내가 연구소 관계자에게 들은 내용인데 반해, 일본 최대 리서치 회사의 상품은 내가 느낀 사례다. 일과 관련해 그 회사에 리서치를 자주 의뢰했는데, 서비스 상품의 변화가 눈에 띄었다. 리서치 상품 중에 신발장이나 옷장, 냉장고 안 사진을 전달해 주는 서비스가 있었다. 그 회사에 등록되어 있는 리서치 모니터 회원(회사의 의뢰를 받아 리서치를 해 주고 일정의 보상을 받는 회원)이 자기 집 신발장이나 냉장고 안에 사진을 찍어 보내는 거다. 처음에는 “이게 뭔가” 했는데, 이미지 머쉰러닝을 접하고 보니, 꽤 괜찮은 서비스라고 생각됐다. 신발 회사는 고객이 어떤 종류, 어느 브랜드를 몇 켤레 가지고 있는 지를 알고 싶다. 그런데 고객에게 설문으로 물으면, 귀찮아 하는게 당연할꺼다. 당연히 응답포기, 응답거부다. 그런데 신발장 열고 그 안 사진 한 장만 찍어달라고 하면 쉽게 해 줄 사람이 많을꺼다. 그 사진 보고 종류, 브랜드, 신발 수를 예전에는 사람이 일일이 다 세어야 했는데, 이제는 머쉰러닝으로 해결하는 거다. 냉장고도 마찬가지다. 사진 이미지 한 장으로 냉장고 안에 있는 식품, 음료가 자동으로 판별된다면, 리서치 회사 입장에서 너무 매력적이다. 이 서비스가 나오기 시작한 시기가, 기업N사가 지원하는 대학 연구소에서 이미지 머쉰러닝 소프트웨어를 교양수업으로 쓰기 시작했을 때 였던 것 같다. 리서치 회사가 실제로 머쉰러닝 소프트웨어 도입했는지 안 했는 지는 나도 모른다. 그런데, 사람이 일일이 작업하는 거라면, 10년 전부터도 나올 법한 서비스 상품인데, 이제 나오는 건, 머쉰 러닝 기술이 상업적으로 이용할 수 있을 정도로 완성도가 올라가니, 재빨리 리서치 회사가 도입했을 것이라 나는 추측한다.

이미지 머쉰러닝 소프트웨어를 접하고, 나도 이용 예를 생각해 보았다. 의류 상품 개발에 무척 효과적으로 보인다. 한 20년 전 쯤에 기사로 읽었는데, 의류 브랜드 E의 경우, 시장 조사를 위해 광장 같은데 직원을 정기적으로 내 보낸다고 한다. 그러면 직원이 지나가는 사람들의 옷 스타일을 기록하는 거다. 상의, 하의, 외투의 종류, 색깔, 소재, 브랜드 등을 보면서 기록하는 거다. 그리고 그걸 취합해 신상품 개발에 쓴다. 사람이 모두 해야 한다. 이걸 머쉰 러닝으로 대체하는거다. 법적 규제 등을 떠나 사람을 내 보내는 대신 CCTV를 설치하고 그 이미지를 수집해 분석하는 거다. 괜찮아 보였다. 그때는.

그 후에 인스타그램을 접한 후, “내 생각이 올드했다”고 느꼈다. 인스타그램은 사진 중심의 SNS다. 인스타에서 잘 팔리는 상품 카테고리 중 하나가 의류다. 인플루언서가 옷 입고 사진 찍고 올린다. 거기에 해쉬태그가 있다. 이게 핵심이다. 이 옷이 어떤 옷인지, 브랜드, 종류, 사이즈, 색상, 브랜드가 해쉬태그로 나타난다. 거기에 팔로워의 성별과 연령을 안다면 금상첨화다.

머쉰런닝을 시키기 위해서는 최초에 사람이 모든 것을 직접 지정해 주어야 한다. 코트, 가디건, 스웨터, 청바지, 면바지, 셔츠, 잠바, 거기에 색상, 크기, 남성용&여성용, 이 모든 것들을 학습시켜야 한다. 코트(종류), 검정(색상), 성별(사용자), 브랜드, 이 4가지로만 나누어도 수백, 수천가지 카테고리를 생성할 수 있다. 거기에 사진 10장씩만 학습시켜도 수십만장의 이미지를 넣어야 하고, 정확도를 높이기 위해 100장씩, 1,000장씩 학습시키려면, 수백만장, 수천만장의 이미지를 사람이 골라서 넣어야 한다. 그런데 인스타를 이용하면 그게 다 자동으로 될 것 같다. 옷사진이 있고 그 옷을 설명하는 해쉬태그가 있다. 크롤링으로 이미지와 태그, 싹 끌어와서 머쉰러닝 연동해서 한 번에 돌리면, 분석하는 시간은 걸릴 지는 몰라도 인적 소스 투입은 거의 필요없다. 광장에 CCTV를 설치해 이미지를 수집하겠다고 한 내 생각이 참 올드하다.

기술보다는 사업에 대한 이해가 더 중요하다. 어느 작업(task)이 핵심이고 어디에 비용이 제일 많이 들어가는 지를 이해하고 있어야, 특정 기술을 사용할 때 퍼포먼스가 향상되고 비용이 절감되는 지를 예상할 수 있다. 신기술이 만드는 사업 기회는 사업에 대한 이해도가 뛰어난 사람들이 더 잘 잡을 수 있다고 생각한다.

keyword

멤버쉽

꿈애취애

N잡러, 디지털노마드, 무역, 투자자이며 평생현역를 꿈꾸고 있습니다. 하고 싶은 일, 지금하면 행복합니다.

구독자 38

월간 멤버십 가입 월간 멤버십 가입

작가의 이전글미래 헬스 케어 트렌드 3건강? 아니 시간을 지킨다.작가의 다음글