데이터, 인공지능의 주식이다.
주식이 없으면 인공지능의 생명은 곧 끝이 난다.
인공지능에 대한 연구가 한창이던 초기에는 인공지능 데이터를 수집하고 라벨링 하고 전처리하는 데에 많은 연구자들이 필요했고, 돈을 들여 단기노동자를 고용하기도 하였다.
그러나 지금은 어떠한가?
정보의 홍수라 불리는 인터넷에서는 데이터가 차고 넘친다.
인스타, 페이스북 등 SNS가 활성화되면서부터는 온갖 얼굴, 자세, 장소 등의 데이터가 자동으로 생성되고 있으며, 이 데이터는 가져가는 사람이 임자인 것마냥 각종 비즈니스와 인공지능 학습에 사용되고 있다. 해킹으로 개인정보가 유출되었다고 날뛰던 예전과는 달리, 얼굴 등의 생체정보는 아무렇지 않게 자발적으로 공개되고 있는 것이다.
그야말로 인공지능 사업자 세상이다.
이렇다 할 법적인 규제도 없다. 인터넷에 공개된 데이터를 이것저것 퍼가서 학습하는데 쓰기만 하면 된다. 그 안에 담긴 개인정보들, 특히 겉보기에는 익명화된 데이터들이 다른 데이터와 조합되어 매우 사생활적인 행태가 드러날 수 있어도 사람들은 아랑곳하지 않는다. 또한, 남이 심혈을 기울여 만든 작품을 저작권 등의 문제없이 학습시킬 수도 있다. 문제가 되면 영업기밀이라던지, 의도한 것이 아니라던지 빠져나갈 구멍은 슝슝 뚫려있다.
데이터가 각 국의 자산이요, 자본이 되었다고 난리 치는 판국에 프라이버시 침해 등을 위해 개인 데이터를 내놓지 않는다고 한다면, 반애국자라고 몰리는 건 시간문제다. 더더욱 AI가 일상생활에 깊숙이 침투하면서, 울며 겨자 먹기로 개인정보 동의를 해야만 평범한 경제활동을 할 수 있는 시기도 머지않아 보인다. 나아가 개인의 권리는 무시한 채 개인의 사생활 족족을 감시하고 통제할 수도 있을 것이다.
무시무시한 가능성이 열려 있는 이 시기에 우리는 어떻게 하면 인공지능이란 도구를 현명하고 적절하게 잘 사용할 수 있을까? 데이터에 얽혀 있는 프라이버시 침해, 인권 침해, 자율권 침해 등의 문제를 어떻게 하면 잘 해결할 수 있을지 비판적인 사고와 행동이 필요한 시점이다.