안녕하세요, 오랜만에 인공지능 관련된 글을 퍼블리싱했습니다. 이번에는 '데이터 편향성이 얼굴인식 시스템에 어떤 영향을 주는지, 좀 더 공정한 시스템을 만들기 위해서는 우리 인간이 어떤 노력을 기울여야 하는지'를 중점적으로 다뤘습니다. 보다 자세한 이야기를 보시려면 링크를 클릭해주세요. :)
https://www.kakaobrain.com/blog/57
- 일상 생활에서 얼굴 인식기가 보편적으로 활용되고 있습니다. 그런만큼 우리는 이 시스템이 공정하다고 믿습니다.
- 하지만 이런 인식과는 달리 편향된 결과를 내놓기도 합니다. 예를 들어, 성별에 따라, 피부색에 따라 사람의 인구통계학적 특정을 잘 인식하지 못하는 거죠.
- 왜 그런가 봤더니 편향된 데이터셋이 원인이었습니다. 그러니까 덜 학습한 부분을 잘 인식하지 못하는 거죠.
- 보다 공정한 얼굴 인식기를 만들기 위해서는 우리 인간이 얼굴의 다양성을 보다 객관적으로 분류할 수 있는 기준을 마련한다면 얼굴 다양성을 잘 표현하는 데이터셋을 구축할 수 있을 거라고 IBM은 말합니다. 그래서 얼굴 사진에 47가지 라벨링을 붙힌 데이터셋을 새로이 공개하죠. 학술 목적으로 하는 단체에만 제한적으로 공개한다고 IBM은 밝혔습니다.
- 하지만 우리 인간사에 큰 영향을 미칠 수도 있는 얼굴 인식기를 기업이 주도에 구축하는 모습에 많은 시민 단체들이 우려를 표하고 있죠.
- 얼굴에서 나타나는 다양성을 어떻게 하면 객관적으로 나타낼 수 있을까에 대한 연구 취지 자체는 좋다고 생각합니다. 더 중요한 건, 우리 인간의 삶에 지대한 영향을 줄 수도 있는 서비스에 해당 기술을 도입할 때는 알고리즘이 공정하게 작동하고 있는지 세심한 모니터링과 외부 감사 시스템 등이 구축이겠죠?