통계와 ai
작금의 ai를 진정한 인공지능이라고 말할 수 있을까?
통계와 ai
황현민
표본과 전수에서 모집단이 가상인 경우는 표본뿐이다. 고로 전수가 아닌 표본의 경우에만 모집단을 가상화하여 통계를 추정하고 예측할 수 있을 뿐이다.
따라서 표본에 의한 통계는 정확한 것이 아닌 정확(정답)에 가까운 추정이나 예측일 뿐이다. 결국 정답이 아니라는 것이다. (100% 확실한 정답이라 해도 믿어선 아니 되며 참조만 해야 할 것인데ㅡ 최종 결정과 선택은 나 자신이 하는 것이니까ㅡ)
자, 통계는 전수가 일반적(연역적)이지만 리소스를 절약하여 (귀납적) 표본 통계로 근사치를 추정할 수 있다는 거다. 이때의 통계가 예측이 된다. 이러한 기술과 기법들이 여러 분야에서 응용되어 사용되고 있으며 최근 ai분야에서 까지 (아니, 특히) 적극 활용하여 인공지능을 훈련시키고 있다고 한다. 결국, 이러한 통계 기법(알고리즘)을 활용하여 ai가 스스로 학습하고 진화한다는 것이다.
과연 이것이 맞는 것일까?
과연 이것이 올바른 것일까?
표본에 의한 통계가 전수에 의한 통계와 거의 일치할 수 있다. 전수와 일치하는 수준으로 표본을 추출하고 준비하고 수행하는 전문가들이 통계학자다. 하지만 이런 수준의 진짜 통계학자들은 아마도 드물 것이다. (그렇기 때문에 세상에 오류가 많은 것이 아니겠는가?!) 무엇보다 진짜 통계 전문가가 되려면 일반적 통계 능력 외에 인간과 사회, 자연과 우주, 진리와 영혼, 초언어(초의식)와 차원 등 두루 깨달은 사람만이 가능할 것이다. 이러한 능력을 바탕으로 하여 직관과 통찰로 전수와 일치하는 표본을 추출할 수 있기 때문이다. 통계에는 매 순간 수많은 변수들이 작용한다. 이러한 변수까지 다 적용시켜서 표본을 추출하고 다각도로 통계화해야 할 것이기 때문이다.
통계는 분석과 예측으로 크게 구분하는 듯싶다. 무엇보다 통계는 숫자다. 숫자로 표현할 수 없는 영역에 대해서는 통계는 아무것도 할 수 없다. 오로지 숫자의 숫자에 의해서 숫자를 위하여 분석하고 예측이 가능할 뿐이다. 실제 숫자로 표현할 수 없는 영역들은 정말 많다. 이러한 영역들에서도 사람들은 통계가 아닌 다양한 능력으로 분석하고 예측을 하면서 세상을 살아가고 있다. 통계는 일부일 뿐이지 전체가 아니다. 이 점이 통계의 함정이고 큰 단점이 아닐까 싶다.
과연 이러한 기법들이 ai를 완성해 낼 수 있을까?
여전히 ai는 스스로 생각할 줄 모른다. 하드웨어적 (돈만 많으면) 연산 속도가 점점 빨라져서 ai 다워 보일 뿐이다. 엄청나게 빠른 그 연산도 대부분 방대한 데이터를 (짜집기?를 위한) 수집하고 (인간 개발자들에 의한) 수차례 반복학습을 하는데 집중될 뿐이다. 한마디로 장비빨이고 돈빨인 것이다. 장비가 좋을수록 돈을 더 많이 투자할수록 더 빠르고 더 정확한 결과를 생성할 수 있을 뿐이란 것이다. 작금의 ai를 진정한 인공지능이라고 말할 수 있을까?
진짜 ai는 아직도 멀었다.
또한, 통계는 수학이 아니다. 수학과 통계는 다르다. 수학이 진리를 표현할 순 있지만 통계는 진리가 아닌 현상을 표출할 순 있겠다. 수학도 그 자체가 진리일 수 없다. 수학은 진리를 숫자로 표현할 수 있는 방법일 뿐이며 수학만으로 세상과 우주의 진리를 다 표현할 수 있는 것도 아니다. 수학은 물질에 한정될 뿐, 비물질에 대해선 아무것도 할 수 없다. 수학은 지능의 극히 일부일 뿐이란 것이다.
통계를 잘 모르는 내가 통계에 대한 짧은 생각들을 여기 메모로 남긴다.
(C) 2024.11.17. HWANG HYUNMIN.
#통계
#통계의단점
#통계의함정