금융문맹 직장인 자본주의 홀로서기 3
통계는 과연 얼마나 중요할까? 우리는 잘 모르지만 사실 보통 대부분의 삶들은 이 통계의 박스권 안에서 움직인다. 비근한 예로 사회는 평균이라는 단어로 여러 가지 지표를 제시한다. 평균 물가, 평균 수명, 평균 근속연수, 평균 임금, 평균 근무 시간 등이 있을 것이다. 이 평균이라는 말을 우리는 그저 그렇다고 생각하고 넘기기 쉬울 수 있으나 이들이 제시하는 수치가 내 삶의 있어 유의미한 지표라면 어떻게 생각하겠는가? 우리가 자주적으로 살아간다라고 생각하고 있는 이 세상은 어떤 보이지 않는 손에 의해 통제되고 있고 그 통제는 분석가들에 의해 어떤 수치로 표현되는 것이다. 볼링 점수에는 에버리지(Average)라는 것이 있다. 나의 능력이 100점이 에버리지라고 한다면 한 경기를 했을 때는 에버리지 100점과 괴리가 클 수 있으나 5경기, 10경기할수록 평균적으로 100점으로 수렴되는 것을 알 수 있다. 당구를 칠 때도 보통 자신이 정한 목표 점수를 빼는 데까지의 능력치를 점수화해서 비교하기도 한다. 통계학에서는 샘플 추출이 중요한데 보통 30개 이상의 샘플이 모여야 정규분포를 띈다고 이야기한다. 이런 통계의 바탕은 모집단을 추정할 수 있는 표본 집단이 있어야 하므로 우리는 이 표본에 대한 데이터를 많이 가질수록 좋다. 이를 빅데이터(Big Data)라고 할 수 있다. 빅데이터는 빠르고(Velocity), 매우 방대하고 (Volume), 다양한 (Variety) 특성이 있다. 이 데이터 속에서 유의미한 것을 캐치할 수 있는 데이터 마이닝 능력이 중요한 시대가 온 것이다. 데이터를 통한 의사결정은 지금 시대에는 매우 중요하다.
통계가 어렵다고 느낄 수 있지만 통계 데이터를 잘 이해하는 능력이 있어야 더욱 바람직한 의사결정을 내릴 수 있다.
이러한 데이터들을 활용한 예로 아래와 같이 '소상공인 상권분석 시스템'이 있다. 이 시스템에서 소상공인이 사업을 지원하기 위해 각종 데이터들을 제공해준다. 이를 통해 해당 지역의 인구 유동성, 매출 분석 등을 할 수 있다. 또한 해당 점포의 수익성도 예측할 수 있다. 이처럼 우리는 여러 데이터 속에서 각종 다양한 통계자료와 데이터 마이닝을 통해 종합적이고 합리적인 의사결정을 해야 한다.
아래는 창원의 한 지역을 선택하여 반경 300미터로 설정하여 냉면 장사를 해보는 것을 시뮬레이션해보았다.
주어진 조건 속에서 해당 상권 분석이 데이터화 되어 나타난다. 아래 표와 같이 해당 지역의 업소수, 일일 발생 매출 건수와 금액, 일일 유동인구 등을 살펴볼 수 있다. 이러한 데이터를 기반으로 냉면가게를 어떻게 운영할지 판단할 수 있는 것이다.
통계라는 수치는 때론 내 삶이 어딘가에 갇혀있다는 느낌을 준다. 인간의 지능과 심리도 이미 유전자적 특성에 따라 정해진 대로 움직이는 것이라는 생각이 든다.