품질 업무를 하는 선배들은 나에게 이런 말을 한다. 품질은 데이터로 말한다. 과연 그 선배들이 말하는 데이터란 무엇일까? Data를 네이버에서 검색하면 (증명·판단·결정 등을 위한) 자료[정보/데이터]라고 나온다.
혹은 21세기 정치학 대사전에서는 사전적 의미로 ‘입론(立論)의 기초가 되는 자료’ 또는 ‘관찰이나 조사에서 얻은 사실’이라고 설명한다. 그리고 나는 회사를 다니며 이해하기 위해 나만의 용어 정리를 하는데, 나는 Data는 존재의 특징을 예측할 수 있는 근거들이라고 표현한다.
모집단과 표본
모집단은 통계적인 관찰의 대상이 되는 집단 전체를 말한다. 예를 들어 10대들의 평균적으로 받는 용돈을 조사한다고 할 때 10대는 모집단이 된다. 그리고 만약 내가 10명의 10대가 받는 용돈을 알게 되었다면, 나는 10개의 표본 data를 가지게 된 것이다.
평균과 분산
10개의 표본 데이터로 나는 10대가 평균 얼마의 용돈을 받는지 예측할 수 있게 된다. 하지만이때 과연 내가 표본을 잘 선택했는가에 대해서 고민해보아야 한다. 왜냐하면 용돈을 받는 10대가 누구인가 보다 그 10대의 부모 혹은 가족이 어떤 경제력을 가졌느냐가 더 중요하기 때문이다. 그래서 부모의 경제 규모에 따라 표본을 선정해야 조금 더 모집단의 특징에 가까운 신뢰할 만한 결괏값을 산출할 수 있다.
분산은 표본 Data가 흩어진 정도를 계산하는 지표인데, 굳이 공식을 설명하지 않고 단어의 의미로 설명하려 한다. 우리는 분산이라는 표현을 사용하지 산분이라는 표현을 사용하지는 않는다. 내가 생각하는 그 이유는 분(나누다, 分)이 먼저 발생하면 산(흩어지다, 散)은 그에 따라오는 결과라고 생각하기 때문이다. 모집단은 다양한 Data가 모여있고, 그 Data끼리 비교하여 나눔으로써 우리는 Data를 정의할 수 있게 된다. 빠르다와 느리다, 크다와 작다라는 표현으로 어떤 대상이나 상황을 정의하려면 무조건 비교 대상이 있어야 한다. 그렇게 하나의 Data가 비교를 통해 의미를 가지고 나눠지면 당연히 흩어짐을 가지게 된다.
정규 분포
평균 15의 표준편차 5의 정규분포
위의 우산 모양의 그래프는 분포를 표현하는 그래프인데, 인터넷에 돌아다니는 것을 가져왔다. 이전 글에서 Spec에 대한 이야기를 했었는데, 위의 그림은 그것과도 연관이 있다. 간단하게 설명하면 평균은 15이며, 표준 편차 5인 제품의 1% 불량이 발생하는 Spec은 어떻게 되는지를 보여주는 그림이다.
당신과 나의 정규 분포
MBTI가 유행했고, 잘은 모르지만 지금도 유행 중인 것 같다. 나는 평균적으로 외향적인 사람이다. 평균적으로 외향적인 사람이라고 말은 하지만 내향적인 면이 없는 것은 아니다. 실제로 지인 중 나에게 MBTI가 I냐고 묻는 사람도 있기 때문이다. 앞서 발행한 글에서 눈치도 눈치 주는 사람에 따라서 간다고 말했던 것처럼 누구를 만나냐에 따라 나는 내향적인 사람처럼 행동하기도 하고 외향적인 사람처럼 행동하기도 한다. 다만 평균적으로 나는 외향적으로 행동하는 사람이다. MBTI Test를 해본 사람들은 알겠지만, 다양한 질문에 답을 하는데, 그 질문들은 얼마나 외향적인가를 표현한다. 외향적인 행동도 비교를 하면 좀 더 외향적이고 좀 덜 외향적인 것으로 분류가 된다. 예를 들어 많은 사람이 모이는 행사에 가서 잘 어울리는 것보다 많은 사람들 앞에서 분위기를 주도하는 것은 더 외향적인 행동이 된다. 전자를 3점의 Data로 치환한다면 후자는 그 보다 높은 점수의 Data로 치환해야 할 것이다.
아내는 평균적으로 내향적인 사람이다. 하지만 그렇다고 외향적인 면이 없는 것은 아니다. 그녀는 익숙한 사람 혹은 환경에서는 오히려 나보다 더 외향적인 것 같다는 느낌을 준다.
당신과 나를 표현한 그래프
아내와 나에 대해서 정규 분포를 그려보면 대충 위와 같은 그림이 될 것 같다. 붉은색으로 빗금 친 부분은 서로의 행동을 이해할 수 있는 확률이 있는 구간이지만, 그 외 영역은 이해되지 않는 확률이 있는 구간이다. 이 그래프는 내향과 외향으로 구분했지만 사실 모든 영역에서 표현이 가능하다.
그래프에서 가장 높은 지점에서 아래로 선을 그었을 때, 붉은색 영역으로 그 선이 들어가면 해당 행동을 타인이 이해할 확률이 있다고 보면 된다. 하지만 붉은색 영역으로 들어가지 않는다면 해당 행동을 타인이 이해하기는 정말 쉽지가 않다. 위의 그림을 보면 아내의 가장 많은 내향 특징은 붉은색 안에 들어가지 않는다. 따라서 나는 그녀의 가장 많은 빈도를 차지하는 행동을 이해하지 못하고 있는 것이다. 그래서 아내는 나에게 이런 말을 자주 한다. "당신은 이해 못 할 거야."
당신을 이해하기 위한 통계적 접근
제품의 품질이 좋다는 것은 표준 편차가 좁을수록 좋다고 한다. 그것은 고정된 기준이 있을 때 적용되는 말이고, 사람 관계에서는 고정된 기준이 없다. 따라서 관계가 좋으려면 오히려 편차가 넓어야 한다. 위의 그래프에서 붉은색 빗금 친 부분은 서로의 행동을 이해할 수 있는 구간이라고 표현했다. 따라서 빗금 친 부분의 면적이 넓어질수록 우리는 서로의 행동을 이해하여 관계가 좋아질 확률이 올라간다. 그럼 우리의 관계가 좋아지기 위해 빗금 친 부분의 면적을 넓게 하는 방법에 대해서 이야기해보려 한다.
1. 평균을 이동한다.
평균 이동
외향과 내향을 예를 들어 나의 평균을 좀 더 내향으로 가지고 간다면, 위의 그림처럼 붉은색 면적은 넓어진다. 하지만 나는 자신의 평균을 이동하여 타인과의 관계가 좋아지는 방법은 별로 추천하고 싶지 않다. 여기서 평균이라는 것은 일종의 나의 타고난 기질을 의미한다. 지인들과 이야기하다 보면 이런 말을 많이 듣는다. "사람은 안 변한다." 여기서 안 변한다는 것은 기질을 말한다. 기질을 바꾸는 것은 불가능할뿐더러 (많은 심리학자들은 기질을 바꾸는 것은 불가능하다고 이야기하며, 사람의 기질이 변하지 않기에 다양한 심리 검사의 결과를 우리는 신뢰할 수 있다.) 만에 하나 바뀐다고 한다면 그것은 바뀐 척을 할 뿐인 것 같다. 타인과 좋은 관계를 유지하기 위해 기질을 바꾼 척하며 사는 것은 아주 힘들다. (나의 경험상 그랬다.) 맞지 않는 옷을 입고 편한 척하는 것은 정말 불편하고 지친다.
2. 표준 편차를 넓힌다.
편차 넓히기
앞에서 설명하였듯이 평균을 이동하여 붉은색 면적을 넓혀 타인과의 관계를 좋게 하는 것은 가능하더라도 좋은 방법이 아니다. (물론 제조업에서는 가장 좋은 방법이다.) 그래서 나는 표준 편차를 넓히는 방법을 추천한다. 그렇다면 표준 편차를 넓히는 방법은 무엇일까? 내가 생각하는 표준 편차를 넓히는 방법은 상대의 경험을 따라 해보는 것이다. 사실 이 방법은 나에게 많은 도움이 되었다. 예를 들어 평소 아내가 하던 자녀 옷 입히기나 식사를 챙겨 등교시켜보면서 그것이 얼마나 힘든지 알게 되었다. 그러면서 나는 매일 그렇게 행동하는 아내가 힘들겠다는 생각을 하게 되었고, 우리의 관계는 좋아졌다. 비단 육아뿐만 아니라, 부모가 되거나 관리자가 되는 역할에 대한 경험, 산책이나 독서처럼 행동에 대한 경험은 많이 따라 해 볼수록 나의 편차는 넓어지며 어떤 타인을 만나더라도 관계가 좋을 확률을 높일 수 있다.
타인과 잘 지내보고 싶다는 생각을 하는 분이 계시다면 당신을 이해하기 위한 통계적 접근법을 추천한다. 거창하게 표현했지만 그냥 타인의 경험을 나도 경험해 보는 것을 추천하는 것이다. 하지만 무조건적으로 타인의 경험을 따라 해 보라고 이번 글을 작성한 것이 아니다. 그 경험은 나의 평균(기질)이 변하지 않는 선에서 해야 한다. 나의 지난 행동과 경험들이 하나의 Data를 만들어 낸다면 그 Data가 모여 나는 이런 기질(평균) 혹은 특징을 가졌다고 표현할 수 있다. 그렇다면 나의 행동과 경험은 기질에 영향을 줄 수 있다는 말이 된다. 그리고 반대로 강제적으로 기질을 이동하면 나의 행동과 경험에 영향을 줄 수도 있다는 말도 된다. 따라서 자신에 대해 깊이 이해한 후 자신이 할 수 있는 만큼의 타인의 경험을 따라 해 보는 것이 중요하다.
글을 마치며......
나는 우리가 불행하지 않았으면 좋겠다는 생각을 한다. 사실 행복하다는 것이 무엇인지 모르겠다. 그래서 동전도 앞면 아니면 뒷면이듯이 불행하지 않으면 그 반대일 것이라고 막연히 생각하고 살고 있다. 오해하고 다투는 것은 불행한 일이다. 나는 우리가 서로 오해하고 다투는 이유는 대체로 서로가 겪었던 경험을 공유하지 못했기 때문이라고 생각한다. 이때 우리가 서로가 겪은 경험을 겪어 보았다면 어떨까? 동병상련이라는 사자성어도 괜히 있는 말이 아니다. 같은 경험을 한 사람끼리는 유대관계를 가지는 사례는 주변에서 쉽게 찾아볼 수 있다. 그래서 나는 오늘도 당신을 이해하기 위해 통계적 접근을 한다.