brunch

매거진 데이터 101

You can make anything
by writing

C.S.Lewis

by 져니박 Jul 29. 2023

똑똑하게 데이터 0탄 : 범주형

1은 작은 수


1은 작다. 메일함에 그득히 차 있는 99+ 안 읽은 메일 중에 1은 너무 작은 수이다. 6천만 명 대한민국 국민 중 나 1명은 정말 소수이다.


아니 그런데 1이 최댓값일 수 있다. 같은 수치형에서도 수량이 아니라 비율이 되면 말이다.


물론 1을 떠올릴 때 가장 자주 연상되는 것은 메일 1개, 사람 1명,  제품 1개이다 보니 비율로서 1은 종종 %로 표시한다, 0.6이 아닌 60%, 0.02 아닌 2%로 말이다.(이렇게 되니 전체 중 일부로서 %뿐 아니라 가치가 절상되거나 절하되었을 때도 쓰곤 한다. 매출이 몇 % 성장했습니다. 주가가 당일 몇% 하락했습니다.)



1은 존재한다


1은 수치가 아니라 존재 자체를 논하기도 한다. 컴퓨터는 0과 1로만 이루어진 bit을 기본단위로 연산해 나간다. 있고 없고의 조합은 숫자, 텍스트, 그림, 동영상까지 된다.


간단한 알고리즘에서 ChatGPT를 통한 자연어 번역까지 확률의 조합에 입각한다. 1(참)인지 0(거짓)인지 수많은 경우를 여러 번에 걸쳐 조합하니 0과 1 사이의 어떤 값이 나온다.


커피가 500mL 있네 했을 때 1mL이 지니는 의미는 수치형이고, 커피 든 컵이 맞다, 다 마시고 빈 컵이다 의 1이 지니는 의미는 범주형이다.




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari