brunch

You can make anything
by writing

C.S.Lewis

by 크게슬기롭다 May 01. 2023

부동산 중개업자도 머신러닝은 필요해

 머신러닝으로 수다떨기

안녕하세요, 머신러닝에 대한 이야기를 해보고 싶어 메모장을 열어 글을 쓰기 시작했습니다. 머신러닝이라는 단어, 챗 GPT 때문에라도 한 번씩 들어보셨을 거예요. 이게 무엇인지 궁금해서 찾아본 분이 계실까요? 그리고 수많은 수식들을 보고 금방 관심이 ‘짜게 싶었’ 던 적은 있나요? 다양한 이유로 머신러닝을 접하고 또 멀어졌을 텐데요, 다시금 가까워지길 바라는 마음에서 이 글을 쓰게 되었습니다. 머신러닝을 향한 관심이 열리길 바라며, 이야기를 시작해 볼까 합니다.



머신러닝이란 단어는 많이 들어보셨을 거예요. 그게 무엇이라고 한 마디로 정의해 볼 수 있을까요? 각자가 생각하는 것들이 듣고 싶네요.


아마 누군가는 ‘함수’라고 이야기를 하시겠죠. ‘데이터를 입력해서 원하는 결과가 나올 때까지 학습을 하는 과정을 말함’이라고도 생각한 분도 있을 거고요. 맞습니다. 머릿속에 있는 자판기 그림을 떠올려보는 것부터 시작해 볼까요. 중고등학생 때 배웠던 그 함수 기억나실지 모르겠어요. 그 함수를 어떻게 만들었는지, 그래서 어떤 답을 찾았는지 기억하시나요? 그걸 기계를 통해 시킬 겁니다.


우리 삶에는 많은 현상들이, 그리고 그 현상들을 어떤 데이터로 변경해 저장해 둔 것들이 아주 많습니다. 관측한 데이터를 토대로, 궁금한 점들(주어진 문제)을 해결하는 알고리즘을 구축하는 기법이 바로 머신러닝이라고 부를 수 있겠네요. 우리 세상을 더 잘 표현할 수 있는 통계모델을 알고리즘으로 만들어, 현실에 닥친 문제들을 풀어내는 것도 포함합니다.


함수, 통계모델, 알고리즘… 현실을 잘 모사하는 것들을 어떻게 만들면 좋을까요? 아마 몇몇 현상들은 ‘이미 벌어진’ 것들이겠죠. 벌어졌기 때문에 그게 무엇인지 결과가 정해져 있을 겁니다. 예를 들어, 새로 집을 구하는 사람이라면 ‘자기만의 집 기준’ 이 있을 거예요. 방은 몇 개 여야, 주변에 있는 대중교통 시설을 이용하기 위해 얼마나 걸어야 하는지 거리만 맞으면 집을 선택하는 사람들이 있을 겁니다. 채광이 잘 들어야 하고, 수압도 괜찮고, 주변 시설에서 소음이 들리지 않는 조건들이 모두 만족스러웠을 때 집을 선택하기도 하겠죠. 이걸 알고 있는 부동산 중개사라면 어떤 ‘함수’를 만들어보고 싶을까요?


집 조건에 따른 ‘계약률’ 정도를 예약해보고 싶지 않을까요? 어떤 조건의 집이 새로 들어왔을 때, ‘얼마나 빠르게 ‘ 계약이 체결될 것인가? 혹은 얼마나 많은 손님들에게 보여주어야 계약이 체결될 것인지 미리 예상해보고 싶을 겁니다. 위에서 열거한 몇 가지 조건들을 함수에 넣었을 때, 몇 %의 비율이 될지 계산을 하고, 그 결과에 따라 손님을 모객하고 집을 보여주며 ‘가장 효율적인 동선’을 짜고 싶겠죠.


우리는 여기서 지도학습에 대한 이야기를 해볼 수 있을 거예요. 이미 오래된 부동산이라면, 위에서 언급한 내용들에 대한 정보를 쌓아두고 있을 겁니다.

f(x) = 방 개수 + 1/ (대중교통까지의 거리 ) + 채광 + 적절 수압 + 1 / (주변 시설의 소음) + …

여러 조건들을 이렇게 + 로 이어진 수의 합으로 둔 뒤의 결과물이 0 또는 1이라는 결과가 나왔다면 어떨까요. 아마 중개사는 열심히 계산하고 있을 겁니다. 어떤 요소들이 0(=계약 미체결)에 영향을 끼쳤고, 어떤 것이 1(= 계약 체결)에 영향을 끼쳤는지 말이죠.


머신러닝은, 그 계산을 컴퓨터에게 시킵니다. 그리고 결과물을 받아내죠. 방 개수가 하나 늘었을 때 결과물에 미치는 영향, 채광이 1 단위 늘어났을 때의 체결률 등으로 말입니다. 기존에 알고 있던 데이터 조건들과, 그 결과 데이터 쌍 (데이터 조건들 - 0 또는 1)이 가장 잘 들어맞게 숫자를 계속해서 맞춰볼 거예요. 실제로 저 조건들이 어느 정도로 ‘영향력(=가중치)’ 를 끼치는지 알 필요가 있거든요.


그렇게 지도학습은, 주어진 변수(features)와 결과(target)를 가지고, 변수에 곱해둘 계약 체결 영향정도(weight)를 예산하는 작업을 통해 관측된 현실을 가장 잘 반영하는 알고리즘, 통계 모델을 만들게 됩니다.



그럼, 결과가 없는 경우엔 어떻게 할 수 있을까요?

다음 글에서 이야기를 해보도록 할게요.

작가의 이전글 초단편 나이트 소재 일곱 가지
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari