알고리즘은 만병통치약 #2

by 전익진

투입과 산출


데이터 분석에서 입력되는 데이터가 무엇이냐에 따라 결과는 확연히 달라진다.

당연한 이야기지만 입력되는 데이터가 쓰레기이면 결과도 쓰레기라는 속설이 있다.

위에 말한 내용은 그만큼 입력이 출력에 미치는 영향력이 크다는 이야기다.

입력이 더 중요하냐 출력이 더 중요하냐의 문제가 아니다. 모든 문제 해결 과정에서는 반드시 입력이 존재해야 한다는 것을 강조하기 위해 데이터 분석에서의 속설을 인용해 보았다.

그런데 데이터 분석 분야에서 생각해 보면 입력 없이 출력이 이루어지는 경우는 없다.

아니 단순히 데이터 분석이나 문제 해결 과정을 떠나서 세상 모든 일에는 원인이 있기 마련이다.

‘인과관계’라고 해도 좋다.

0032.jpg

모든 사건에는 사건을 발생시키는 원인이 존재하듯 문제 해결 과정에서는 결과를 얻기 위한 입력이 반드시 존재하기 마련이다.

단 헷갈리지 말아야 할 부분은 주어진 문제를 알고리즘에 대한 입력, 즉 문제 해결 과정상의 입력으로 착각해서는 안된다는 것이다. 이는 엄연히 다르다.

주어진 문제는 알고리즘의 범위에 포함시키지 않는다. 그러니 주어진 문제는 입력이 될 수 없다.

그 주어진 문제를 풀기 위해 새롭게 투입되는 여러 값과 원인 등이 입력이 되는 것이다.

또한 알고리즘을 위해 새롭게 투입된 입력을 요리조리 분석하여 최상의 문제 해결 절차를 수립했다고 가정해 보자. 그로부터 도출된 문제 해결 절차는 반드시 하나일 필요는 없다.

0033.jpg

그 결과가 몇 개인가를 떠나서 알고리즘의 범위에서 보면 절차가 수립되었으니 임무가 완수된 것이다.

따라서 수립된 절차는 결과물, 즉 출력물이 되는 것이다.

그런데 이 또한 최종 결과(데이터 분석을 통해 얻은 가치)로 인식하는 분들이 있다.

이 역시 엄연히 다르다. 가치 발견을 위한 결과물은 주어진 문제에 대한 출력물이다.

그러니 알고리즘의 범위에 포함되진 않는다.

A01.jpg

문제 해결 과정을 수립하는 절차를 위해서는 하나 이상의 투입과 산출이 반드시 존재한다는 점 있지 말자.


http://www.yes24.com/Product/Goods/91614222


매거진의 이전글알고리즘은 만병통치약 #1