내가 공부하려고 정리하는 머신러닝 필수 용어들
내가 공부하려고 정리하는 머신러닝 필수 용어들! 그리고 알 수 없는 이니셜들! 계속 업데이트 됩니다.
Collaborative Filtering Recommendation System (협업 필터링 추천 시스템)
큐레이션 시스템에서의 협업 필터링은 유저들로부터 모은 취향 정보들을 기반으로 하여 스스로 비슷한 집단의 행동을 예측하는 기술을 말한다.
예를 들어, 어떤 특정한 인물 A가 어떤 상품에 대해 인물 B와 같은 구매/탐색 이력을 갖는다면,
이것은 비슷한 다른 상품에 대해서도 비슷한 의견을 가질 확률이 높을 것이라는 사실에 기반한다.
단, 기존 데이터가 없는 신규 사용자, 즉 데이터가 부족한 사용자의 경우에는 정확한 추천이 힘들며,
또 데이터가 쌓이더라도, 정확한 추천이 이루어지기 위해 데이터가 쌓이기 위한 시간이 많이 소요된다.
KNN
K-최근접이웃(K-Nearest Neighbor, KNN) 알고리즘
K 는 주변의 참조 데이터(요소)의 개수를 의미하며, 새로운 참조 데이터를 수집 했을 때,
가장 가까이에 이웃해 있는 데이터(요소)를 중심으로 데이터의 종류를 정해주는 알고리즘이다.
유사사용자 탐색에 의한 개인화서비스를 제공 하기 위해 많이 쓰이는 방식이다.
NLP
자연어 처리 (natural language processing)
쉽게 말해 컴퓨터와의 상호작용을 위해서 컴퓨터가 인간이 사용하는 언어 (자연어)를 이해 할 수 있게끔 하는것 또는 학문을 의미한다.
여기에서 자연어는 한국어, 영어, 일본어와 같은 인간이 의사소통을 하기 위해 자연적으로 오랜 시간 동안 만들고 이어져 내려온 언어를 의미한다.
Supervised Learning 지도형 기계 학습 (지도 학습)
입력값과 출력값이 있는 즉, 정답이 있는 문제를 해결 하기 위한 학습 모델링을 의미한다.
학습 훈련 데이터로 입력(문제)과 출력(정답)이 같이 제공되는 상황을 가르쳐 주는 학습이므로 주도형 학습이라고도 한다.
지도학습은 외귀와 분류로 나누어 진다. 회귀는 보통 숫자일때 사용 되며 날씨(온도)에 따라 팔리는 상품 판매량 예측이 그것이다. 분류는 추측하고 싶은 결과가 이름을 가지거나 문자 일때 주로 사용 되며 예를 들면사진이나 이미지를 보고 개인지 고양이인지를 식별하는 것이다.