1-1 머하웃(Mahout)이란?
하둡은 쉽게 얘기하면, 빅데이터를 처리하는 자바기반의 오픈소스 프레임워크이다. 이 플랫폼 위에서 머신러닝을 통해서 데이터를 처리하는 것을 머하웃(Mahout)이라고 한다. 머하웃(Mahout)을 번역하면, "코끼리를 부리는 사람"이다. 하둡의 마스코트가 코끼리이니까 쉽게 이해가 된다.
위키에서는 아래와 같이 정의하고 있다.
https://en.wikipedia.org/wiki/Mahout
아파치에서 개발하고 있는 머하웃(Mahout)의 최종 목표는 빅데이터를 처리할 수 있는 기계학습 어플리케이션 개발환경을 쉽고 빠르게 구축하는 것입니다.
머하웃(Mahout)의 주요 3가지 구성요소는 빅데이터 구축 알고리즘, Scala+Spark 그리고 H2O 알고리즘 그리고 하둡 맵리듀스 알고리즘입니다.
아파치 머하웃(Mahout)에서는 "Samsara"라는 새로운 툴을 발표했습니다. 이것은 확장 가능한 머신러닝 알고리즘을 만들고, 커스텀화가 가능하다.
참고자료 :
http://develop.sunshiny.co.kr/1016?category=58