brunch

You can make anything
by writing

C.S.Lewis

by 파도비늘 Mar 02. 2016

하둡과 머신러닝

1-1 머하웃(Mahout)이란?

하둡은 쉽게 얘기하면, 빅데이터를 처리하는 자바기반의 오픈소스 프레임워크이다. 이 플랫폼 위에서 머신러닝을 통해서 데이터를 처리하는 것을 머하웃(Mahout)이라고 한다. 머하웃(Mahout)을 번역하면, "코끼리를 부리는 사람"이다. 하둡의 마스코트가 코끼리이니까 쉽게 이해가 된다. 


위키에서는 아래와 같이 정의하고 있다.

https://en.wikipedia.org/wiki/Mahout


아파치에서 개발하고 있는 머하웃(Mahout)의 최종 목표는 빅데이터를 처리할 수 있는 기계학습 어플리케이션 개발환경을 쉽고 빠르게 구축하는 것입니다.

머하웃(Mahout)의 주요 3가지 구성요소는 빅데이터 구축 알고리즘, Scala+Spark 그리고 H2O 알고리즘 그리고 하둡 맵리듀스 알고리즘입니다.


- 06 Nov 2015 - Apache Mahout 0.11.1 released

아파치 머하웃(Mahout)에서는 "Samsara"라는 새로운 툴을 발표했습니다.  이것은 확장 가능한 머신러닝 알고리즘을 만들고, 커스텀화가 가능하다. 


참고자료 :

https://mahout.apache.org/

http://develop.sunshiny.co.kr/1016?category=58


작가의 이전글 성남의 지명
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari