Apache Superset 6.0 릴리즈!
오픈소스 대시보드 도구
여러분들께서는 데이터를 가지고 무엇을 하시나요?
데이터 살펴보거나 뭔가 해봐야하는데 뭐부터 해야할까... 뭘로 하지?라는 고민이 먼저 듭니다. 일단, 가장 만만한 엑셀(Excel)로 시작해봅니다. 뭔가 좀 허전합니다...
통계학이나 데이터 분석 책들을 보시게 되면 처음에 항상 나오는 것이 EDA (Exploratory Data Analysis) - 즉, 탐색적 자료분석을 하라고 합니다.
데이터가 하는 이야기를 듣기 위해 데이터를 먼저 간단히 살펴보고자 하는데, 그에 대한 첫번째 수단이 바로 데이터 시각화입니다. 막대그래프를 그려보거나, 파이그래프를 그려보거나...
그러나...
문제는 여기서부터 발생합니다...
데이터 시각화를 무엇으로 해야할까라는 문제입니다. 엑셀 좋습니다. 그러나, 엑셀은 데이터가 10만 줄 이상일 경우 다루기가 어렵습니다. 그렇다고 모든 데이터들이 엑셀 파일로 존재하지도 않습니다. 그래서, PowerBI나 Tableu와 같은 상용 도구를 사용하면 너무나도 편하고 좋습니다. 그러나... 또 비용이 문제가 발생합니다.
그렇다고, 직접 D3.js, Bokeh, Shiny와 같은 것들을 사용하자니 코딩의 문제가 발생합니다.
그래서, 대안으로 오픈소스 도구인
Apache Superset
를 추천해드립니다.
https://superset.apache.org/
Apache Superset은 오픈소스이지만, Power BI 및 Tableu의 고급 기능까지는 미치지 못하겠지만, 기본적으로 40개 이상의 시각화는 지원하고, 아래 이미지와 같이 많은 종류의 데이터베이스를 지원하면서 그 데이터베이스의 데이터를 쉽게 시각화하면서 SQL 문을 통해 살펴볼 수 있는 방법도 가지고 있기에 기본적인 데이터 시각화나 탐색 플랫폼으로서는 그것들이 뒤지지 않습니다.
지원하는 많은 데이터베이스 종류
Apache Superset은 갑자기 생겨난 것은 아닙니다. 2025년 12월 19일에 Apache Superset 6.0이 공개되었습니다. 1.0도 아닌 6.0입니다. Airbnb에서 일 하던 Maxime Beauchemin이 2015년부터 개발하기 시작했습니다. 이 분은 데이터 파이프라인 자동화 도구인 Apache Airflow의 창시자이기도 합니다. 지금은 데이터 처리 플랫폼 회사인 Preset (https://preset.io/)의 설립자이자 CEO이기도 합니다.
Apache Superset은 10년이 넘는 시간동안 꾸준히 개발되면서 6개월 단위로 공개해 오고 있었습니다. 또한, 이번 6.0으로 업그레이드되면서 Python 3.12를 지원하게 되었습니다.
저는 일하면서 데이터를 보거나 회의시 데이터를 직접보면서 이야기할 때 이 도구를 사용하고 있습니다. 또한, 파트너사들에게 매일 저녁 8시에 결산된 대시보드를 메일로 발송하고 있습니다.
앞으로 Apache Superset의 강력한 기능을 조금씩 소개해드리겠습니다!!!