레디미의 명품동아리
1분이라는 짧은 시간에
페이스북에는 2000만번의 자료가
트위터에는 30만번 이상의 트윗이,
인스타그램에는 22만장 이상의 사진이,
유튜브에는 72시간짜리 영상이 업로드 되고 있다는 사실 아시나요?
데이터의 증가 추이는 더욱 가속화되고 있으며
바야흐로 정보의 시대가 도래함에 따라
빅데이터는 미래 경쟁력의 핵심 자원으로 떠오르고 있어요.
그렇다면 이렇게 많은 데이터로 어떠너 일을 할 수 있을까요?
데이터를 어떻게 접근해야 유의미한 결과를 도출할 수 있을까요?
오늘은 이러한 질문들의 답을 찾아가고 있는
국내 최초 빅데이터 연합동아리 BOAZ를 소개해보려 합니다. 함께 알아보시죠!
국내 최초 빅데이터 연합 동아리인 BOAZ는
2013년 창립된 대학생 동아리로,
대학생들이 모여 빅데이터의 A에서 Z까지 함께 공부하고 있어요.
BOAZ에서는 커리큘럼에 따라
프로그래밍, 통계, 시각화, 머신러닝, 딥러닝 등을 학습하고,
자발적인 스터디를 통해 서로의 부족한 점을 메꿔주며
데이터 사이언티스트를 목표로 성장하고 있어요.
더불어 BOAZ 멤버들은 프로젝트를 진행하며
6개월마다 열리는 컨퍼런스에 참여하고,
데이터 사이언티스트가 되기 위한 밑거름을 다지고 있어요.
BOAZ는 2019 공공데이터 빅데이터 분석 공모전 대상,
KED 빅데이터 시각화 공모전 대상,
KED 디지털 산업혁신 빅데이터 시각화아이디어 경진대회 대상,
빅콘테스트 퓨처스리그 최우수상 NIA 장관상,
제4회 2016 빅콘테스트 챌린지리그 미래창조과학부 장관상을 비롯해
총 39회라는 정말 놀라운 수상실적을 자랑한답니다.
흔히 데이터 사이언스를 생각하면
통계학, 프로그래밍 등을 떠올리실 텐데요.
데이터를 어떤 도메인에 활용하느냐에 따라
요구되는 지식이 달라지고,
기술이 하루하루 발전하며
필요한 능력이 다양해지고 있어요.
그렇기 때문에
다양한 사람들이 모여
각자의 시야를 공유하는 공간이 필요하죠.
데이터를 독학할 때는
공부 자체에 큰 어려움이 없을지 몰라도
접할 수 있는 지식의 폭은 지극히 한정적이에요.
그러나 BOAZ에서 함께한다면
내가 가진 지식을 나누고, 새로운 시선의 접근 방법을 배우며
같이의 가치를 나눌 수 있어요.
BOAZ의 로고를 보시면
다들 <어린 왕자>를 떠올리실거예요.
실제로 BOAZ의 로고는
<어린 왕자>에 나오는
코끼리를 삼킨 보아뱀의 모습을 나타내었다고 해요.
이는 모두가 '모자'라고 할 때
'코끼리를 삼킨 보아뱀'을 상상할 수 있는 창의력을 뜻하며
코끼리, 즉 빅데이터를 집어삼키는 보아뱀이 되겠다는
BOAZ의 도전 정신을 의미한다고 합니다.
또한 오른쪽의 로고에서는 O 글자 안에 차트가 들어 있는데요.
이는 데이터를 분석하고 시각화하여 병자들을 구했던
나이팅게일의 Rose Diagram을 모티브한 것이라고 합니다.
BOAZ의 정규 세션은
데이터를 수집, 분석하고 머신러닝 및 딥러닝 모델링을
실시하는 데이터분석 부문,
정보 전달 효율성의 극대화를 위해 주어진 데이터를 통해 인사이트를 도출하는
데이터시각화 부문,
데이터 적배부터 전처리, 모델링 결과 활용까지
데이터 처리의 전반적인 흐름을 정의하는 데이터엔지니어링 부문으로 나뉘어요.
각 부문의 정규 세션은 1년의 커리큘럼으로
Base 방학세션 -> Base학기세션 -> Adv 방학세션 -> Adv 학기세션으로 나뉘어요.
[ Python을 이용한 프로그래밍 실습 / 머신 러닝, 딥러닝 학습 / 통계 이론 / 데이터 분석 프로젝트 ]
데이터분석은 데이터 수집, 전처리, 머신러닝 및 딥러닝을 통한 모델링까지
전반적인 데이터 분석을 아우르는 부문인데요.
Base 방학세션에서는
빅데이터를 다루기 위한 기초 지식, 머신 러닝 및 딥러닝 기초 이론을 배우고 실습을 해요.
이어서 Base 학기 세션에는
방학 중 배운 머신러닝 알고리즘을 직접 실습해보고 딥러닝 논문을 읽고 구현하죠.
이 때 자연어 처리, 컴퓨터 비전에 대해 배워요.
이후 Advanced 방학세션, 학기세션에는 신입 기수와 함께
새로운 커리큘럼으로 세션을 진행하고, 컨퍼런스 프로젝트를 진행하는데요.
컨퍼런스 프로젝트를 진행하기 위해 프로젝트 주제를 선정하고, 스터디를 진행하고
우수 결과물을 제출한 팀은 BOAZ에서 주최하는
BOAZ 빅데이터 컨퍼런스 무대에 설 수 있는 자격이 주어져요.
이 자리에서 1년간 BOAZ에서 배우고 익힌 것들을 대중에게 공개하죠.
[ Python을 이용한 프로그래밍 학습 / Tableau를 이용한 데이터 시각화 학습 / 데이터 시각화 케이스 스터디 ]
데이터시각화는 통계 분석으로는 도저히 알 수 없는 데이터의 이야기를 끌어내
숨겨진 인사이트를 도출하는 것을 목표로 하는 부문입니다.
Base 방학세션에서는 데이터 수집 및 전처리, 시각화 툴 활용,
자율 과제 및 미니 프로젝트를 통해 전반적인 데이터 시각화에 대한 이해를 넓혀요.
python을 통해 기초 프로그래밍을 학습하고,
기존 기수와 신입 기수가 함께 태블로(Tableau)를 활용한
대시보드 설계 구성 방법 등을 학습해요.
이어서 Base 학기세션에서는 시각화 툴 실습, 팀별 프로젝트를 통해
데이터 분석부터 시각화까지 전체적인 과정을 진행하죠.
이후 Advanced 방학세션, 학기세션에는 역시 신입 기수와 함께
새로운 커리큘럼으로 세션을 진행하고 컨퍼런스 프로젝트를 진행해요.
앞선 데이터분석 부문과 마찬가지로 프로젝트 주제를 선정하고, 설계하고, 진행하여
우수작은 BOAZ 빅데이터 컨퍼런스에서 선보입니다.
[DBMS 및 SQL 이론 학습 / Hadoop 기초와 HDFS 이론 학습 / Docker를 이용한 Kafka 및 Spark 학습 ]
마지막으로 데이터 엔지니어링 부문은
매일 1PB이상 발생하는 데이터들을 어떻게 효율적으로 관리하고 운영할지 고민하고,
데이터를 잘 전달할 수 있는 방법에 대해 공부해요.
Base 방학세션에는 리눅스와 가상화, DBMS, SQL 등
데이터 파이프라인 구축을 위한 기초를 다지고,
이후에 진행되는 Base 학기세션에서는 Docker를 통해 Kafka와 Spark을 실습해보고
데이터 운영 및 관리를 진행해보는 시간을 가져요.
이때 범용 빅데이터 저장소 구축, 인메모리 분산 데이터 처리,
실시간 메시지 처리 등에 대해 배우죠.
그리고 이어서 Advanced 방학세션, 학기세션에는
역시 똑같이 신입 기수와 함께 새로운 커리큘럼으로 세션을 진행하고
컨퍼런스 프로젝트를 진행해요.
프로젝트의 주제선정부터 BOAZ 빅데이터 컨버런스까지
앞선 부문과 동일하게 진행됩니다.
먼저 데이터분석 부문의 경우
데이터 분석, 머신러닝 및 딥러닝의 기초적인 개념을 익히고
세부 Task를 나눠 심화과정을 공부하여
논문 스터디, 미니 프로젝트를 마친 후에는
데이터 수집부터 모델링까지 딥러닝 프로젝트의 전반적인 과정을 익히게 된다고 해요.
데이터시각화 부문의 경우
웹 크롤링을 통한 데이터 수집, 파이썬을 활용한 전처리,시각화 툴 태블로(Tableau)를 다루며
직관적이고 멋있는 시각화 방법을 익히고,
데이터 신뢰성과 정확성을 위한 수집 및 전처리 방법, 통계 이론을 균형있게 학습하며
프로젝트를 통해 데이터에서 원하는 인사이트를 뽑아내고,
이를 남들에게 제공하고 소통하는 방법을 배운다고 해요.
그리고 데이터엔지니어링 부문의 경우
다양한 DB에 대한 개념을 정립하고, 빅데이터 저장 및 관리에 대한 전반적인 부분을 학습하며
이후에는 기초적 운영 및 SQL부터 Streaming, 머신러닝까지 배운 내용을 실습하고 구현하고,
프로젝트를 진행하면서 빅데이터에 관한 효율적인 관리 능력을 얻고,
나아가 데이터 파이프라인 구축을 통해 데이터 수집부터 ML/DL 분석까지의 과정에 대해
Real-Time 수준의 데이터 운용 실력을 키우게 된다고 합니다.
각 부문별로 진행되는 개별 세션 외에도
한 달에 한 번씩 데이터분석, 시각화, 엔지니어링 부문 회원들이 모두 모여
빅데이터와 관련된 다양한 활동을 하는 공동 세션이 진행됩니다.
공동 세션에서는 빅데이터와 관련된 이슈로 토론하거나
정규 세션에서는 배우지 않는
새로운 빅데이터 분석 알고리즘 강연이 이뤄진다고 해요.
동아리원들은 공동 세션을 통해 빅데이터에 관한 다양한 견해를 나누고 배우며,
사회 전반에 걸치는 전체적인 동향을 파악하죠.
또한 자주 만나지 못하는 각 부문 회원들과 함께하는 자리이기도 해요.
지난 공동 세션에서는 크롤링, Colab, Git, SQL과 ORM 등
다양한 주제가 이뤄졌다고 합니다.
BOAZ 빅데이터 컨퍼런스는
동아리원 모두가 자신의 역량을 쏟아내는 자리로
동아리에서 습득한 지식과 기법을 적용해
새로운 알고리즘에 도전한다고 해요.
컨퍼런스의 각 참가팀은 동아리원으로 구성되며
동아리원들은 매 발표 후 질문을 받고 답변하며
상호 피드백을 통한 발전을 모색하죠.
다양한 의견과 열띤 토론을 통해
BOAZ의 지향점인 '교류'와 '상생'에 한걸음 더 다가선답니다.
지금까지 진행됐던 컨퍼런스는
데이터 분석을 통한 효율적 사막화 방지,
실시간 축구 중계 영상 화질 개선 모델,
채용공고로 알아보는 IT기술트렌드 분석 서비스 등이 있었는데요.
정말 제목만 봐도 흥미로운 내용들이 많았답니다.
BOAZ에서는 정규 세션을 진행하며
자신이 부족하다고 느끼는 부분이나 더 공부하고 싶은 부분을
자율적인 스터디를 통해 보충합니다.
원하는 분야, 공부하고 싶은 책을 추천하여
신청자를 받아 스터디 팀을 구성하며,
구성된 스터디 팀은 8주 동안 함께 공부해요.
보통 해당 주차에 계획된 분량을 각자 공부한 뒤,
스터디를 통해 다른 팀원들과 의견을 나누고,
혹은 다른 팀원이 진행하는 강의를 들으며 궁금한 내용을 질문합니다.
2021년 상반기에는
'SQLD 1달 뽀개기', '추천시스템으로 배우는 논문읽기',
'asap하게 adsp 뿌시기', '알고리즘 난 모르고' 등
총 16개의 스터디 팀이 함께 공부했다고 해요.
컨퍼런스 톡은 BOAZ 내에서 진행되는
자율 방식의 미니 컨퍼런스예요.
형식적인 자리에서 이뤄지는 깊은 전문 지식 공유가 아닌,
BOAZ 동아리원들끼리 자신이 진행하는 일, 공부, 연구 등을
편하고 자유롭게 공유하는 자리예요.
BOAZ의 해커톤은 1박 2일로 진행되며
조별로 주제를 선정하고,
데이터 분석 및 시각화를 진행해 발표한다고 해요.
해커톤은 활동 기수 뿐만 아니라
수료 회원들도 함께 참여하는 자리라고 합니다.
BOAZ는 기업에 방문하여 실무에서의 데이터 분석 현황, 과정을 직접 경험해요.
또한 인사 담당자를 만나 채용 과정에 대한 질의 응답도 진행한다고 해요.
현재 다양한 기업과 단체에서 먼저 연락이 오는 등 활발한 교류가 이뤄지고 있다고 하며
지금까지 넥슨 코리아, 씨이랩(XIIlab),
현대자동차, 한국기업데이터(KED),
밀버스에 방문했다고 합니다.
BOAZ는 학업 외의 시간에
워크샵, 뒷풀이, 선배 기수와의 팀별 미션 등을 진행하며 친목을 도모하고,
이를 통해 구성원간의 유대감을 형성한다고 해요.
BOAZ는 수료 이후에도
동아리원들끼리 인적 네트워크를 형성하고 있었어요.
이들은 Slack을 통해 지속적인 교류를 이어나가며
구인구직 및 스터디, 최신 논문,
최신 트렌드에 대한 정보를 공유한다고 해요.
BOAZ의 생생한 활동사진, 세션, 영상 등이 궁금하다면
페이스북 : https://www.facebook.com/BOAZbigdata
인스타그램 https://www.instagram.com/boaz_bigdata/
네이버 블로그 : https://blog.naver.com/boazbigdata
유튜브 : https://www.youtube.com/channel/UCSniI26A56n2QZ71opJtTUg/videos
위 사이트들에 방문해보시길 추천드립니다 :)
오늘은 국내 최초 빅데이터 연합동아리 BOAZ에 대해 알아봤는데요.
혹시 추가로 궁금하신 동아리, 학회가 있으시다면 언제든 댓글 남겨주세요 :)
*언더패스는 21년 9월 13일자 이후로 "레디미 온보딩"으로 리뉴얼 되었습니다
참고 사이트
BOAZ 페이스북 https://www.facebook.com/BOAZbigdata/
BOAZ 인스타그램 https://www.instagram.com/boaz_bigdata/
BOAZ 네이버 블로그 https://blog.naver.com/boazbigdata
BOAZ 유튜브 https://www.youtube.com/channel/UCSniI26A56n2QZ71opJtTUg/featured