보유 중인 DATA가 돈이 되는 시대입니다. 그래서 너도 나도 Data를 확보하고, 활용하는데 혈안이지만 Data가 적으면 적어서, 많으면 많다는 이유로 어떤 결과를 만들어 내기는 쉽지가 않습니다. 기본적으로 의미 있는 데이터들이 있어야 되고, 또 그걸 활용할 수 있는 역량과 돈이 필요한데 어느 거 하나라도 부족하면 의미 있는 결과를 만들어 내기는 현실적으로 어렵습니다. 제 느낌으로는 어느 정도 규모가 있는 조직/회사들만이 제대로 할 수 있는 영역이라는 생각이 듭니다.
그렇다고 저 같은 이름도 없는 개인은 데이터를 활용할 수 없다고 말하는 건 아닙니다. 기대치를 낮추거나 현실적인 방법으로는 얼마든지 해볼 수 있습니다. 그나마 제가 조금은 유리할 수 있는 건 데이터와 돈과 역량 중 사업을 하면서 발생하는 데이터를 개발자였다는 역량을 활용해서 지금까지 저장해오고 있었다는 점입니다. 물론 데이터, 돈, 역량 모두 부족하지만 '제로'가 아니라는 점이 중요하고, 절대적으로 부족한 조건이지만 그 환경에 맞는 현실적인 목표를 잡는다면 뭔가를 해볼 수는 있는 상황입니다. 소소한 개선/활용 정도로 시작을 한다면 의외로 도움이 될만한 것들도 없지는 않습니다.
DashBoard
4년 동안의 주문/판매/배송/고객 등의 데이터가 제 DB에 저장되어 있고, 지금도 매일매일 소소하게 쌓이고 있습니다. 그리고 예전보다는 주문과 매출이 늘어서 현재의 제 상황이 궁금한데 전처럼 눈으로만 봐서는 매출이나 수익을 가늠하기가 쉽지 않습니다. 결국 여러 조건에 부합하는 현재나 과거의 수치를 예쁘게 보여줄 필요가 생겼고, 다행히 저는 그런 내용의 작업을 개발자로 일할 때 해봤던 적이 있습니다. 제가 일했던 개발 분야에서는 대시보드라고 부르는 화면으로 차트 형태로 어떤 수치를 조회할 수 있는 웹 페이지입니다.
보통은 예제나 테스트, 가짜 데이터로 차트를 만들어 보는의 의미를 두고 학습하는 정도로 접근하는 경우가 많지만 저는 실제 제 사업 매출과 수익, 사용자 등의 정보를 한눈에 확인해야 하는 실질적인 필요성에 의해 시작하게 된 작업입니다. 이런 필요성은 1년 전에도, 2년 전에도 느꼈던 거지만 매출이 적고, 바쁘고, 귀찮다는 여러 이유로 계속 미루고 있었습니다. 그러다가 최근에 다시 관심이 생긴 건 늘어난 매출과 ChatGPT 덕분입니다. 데이터를 Chart로 보여주기 위해서는 시각화를 위한 개발 역량도 필요하지만 쿼리(Query)를 얼마나 잘 사용할 줄 아느냐가 더 중요하다고 생각합니다.
Query
쿼리(Query)라는 건 최신의 기술도 아니고, 그렇다고 '핫'한 무엇도 아닙니다. 수 십 년 전에부터 있어 왔던 문법 체계로 흔히들 말하는 DB에 저장되어 있는 데이터를 사용하려고 할 때 필요합니다. 데이터를 저장/조회/수정/삭제할 때 쿼리를 이용합니다. 쿼리를 얼마나 잘 사용하느냐에 따라서 내가 원하는 통계 데이터를 DB에서 읽어올 수 있고, 같은 결과를 더 빠르게 실행할 수 있습니다.
제 매출과 수익, 판매, 사용자에 대한 정보를 쿼리로 읽어오면 그때부터 개발 기술을 활용해서 그 데이터를 웹 페이지에 차트로 예쁘게 보여주는 작업이 시작되는 겁니다. 제 입장에서는 웹 페이지에 차트를 보여주는 건 어렵지 않지만 보여줄 데이터를 DB를 쿼리에서 읽어오는 데 역량이 상대적으로 부족했습니다...
그런데 지금의 시대에는
ChatGPT라는 녀석이 활개를 치고 있죠.
ChatGPT에게 정확한 정보와 질문을 던져주면 적어도 Query에 대해서는 거의 100%에 가까운 정확도로 답변을 받을 수 있습니다. 저는 그저 그 Query를 약간만 다듬어서 잘 사용만 하면 됩니다. 결국 사업 데이터의 시각화 작업을 위한 개발 작업은 제가 직접 했고, Query는 ChatGPT를 통해 간접적으로 해결을 했습니다. 그리고 그 과정 중에서 일부를 유튜브에 영상으로 올려놓았습니다.
물론 제가 Query를 아예 못하는 것도 아니고, ChatGPT를 통해서 얻은 결과도 어떻게든 알아낼 수는 있습니다. 단지 시간이 더 오래 걸렸을 거고, 성능적으로도 많이 부족했을 겁니다. 그만큼 제가 쿼리를 겉핥는 수준으로만 할 수 있었고, 그러다 보니 바쁘다, 혹은 귀찮다는 핑계로 지금까지 하지 않고 있었던 겁니다.
그러다가 한동안 잊고 지냈던 ChatGPT를 아무 생각 없이 가지고 놀다가 작년보다 훨씬 빨라진 속도를 보고 '어라? 이거 봐라?!' 하면서 이것저것 해보다가 ChatGPT 이용해서 대시보드를 만들어 보면 되겠다는 결론을 내렸고, 이미 한 달 전쯤에 작업은 완료했습니다.
다른 데이터도 아니고 제가 노력해서 만들어 낸 사업의 결과물에 해당하는 데이터입니다. 그래서 그냥 한눈에 보고 싶다는 생각으로 작업을 한 거였는데 막상 작업이 완료된 DashBoard를 보면서 '어라?', '뭐지?' '진짜?' 이런 생각이 많이 들었습니다. 그만큼 대시보드를 통해서 제가 생각하지도 못했던 내용이나 시점, 수치를 알게 되었고, 한참 동안 이것저것 고민하고, 생각해 보기도 했습니다. 즉, 제 기대 이상의 효용이 있었습니다.
물론 지금 세상에서 난리가 나있고, 필요로 하는 정도는 절대 이 정도가 아닙니다. 제가 한 정도는 그냥 기초 중의 기초일 뿐입니다. 이 정도 가지고 어디 가서 데이터 좀 건드려 봤다는 이야기는 절대 꺼내서도 안 됩니다. 그저 저는 사업을 하면서 부족하거나 개선이 필요한 것 중의 일부를 제 IT 역량 내에서 보완하고 있을 뿐입니다. 사업을 하고 있을 뿐입니다.
데이터 분석
종종 데이터 쪽으로 공부/취업을 원하시는 분들을 대상으로 컨설팅/멘토링을 하고 있습니다. 그때마다 제가 하는 말 중의 하나입니다.
1. 데이터 쪽은 혼자 공부해서는 배우는 데 한계가 있다.
2. 석사/박사를 가거나 데이터를 BM으로 활용하고 있는 회사에서 일을 하거나 데이터 관련 프로젝트에 참여하면서 배워야 한다.
3. 그만큼 제약이 크고, 기술적 진입 장벽도 높다.
4. 더욱이 알아야 되는 영역이나 지식, 기술도 많고, 깊이도 있어야 된다.
이런 많은 허들에도 어쨌든 시작을 해야 한다면 가장 좋은 건 결국 본인이 좋아하는 분야의 데이터를 활용하여 간단한 분석부터 해보라고 많은 분들이 공통적으로 말을 합니다. 그리고 저도 그 의견을 동의하고, 그리고 그 의견을 따라서 지금 제가 가장 관심이 많은 제 사업 데이터를 활용하여 데이터 분석까지는 아니더라도 간단한 시각화 작업을 해 본 겁니다. 제가 지금 하고 있는 일에 직접적으로 도움도 되니 '내가 이걸 왜 해야 하지?'와 같은 근원적인 질문을 할 필요도 없습니다. 그거 제가 하기만 하면 무조건 저한테 도움이 되는 상황입니다. 안 할 수가 없었습니다!