brunch

You can make anything
by writing

C.S.Lewis

by 데이터리안 Jul 24. 2024

데이터 시각화의 거의 모든 것(책 추천)

데이터리안 세미나, Q&A 중 일부를 공유합니다.

5월 세미나 [설득의 시작, 데이터 제대로 보여주는 법] 실시간 질의응답   


5월 세미나 콘텐츠 모아보기!          

5월 세미나 슬라이드

5월 세미나 VOD

5월 세미나 실시간 질의응답


월간 데이터리안 5월 세미나에서는 데이터 시각화에 대한 이야기를 나눠봤습니다. 강연 중 실시간으로 진행된 질의응답의 일부를 공유합니다. 

  

궁금이 “데이터 시각화 이야기”

선미 “데이터로 보고서 만들기 with 구글 스프레드시트”


두 강연에서 어떤 이야기가 오고갔는지 아래에서 확인해보세요 :) 월간 데이터리안 세미나의 분위기도 함께 느껴보세요!  




[데이터 시각화 이야기] Q&A 


Q. 개발자에서 데이터분석가로 커리어를 바꾸게 되신 계기가 궁금합니다! 개발자에 비해 어떤점이 더 나은지? 또는 더 힘든 부분은 무엇일까요?

궁금이: 커리어를 바꾸었다기보다 하는 일이 점차 확대된 느낌이에요. 지금도 개발은 계속 하고 있답니다. 장단점을 빨리 생각하기가 쉽지 않은데 음… 개발에 비해 단점이 뭔지 하나 떠올랐는데요. 제가 한 일에 대한 명확하고 구체적인 피드백을 (상대적으로) 충분히 자주 받을 수 없다는 점이라고 생각합니다. 예를 들어 개발자라면 내가 코드를 어떻게 고치면 코드 품질이 얼마나 향상되는지, 성능이 얼마나 좋아지는지 등의 피드백을 정말 빠르게 받을 수 있는 편인데요. 그래서 기량이 향상되기에 상대적으로 장점이 있다고 생각합니다. 이게 직무에 따른 장단점이라기보단 제 경험이 그랬던 것 같아요. 동일한 직무라도 상황에 따라 다를 수 있다고 생각합니다. 



Q. 그러면 지금 현재 직무가 데이터 분석가가 아니고 개발자이신데 데이터 분석 업무도 같이 하시는걸까요? 데이터 분석 업무와 같이 어떤 개발 업무를 하시는지도 궁금합니다!

궁금이: 분석을 잘 하지는 못해요. 통계에 익숙하지 않아서요. 저는 정보 대시보드를 만들거나 데이터를 가공하는 일을 종종 하는데요. 이런 종류의 일들은 엔지니어와 분석가의 중간 쯤에 있는 종류의 일이라서 (개발자로만 오래 일했던) 제가 접근하기에 상대적으로 수월하더라구요. 



Q. 컬러팔레트 이름을 알 수 있을까요?

궁금이: 널리 쓰이는 컬러팔레트의 종류, 이름, 용도는 여기를 참고하시면 좋습니다  

https://matplotlib.org/3.5.0/tutorials/colors/colormaps.html

https://observablehq.com/@d3/color-schemes



Q. 데이터 시각화 결과물들이나 대시보드 레퍼런스로 추천하시는 곳들이 있나요? (참고하기 좋은 사이트나 책)

궁금이: 대시보드 래퍼런스로 제일 좋았던건 Stephen Few의 책 "Information Dashboard Design”이라는 책인데요, 아쉽게도 번역서가 아직 없어요. 이 이름으로 구글에서 검색한 후 "이미지” 탭을 누르시면 모범적인 사례들이 나옵니다. 번역서 중에 내용이 약간 유사한 책으로는 “월스트리트저널 인포그래픽 가이드”가 있습니다.

선미: “월스트리트저널 인포그래픽 가이드” 저도 추천해요! 얇아서 금방 읽고 적용하기에도 좋아요. 



Q. 데이터 시각화 업무는 데이터 분석가 뿐만 아니라 마케터, 기획자 등 다양한 직군들도 많이 활용하는 편일까요? 특히나 마케터 중에서도 데이터 분석가 만큼이나 데이터 분석 역량을 많이 요하는 세부 직군이 있기도 하더라구요. 궁금합니다!

궁금이: 네, 제 경험으로는 그랬던 것 같아요. 2000년대 중반 이후부터는 어느 직군이건 대체로 데이터 분석 역량을 중요하게 여기는 것 같아요. 특히 시각화는 다양한 분야에서 유용하게 쓰인다고 생각해요. 



Q. 비지니스 분석가(머신러닝은 안하고, 데이터 추출과 대시보드 기획 위주의 업무를 하고 있습니다)에게도 통계가 중요할까요?

궁금이: 제가 느끼기엔 그런 것 같습니다. 구체적인 통계적 기법을 아는 것도 분명 도움이 될테고요, 소위 말하는 '통계적 사고'라는 사고방식에 익숙해지는 것도 도움이 된다고 생각합니다. 



Q. 컬러에서 그레이로 바꾸면 정보가 줄어드는 것 아닌가요? 

궁금이님의 강연 “데이터 시각화 이야기” 슬라이드 일부


궁금이: 정보의 양이 많은게 반드시 좋지는 않다고 해요. 예를 들어 데이터의 차원은 1차원인데, 시각화한 결과물은 2차원이라면 데이터에 없던 잉여 정보가 생긴 것이라 이것도 때론 왜곡이라고 볼 수 있습니다. 색도 비슷합니다. 색에는 여러 채널(명도, 채도, 색조)이 섞여 있어요. 특히 각 채널의 인지적 특성이 서로 다르기 때문에 용도에 맞는 채널을 선택하는 게 중요합니다. 명도 채널은 해상도가 높고 깊이 지각에 특화되어 있어서 물체 표면의 미세한 질감을 잘 드러내는 특성이 있어요. 그래서 위 사례에서도 색조 채널이 아닌 명도 채널을 쓴 것이고요. 



Q. 시각화를 할 때 꾸밈이 마냥 적은 것도 좋은 것이 아닐텐데, 그렇게 해야만 하는 상황이 있을까요?

궁금이: 시각화를 하는 목적에 따라 다를텐데요, 탐색적 분석exploratory data analysis을 하거나 과학적 시각화scientific visualization를 하는 경우에는 대체로 시각적 특성을 과도하게 쓰지 않는 게 좋다고들 말합니다(smallest effective difference). 낭비하지 않고 절약한 시각적 특성들을 다른 무언가를 강조할 때 활용할 여지도 있고요. 모니터에서 표현을 했던 정보를 흑백으로 인쇄한다거나, 애니메이션을 쓸 수 없게 된다거나, 색맹 또는 색약인 사용자를 고려하기 위해 색상 선택에 제약이 생긴다거나 등 다양한 상황이 생길 수 있는 점을 고려해도 재료(가용한 시각적 특성들)를 아껴쓰면 좋습니다. 하지만 대중과의 소통을 목적으로 하는 인포그래픽을 만드는 상황이라면 꾸밈을 조금 더 적극적으로 쓰면 좋다고 생각합니다. 



Q. 대시보드를 다른 부서의 인사이트를 위해서 만드는 경우에는, 다른 부서들의 업무도 어느정도 이해하고 있어야한다고 생각을 하는데… 이를 위해서는 어떤 노력을 하시는지 궁금합니다!

궁금이: 네, 말씀하신대로 해당 업무(도메인)를 잘 이해할수록 좋다고 생각합니다. 해당 업무를 하시는 분과 이야기를 많이 나누는 것도 필요하고, 업무를 이해하기 위해 관련 분야 입문서를 읽거나 업무를 하는 사람들의 커뮤니티를 구경하는 등의 노력이 필요하다고 생각합니다. 



Q. 저도 개발자 출신으로 데이터분석가로 이직 준비중이라, 개발 업무도 하면서 데이터 분석가 업무도 하는 직무는 어떻게 찾으신건지 궁금하네요 ㅎㅎ 너무 개인적인 질문이려나요?

궁금이: 전략적으로 찾아냈다기보다 운이 좋았던 점이 컸던 것 같아요. 재미있는 걸 꾸준히 공부하고 내가 이런 공부를 하고 있다는 걸 꾸준히 블로그, 커뮤니티 등을 통해 알리면 기회가 찾아올 가능성이 약간은 높아진다고 생각하는데요. 그래도 여전히 운도 필요한 것 같아요. 



Q. 보민(진행자): 혹시 궁금이님 강연에서 어떤게 가장 기억에 남으세요?

●: 컬러스케일이요 생각지도 못했네요.

○: 최근 일수록 진한 색 그래프를 표시하는게 기억에 남았습니다!

◇: 흑백으로 그래프를 표현했을 때 컬러보다 더 좋았던게 신기했어요~  



[데이터로 보고서 만들기 with 구글 스프레드시트] Q&A 


Q. 저는 가끔 제가 문제 정의에 충분한 데이터를 찾기 어려울 때가 있더라구요ㅠㅠ 이럴 때 어떻게 하시나요?

선미: 아주 현실적인 고민이네요. 데이터리안에서도 해결하고 싶은 문제가 있는데, 데이터가 없는 경우가 종종 있거든요. 그럴 때에는 해결해야 하는 문제가 정말 중요하다면 새롭게 데이터를 쌓아요. 



Q. 데이터 설명 부분이 보고서 앞단 뒷단 중 어디에 위치하는 게 좋을까요? (발표에서 말한 목차 안에서 네 번째가 가장 적합한 부분인가요?) 뒷부분에 넣으면 보시는 분이 이해를 못할 것 같고, 앞에 넣자니 내용이 길어지는 것 같습니다.

선미: 저는 네 번째에 많이 넣는데요. 읽는 사람마다 다르게 넣긴 해요. 예를 들어서, 데이터리안 안에서 데이터를 공유 할 때에는 다들 데이터에 대한 이해도가 높기 때문에 데이터 설명부터 해주는게 좋을 때도 있더라구요. 



Q. 연사님은 데이터 피보팅하실때 SQL 보다 스프레드시트의 피봇 테이블 기능을 더 애용하시는편인가요? 

선미: 데이터 사이즈에 따라서 좀 달라요. 시트로 하려면 데이터가 너무 크면 안되거든요. 데이터 크기가 좀 크면 SQL로 최대한 전처리를 하고요. 작은 데이터라면 시트로만 핸들링해도 충분해서 시트로 많이 하게 되는 것 같아요. 



Q. 보민(진행자): 선미님 강연에서 어떤게 가장 기억에 남으시나요?

궁금이: 저는 오늘 선미님이 발표해주신 내용 중에서 문제 정의를 강조하신 부분이 특히 좋았어요. 실무 상황에서 주어지는 일들은 대부분 문제 자체가 잘 정의되지 않은 경우(ill-defined problems)가 많아서, 이걸 잘 정의된 문제(well-defined problems)로 바꿔서 규정하는 게 정말 중요한 능력인 것 같아요.


●: 보고서 구성 순서요!

○: A로 시작해서 B로 끝나는 경우 너무 공감됩니다.

◇: 호미로 할 수 있는 일은 호미로 하자…

◆: 보고서의 3원칙을 들으면서.. 지나간 저의 보고서들을 생각하고 씁쓸했어요..^__^ㅠ

▷: 서론-본론-결론은 순서대로 쓰는 것도 아니고 의식의 흐름으로 쓰는 것과 다름없다 ㅎㅎ

▶: 중요한 것은 데이터가 가진 의미이지 멋진 데이터가 아니다.

□: 자주 하는 실수들 많이 찔리네요. 나의 과오가 떠올랐습니다…

■: 구글 스프레드시트를 너무 잘쓰고 싶다

☆: 저는 보고를 받는 입장인데요ㅎㅎㅎ 친구들이 매번 하는 실수들이 안타까웠습니다.  




[기타 세션] Q&A


Q. 데이터를 중요시하지 않는 회사인데요 그 회사에 데이터로 이런 것도 도출할 수 있다는 걸 보여드리고 싶은데 어떤 방법이 좋을지, 사례가 있으실까요?

선미: 많이 보여주는 것만큼 설득에 좋은건 없는 것 같아요. 아는 시니어 데이터 분석가님은 그런 조직에서 일을 할 때, ‘데이터로 봤을 때 제일 의외인 것' 부터 보여줬다고 하더라구요. 사람들의 감에 반하는 데이터부터 보여주는게 중요성을 설득하는데 도움이 많이 되셨다고 했었어요. 



Q. 궁금이님이 UX 디자이너라고 하셔서 놀랐는데, UX 디자인 커리어 측면에서도 데이터 시각화 능력이 크게 요구되나요? UX 측면에서 데이터 시각화가 필요했던 예시가 궁금합니다. 그리고 오늘 강의자료가 개인적으로는 되게 학술적인 느낌이었는데 실례가 되지 않는다면 혹시 대학원 진학이 있으셨으지, 요런 자료들은 접하는 채널이 있으신지도 궁금했습니다 :)

궁금이: 좋은 UX 디자인의 원칙과 좋은 시각화의 원칙이 상당히 겹치더라고요. 공부하면서 겹치는 내용이 하도 많아서 놀랐던 기억이 있어요. 눈동자의 움직임, 손(마우스)의 움직임, 인간의 인지와 기억이 작동하는 방법에 대한 이해 등등 겹치는 내용이 정말 많았습니다. 그리고 대학원은, 저는 고등학생 때 공부를 워낙 못했어서 대학을 못갔습니다. 이런 저런 책이나 논문을 보며 독학을 했습니다. 



Q. 분석하는 상황마다 어떤 그래프를 사용하면 좋을지 알려주는 규칙이 있나요?

궁금이: 아래 책들이 도움이 될겁니다. 



◆ 데이터 시각화 추천도서 8권      

1. 진실을 드러내는 데이터 시각화의 과학과 예술 (알베르토 카이로) 

2. 월스트리트저널 인포그래픽 가이드 (도나 웡) 

3. Now You See It (Stephen Few) 

4. Information Dashboard Design (Stephen Few) 

5. Visual Explanation (Edward Tufte) 

6. The Visual Display of Quantitative Information (Edward Tufte) 

7. Information Visualization (Colin Ware) 

8. Visual Thinking for Design (Colin Ware)





데이터리안 콘텐츠와 데이터 분석 능력 업그레이드 해볼까요?


 데이터 분석가들이 직접 발행하는 뉴스레터 무료로 받아보기


 데이터 분석 실무자들이 모여있는 오픈 카톡방 참여하기

(링크 클릭 후 오카방 메인 화면에서 참여 코드 확인 필수!)


 SQL 데이터 분석 캠프 커리큘럼 보러가기


 GA4 데이터 분석 캠프 커리큘럼 보러가기


 데이터리안 블로그에서 더 다양한 데이터 분석 콘텐츠 구경하기


 데이터 분석 전문 세미나 다음 주제 보러가기

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari