권순목

코드 리뷰, 9가지 이야기 - 소프트웨어 개발 노트

2024-10-05T06:33:44Z

개발자들 누구나 이 주제에 대해 할 말이 있을 것이다. 나 역시 오래된 개발자로서 이 주제에 할 말이 있지만 딱히 나서 본 적은 없었는데, 최근 회사에서 이 주제로 강연 비슷한 것을 하면서 생각을 정리할 기회가 있었다. 그 내용을 여기에 글로 풀어 써 보고자 한다. 이 글에서 코드 리뷰에 관해 9가지 이야기를 할 것이다. 처음 3개는 What, 다음 3개

개발 팀 성과 도식화 - 소프트웨어 개발 노트

2022-04-12T06:07:07Z

스플렌더(Splendor)라는 보드 게임이 있다. 앱 버전도 있어서 인공 지능과 대전을 할 수 있다. 인공 지능에는 여러 가지 모드(Mode)가 있는데, 대충 다음과 같은 것 들이다. Opportunistic (기회주의 모드): 장기 전략 없이 각 턴에서 가장 가성비 높은 행동을 한다. Specialized (전문성 강화 모드): 전문성 점수를 높이는 장

맺는 글 - 데이터 과학 미니북

2022-02-16T09:35:35Z

프로그래밍을 배우려는 학생들에게 이 단계에서 가장 필요한 것은 특정 프로그래밍 언어 문법이나, 한 두 개의 세련된 알고리즘이나, 그 알고리즘에 대한 수학적 분석 같은 것이 아니다. 학생들은 프로그램의 기저에 흐르는 작성 원리를 통찰하고, 그 아름다움 또한 느껴 보아야 한다. 그리하여 수십 페이지 길이의 코드에서 어느 부분을 읽어야 하고 어느 부분을 읽지 않

4.2 데이터 시각화 - 데이터 과학 미니북 - 4. 데이터 분석 실무

2023-04-09T09:23:12Z

4.2 데이터 시각화 데이터를 보여주는 방법에는 여러가지가 있습니다. 표로 데이터 내용을 있는 그대로 보여줄 수도 있고, 산포도, 히스토그램 등으로 나타낼 수도 있습니다. 보통 ‘데이터 시각화’라고 하면, 표처럼 데이터의 변수 값들을 있는 그대로 보여주는 것 보다는, 히스토그램, 산포도 등과 같이 한눈에 볼 수 있는 형태로 가공된 것을 일컫습니다. 여기서

4.1 모델 선택 - 데이터 과학 미니북 - 4. 데이터 분석 실무

2021-12-17T05:43:25Z

4. 데이터 분석 실무 앞 장에서 다양한 통계 분석 기법과 머신 러닝 모델들을 살펴보았습니다. 이번 장에서는 이런 여러 가지 분석 기술들을 활용하여 실무에 나설 때 도움이 될 수 있는 두 가지를 살펴봅니다. 우선, 주어진 문제에 대하여 어떤 분석 모델을 쓸 것인지 선택하는 방법을 알아봅니다. 다음으로, 분석 결과를 다른 사람에게 보여줄 때 사용하는 시각화

3.4 모델 평가 - 데이터 과학 미니북 - 3. 데이터 분석

2021-12-17T05:43:23Z

3.4 모델 평가 3장에서는 여러가지 모델을 살펴보았습니다. 이번 단원에서는 마지막으로 모델을 평가하는 방법에 대해서 설명합니다. 앞서 3.2.2 단원에서 예측 대상 변수가 범주형인 모델은 분류 모델(Classification Model, Classifier), 예측 대상 변수가 수치형인 모델은 회귀 모델(Regression Model, Regressor

3.3 비지도 학습 모델 - 데이터 과학 미니북 - 3. 데이터 분석

2021-07-31T11:51:03Z

3.3 비지도 학습 모델 지도 학습은 예측을 목적으로 하는 모델을 피쳐와 레이블 변수들을 이용해서 만들어 내는 것을 말합니다. 이에 반해 비지도 학습은 레이블 없이 피쳐 변수들 만으로 모델을 만들어내며, 모델의 목적은 예측에 국한되지 않습니다. 비지도 학습 기법들은 기초 통계 분석과 같이 특별한 목적 없이 데이터의 내용을 설명하는 데에 초점을 두는 측면이

3.2 지도 학습 모델 - 데이터 과학 미니북 - 3. 데이터 분석

2021-08-01T16:55:26Z

3.2 지도 학습 모델 앞서 살펴 본 기초 통계 분석 기법은 데이터의 내용을 설명하는데 초점을 맞춥니다. 특정 변수의 평균값이 어떠한가? 변수가 어떻게 분포하고, 변수들 사이의 상관 관계가 어떠한가? 같은 질문에 답합니다. 이런 식의 분석은 특별한 분석 목적이 없어도 데이터가 주어지면 기본적으로 해 볼 만한 것들입니다. 분석 목적이 정해지면 그때부터는

3.1 기초 통계 분석 (하) - 데이터 과학 미니북 - 3. 데이터 분석

2022-03-30T22:40:39Z

3.1.3 이상치 제거 기초 통계 분석을 통해 데이터의 특성을 파악하다 보면 이상치(Outlier)를 발견할 수 있습니다. 통계학에서 이상치의 정의는 '다른 관측치와 상당히 다른 측정치'[1]입니다. 이상치를 발견하면 그 발생 원인을 규명하여, 측정 오류로 판명 나는 경우 데이터에서 제거해 줌으로써, 다양한 모델의 성능을 향상시킬 수 있습니다. 다만 데이

3.1 기초 통계 분석 (상) - 데이터 과학 미니북 - 3. 데이터 분석

2022-04-01T14:11:30Z

3. 데이터 분석 본 장에서는 다양한 데이터 분석 기법을 살펴봅니다. 우선 기초적인 통계 도구들을 이용하여 데이터의 특징을 살펴보는 방법을 소개하고, 다양한 통계 및 머신 러닝 모델을 이용하여 데이터를 분석하는 단계로 나아갑니다. 모델은 지도 학습 모델과 비지도 학습 모델로 분류할 수 있는데, 이 책에서는 우선 지도 학습 모델들에 대해서 다루고, 비지도

2.3 데이터 엔지니어링 - 데이터 과학 미니북 - 2. 데이터 가공

2023-06-27T23:52:47Z

2.3 데이터 엔지니어링 2.3.1 데이터 엔지니어링 업무 분석 팀을 구성하는 여러 역할 중 하나로 데이터 엔지니어가 있습니다. 데이터 엔지니어가 하는 일이 바로 데이터 엔지니어링입니다. 이 단원에서는 데이터 엔지니어링 업무에 대해서 자세하게 살펴보겠습니다. 데이터 엔지니어링을 작게 보면 "데이터를 가져와서 분석하기 좋은 형태로 가공하는 것"입니다.

2.2 피쳐 엔지니어링 - 데이터 과학 미니북 - 2. 데이터 가공

2021-08-03T04:12:24Z

2.2 피쳐 엔지니어링 2.2.1 설명 변수, 반응 변수, 피쳐, 레이블 앞서 2.1장에서 변수의 종류를 수치형 변수와 범주형 변수로 나눴습니다. 이것은 변수의 내용에 따른 분류라 할 수 있는데, 변수는 그것이 어떤 용도로 쓰이느냐에 따라서도 분류될 수 있습니다. 외재적 요인을 이용한 분류라 할 수 있습니다. [표 1]은 앞 단원에서 살펴 본 달리기

2.1 통계 데이터의 정의 - 데이터 과학 미니북 - 2. 데이터 가공

2021-12-17T05:43:12Z

2. 데이터 가공 본 장에서는 데이터 자체에 대하여 살펴봅니다. 우선 통계학적으로 데이터를 정확하게 정의합니다. 그리고 피쳐 엔지니어링이라는 과정을 통해 데이터를 추가 가공하는 방법을 알아봅니다. 본 장의 후반부에서는 앞 장에서 간단히 언급했던 데이터 엔지니어의 업무. 즉 데이터 엔지니어링에 대해서 좀 더 상세히 알아봅니다. 데이터 엔지니어링이 영역은 매

1.4 모델 - 데이터 과학 미니북 - 1. 기초 개념

2021-08-16T16:21:43Z

1.4 모델 앞서 모델이란 말이 통계학자와 머신 러닝 엔지니어의 업무 속에서 잠깐 나왔었습니다. 그들이 만들고 학습시키는 것이 통계 모델 또는 머신 러닝 모델입니다. 모델이란 말은 데이터 과학에서 가장 많이 쓰이는 말 중 하나입니다. 이 책 또한 데이터 과학자들이 사용하는 통계 모델과 머신 러닝 모델들을 설명하는 데에 상당한 분량이 할애되어 있습니다. 모

1.3 데이터 분석 팀 - 데이터 과학 미니북 - 1. 기초 개념

2022-02-06T16:47:25Z

1.3 데이터 분석 팀 데이터 과학 개념이 어느 정도 자리를 잡고, 데이터 레이크가 구축되기 시작하면서 많은 기업체 내에는 소위 데이터 분석 팀이라 불리는 조직들이 생기기 시작합니다. 세부적인 업무 내용은 차이가 있을 수 있지만, 이런 팀들의 공통적인 목적은 데이터에서 의미를 발굴하여 그것을 비즈니스 성과로 연결시키는 것입니다. 데이터 분석 팀은 다양한

1.2 하둡과 데이터 레이크 - 데이터 과학 미니북 - 1. 기초 개념

2023-01-18T08:24:03Z

1.2 하둡과 데이터 레이크 데이터 과학이 통계학에서 갈라져 나오는 동안, 소프트웨어 세계에서도 큰 변화가 일어나고 있었습니다. 1.2.1 하둡 (Hadoop) 2000년대 초반 한창 성장 가도에 있던 구글(Google)사는 큰 문제에 봉착해 있었습니다.[1] 검색 엔진이 기초적인 부분에서 에러를 일으키는 경우가 부쩍 잦아진 것입니다. 예를 들어, 이

1.1 데이터 과학의 기원 - 데이터 과학 미니북 - 1. 기초 개념

2023-11-22T07:59:25Z

1. 기초 개념 본 장에서는 먼저 데이터 과학이라는 단어가 어디서 왔는지부터 알아봅니다. 다음으로, 빅데이터 관련 개념 중 핵심이라 할 수 있는 하둡과 데이터 레이크에 대해서 살펴보고, 기업들이 운용 하는 데이터 분석 팀이 어떤 멤버들로 구성되는지 알아봅니다. 마지막으로 데이터 과학에서 널리 쓰이는 모델이라는 용어의 의미를 살펴봅니다. 1.1 데이터 과

여는 글 - 데이터 과학 미니북

2022-06-02T23:14:23Z

사물이 왜 생겨났는지 모르면, 그것이 무엇인지도 이해하기 힘듭니다. 데이터 과학의 여러 이론이나 기법들도 마찬가지입니다. 소프트웨어 개발자와 데이터 과학자로서 10년 이상 일한 경험으로, 데이터 과학 실무에서 기초 필수라고 여겨지는 것들만 모아 작은 책을 엮었습니다. 이 기초만 잘 이해해도 데이터 과학자의 말에서 핵심적인 부분은 전부 알아들을 수 있을 것