[강의노트] KDT_day3_260108

판다스 병합과 연결, 넘파이 판다스 실습

by 아르떼

Google NotebookLM 활용

강의자료를 입력해서 요약 동영상, 슬라이드 등을 생성할 수 있다.


판다스 병합과 연결

병합(merge) : 두 개의 데이터를 특정한 기준을 가지고 하나로 통합하는 작업

병합에는 inner join, outer join, left join, right join 방식이 있다.

inner join : 양쪽 테이블에서 모두 존재하는 키 값의 행끼리 병합

outer join : 양쪽 테이블 중 하나만 존재하거나, 모두 존재하는 키 값의 행끼리 모두 병합

left join : 왼쪽 테이블을 기준으로 존재하는 키 값의 행 병합

right join : 오른쪽 테이블을 기준으로 존재하는 키 값의 행 병합


예시) subject_id를 기준으로 내부 조인을 수행

pd.merge(left=df_left, right=df_right, how="inner", on='subject_id')

# left, right 매개변수에 각 위치에 해당하는 데이터프레임 객체를 입력

# how에 조인 방법 "inner"를 문자열 타입으로 입력

# on에 병합의 기준이 되는 열 이름을 입력


연결(concatenate) : 두 테이블을 그대로 붙임

두 데이터프레임의 컬럼이 같아야만 연결이 가능하다 = 데이터의 스키마가 동일할 때 그대로 연결

주로 세로로 데이터를 연결

예시) df = pd.concat(df_list, axis=0) # axis=0으로 세로로 연결




실습 (구글 콜랩을 활용한 넘파이 판다스 실습)

https://colab.research.google.com/drive/1w0eWKIi7IirTMUH_CSUmt5tKUZ3TL6Xl?usp=sharing


작가의 이전글[강의노트] KDT_day2_260107