판다스 병합과 연결, 넘파이 판다스 실습
Google NotebookLM 활용
강의자료를 입력해서 요약 동영상, 슬라이드 등을 생성할 수 있다.
판다스 병합과 연결
병합(merge) : 두 개의 데이터를 특정한 기준을 가지고 하나로 통합하는 작업
병합에는 inner join, outer join, left join, right join 방식이 있다.
inner join : 양쪽 테이블에서 모두 존재하는 키 값의 행끼리 병합
outer join : 양쪽 테이블 중 하나만 존재하거나, 모두 존재하는 키 값의 행끼리 모두 병합
left join : 왼쪽 테이블을 기준으로 존재하는 키 값의 행 병합
right join : 오른쪽 테이블을 기준으로 존재하는 키 값의 행 병합
예시) subject_id를 기준으로 내부 조인을 수행
pd.merge(left=df_left, right=df_right, how="inner", on='subject_id')
# left, right 매개변수에 각 위치에 해당하는 데이터프레임 객체를 입력
# how에 조인 방법 "inner"를 문자열 타입으로 입력
# on에 병합의 기준이 되는 열 이름을 입력
연결(concatenate) : 두 테이블을 그대로 붙임
두 데이터프레임의 컬럼이 같아야만 연결이 가능하다 = 데이터의 스키마가 동일할 때 그대로 연결
주로 세로로 데이터를 연결
예시) df = pd.concat(df_list, axis=0) # axis=0으로 세로로 연결
실습 (구글 콜랩을 활용한 넘파이 판다스 실습)
https://colab.research.google.com/drive/1w0eWKIi7IirTMUH_CSUmt5tKUZ3TL6Xl?usp=sharing