brunch

You can make anything
by writing

C.S.Lewis

by 이지섭 Jan 26. 2021

R 기초 - 데이터프레임 조물딱조물딱

데이터프레임 만들고 복사하고 변수명 바꾸기 

데이터프레임을 만들고 백업본을 생성해보자.  

df_raw <- data.frame(var1 = c(4, 5, 3), 

                                       var2 = c(7, 8, 9))

> df_raw

  var1 var2

1    4    7

2    5    8

3    3    9


데이터를 수정하기에 앞서 백업본을 만들어 놓아야 한다. 어떻게? 

데이터프레임의 복사본을 만들면 된다. 


df_new <- df_raw 

df_raw라고 만들어놓은 데이터프레임을 df_new로 똑같이 넣어줬다. 

df_raw는 그대로 두고 df_new로 작업하면 혹여 실수를 하더라도 원상복구가 가능하다.



데이터의 변수이름을 바꿔보자. 

df_new <- rename(df_new, v2 = var2). 

df_new 안에 있는 변수이름을 var2에서 v2로 바꿨다. 

순서가 중요하다. rename(데이터이름, 새이름=옛이름). 새이름이 먼저 나온다.  

데이터를 바꿨다면 항상 새롭게 assign 해줘야 한다. 

assign을 안하면 이름이 바뀐 변수가 화면에 출력만 될 뿐, 데이터의 원본은 그대로 유지된다.



문제를 풀어보자. 

문제를 풀기에 앞서, mpg데이터를 불러와서 새로운 변수명에 지정한 뒤 데이터를 살펴보자. 또 소스창에 

?mpg를 입력해 mpg데이터를 구성하는 변수명의 의미를 파악한 뒤 스스로 이해하기 쉬운 단어로 바꿔보자. 


Q1. ggplot2 패키지의 mpg 데이터를 사용할 수 있도록 새로운 변수명에 지정한 뒤 복사본을 만들어라. 



Q2. ?mpg를 입력해 mpg데이터를 구성하는 변수명의 의미를 파악한 뒤 스스로 이해하기 쉬운 단어로 수정해보라. 



Q3. 데이터 일부를 출력해 변수명이 바뀌었는지 확인해보라.  




A1. 

mpg_raw <- as.data.frame(ggplot::mpg)

mpg_new <- mpg_raw



A2. 

?mpg

mpg_new <- rename(mpg_new, city = cty, highway = hwy)



A3.

head(mpg_new) 

str(mpg)

View(mpg)

dim(mpg), ... 등 다양한 함수를 활용할 수 있다. 





간단정리


1. 데이터프레임 만들기 

df_raw <- data.frame(var1 = c(1, 2, 1), 

                                       var2 = c(2, 3, 2))


2. 백업본 만들기

df_new <- df_raw


3. 변수명 바꾸기 

df_new <- rename(df_new, v2 = var2)


매거진의 이전글 R 기초 -데이터의 특성을 파악하자
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari