데이터프레임 만들고 복사하고 변수명 바꾸기
df_raw <- data.frame(var1 = c(4, 5, 3),
var2 = c(7, 8, 9))
> df_raw
var1 var2
1 4 7
2 5 8
3 3 9
데이터를 수정하기에 앞서 백업본을 만들어 놓아야 한다. 어떻게?
데이터프레임의 복사본을 만들면 된다.
df_new <- df_raw
df_raw라고 만들어놓은 데이터프레임을 df_new로 똑같이 넣어줬다.
df_raw는 그대로 두고 df_new로 작업하면 혹여 실수를 하더라도 원상복구가 가능하다.
df_new <- rename(df_new, v2 = var2).
df_new 안에 있는 변수이름을 var2에서 v2로 바꿨다.
순서가 중요하다. rename(데이터이름, 새이름=옛이름). 새이름이 먼저 나온다.
데이터를 바꿨다면 항상 새롭게 assign 해줘야 한다.
assign을 안하면 이름이 바뀐 변수가 화면에 출력만 될 뿐, 데이터의 원본은 그대로 유지된다.
문제를 풀기에 앞서, mpg데이터를 불러와서 새로운 변수명에 지정한 뒤 데이터를 살펴보자. 또 소스창에
?mpg를 입력해 mpg데이터를 구성하는 변수명의 의미를 파악한 뒤 스스로 이해하기 쉬운 단어로 바꿔보자.
Q1. ggplot2 패키지의 mpg 데이터를 사용할 수 있도록 새로운 변수명에 지정한 뒤 복사본을 만들어라.
Q2. ?mpg를 입력해 mpg데이터를 구성하는 변수명의 의미를 파악한 뒤 스스로 이해하기 쉬운 단어로 수정해보라.
Q3. 데이터 일부를 출력해 변수명이 바뀌었는지 확인해보라.
A1.
mpg_raw <- as.data.frame(ggplot::mpg)
mpg_new <- mpg_raw
A2.
?mpg
mpg_new <- rename(mpg_new, city = cty, highway = hwy)
A3.
head(mpg_new)
str(mpg)
View(mpg)
dim(mpg), ... 등 다양한 함수를 활용할 수 있다.
1. 데이터프레임 만들기
df_raw <- data.frame(var1 = c(1, 2, 1),
var2 = c(2, 3, 2))
2. 백업본 만들기
df_new <- df_raw
3. 변수명 바꾸기
df_new <- rename(df_new, v2 = var2)