R 프로그램_회귀 분석
프로그램 시작 전에 자신의 디렉토리 확인 및 설정부터...
getwd()
setwd("C:\\myRproject")
오늘 할 것은 근무 연수에 따른 연봉 그래프 그리고 1차 함수로 FITTING. 이걸 1차 회귀분석이라고 함
두 변수를 하나로 묶기 위해서는 data.frame(x변수, y변수)
그리고 간단한 통계 지수 보려면 summary()
year=c(26,16,20,7,22,15,29)
annual_salary=c(1267,887,1022,511,1193,795,1713)
Data=data.frame(year,annual_salary)
summary(Data)
> summary(Data)
year annual_salary
Min. : 7.00 Min. : 511
1st Qu.:15.50 1st Qu.: 841
Median :20.00 Median :1022
Mean :19.29 Mean :1055
3rd Qu.:24.00 3rd Qu.:1230
Max. :29.00 Max. :1713
1차식 만들려면 ls=lm(y변수~x변수, data = ...)
그리고 plot과 abline
기울기와 y 절편 알려면 summary(ls)
plot(year,annual_salary)
abline(ls)
summary(ls)
> summary(ls)
Call:
lm(formula = annual_salary ~ year, data = Data)
Residuals:
1 2 3 4 5
-127.1104 -2.6907 -69.4586 75.2871 0.6575
6 7
-44.2487 167.5637
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 82.619 120.415 0.686 0.523151
year 50.442 5.885 8.572 0.000356 ***
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 106.5 on 5 degrees of freedom
Multiple R-squared: 0.9363,Adjusted R-squared: 0.9235
F-statistic: 73.48 on 1 and 5 DF, p-value: 0.0003561
여기서 y 절편은 82.619, 기울기는 50.442
코드 정리
getwd()
setwd("C:\\myRproject")
year=c(26,16,20,7,22,15,29)
annual_salary=c(1267,887,1022,511,1193,795,1713)
Data=data.frame(year,annual_salary)
summary(Data)
ls=lm(annual_salary~year,data=Data)
plot(year,annual_salary)
abline(ls)
summary(ls)