R을 배우자: 비슷한 친구끼리 묶기(데이터 프레임)

컴알못의 고군분투기 3

by 노랑연두

얼마전 석사학위 논문을 위해서 설문조사를 돌렸다. 총 문항은 60개지만, 크게는 4개로, 작게는 15개로 분류를 할 수 있기 때문에 관련있는 데이터끼리 묶는 것은 중요하다.


예를 들어 설문을 통해 레고의 구매의향(PI)을 알아본다고 해보자.


만약 간단히 조사한다면, "당신은 레고를 구매할 의향 있습니까?"라고 물어보면 될 것이다. 하지만, 학계에서는 충분한 신뢰도를 확보하기 위해서는 한 개념에 대해 최소 3개의 질문을 하여 답변을 받으라고 말한다. 따라서 아래와 같이 거의 비슷해보이지만 조금 다른 3가지 질문을 준비했다.


PI 1:나는 레고에서 구매할 의향이 있다.

PI 2:나는 레고 제품에 대해 더 많은 정보를 알고 싶다.

PI 3:나는 레고 브랜드에 관심이 있다.


그런 후 3개의 질문에 대한 답변이 얼마나 일관성(내적 일치도:internal consistency reliability)이 있는지를 확인해서 데이터의 신뢰도를 구한다.


자 앞서 나의 설문 문항수는 모두 60개라고 했다. 하지만, 이중에서 구매의향에 관한 질문은 3개. 이 세 문항에 대한 답변만 가지고 신뢰도 계산을 하려면, 이 세 문항에 대한 답변만 따로 모아서 주어야한다.


이 때 사용하는 함수가 바로 "data.frame"이다.

원하는 이름<- data.frame(결과파일명$해당열이름,....)

만약 구매의향(PI)이라는 이름으로 데이터 프레임을 만들어서, 파일SurvayData에 PI1,PI2, PI3 결과값을 묶고 싶다면 아래와 같이 입력하면 된다.


PI<- data.frame(SurveyData$PI1,SurveyData$PI2,SurveyData$PI3)


이렇게 만든 PI는 평균, 분산 뿐 아니라 상관관계나, 내적일치도 확인을 위한 크롬바흐 알파계수등을 계산 할 수 있게 된다.



더 자세한 내용이 궁금하다면 아래 링크를 참고하세요.

https://moa-study.tistory.com/76


keyword
매거진의 이전글R을 배우자:데이터 유형이란?