논문작성법

2. 자료수집과 기술통계

by 연금술사 Apr 02. 2025

(논문 통계표 읽기 전 준비사항)
-통계용어: 기술통계(카이스퀘어 x2), R2변화량(델타 알 스 ◇R2), 상관관계(피어슨 r알, 켄달 t타우, 스피어만 p로우), B 비표준화계수, 베타 표준화계수
-로직(Logic, 논리구조):가설검증 위한 기법 사용순서
이슈=> 선행연구=> 연구문제=> 연구목적=> 연구설계

-척도: 명목 - 서열 - 등간 - 비율

-모형설계 (변수)~문항-응답 => 모수추정 ML 정규식

● 논문통계기법 대분류 4가지

1. 인과관계(50%) 모형기법

~가~에 미치는 영향 연구, ~ 에 대한 영향 요인 연구, ~와 ~및~의 구조적 관계에 대한 연구

2. 차이모형(30%) 기법: ~~ 효과성 연구(실험연구).

변수 1개에 집단 2개 이상(T-test: 독립표본 T, 대응표본 T, 실험연구-실험집단: 대조집단) T값-평균, 3개 이상(ANOVA, 변량분석, 분산분석:one way, 일원배치) F값-분산. (F값이 클수록 집단 간 차이 있음)

예) 성별, 경험유무, 여부(○×), 직업

3. 분류(15%) 모형기법:분류(군집), 개발(요인), 의사결정

4. 기타(5%) 모형기법:의사결정나무, 인공신경망, 로지스틱처리

● Data코딩하기(SPSS 직접 or Exel 사용)

-spss:변수보기칸 변수입력, 데이터보기칸 숫자 입력

-엑셀:데이터 첫 행에서 변수이름 읽어오기(체크하기)

*역코팅(반대나 부정 질문항): 변환->같은 변수로 코딩변경-기존 값 및 새로운 값 체크 후(1->7, 2->6,.. )

● 분석흐름(설문 엑셀(. xlsx) 클린작업, spss, sem)

- 설문클린(결측치, 정규성, 이상치):

1. 엑셀 stdev.p (엑셀 문항 전체행 선택)

2. 삼각형 눌러 전체범위- <데이터-정렬:
기준(열 Y- 오름/내림차순)- 0.4 이하와 2.5 이상 제거

- SPSS(. sav):

인구통계분석(빈도분석)

1. 데이터 클린작업, 파일유형을 엑셀로 열고 (분석-기술통계량-기술통계)

- SEM:

1. 측정모형개발(CFA): 집중타당도, CR/AVE, 판별타당도

2. 구조모형분석: 가설검증
-측정도구의 타당성(요인분석)과 신뢰성(신뢰도) 검증 통한 미확보된 설문문항 제거

*측정도구 인용(신뢰성, 타당성확보)해서 설문지 완성
척도: 질적(변화지 않음, 성별 직업)/양적(변함, 인식)
=> 선행연구 추론의 의한 연구가설을 바탕으로 한 분석기법인 (질/양적) 척도에 따라 개발된 설문지를 인용하여 신뢰성과 타당성 확보를 바탕으로 통계분석
•선행연구> 연구가설> 분석기법> 측정도구> 설문지
==> 분석과정이 타당, 논리적이어야
가설검증 결과를 신뢰할 수 있기 때문임

*분석과정 흐름

1. 데이터 클리닝

2. 연구대상(빈도, 교차분석) > 데이터 기술통계분석

3. 측정도구의 타당성(요인분석)과 신뢰성(크롬알파 신뢰도) 분석

4. 변수의 상태(상관 및 다중공선성 분석)

5. 가설검정

■ 빈도분석:표본이 모집단 설명하는데 대표성 있나.
(분석-기술통계-빈도분석:통계량, 차트, 붓스트랩 체크)
=> 결과저장:우측빈칸 내보내기- 파일이름(찾아보기)
- 독립적인 분석방법으로, 표본에 대한 성격을 설명하는 인구통계적 특성을 확인할 때 수행하는 분석

*분석은 평균이 시작점이다.

■ 평균을 검증하는 방법(t-test, 분산분석)
=> 표본의 평균차이 비교 또는 평균이 맞는지 검증함
독립변수(명목, 서열척도) 종속변수(등간, 비율척도) 임

- t검증: 표본 최대 2개(집단이 1개일 때- 일표본 t검증, 대응표본 t검증/집단이 2개일 때 독립표본 t검증)

*일표본 t검증(분석-평균비교-일표본 t검증:용량, 값)
=>1개 표본에 대해 1회 측정 후 검증하고 분석하는 방법 ex) 용기 용량 300ml

*대응표본 t검증(분석-평균비교-대응표본 t검증)
=>1개 표본을 2회(사전/사후) 측정하여 두 측정치의 차이여부를 판단하는 분석방법 ex) 약의 체중감량효과

*독립표본 t검증(분석-평균비교-독립표본 t검증:시간)
=> 집단 2개일 때, 집단 간 평균비교 후 분산(F검증) 비교
ex) A사와 B사의 배터리 사용시간 비교
(검증변수: 사용시간, 집단정의: 집단 1, 집단 2 혹은 변수보기 클릭 제조사 값- 1=> A사, 2=> B사)
결과(F, t, p값)는 유의확률>0.05이면, H1 등분산 아닐 수 있음이 기각되고, H0 '등분산을 가정함' 채택.

- 분산분석: 3개 이상 표본에 대한 (평균) 차이를 분석 (종속변수 1개 단일변량분산=> One way독립 1개 일원분산, 독립 2개 이원분석, 독립 3개 다원분석), (종속변수 2개 이상 다변량분산=> MANOVA분석)
- 검증: 집단이 1개(카이제곱검증), 집단 2개(F검증)

*일원배치 분산분석: 분석-평균비교-일원배치 분산 (종속변수- 만족도, 요인- 편의점)(사후검증-schefe)
(옵션- 기술통계, 분산의 동질성 검정)
:집단수 3개 이상이고, 독립변수 1개일 때 집단 간 종속변수의 평균차이를 비교 분석 방법
ex) 국내 편의점의 소비자 만족도 조사

*이원배치 분산분석:분석- 일반선형모형- 일변량
(종속변수- 매출액, 고정요인- 위치와 흡연석유무, 모형(위치, 흡연석)- 항 설정- 주효과(항 설정- 상호작용, 위치 및 흡연 선택 후 EM평균), 옵션-기술통계)/(사후분석- schefe 체크 후 확인)
: 집단수 3개 이상이고, 독립변수 2개일 때 집단 간 종속변수의 평균차이를 비교분석 방법
ex) 서울 3개 상권위치와 흡연석 유무가 매출액 영향

*다변량 분산분석(MANOVA):

분석-일반선형모형- 다변량(종속변수- 매출액, 재방문, 고정요인-위치와 흡연석, 상호작용-EM평균, 옵션-기술통계, 사후분석- schefe 선택 후 확인)
: 집단수 3개 이상이고, 종속변수 2개일 때 집단 간 평균차이를 비교분석 방법
ex) 3 상권위치와 흡연석유무가 매출액과 재방문 영향

keyword