독립성검정(카이스퀘어 테스트) 엑셀과 R실습
1. 독립성검정
독립성검정은 표를 교차해서 그리는 것으로 교차상관표 즉 cross tabulation이라고 한다. 독립성검정, 교차상관표, 카이스퀘어테스트 모두 같은 표현이다. 독립성검정은 시장세분화를 하기 위해 쏠림이 있는지 분석하기 위한 방법이며 마케팅 조사기관에서 소비자 설문조사시 가장 많이 사용하는 방법이다. 쏠림이 있는지 나온 결과를 통해 마케팅 전략에 적용하고 쏠림이 있는 경우 상관이 있다는 것이며 쏠림이 없는 경우 독립이라고 한다. 쏠림이 없는 경우 골고루 퍼져있다고 할 수 있다.
- 쏠림이 있다 - 상관 dependent
- 쏠림이 없고 골고루 퍼져있다-독립 independent
2. 기대도수
기대도수는 전체가 골고루 퍼져있다고 가정했을 때 값으로 기대도수를 나타내는 식은 다음과 같다. i행 j열 표가 있을 때 i행의 가로합과 j열의 세로합을 곱한 후 전체 샘플 수로 나누면 기대도수 값이 나온다.
3. 카이스퀘어 값
엑셀에서 카이스퀘어 값을 얻기 위해 식이 필요한데 해당 식은 아래와 같다.
4. 실습
엑셀 실습
엑셀에서 카이스퀘어 test p-value를 알려주는 함수 이용
1) CHITEST(actual_range, expected_range)
(실제 frequency, 골고루 퍼졌다고 가정했을 때 값 )
통계적이고 적절한 자유도에 대한 카이 제곱 분포값을 의미함.
2) 0.1, 0.05, 0.01 작은지 비교
작을 때 -쏠림이 있다는 것을 의미
3) 어디에 쏠림이 있는지 찾기
f-e 양의값을 갖는 것에 집중한 마케팅 전략 펼쳐야 함을 보임.
4) chi-square statistics값 구하기
카이스퀘어 테스트 식 이용.
데이터 개수에 따라 분포가 달라짐.
R실습
tourist=read.csv("C:/data/tourist.csv")
tourist
table=xtabs(~국적+관광지,data=tourist)
xtables 만들어-개수를 세는 표,(축 국적과 관광지를 따로따로)
:데이터셋 tourist에 있는 변수 국적과 관광지로 교차상관표를 만들어 수를 계산하고 table에 저장하라.
table :table보여라
chisq.test(table)
:교차상관표 table를 카이스퀘어테스트해라
p값을 통해 국적별 쏠림이 있는지 확인
'통계 및 데이터분석' 카테고리의 다른 글
[통계적 연구방법]ANOVA 세 집단 이상의 평균 비교 : 엑셀과 R실습 (0) | 2023.06.27 |
---|---|
[통계적 연구방법론] 가설검정, T-test 두 집단의 평균 비교 (0) | 2023.06.27 |
[통계적 연구방법] 회귀분석(2) : 다중공선성, 더미변수, 엑셀과 R실습 (0) | 2023.06.26 |
[통계적 연구방법] 회귀분석(1) : 회귀분석, 최소제곱법 (0) | 2023.06.26 |
[통계적 연구방법] 컨조인트 분석: 엑셀과 R실습 (0) | 2023.06.26 |