Wilcoxon Rank Sum Test(= Mann-Whitney U test)는 두 그룹의 분포 차이를 비교하는 비모수 검정입니다.
순위를 기반으로 검정 통계량을 계산한 후, 이를 이용해 p-value를 구하는 과정을 예제로 설명하겠습니다.
1️⃣ 예제 데이터
두 그룹의 데이터를 예제로 들어보자.
- 그룹 A (X1): [8,12,14]
- 그룹 B (X2): [7,10,15,18]
이제 Wilcoxon Rank Sum Test를 수행하면서 p-value를 계산해보자!
2️⃣ 모든 데이터를 하나로 묶어 순위(Rank) 계산
- 두 그룹을 합친 후 오름차순 정렬
- 작은 값부터 순위 부여 (동순위 값이 있으면 평균 순위 할당)
값 | 그룹 | 순위 (R) |
7 | B | 1 |
8 | A | 2 |
10 | B | 3 |
12 | A | 4 |
14 | A | 5 |
15 | B | 6 |
18 | B | 7 |
3️⃣ 그룹 A의 순위 합 R1 계산
Wilcoxon Rank Sum Test에서 한 그룹(A)의 순위 합을 검정 통계량으로 사용함.
R1 = ∑(그룹 A의 순위)
그룹 A의 데이터(8, 12, 14)에 대한 순위를 더하면:
R1 = 2+4+5 = 11
4️⃣ 기대값과 표준편차 계산
정규 근사를 이용하려면 기대값 μW와 표준편차 σW 를 구해야 해.
- 그룹 A의 크기 n1 = 3
- 그룹 B의 크기 n2 = 4
- 총 샘플 수 N = n1 + n2 = 3 + 4 = 7
5️⃣ Z-통계량 계산
정규 근사를 적용하면 Wilcoxon Rank Sum 검정 통계량 W 를 표준 정규 분포의 Z 값으로 변환할 수 있음.
6️⃣ p-value 계산
Z = −0.35를 표준 정규 분포에서 확인하면:
P(Z≤−0.35) ≈ 0.3632
단측 검정을 한다면 이 값이 바로 p-value고,
양측 검정이라면:
p = 2×P(Z≤−0.35) = 2 × 0.3632 = 0.7264
즉, p-value ≈ 0.726이므로, 일반적인 유의수준(0.05)에서 귀무가설을 기각할 수 없음
→ 두 그룹의 분포 차이가 통계적으로 유의하지 않다!
최종 정리: Wilcoxon Rank Sum Test에서 p-value 계산 과정
1️⃣ 모든 데이터를 정렬하고 순위를 매긴다.
2️⃣ 한 그룹(A)의 순위 합 R1R_1 을 계산한다.
3️⃣ 기대값 μW 와 표준편차 σW 를 구한다.
4️⃣ Z통계량을 계산한다.
5️⃣ Z 값을 이용해 p-value를 계산한다.
'통계' 카테고리의 다른 글
t-test : t-검정 통계량 계산 방법 (0) | 2025.02.26 |
---|---|
비모수 데이터에서 t-test를 진행하게 되면? (0) | 2025.02.26 |