통계

Wilcoxon Rank Sum Test에서 p-value 계산 과정 (예제 포함)

쉼터장 2025. 2. 26. 20:05

Wilcoxon Rank Sum Test(= Mann-Whitney U test)는 두 그룹의 분포 차이를 비교하는 비모수 검정입니다. 
순위를 기반으로 검정 통계량을 계산한 후, 이를 이용해 p-value를 구하는 과정을 예제로 설명하겠습니다. 

 

1️⃣ 예제 데이터

두 그룹의 데이터를 예제로 들어보자.

  • 그룹 A (X1): [8,12,14]
  • 그룹 B (X2): [7,10,15,18]

이제 Wilcoxon Rank Sum Test를 수행하면서 p-value를 계산해보자!

 

2️⃣ 모든 데이터를 하나로 묶어 순위(Rank) 계산

  1. 두 그룹을 합친 후 오름차순 정렬
  2. 작은 값부터 순위 부여 (동순위 값이 있으면 평균 순위 할당)
그룹 순위 (R)
7 B 1
8 A 2
10 B 3
12 A 4
14 A 5
15 B 6
18 B 7

 

 

3️⃣ 그룹 A의 순위 합 R1 계산

Wilcoxon Rank Sum Test에서 한 그룹(A)의 순위 합을 검정 통계량으로 사용함.

 

R1 = ∑(그룹 A의 순위)

 

그룹 A의 데이터(8, 12, 14)에 대한 순위를 더하면:

 

R1 = 2+4+5 = 11

 

4️⃣ 기대값과 표준편차 계산

정규 근사를 이용하려면 기대값 μW와 표준편차 σW 를 구해야 해.

  • 그룹 A의 크기 n1 = 3
  • 그룹 B의 크기 n2 = 4
  • 총 샘플 수 N = n1 + n2 = 3 + 4 = 7

 

5️⃣ Z-통계량 계산

정규 근사를 적용하면 Wilcoxon Rank Sum 검정 통계량 W 를 표준 정규 분포의 Z 값으로 변환할 수 있음.

 

6️⃣ p-value 계산

Z = −0.35를 표준 정규 분포에서 확인하면:

P(Z≤−0.35) ≈ 0.3632

단측 검정을 한다면 이 값이 바로 p-value고,

 

양측 검정이라면:

p = 2×P(Z≤−0.35) = 2 × 0.3632 = 0.7264

 

즉, p-value ≈ 0.726이므로, 일반적인 유의수준(0.05)에서 귀무가설을 기각할 수 없음

두 그룹의 분포 차이가 통계적으로 유의하지 않다!

 

최종 정리: Wilcoxon Rank Sum Test에서 p-value 계산 과정

1️⃣ 모든 데이터를 정렬하고 순위를 매긴다.
2️⃣ 한 그룹(A)의 순위 합 R1R_1 을 계산한다.
3️⃣ 기대값 μW 와 표준편차 σW 를 구한다.
4️⃣ Z통계량을 계산한다.
5️⃣ Z 값을 이용해 p-value를 계산한다.

'통계' 카테고리의 다른 글

t-test : t-검정 통계량 계산 방법  (0) 2025.02.26
비모수 데이터에서 t-test를 진행하게 되면?  (0) 2025.02.26