Wilcoxon Rank Sum Test에서 p-value 계산 과정 (예제 포함)

통계

Wilcoxon Rank Sum Test에서 p-value 계산 과정 (예제 포함)

쉼터장 2025. 2. 26. 20:05

Wilcoxon Rank Sum Test(= Mann-Whitney U test)는 두 그룹의 분포 차이를 비교하는 비모수 검정입니다.
순위를 기반으로 검정 통계량을 계산한 후, 이를 이용해 p-value를 구하는 과정을 예제로 설명하겠습니다.

1️⃣ 예제 데이터

두 그룹의 데이터를 예제로 들어보자.

그룹 A (X1): [8,12,14]
그룹 B (X2): [7,10,15,18]

이제 Wilcoxon Rank Sum Test를 수행하면서 p-value를 계산해보자!

2️⃣ 모든 데이터를 하나로 묶어 순위(Rank) 계산

두 그룹을 합친 후 오름차순 정렬
작은 값부터 순위 부여 (동순위 값이 있으면 평균 순위 할당)

값	그룹	순위 (R)
7	B	1
8	A	2
10	B	3
12	A	4
14	A	5
15	B	6
18	B	7

3️⃣ 그룹 A의 순위 합 R1 계산

Wilcoxon Rank Sum Test에서 한 그룹(A)의 순위 합을 검정 통계량으로 사용함.

R1 = ∑(그룹 A의 순위)

그룹 A의 데이터(8, 12, 14)에 대한 순위를 더하면:

R1 = 2+4+5 = 11

4️⃣ 기대값과 표준편차 계산

정규 근사를 이용하려면 기대값 μW와 표준편차 σW 를 구해야 해.

그룹 A의 크기 n1 = 3
그룹 B의 크기 n2 = 4
총 샘플 수 N = n1 + n2 = 3 + 4 = 7

5️⃣ Z-통계량 계산

정규 근사를 적용하면 Wilcoxon Rank Sum 검정 통계량 W 를 표준 정규 분포의 Z 값으로 변환할 수 있음.

6️⃣ p-value 계산

Z = −0.35를 표준 정규 분포에서 확인하면:

P(Z≤−0.35) ≈ 0.3632

단측 검정을 한다면 이 값이 바로 p-value고,

양측 검정이라면:

p = 2×P(Z≤−0.35) = 2 × 0.3632 = 0.7264

즉, p-value ≈ 0.726이므로, 일반적인 유의수준(0.05)에서 귀무가설을 기각할 수 없음

→ 두 그룹의 분포 차이가 통계적으로 유의하지 않다!

최종 정리: Wilcoxon Rank Sum Test에서 p-value 계산 과정

1️⃣ 모든 데이터를 정렬하고 순위를 매긴다.
2️⃣ 한 그룹(A)의 순위 합 R1R_1 을 계산한다.
3️⃣ 기대값 μW 와 표준편차 σW 를 구한다.
4️⃣ Z통계량을 계산한다.
5️⃣ Z 값을 이용해 p-value를 계산한다.

저작자표시 비영리 변경금지 (새창열림)

'통계' 카테고리의 다른 글

t-test : t-검정 통계량 계산 방법 (0)	2025.02.26
비모수 데이터에서 t-test를 진행하게 되면? (0)	2025.02.26

현재글Wilcoxon Rank Sum Test에서 p-value 계산 과정 (예제 포함)

생물정보쉼터

stringsAsFactors, 비모수 검정, RNA시퀀싱, RNA-seq, paste0, 번역 #ollama #ai #llm, Model이란, 데이터프레임, tsv, data.frame(), 경사하강법, 외부데이터, 생물정보학, RNAseq, 선형회귀, row.names, 그레디언트, LinearRegression, DEG, r,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

생물정보쉼터