본문 바로가기
비모수 통게

비모수 통계 기초 : 부호와 순위

by 방구석 데이터사이언티스트 2022. 3. 28.
728x90
반응형

비모수 통계학에서의 검정통계량은 부호, 순위, 부호순위 등으로 구성되기 때문에, 비모수적 방법을 통한 추론을 위해서는 부호와 순위에 대한 개념을 잘 알아야합니다. 

1. 부호

- 관측값이 기준값보다 크면 1, 아니면 0으로 부여된 값 

예제

위 문제는 연속형이면서 x가 특정값에 대칭되는 임의의 분포를 가진다고 정의됩니다.( F -> F분포 X )

그리고 10개의 표본을 뽑아 가설검정을 진행하려고 합니다. 

 

여기 가설검정을 위해 저희는 표본에 부호를 부여합니다. 이때 부호는 관측값과 기준값을 비교하여 정합니다. 

여기서 관측값을 각 표본의 값이며, 기준값은 0입니다. 기준값이 0인 이유는 간단합니다. 귀무가설 H0를 "특정값 = 0"이라고 세웠기 때문입니다.

 

맨 처음, 비모수 통계에서 검정통계량은 부호로 구성된다고 말했습니다. 위 자료를 보면, 검정통계량 B는 부호의 합입니다. 즉 10개의 표본들 중에서 양의 부포를 갖는 표본의 개수입니다. 

 

저희는 가설을 설정했고 검정통계량도 구했습니다. 마지막으로 할 일은 기각역을 설정하는 것입니다. 기각역은 B의 분포를 보고 결정합니다. B는 베르누이 시행에 의해 생성된 검정통계량입니다. 즉 B의 분포는 N=10, p=0.5인 이항분포입니다. 결론적으로 이항분포를 참고하여 기각역을 설정하고 가설검정을 진행하면 됩니다. 

 

2. 순위

- 관측값을 크기 순으로 나열했을 때의 순서

- 평균순위 : 같은 값을 갖는 관측 값들에 부여하는, 이들이 서로 다른 값일 때 가지게 되는 순위들의 평균값

부호검정말고도 비모수통계론에서는 순위를 이용한 검정방법도 있습니다.

위 문제는 순위를 통한 가설검정의 예시입니다.

 

X1, X2 , X3 그리고 Y1, Y2가 각각 위와 같은 분포를 따른다고 가정합니다. 그리고 저희는 두 집단의 분포가 같은지를 검정하고자합니다. 그렇다면 y의 분포에서 △=0이 귀무가설이 됩니다.

 

가설을 설정한 후에는 검정통계량을 구합니다. 검정통계량은 Y의 순위 합으로 결정됩니다. 여기서 Y의 순위합을 사용한하는 이유는 X의 순위합을 구하는 것보다 Y의 순위합을 구하는 것이 더 간편하며, 추후 기각역 설정의 용이함도 있습니다. 

 

 

순위 합을 통해 검정통계량을 구했다면 기각역만 알면 저희는 귀무가설의 기각여부를 판단할 수 있습니다.

기각역을 설정하기 전에 면저 W의 분포(귀무가설하의 분포)를 알아야합니다. 이는 앞서 본 Y1과 Y2이 전체 (X1,X2,X3,Y1,Y2)에서 어느 순위합이 될지 확률로 나타냅니다.

 

예를 들어 위 표1-3에서 3이 0.1이 되는 이유는 전체 경우의 수는 5개에서 2개를 뽑는 경우의 수이므로 5C2(5 Combinetion 2), 10개입니다. 그리고 3이 될 경우의 수는 1과2가 뽑히는 경우밖에 없으므로 1/10입니다. 이어서 6의 경우를 보면 (1과5), (2와4) 두 가지이므로 2/10입니다. 이렇게 W의 분포를 구하여 기각역을 설정하면 최종적으로 가설검정을 할 수 있습니다.   

 

728x90
반응형

댓글