생물정보학/Statistics

[SPSS] ANOVA후 사후분석(Post-hoc Analysis)

케이든 2014. 1. 20. 19:16

 

다중비교(multiple comparison) 에 대하여

 

분산분석을 통하여 인자간에 유의한 차이가 있다고 인정되면 개의 처리 중에서 두 개씩의 처리 조합을 생각하여 처리 조합별 효과 차이의 유무를 검토하는 것이 분석에 도움을 준다. 이 때 사용하는 검정방법을 다중비교(multiple comrapison)라고 한다. 즉, 수준이  개 있는 일원분산분석의 경우, 귀무가설

 

H0 = U1 = U2 = U3 = ... = Ua  [각 집단의 평균은 동일하다.]

               

에 대한 검정은 분산분석표에서 F-검정을 이용하여 귀무가설에 대한 검정을 하게 된다. 여기에서 귀무가설이 기각되는 경우 어느 그룹들간에 모평균의 차이가 있는지를 구체적으로 알아보고자 할 때, 평균들간의 비교를 수행하는 일련의 통계분석절차를 다중비교라 한다. 실제로 다중비교는 F-검정에 대한 귀무가설의 기각여부에 관계없이 수행가능하며, F-검정 결과 귀무가설이 기각되지 않는 자료에 대해서 다중비교를 하더라도 모평균간에 차이가 있을 수 있다.

 

  SPSS에서는 그룹별 등분산이 가정되는 경우와 등분산이 가정되지 않는 경우의 다양한 다중비교 방법을 제공하고 있다. 출력결과는 주어진 유의수준에서 두 처리간에 유의한 차가 있는가를 검정해 주며, 또한 동질적인 그룹들끼리 묶어준다. 일반적으로 많이 이용되는 검정방법의 특징을 간략히 소개하면 다음과 같다. 실제로 다중비교를 할 때는 어느 한 절차에만 전적으로 의존할 것이 아니라, 최소한 세 종류 이상의 다중비교를 동시에 시행해보고 공통적인 결론을 도출하는 것이 좋다고 할 수 있다.

 

  ∙ Fisher의 최소유의차 LSD(least significant difference)
  이 방법은 반복수가 다른 경우에도 사용 가능하며, 귀무가설이 기각되는 경우에 사용한다.

 

   장점 : 쉽게 적용, 각 집단의 표본의 크기가 다른 경우에도 적용 가능 
   단점 : 동시 검정에 적용하는 것은 무리

 

 ∙ Newman-Keuls 방법

  반복수가 같은 경우에 사용하며, 이 방법은 귀무가설에 대한 검정과 관계없이 이용 가능 하다.
        
   ∙Tukey의 정직유의차(honestly significance difference, HSD)

    원래 반복수가 동일하다는 가정하에서 고안된 방법이다. Fisher의 최소유의차 LSD,
    Newman-Keuls 방법보다 더욱 엄격하므로 유의한 차이로 판단되는 경우가 적다.
    즉, 검정력이 떨어진다. 따라서 이 방법에서는 유의수준 를 0.1 이상의 큰 값으로  사용할 것이 바람직하다.

     여기서 검정력이란 어떤 차이가 존재할 때 이를 탐지하는 확률, 즉, 귀무가설이 거짓일 때

     귀무가설을 기각하는 확률을 말한다.

 

    장점 : 딥단간 차이를 가장 정밀하게 감지
    단점 : 각 집단의 표본의 수가 같을 경우에만 의미가 있는 결과 제공

 

   ∙Tukey의 스튜던트화 범위검정(studentized range test)

     Tukey의 HSD 방법의 신중성을 극복하기 위하여 제안된 방법으로, Tukey의 HSD
     방법과 Newman-Keuls 통계량을 평균하여 검정의 기준으로 이용하는 방법이다.
 
   ∙ Scheffe 방법

      반복수가 다른 경우에도 사용할 수 있으므로 Tukey 방법보다 더 일반적이며, 융통성
      이 있다. 따라서 이러한 일반성의 댓가로 검정력이 감소하므로 유의수준 를 0.1 의
      값으로 사용하는 것이 바람직하다. 
      

      모든 가능한 집합에 대하여 동시에 적용 할 수 있는 신뢰구간 제공
      이점 : 각 cell의 크기가 다르더라도 사용 가능
      단점 : 필요이상으로 넓은 신뢰 구간을 제시     


   ∙ Duncan 방법

      등분산성과 반복수가 동일하다는 가정하에서 고안된 방법이다. 다른 방법에 비해 차
      이를 검출하는 확률이 높아서 자주 이용되고 있으나 제 1 종 오류(실제로는 차이가
      없으나 차이가 있다고 판단할 오류)가 높을 가능성이 있으므로 그리 좋은 방법은 못
      된다.

 

  ∙ Bonferroni 방법

     이점 – 각 cell의 크기가 다르더라도 사용 가능
     단점 – 필요이상으로 넓은 신뢰 구간을 제시

 

  ∙ SNK(Student–Newman–Keuls) & Duncan
    표본의 평균을 크기 순서에 따라 다수의 범위를 이용하여 신뢰구간을 구하여 모집단 평균간의 차이에 대한 검정만을     

    할 수 있는 절차
    다중범위 검정 (Multiple Range Tests)
    동질성 집단의 유무를 가리는 것에 목적을 둔 경우


 

'생물정보학 > Statistics' 카테고리의 다른 글

Correspondence Analysis (대응 분석)  (0) 2016.08.30
통계학 용어집(영한)  (0) 2014.02.26