본문 바로가기
임상연구

95% 신뢰구간

by Eternal health 2021. 10. 9.
728x90
반응형

임상논문을 볼 때 가장 많이 마주하는 용어가 95% CI 일 텐데요.

이번 포스팅에서는 95% CI에 관해 다뤄보록 하겠습니다.

 

 

우리는 모집단으로부터 표본을 추출하고,

그 추출된 표본의 통계량 (표본 평균, 표본 표준편차)을 통해 모수(모평균, 모 표준편차)를 추정하고자 하였습니다. 

이를 점추정이라고 하는데요. 

 

 

점추정(point estimation)만으로는 이 모수가 얼마나 정밀하게 추정되었는지 아는데 한계가 있어

모평균이 존재할 구간을 확률적으로 추정하는 구간 추정(interval estimation)을 같이 하면서 그 한계를 보완할 수 있습니다.

 

대표적인 구간 추정이 신뢰구간(confidence interval, CI)입니다. 

신뢰구간이란 이 구간 내에 실제 모수가 존재할 것으로 예측되는 구간으로 정의됩니다.

90%, 95%, 99% 신뢰구간 등 다양한 정도의 구간추정이 가능합니다.

 

보통 임상연구에서는 95% 신뢰구간이 가장 많이 사용되고 있습니다.

이에 대한 의미는 예측된 구간 내에 실제 모평균이 있을 가능성이 95%라고 신뢰할 수 있는 구간 이란 뜻입니다.

표현은 (구간의 시작, 구간의 끝)으로 나타냅니다. 

ex. (95% CI 16.0, 21.1)

모평균에 대한 신뢰구간


연속형 자료의 경우 표본의 크기(표본수)가 충분히 크다면 표본 평균이 정규분포에 따른다고 가정할 수 있습니다.

정규분포라는 가정하에 표본 평균과 표본 표준편차로부터 모평균의 신뢰구간을 구할 수 있습니다.

 

표본 평균 X, 표본 표준편차 s, 표본의 크기 n

 

표본수가 클수록 신뢰구간이 좁아지겠죠? 모평균은 정밀하게 추정될 수 있습니다. 

표본수가 작다면 신뢰구간이 너무 넓어, 모평균이 실제로 어디쯤 위치할지 예측하기 어렵습니다.

 

신뢰구간은 T 검정 시 이용되는데요.

독립 표본 T 검정에서 (실험군과 대조군의 크기의 차이)의 신뢰구간을 아래의 그림처럼 표현하면 

 

 

1, 2는 95% 신뢰구간이 0을 포함하고 있지 않아 

실험군과 대조군의 모평균 차이가 실제로 0일 가능성은 5% 미만이며, 검정 결과 p <0.05와 같습니다.

 

따라서, 1은 실험군이 대조군보다 통계적으로 유의하게 점수가 높고

2는 반대로 실험군이 대조군보다 통계적으로 유의하게 점수가 낮다고 해석하시면 됩니다.

 

신뢰구간의 끝이 0에 겹쳐 있는 3과 같은 경우는

p value가 정확히 0.05가 되는 것이며

 

4, 5, 6은 모두 95% 신뢰구간이 0을 포함하고 있어 두 군이 통계적으로 유의한 차이가 없다고 할 수 있습니다. (p>0.05)

 

2와 6의 차이는 6이 n수가 너무 적어, 신뢰구간이 넓게 나와 유의성을 보이지 못한 것일 수 있습니다.

그만큼 n수가 많은 것이 중요합니다.

 

 

 

728x90
반응형

댓글