본문 바로가기
임상연구

범주형과 연속형 자료

by Eternal health 2021. 8. 2.
728x90
반응형

data가 넘쳐나는 시대에 살고 있는데요. 이러한 data를 어떻게 분석하느냐에 따라 좋은 insight를 얻게 됩니다. 

 

 

이번 포스팅에서는 이렇게 분석하기 전 알아야 할 기초적인 내용을 다뤄보도록 하겠습니다.

 

자료를 어떻게 분류하느냐는 통계에서 중요합니다. 

범주형 자료인지 연속형 자료인지는 통계 분석의 tool을 결정할 때 중요한 기준이 되기 때문이죠.

 

독립변수가 범주형이고 종속변수가 연속형 자료일 때는 어떤 통계 분석을 씁니다.처럼 정해져 있습니다.

 

그렇다면, 독립변수는 무엇이고 종속 변수는 무엇인지도 알아야 하겠죠?

 

독립변수와 종속변수


독립변수는 쉽게 말해 원인이고

종속변수는 결과라고 보시면 됩니다.

 

한 연구자가 돈과 행복의 관계를 알아보고자 할때

돈이 많을수록 행복하다 라는 가설을 세우고 연구를 시작하였다고 합시다.

 

여기에서 독립변수는 돈이 되겠고, 종속변수는 행복이 됩니다. 

 

한 변수가 다른 변수의 원인이 되는 변수를 독립변수(independent variable), 설명변수(explanatory variable), 예측 변수(predictor variable), 위험인자(risk factor) 등으로 부르게 됩니다.

결과에 해당하는 변수는 종속변수(dependent variable), 반응 변수(response variable), 결과변수(outcome variable), 표적 변수(target variable) 등으로 부르게 됩니다.

 

범주형 자료와 연속형 자료


대부분의 통계 서적은 자료를 분류하는 것으로 시작하는데요.

자료의 성격에 따라 적용할 수 있는 통계 tool이 거의 정해져 있기 때문입니다.

 

따라서, 내가 가지고 있는 data가 범주형인지 연속형인지만 알아도 통계 분석의 반은 한 것이라고 보면 됩니다.

 

범주형 자료는 범주를 서로 구분하는 이름에 해당하는 자료입니다.

예를 들면, 성별(남/여), 직종(서비스직/전문직/기술직) 등 단순히 분류되는 자료들입니다.

 

연속형 자료연속적인 수로 수량화가 가능한 자료입니다. 

예를 들면, 온도, 키, 체중, 나이, 등이 있겠죠?

 


범주형 자료

 

범주형 자료는 자료들이 서열성이 있는지에 따라 명목 척도와 순위 척도로 나뉘게 됩니다. 

명목척도 범주 각 자료를 구분하는 이름과 같음
ex. 성별, 혈액형, 직종, 지역 등 
순위척도 범주, 순위 서열은 있으나, 간격이 같지 않아, 수량화 불가. 즉 평균을 낼 수 없음
ex. 환자의 만족도(불만족/중간/만족)
질병의 중증도(경증/중등도/중증)

 

순위 척도는 연속형 자료 아닌가요?


순위 척도는 얼핏 보면 범주형보다는 연속형으로 보입니다.

순위 척도가 연속형인지 범주형인지 모르겠을 때는 평균을 한번 내보세요.

 

예를 들어, 학년(1-6학년), 연령 (10대/20대/30대 등) 또한 순위 척도에 해당하는 것인데요.

3학년 10명과 5학년 10명을 합쳐서 평균 4학년이라고 할 수 없기 때문에, 학년은 범주형 자료에 해당하게 되는 것입니다.

 

또 다른 예시를 들어 볼까요?

20대가 30명, 40대가 30명이라고 해서 평균 30대이라고 할 수 없겠죠?

 

순위 척도는 위아래의 순서는 존재할 뿐입니다.

 

연속형 자료의 대표적인 예는 키인데요.

10명의 키가 180cm이고 10명의 키가 170cm일 때

평균은 175cm가 되겠죠? 

 

자료의 성격은 변할 수 있습니다.


나이는 연속형 자료입니다. 

하지만, 10대, 20대, 30대 등으로 구분하게 되면, 순위 척도가 되고, 

미성년과 성년으로 구분하면 명목 척도가 되는데요.

 

이처럼 변수의 성격은 고정되어있지 않고, 필요에 따라 변형 가능합니다.

 

 

이번 포스팅에서는 통계에 들어가기 전 아주 기본적인 내용 중 하나인 자료 분류에 대해 알아보았습니다.

다음 포스팅은 가설을 어떻게 검정하는지에 대해 알아보겠습니다.

 

2021.08.05 - [임상연구] - 가설을 검정하는 방법

 

가설을 검정하는 방법

지난 포스팅에서 자료의 분류에 대해 다뤘었는데요. 돈과 행복 간의 관계라는 가설을 세울 때 독립변수, 종속변수도 같이 설명드렸습니다. 좀 더 알아보고 싶으신 분들은 아래 링크 참고하시면

multi.tistory.com

 

ref. 닥터 배의 술술 보건의학통계 

728x90
반응형

댓글