척도(scale)는 데이터(자료)가 정의되고 분류되는 방식을 나타냅니다.
이 글에서는 4가지의 척도의 종류(명목, 서열, 구간, 비율 척도)를 설명해보겠습니다.
질적 자료 vs 양적 자료
자료는 크게 질적과 양적 자료로 구분할 수 있습니다.
- 질적 자료 (quantitative): 숫자로 표현할 수 없는 정보로 그룹으로 묶기 때문에 범주형 자료라고도 합니다. (예: 색깔, 성별, 취미, 국가), 연산이 불가능
- 양적 자료 (qualitative): 숫자로 표현할 수 있는 정보 (예: 키, 몸무게, 시험 성적), 연산 조작이 가능, 평균, 편차 등 계산이 가능하다
질적 자료는 다시 명목 척도, 순위 척도로, 양적 자료는 구간 척도, 비율 척도로 구분됩니다.
명목 척도 (nominal scale)
nominal 뜻 그대로 '이름'만 나타내는 척도를 말합니다. 숫자로 표현을 할 수 도 있지만 숫자는 분류의 기능만 할 뿐 양적인 의미는 없고 특정 카테고리만 표현합니다.
e.g. 색깔 (빨 0, 주 1, 노 2, 초3), 성별 (남 0, 여 1), 취미 (운동 0, 독서 1, 미술 2)
서열 척도 (ordinal scale)
순위(서열)가 있는 척도로 수량화할 수 있는 자
료입니다. 숫자는 서열을 나타내지만 '어느 정도' 크고 작다는 표현할 수 없습니다.
e.g. 달리기 순위 (1등, 2등, 3등), 학년 (1학년, 2학년), 만족도 (낮음 0, 보통 1, 높음 2)
구간 (등간) 척도 (interval scale)
연속적인 수로 수량화할 수 있으며 절대적인 원점이 존재하지 않는다. 위와 다르게 어느 정도 크고 작다를 표현할 수 있습니다. 숫자 간의 간격이 동일합니다.
'0'이라는 값이 값이 없다고 할 수 없습니다.
e.g. 온도
절대적인 원점이 없기 때문에 온도 0도는 온다가 없다고는 할 수 없다.
비율 척도 (ratio scale)
연속적인 수로 수량화할 수 있으며 절대적인 원점이 존재한다.
이것은 ‘0’ 값이 의미 있는 값을 나타내며, 이 값은 해당 수량의 완전한 부재를 나타낸다.
e.g. 몸무게, 인구수, 길이
절대 영점이 존재하기 때문에 몸무게 0kg은 몸무게가 없다고 할 수 있다는 것
'ᐧ༚̮ᐧ Data Science | AI > 통계, 수학' 카테고리의 다른 글
[통계] p값 이해하기 (1) | 2024.11.14 |
---|---|
[딥러닝 / 수학] 코사인 유사도 cosine similarity 이해하기 (0) | 2024.06.21 |
[통계학 with R, Python] t-검정 (t-test) (0) | 2021.09.12 |
[통계] 결합확률분포 Joint Distributed Random Variables (0) | 2021.06.15 |
[통계] 확률변수, 확률분포 (1) | 2021.06.12 |