728x90
반응형

통계학 3

[통계학 with R, Python] t-검정 (t-test)

t-test란? t-test는 두 집단의 평균을 비교하는 검정 방법입니다. 예를 들면, A나라의 사람들의 평균 수명과 B나라의 평균 수명을 비교하는 데에 t-test를 사용할 수 있습니다. 이때 가설은 다음과 같습니다 귀무가설 (null hypothesis): 두 나라의 평균 수명은 차이가 없다. (H₀: µ₁=µ₂) 대립가설 (althernate hypothesis): 두 나라의 평균 수명은 차이가 있다. (H1: µ₁≠µ₂) t-test는 이렇게 두 집단을 비교할 때 사용할 수 있으며 두 집단 이상은 분산분석(ANOVA)을 사용합니다. 또, t-test는 표본이 독립성 (independent), 정규성 (Normally distributed), 등분 산성 (homoscedasticity)을 만족시킨다..

[통계] 확률변수, 확률분포

확률 Probability 확률이란 어떤 일이 일어날 가능성의 측도입니다. 확률은 A 사건(event)이 일어나는 경우의 수와 나올 수 있는 모든 경우의 비율이라고 할 수 있습니다. 통계적 실험을 했을 때 나올 수 있는 모든 경우의 수를 표본 공간 sample space라고 부릅니다. 어떤 사건 A의 확률 = (A 사건이 일어나는 경우의 수) / (나올 수 있는 모든 경우 [표본 공간]) 예를 들어, 동전을 던졌을 때 얼굴이 나오는 확률은 나올 수 있는 경우 숫자면, 얼굴면 2가지 경우에서 하나이기 때문에 1/2 = 0.5 = 50%의 확률입니다. 확률 변수 Random Variable 결과를 예측할 수 없는 무작위 (random) 실험에서 나타날 수 있는 결과를 수치로 표현한 값입니다. 주로 대문자 알..

[통계] 척도 (Scale)의 4가지 종류: 명목 척도, 서열 척도, 구간 척도, 비율 척도

척도(scale)는 데이터(자료)가 정의되고 분류되는 방식을 나타냅니다. 이 글에서는 4가지의 척도의 종류(명목, 서열, 구간, 비율 척도)를 설명해보겠습니다.질적 자료 vs 양적 자료자료는 크게 질적과 양적 자료로 구분할 수 있습니다.질적 자료 (quantitative): 숫자로 표현할 수 없는 정보로 그룹으로 묶기 때문에 범주형 자료라고도 합니다. (예: 색깔, 성별, 취미, 국가), 연산이 불가능양적 자료 (qualitative): 숫자로 표현할 수 있는 정보 (예: 키, 몸무게, 시험 성적), 연산 조작이 가능, 평균, 편차 등 계산이 가능하다 질적 자료는 다시 명목 척도, 순위 척도로, 양적 자료는 구간 척도, 비율 척도로 구분됩니다. 명목 척도 (nominal scale)nominal 뜻 그대..

728x90
반응형