이론 및 T검정
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Statistics
Table of Contents
이론및 T검정 #
통계검정의 순서도 #
<<통계검정의 순서도>>
T-검정이란? #
T- 검정은 모집단의 분산이나 표준편차를 알지 못할 때, 표본으로부터 추정된 분산이나 표준편차를 이용하여 두 모집단의 평균의 차이를 알아보는 검정 방법이다. 집단의 수는 최대 2개까지 비교 가능하며 3개 이상인 경우 분산분석(ANOVA)를 사용한다.
T-검정의 가정 #
1)종속변수가 양적 변수일 때
2)모집단의 분산이나 표준편차를 알지 못할 때
3)모집단의 분포가 정규분포일 때
T-검정의 유형 #
1. 단일표본 T-검정(One sample T-test) #
표본이 하나일 때, 모집단의 평균과 표본집단의 평균 사이에 차이가 있는지를 검증하는 방법이다. (집단의 수가 1개)
2. 두 표본 T-검정(Two sample T-test) #
두 집단의 표본을 종속적, 독립적 관계로 추출하여 비교함으로써 유사성을 검정하는 방법으로 두 집단의 차이를 알아보기 위해 사용되는 분석방법이다. (집단의 수가 2개) 독립적인 두 집단의 평균의 차이가 0인지를 검정한다.
1)분석 순서 #
1)두 집단의 분산이 같은지 검정한다 (var.test())
2)분산이 다르면 Welch의 t-test를 적용한다 (t.test())
3)분산이 같으면 pooled variance를 이용한 t-test를 적용한다 (var.equal=TRUE)
2)가정 #
1)독립성: 독립변수의 그룹 군은 서로 독립적 이여야 한다.
2)정규성: 독립변수에 따른 종속변수는 정규분포를 만족해야한다.
3)등분산성: 독립변수에 따른 종속변수 분포의 분산은 각 군마다 동일하다.
3. 대응표본 T-검정(Paired T-test) #
실험 이전의 집단과 실험 이후의 집단이 동일한 집단인 경우 사용하는 검정으로 한 사람이 처리 이전과 이후 각 1번씩 측정을 해서 사전/사후를 비교하는 것을 말한다. 모집단이 1개인 경우이다. 쌍을 이룬 두 변수 간에 차이의 평균이 0인지를 검정한다.
대응표본과 독립표본의 차이 #
독립표본 T 검정 | 대응표본 T 검정 |
---|---|
조사대상 개체가 다름 | 조사대상 개체가 같음 |
두 범주의 표본숫자가 다를 수 있음 | 표본 숫자가 같음 |
다른 집단을 비교 | 전후 개념이 있는 경우가 많음 |
T검정의 예제 #
1. 단일표본 T-검정 #
예제) 2006년 조사에 의하면 한국인의 1인 1일 평균 알코올 섭취량이 8.1g 이다. 200년 알코올 섭취량이 달라졌는지를 조사한 자료이다.
* 2006년도 평균 알코올 섭취량: 8.1g
* 2008년도 알코올 섭취량(random)
15.50 11.21 12.67 8.87 12.15 9.88 2.06 14.50 0 4.97
x = c(15.50, 11.21, 12.67, 8.87, 12.15, 9.88, 2.06, 14.50, 0, 4.97)
mean(x)
sd(x)
t.test(x, mu=8.1)
2. 두 표본 T-검정 #
예제) 데이터 Data.csv는 다른 두 조건(control, test)에서 배양된 뼈세포의 수(resp)를 측정한 자료이다.
Treatment | resp |
---|---|
test | 148 |
test | 190 |
test | 68 |
test | 79 |
control | 40 |
control | 80 |
control | 64 |
tcontrol | 52 |
Data = read.csv(“Data.csv”)
Var.test(log(resp) ~ treatment,data=Data)
* 분산이 다른경우:
t.test(log(resp) ~ treatment, data=Data)
* 분산이 같은경우:
t.test(log(resp) ~ treatment, data=Data, var.equal=TRUE)
3. 대응표본 T-검정 #
예제) 데이터 anorexia.csv는 7명을 대상으로 거식증 치료제 FT 복용 전후의 체중 변화를 측정하여 FT가 체중 감소에 영향이 있는지를 조사한 실험이다. 여기서 복용전과 복용후 차이가 0 인지가 관심의 대상이다.
복용 전 | 복용 후 | 복용 후 – 복용 전 |
---|---|---|
83.8 | 95.2 | 11.4 |
83.3 | 94.3 | 11 |
86 | 91.5 | 5.5 |
82.5 | 91.9 | 9.4 |
86.7 | 100.3 | 13.6 |
86.6 | 91.7 | 5.1 |
87.3 | 98 | 10.7 |
Data = read.csv(“anorexia.csv”)
t.test(Data$3) # 복용 후 – 복용 전
참고 #
- R을 이용한 누구나 하는 통계분석. 안재형 지음 | 한나래 | 2016년 03월 25일 출간 (1쇄 2011년 01월 15일)