R활용
Surval analysis
#
Find similar titles
- (rev. 8)
- green
Structured data
- Category
- Statistics
Table of Contents
Survival analysis #
1. 생존분석? #
생존분석은 통계학의 한 분야로써 어떠한 현상이 발생하기까지 걸리는 시간에 대한 분석이다. (Ex)환자의 사망에 이르는 시간을 분석)
2. 절단된 자료란? #
연구에 사용된 환자의 생존기간을 20년 동안 연구한다고 한다면, 계속 환자의 생존을 확인했는데 5년까지 생존이 확인된 환자가 보고 없이 연락이 안 된다면 환자의 정확한 생존기간을 알 수 없지만 생존기간이 5년 이상이라는 것을 알 수 있다. 또한 20년이 지나 아직도 살아 있는 경우라면 정확한 생존기간을 알 수 없지만 20년 이상이라는 것을 알 수 있다. 이런 경우 생존기간이 절단되었다고 하는데 생존분석은 이러한 절단된 자료를 버리지 않고 최대한 이용해야 한다.
3. 생존함수 S(t)와 위험함수 h(t) #
- 생존함수 : S(t) = Pr(T>t)
T: 사망에 이르는 시점, t: 시간변수 , Pr: 확률함수
생존함수는 특정한 시간 t 보다 오래 생존할 확률을 의미한다. - 위험함수: t시점에서 살아 있지만 아주 짧은 시간 안에 죽을 위험의 정도를 나타낸다.
4. Kaplan-Meier curve #
Kaplan-Meier 생존분석은 사망이 발생한 시점마다 구간생존율을 구하여 이들의 누적으로 누적생존율을 추정하는 방식이다. 생명표법은 표본의 크기가 50이 넘어야 적용이 가능하기 때문에 작은 표본에서도 사용할 수 있는 Kaplan-Meier 생존분석이 훨씬 폭 넓게 사용된다.
5. Cox regression #
Log-hazard를 회귀분석처럼 선형모형화 하여 위험함수 h(t)를 추정한다.
6. 분석 예제 #
파일 이름:BREST
status는 생존시간이 절단되어 있는지 여부
(status=1 : 연구기간 이내에 사망 , status =0: 추적이 안되거나 아직 살아 있는경우)
time | status | x |
---|---|---|
11 | 1 | Treated |
9 | 1 | Treated |
13 | 0 | Treated |
. | . | . |
. | . | . |
143 | 0 | Treated |
6 | 1 | nontreated |
6 | 1 | nontreated |
7 | 1 | nontreated |
. | . | . |
. | . | . |
43 | 1 | nontreated |
attach(BREST)
1) Kaplan-Meir curve
> Out=survfit(Surv(time, status==1) ~1, data=BREST)
> Plot(Out) #95% 신뢰구간을 점선으로 포함
> Plot(Out, conf.int=FALSE) # 신뢰구간 점선 제거
-------------------------------------------------
치료 받은 환자 (Treated) , 치료 받지 않은 환자 (nontreated)의 생존곡선
> Out.x=survfit(Surv(time, status==1) ~ x, dat=BREST)
> Plot(out.x, lty=1:2, col=c(“red”, “blue”))
2) Cox regression
> Coxph(Surv(time,status==1)~x, data=BREST)
7. 참고문헌 #
- R을 이용한 누구나 하는 통계분석. 안재형 지음 | 한나래 | 2016년 03월 25일 출간 (1쇄 2011년 01월 15일)
- https://dic1224.blog.me/220279770076