Skip to content

R활용 Surval analysis #

Find similar titles

7회 업데이트 됨.

Edit
  • 최초 작성자
    notitle
  • 최근 업데이트
    green

Structured data

Category
Statistics

Survival analysis #

1. 생존분석? #

생존분석은 통계학의 한 분야로써 어떠한 현상이 발생하기까지 걸리는 시간에 대한 분석이다. (Ex)환자의 사망에 이르는 시간을 분석)

2. 절단된 자료란? #

연구에 사용된 환자의 생존기간을 20년 동안 연구한다고 한다면, 계속 환자의 생존을 확인했는데 5년까지 생존이 확인된 환자가 보고 없이 연락이 안 된다면 환자의 정확한 생존기간을 알 수 없지만 생존기간이 5년 이상이라는 것을 알 수 있다. 또한 20년이 지나 아직도 살아 있는 경우라면 정확한 생존기간을 알 수 없지만 20년 이상이라는 것을 알 수 있다. 이런 경우 생존기간이 절단되었다고 하는데 생존분석은 이러한 절단된 자료를 버리지 않고 최대한 이용해야 한다.

3. 생존함수 S(t)와 위험함수 h(t) #

  • 생존함수 : S(t) = Pr(T>t)
    T: 사망에 이르는 시점, t: 시간변수 , Pr: 확률함수
    생존함수는 특정한 시간 t 보다 오래 생존할 확률을 의미한다.
  • 위험함수: t시점에서 살아 있지만 아주 짧은 시간 안에 죽을 위험의 정도를 나타낸다.

4. Kaplan-Meier curve #

Kaplan-Meier 생존분석은 사망이 발생한 시점마다 구간생존율을 구하여 이들의 누적으로 누적생존율을 추정하는 방식이다. 생명표법은 표본의 크기가 50이 넘어야 적용이 가능하기 때문에 작은 표본에서도 사용할 수 있는 Kaplan-Meier 생존분석이 훨씬 폭 넓게 사용된다.

5. Cox regression #

Log-hazard를 회귀분석처럼 선형모형화 하여 위험함수 h(t)를 추정한다.

6. 분석 예제 #

파일 이름:BREST
status는 생존시간이 절단되어 있는지 여부
(status=1 : 연구기간 이내에 사망 , status =0: 추적이 안되거나 아직 살아 있는경우)

time status x
11 1 Treated
9 1 Treated
13 0 Treated
. . .
. . .
143 0 Treated
6 1 nontreated
6 1 nontreated
7 1 nontreated
. . .
. . .
43 1 nontreated
attach(BREST)
1)  Kaplan-Meir curve
> Out=survfit(Surv(time, status==1) ~1, data=BREST)
> Plot(Out) #95% 신뢰구간을 점선으로 포함
> Plot(Out, conf.int=FALSE) # 신뢰구간 점선 제거
-------------------------------------------------
치료 받은 환자 (Treated) , 치료 받지 않은 환자 (nontreated)의 생존곡선
> Out.x=survfit(Surv(time, status==1) ~ x, dat=BREST)
> Plot(out.x, lty=1:2, col=c(“red”, “blue”))

Image

2)  Cox regression 
> Coxph(Surv(time,status==1)~x, data=BREST)

7. 참고문헌 #

  1. R을 이용한 누구나 하는 통계분석. 안재형 지음 | 한나래 | 2016년 03월 25일 출간 (1쇄 2011년 01월 15일)
  2. https://dic1224.blog.me/220279770076
0.0.1_20240318_1_v95