r sas logistic-regression survival-analysis cox-regression

Análisis de supervivencia para Telecom Churn usando R



sas logistic-regression (2)

Aquí hay un código para comenzar:

Primero, lea los datos

nm <- read.csv("http://www.sgi.com/tech/mlc/db/churn.names", skip=4, colClasses=c("character", "NULL"), header=FALSE, sep=":")[[1]] dat <- read.csv("http://www.sgi.com/tech/mlc/db/churn.data", header=FALSE, col.names=c(nm, "Churn"))

Utilice Surv() para configurar un objeto de supervivencia para modelar

library(survival) s <- with(dat, Surv(account.length, as.numeric(Churn)))

Ajustar un modelo de riesgos proporcionales Cox y trazar el resultado

model <- coxph(s ~ total.day.charge + number.customer.service.calls, data=dat[, -4]) summary(model) plot(survfit(model))

Agrega un estrato:

model <- coxph(s ~ total.day.charge + strata(number.customer.service.calls <= 3), data=dat[, -4]) summary(model) plot(survfit(model), col=c("blue", "red"))

Estoy trabajando en el problema de Telecom Churn y aquí está mi conjunto de datos.

http://www.sgi.com/tech/mlc/db/churn.data

Nombres - http://www.sgi.com/tech/mlc/db/churn.names

Soy nuevo en el análisis de supervivencia. Di los datos de entrenamiento, mi idea de construir un modelo de supervivencia para estimar el tiempo de supervivencia junto con la predicción de datos de prueba de abandono / no abandono basados ​​en factores independientes. ¿Alguien podría ayudarme con el código o los indicadores? sobre cómo resolver este problema

Para ser precisos, digamos que mis datos de tren tienen

detalles de uso de llamadas de los clientes, detalles del plan, tenencia de su cuenta, etc. y si se movió o no.

Utilizando modelos de clasificación general, puedo predecir el abandono o no de los datos de prueba. Ahora, usando el análisis de supervivencia, quiero predecir la duración de la supervivencia en los datos de prueba.

Gracias, Maddy


Si todavía está interesado (o para el beneficio de los que vendrán después), he escrito algunas guías específicamente para llevar a cabo análisis de supervivencia sobre los datos de abandono de clientes usando R. Cubren un conjunto de diferentes técnicas analíticas, todas con datos de muestra y Código R

Análisis básico de supervivencia: http://daynebatten.com/2015/02/customer-churn-survival-analysis/

Regresión básica de Cox: http://daynebatten.com/2015/02/customer-churn-cox-regression/

Covariables dependientes del tiempo en la regresión de Cox: http://daynebatten.com/2015/12/survival-analysis-customer-churn-time-varying-covariates/

Coeficientes dependientes del tiempo en la regresión de Cox: http://daynebatten.com/2016/01/customer-churn-time-dependent-coefficients/

Tiempo de supervivencia medio restringido (cuantificar el impacto de la rotación en términos de dólares): http://daynebatten.com/2015/03/customer-churn-restricted-mean-survival-time/

Pseudo-observaciones (cuantificar la ganancia / pérdida de dólares asociada con los efectos de abandono de las variables): http://daynebatten.com/2015/03/customer-churn-pseudo-observations/

Por favor, perdona las imágenes tontas.