studio odbcconnect dbconnect con sql r dplyr binning

sql - odbcconnect - ¿El binning de estilo cut() está disponible en dplyr?



rstudio odbcconnect (1)

Solo para que haya una respuesta inmediata para los demás que llegan aquí a través del motor de búsqueda, la forma de cut de n-breaks ahora se implementa como la función dplyr en dplyr :

> data.frame(x = c(5, 1, 3, 2, 2, 3)) %>% mutate(bin = ntile(x, 2)) x bin 1 5 2 2 1 1 3 3 2 4 2 1 5 2 1 6 3 2

¿Hay alguna manera de hacer algo como una función cut() para agrupar valores numéricos en una tabla dplyr ? Estoy trabajando en una tabla grande de postgres y actualmente puedo escribir una declaración de caso en el sql desde el principio, o generar datos no agregados y aplicar cut() . Ambos tienen desventajas bastante obvias ... las declaraciones de casos no son particularmente elegantes y no es eficiente collect() una gran cantidad de registros a través de collect() .