ggplot - Agrupe los datos unidimensionales de manera óptima?
r plot scale (3)
Creo que este es el documento que estás buscando:
¿Alguien tiene un documento que explica cómo funciona el algoritmo Ckmeans.1d.dp ?
O bien, ¿cuál es la forma más óptima de agrupar k-means en una dimensión?
El agrupamiento de k-medias univariante se puede resolver en tiempo O (kn) (en entrada ya ordenada) en base a resultados teóricos en matrices Monge, pero el enfoque no fue popular probablemente debido a la inestabilidad numérica y también a desafíos de codificación.
Una mejor opción es un método O (knlgn) que ahora se implementa en Ckmeans.1d.dp versión 3.4.6. Esta implementación es tan rápida como la heurística k-means pero ofrece optimalidad garantizada, órdenes de magnitud mejores que heuristic k-means especialmente para k grandes.
La solución de programación dinámica genérica de Richard Bellman (1973) no toca detalles específicos del problema k-means y el tiempo de ejecución implícito es O (kn ^ 3).
Es una técnica muy antigua de Bellman: una nota sobre el análisis de clusters y la programación dinámica http://www.sciencedirect.com/science/article/pii/0025556473900072
www.informationgeometry.org