r statistics matrix sparse-matrix

¿Paquete de matriz dispersa más maduro para R?



statistics matrix (3)

Hay al menos dos paquetes de matriz dispersos para R. Estoy investigando estos porque estoy trabajando con conjuntos de datos que son demasiado grandes y escasos para caber en la memoria con una representación densa. Quiero rutinas básicas de álgebra lineal, además de la capacidad de escribir fácilmente código C para operarlas. ¿Qué biblioteca es la más madura y la mejor para usar?

Hasta ahora he encontrado

  • Matrix que tiene muchas dependencias inversas, lo que implica que es la más utilizada.
  • SparseM que no tiene tantos deps inversos.
  • Varias bibliotecas de gráficos probablemente tienen sus propias versiones (implícitas) de esto; eg igraph y network (este último es parte de statnet ). Estos son demasiado especializados para mis necesidades.

Alguien tiene experiencia con esto?

Después de buscar un poco en RSeek.org , el paquete Matrix parece ser el más mencionado. A menudo pienso en CRAN Task Views como bastante autorizado, y la vista de tareas multivariante menciona Matrix y SparseM.


En mi experiencia, Matrix es el paquete más compatible y más maduro de los que menciona. Su arquitectura C también debe estar bastante bien expuesta y relativamente fácil de trabajar.



log (x) en una matriz dispersa es una mala idea ya que el log (0) no está definido y la mayoría de los elementos de una matriz dispersa son cero.

Si desea obtener el registro de los elementos que no son cero, intente convertir a una representación de triplete disperso y tome un registro de esos valores.