cassandra - sola - Max. tamaño de filas anchas?
cuanto mide una celda de excel (2)
En Cassandra, el número máximo de celdas (filas x columnas) en una sola partición es de 2 mil millones .
Además, el valor de una sola columna no puede ser mayor que 2 GB, pero en la práctica, "un solo dígito de MB" es un límite más razonable, ya que no hay transmisión o acceso aleatorio de los valores de blob.
Las particiones mayores a 100Mb pueden causar una presión significativa en el montón.
Teóricamente, Cassandra permite hasta 2 mil millones de columnas en una fila amplia.
He oído que en realidad hasta 50,000 cols / 50 MB están bien; 50,000-100,000 cols / 100 MB están bien, pero requieren un poco de ajuste; y que nunca se deben superar las 100.000 / 100 MB de columnas por fila. La razón es que esto presionará al montón.
¿Hay algo de verdad en esto?
Una de nuestras tablas con cassandra 1.2 pasó las 100 MB de columnas por límite de fila debido a los nuevos patrones de escritura que experimentamos. Hemos experimentado una presión significativa en ambas compactaciones y nuestras memorias caché. Por cierto, tuvimos filas con varios cientos de MB.
Un enfoque es simplemente rediseñar y migrar la tabla a una tabla (s) mejor diseñada que mantendrá sus filas amplias por debajo de ese límite. Si eso no es una opción, entonces sugiero que sintonices tu cassandra para que tanto las compactaciones como las configuraciones de caches puedan manejar tus amplias filas de manera efectiva.
Algunos enlaces interesantes a cosas para sintonizar: