tutorial features example solr lucene

features - solr vs elasticsearch 2018



Colección Solr vs Cores (6)

Única instancia

En una sola instancia, Solr tiene algo llamado SolrCore que es esencialmente un único índice. Si quiere múltiples índices, crea múltiples SolrCores.

Solr Cloud

Con SolrCloud, un solo índice puede abarcar varias instancias de Solr. Esto significa que un solo índice puede estar compuesto de múltiples SolrCore en diferentes máquinas. Llamamos a todos estos SolrCores que componen un índice lógico una colección.

Una colección es esencialmente un único índice que abarca muchos SolrCore, tanto para la escala del índice como para la redundancia. Si quisiera mover su configuración de 2 SolrCore Solr a SolrCloud, tendría 2 colecciones, cada una compuesta de múltiples SolrCores individuales.

Me cuesta entender la diferencia entre colecciones y núcleos . Si lo entiendo correctamente, los núcleos son índices múltiples. La colección se compone de núcleos, por lo que esencialmente comparten la misma lógica en la separación, es decir, los núcleos separados y las colecciones tienen puntos finales separados.

Tengo el siguiente escenario. Creo un backend para servicio en la nube para varias tiendas en línea. Cada tienda tiene un conjunto de productos a los que los clientes pueden agregar revisiones. Quiero indexar los datos estáticos (información del producto) por separado de la información dinámica (revisiones) para poder mejorar el rendimiento.

¿Cómo puedo separarme mejor en Solr?


Las otras respuestas definen el significado de núcleos y colecciones. Mi respuesta explica el uso de núcleos y colecciones.

Única instancia

Cuando se trata de una sola instancia de solr, consulta los cores .

La interfaz de usuario de administración de una sola instancia de Solr no tiene selector de colecciones:

Solr Cloud

Cuando se trata de Solr Cloud consultas a collections . Las colecciones están organizadas en diferentes núcleos (réplicas, fragmentos) en diferentes instancias de solr.

La interfaz de usuario de administración de una instancia de Solr Cloud tiene una colección y un selector de núcleos. Pero los núcleos son instancias técnicas, aquí:


Núcleo

En Solr, un core se compone de un conjunto de archivos de configuración, archivos de índice Lucene y registro de transacciones de Solr.

un núcleo Solr es un índice con nombre único, administrado y configurado que se ejecuta en un servidor Solr; un servidor Solr puede alojar uno o más núcleos. Un núcleo se usa generalmente para separar documentos que tienen diferentes esquemas

colección

Solr también utiliza el término collection , que solo tiene significado en el contexto de un clúster de Solr en el que se distribuye un único índice en varios servidores.

SolrCloud presenta el concepto de una collection , que amplía el concepto de un índice con nombre único, administrado y configurado a uno que se divide en fragmentos y se distribuye en varios servidores.


Según mi entendimiento:

En búsqueda distribuida ,

La recopilación es un índice lógico distribuido en varios servidores. Core es la parte del servidor que ejecuta una colección.

En la búsqueda no distribuida ,

El único servidor que ejecuta Solr puede tener múltiples colecciones y cada una de esas colecciones también es un núcleo. Por lo tanto, la recopilación y el núcleo son los mismos si la búsqueda no se distribuye.

Resumen

  1. La colección por servidor se llama núcleo.
  2. La colección es lo mismo que un índice.
  3. Un servidor Solr puede tener muchos núcleos.
  4. La recopilación es un índice lógico (Ejemplo de uso para varias colecciones: supongamos que dos equipos en el mismo grupo no son lo suficientemente grandes como para justificar un servidor Solr completo). Pero tampoco quieren mezclar sus datos en un solo índice. crear colecciones / índices separados que mantendrán sus datos separados).
  5. Es mejor usar una nube de Solr separada en lugar de crear colecciones si los datos de una colección son lo suficientemente grandes (no estoy seguro, ¿por favor, comentarios?)

De Solr Wiki :

Las colecciones están compuestas por uno o más fragmentos. Los fragmentos tienen una o más réplicas. Cada réplica es un núcleo. Una sola colección representa un único índice lógico.


De la Documentación de SolrCloud

Colección: un único índice de búsqueda.

Shard: una sección lógica de una sola colección (también llamada Slice). A veces las personas hablarán sobre "Shard" en un sentido físico (una manifestación de un fragmento lógico)

Réplica: una manifestación física de un fragmento lógico, implementado como un único índice Lucene en un SolrCore

Líder: Una Réplica de cada Fragmento será designada como Líder para coordinar la indexación para ese Fragmento

SolrCore: encapsula un solo índice físico. Uno o más componen fragmentos lógicos (o sectores) que componen una colección.

Nodo: una sola instancia de Solr. Una sola instancia de Solr puede tener múltiples SolrCores que pueden formar parte de cualquier cantidad de colecciones.

Clúster: todos los nodos que está utilizando para alojar SolrCores.

Entonces, básicamente, una colección (grupo lógico) tiene múltiples núcleos (índices físicos).

Además, verifique la discusión