multiple - ¿Cuáles son algunos casos de uso para usar Elasticsearch versus consultas sql estándar?

match_phrase elasticsearch example (2)

Hay dos casos de uso principales de Elasticsearch:

Búsqueda de texto

Desea Elasticsearch cuando realiza muchas búsquedas de texto, donde las bases de datos RDBMS tradicionales no funcionan realmente bien (configuración deficiente, actúa como un recuadro negro, rendimiento deficiente). Elasticsearch es altamente personalizable, ampliable a través de complementos. Puede construir una búsqueda robusta sin mucho conocimiento bastante rápido.

Registro y análisis

Otro caso extremo es que mucha gente usa Elasticsearch para almacenar registros de varias fuentes (para centralizarlos), de modo que puedan analizarlos y darle sentido. En este caso, Kibana se vuelve útil. Le permite conectarse al clúster Elasticsearch y crear visualizaciones de inmediato. Por ejemplo, Loggly está construido con Elasticsearch y Kibana.

~~Tenga en cuenta que no desea utilizar Elasticsearch como su almacenamiento de datos principal.~~ ~~Razones aquí: qué tan confiable es ElasticSearch como un almacén de datos primario contra factores como la pérdida de escritura, la disponibilidad de datos~~

Actualizar

Sentí que la segunda parte ya no es nerviosa, en realidad es lo que Elastic como compañía ha estado haciendo realmente bien el año pasado. Con el movimiento actual de DevOps, las canalizaciones de CI / CD y la creciente cantidad de métricas de varias fuentes, ELK se convirtió en una opción de facto para el monitoreo de infraestructura, ya no es solo un motor de búsqueda de texto RESTful distribuido. Tiene un increíble conjunto de productos:

Logstash (toneladas de entradas de datos)
Latidos
- Filebeat
- Latido métrico
- Latido del paquete
- Winlogbeat
Kibana
- Grafico
- Timelion
X-Pack (premium)
- Alertas
- Informes
- Seguridad
- Aprendizaje automático
- Métricas cruzadas del centro de datos

Un ecosistema, creado por la comunidad, está creciendo alrededor de la pila ELK que expande las características actuales, algunas de ellas vale la pena mencionar:

ElastAlert
Guardia de búsqueda

Recién estoy comenzando con Elasticsearch y uno de los principales casos de uso que he visto es su escalabilidad con búsquedas en grandes conjuntos de datos, pero además de esto, ¿cuándo querría usarlo solo para crear consultas SQL con un RDBMS tradicional?

Para agregar con la otra respuesta, el registro sigue siendo un caso de uso importante, así como las búsquedas, pero ahora las métricas y los análisis son cada vez más importantes.

Creo que esta publicación resume los cambios en el mercado que están generando nuevos casos de uso para Big Data. Todo lo que realmente necesita saber sobre las bases de datos de código abierto

Con la llegada de la Web 2.0, las páginas web estáticas se han vuelto dinámicas y las redes sociales nos rodean. Todos están tuiteando, publicando, blogueando, vlogueando, compartiendo fotos, chateando y comentando. El Internet de las cosas (IoT) está emergiendo: una red de dispositivos conectados que crece y recolecta rápidamente e intercambia datos, como sensores y dispositivos inteligentes. Hay algunos buenos ejemplos aquí.

En total, esto genera enormes cantidades de datos nuevos que las empresas desean absorber y utilizar para mantenerse a la vanguardia, para proporcionar características tales como recomendaciones de productos y una mejor experiencia del cliente. Los datos pueden analizarse en busca de patrones para aplicaciones tales como detección de fraude y análisis de comportamiento. Gran parte de los datos nuevos no están estructurados, lo que significa que no pueden almacenarse de forma ordenada en una base de datos tabular.

Imagínese tratando de diseñar una base de datos para almacenar datos sobre sus compras de comestibles: lo que le gusta, con qué frecuencia lo compra, si prefiere leche o crema con su café. Se necesitan nuevos tipos de bases de datos para almacenar los nuevos datos, y deben ser no relacionales e idealmente de bajo costo. ¿Suena alguna campana? No es relacional como en NoSQL y de bajo costo como en código abierto.

Uno de los arquitectos de Elasticsearch con los que hablé dijo que el 80% de los datos con los que trabaja Elasticsearch en las empresas no está estructurado, mientras que el 20% está estructurado. Son los datos no estructurados que las empresas están buscando para descubrir patrones de datos raros o inusuales. También están utilizando Elasticsearch para monitorear patrones de datos. Por ejemplo, un minorista importante está haciendo un seguimiento en tiempo real con Elasticsearch para garantizar suministros de dinero adecuados en las tiendas para que las personas puedan cobrar cheques los días de pago.

En mi propia experiencia con nuestro caso de uso de búsqueda, no solo utilizamos búsquedas difusas, sino que evolucionó a búsquedas automáticas y rápidas. Por lo que he visto, una vez que comienza a trabajar con Elasticsearch, comienza a evolucionar hacia otros casos de uso que complementan lo que ya tiene implementado. Ahora que hemos establecido a Elasticsearch como un motor de búsqueda difuso en nuestra empresa, ahora tenemos otros equipos que buscan análisis y métricas para el registro.

Aquí hay algunos recursos adicionales que profundizan en este tema: