triplestore graph-databases

triplestore - Bases de datos de gráficos vs. tiendas triples



graph-databases (2)

Con Virtuoso tienes lo siguiente trabajando para ti:

- SPARQL, SQL, SPASQL (SPARQL dentro de SQL), y SQL dentro del soporte SPARQL (por ejemplo, para tratar las relaciones N-arias a través de predicados / propiedades magic / function).

- funciona como un motor compacto (p. ej., como se explota a través de KDE Desktop) o DBMS masivo como se demuestra a través de los 17 mil millones de triples en vivo + LOD Cloud Cache o la instancia en vivo más pequeña de DBpedia.

- incluye indización de texto completo y patrones de texto en SPARQL (a través de bif: contiene) también incluye XPath / Xquery (a través de xcontains)

- Modo Ácido o No Ácido ditto Schema-Last cuando se trata con Property Graph Store

- A través de Transformation Middleware, puede extraer datos de más de 80 fuentes de datos (incluye API REST, servicios SOAP, Hypermedia Resource, ODBC o fuentes de datos relacionales accesibles desde JDBC, etc.) y transformarse en gráficos de datos vinculados transitorios o persistentes.

- La publicación de datos vinculados es automática, es decir, después de la creación del registro DBMS, usted tiene páginas de datos vinculados incorporadas que se visualizan en el DBMS. Sin perder el tiempo re. Reglas de reescritura de URL, redirecciones 303 o algo así. ¡Las Super Keys de la escala InterWeb simplemente funcionan!

Eso es todo por ahora :-)

¿Cuál es actualmente la mejor opción para persistir en estructuras gráficas? ¿Bases de datos de gráficos (por ejemplo, Neo4j ) o tiendas triples RDF (por ejemplo, Virtuoso )?

Por ejemplo, tenemos el siguiente caso de uso:

  • el gráfico débilmente conectado (similar al de los trabajos académicos en una colección) con casi 10M nodos;
  • actualizaciones bastante raras;
  • operaciones críticas: recuperación de sub-gráficos en particular, actualización de nodos en un sub-gráfico dado, recálculo de medidas de análisis de enlace (por ejemplo, HITS o PageRank) después de actualizar algunos nodos.

También se desea proporcionar la API estándar para consultar los datos de aplicaciones de terceros (a la Facebook o Twitter).


Para las bases de datos de escala horizontal (por lo tanto, de bases de datos pequeñas y medianas), las bases de datos como neo4j darán actualmente un mejor rendimiento para los recorridos de gráficos. Triplestores están alcanzando sin embargo. La gran ventaja de una Tienda Triple en comparación con una base de datos gráfica es que los volcados de datos y el lenguaje de consulta están estandarizados, lo que significa que es mucho más fácil pasar a otro producto y evitar el bloqueo de proveedores.