que - ¿Hay alguna aplicación asesina para Ontology/semantics/OWL/RDF todavía?

owl ontology (7)

Me interesé en las tecnologías semánticas después de leer muchos libros, blogs y artículos en la red que decían que haría que los datos fueran entendibles por máquina, permitiría a los agentes inteligentes hacer un gran razonamiento, una composición de servicio automática y dinámica, etc.

Todavía estoy leyendo lo mismo desde hace 2 años. El número de artículos / blogs / conferencias semánticas ha aumentado considerablemente. Pero aún no puedo ver ninguna aplicación asesina. ¿Por que es esto entonces? ¿O existe alguna aplicación / producto (comercial / de código abierto) ya existente, que en realidad está haciendo todo lo que se jacta de?

Para decirlo de forma más precisa, ¿hay algún producto que aproveche las tecnologías semánticas (especialmente RDF / OWL / SPARQL) y entregue funcionalidad / rendimiento / mantenibilidad, que no hubiera sido posible con las tecnologías existentes (no semánticas)? ¿Algún producto que es completamente dependiente de las tecnologías semánticas y realmente agrega valor a los clientes y genera ingresos?

Acabo de descubrir DBpedia . Es un intento prometedor de representar una gran cantidad de datos de Wikipedia como RDF. Puede descargar la extracción completa como un archivo de 16 GB, pero también tiene una página de búsqueda de palabras clave . Ser representado como RDF permite consultas "semánticas" muy específicas. This muestra algunas consultas de ejemplo, como la forma en que encontraría una lista de los sitios web oficiales de las empresas con más de 50000 empleados. Incluso puede consultar "la nube" de forma remota con cualquier contenedor que pueda interactuar con su API pública, como este módulo de Python .

Creo que Drupal 7 tiene una posibilidad de ser una aplicación semántica asesina, es la próxima versión de un CMS con una base de instalación considerable y cuando el lanzamiento sea definitivo y todo el mundo empiece a actualizar de repente toneladas de sitios expondrán automáticamente RDF en forma de incrustado RDFa sin ninguna intervención por parte de los usuarios.

Desde un punto de vista empresarial, creo que las cosas vinculadas a datos como GoodRelations son una aplicación potencialmente peligrosa , por ejemplo, vea estas publicaciones del blog Scott Brinker y Priyank Mohan que describen cómo BestBuy experimentó un aumento del 30% en el tráfico después de comenzar a incorporar datos vinculados basados en GoodRelations como RDFa. sus páginas web.

En general, los datos enlazados son una excelente manera de aumentar su sitio con datos legibles por máquina y muestran resultados notables en la visibilidad de su sitio. Recientemente, he visto un par de presentaciones de chicos de la BBC cuya aplicación de búsqueda de vida silvestre (una aplicación de datos vinculada) utilizando los recursos de la historia natural de la BBC) ya supera algunas páginas de Wikipedia para los animales en los resultados de búsqueda de Google

El soporte semántico profundo es interesante para una serie de lugares donde se necesitan consultas poderosas. Un ejemplo fue en un project estuve trabajando recientemente, donde el servicio que se usaba para buscar a dónde enviar la carga de trabajo estaba basado semánticamente. RDF / SPARQL en sí mismo es interesante porque te da una gran cantidad de consultas desde el principio, pero cuando agregas una ontología OWL se hace aún mejor ya que significa que puedes responder consultas más ricas (es decir, que hacen preguntas más cerca de lo que el usuario - y su empleador - realmente quiere) al tiempo que permite a los proveedores de servicios expresar lo que están ofreciendo con mayor claridad también. Lo que no quiere decir que signifique que todos le digan todo a todos, en absoluto. En su lugar, teníamos partes que describían qué servicios se proporcionaban y no qué configuración estaban utilizando para proporcionar esos servicios. Y todo se potenciaba mediante el uso de tecnologías semánticas en todos los sistemas de información.

Actualmente estoy trabajando en Taverna que ahora usa RDF para proporcionar un sistema de registro mejorado; en particular, los usuarios (especialmente los científicos) pueden buscar a través de la riqueza de la información grabada con mucha más facilidad que si tuvieran que grep través de un enorme archivo de texto. Después de todo, sería un poco absurdo si tuviera que usar minería de texto para averiguar qué sucedió realmente en su flujo de trabajo de minería de textos ...

En biología, el interés en RDF y la tecnología relacionada es muy alto. La gente quiere menos código analítico y personalizado para integrar datos y consultas más avanzadas. RDF ya está proporcionando el primero; Por ejemplo, UniProtKB , uno de los mayores recursos biomédicos, ofrece sus datos en RDF. Para las consultas avanzadas todavía no hemos llegado, ya que el rendimiento y la disponibilidad de buenos datos RDF y ontologías OWL todavía son escasos. Pero está comenzando, echa un vistazo a BioGateway para ver un ejemplo de lo que se puede hacer.

Desde ese punto de vista, los frutos de estas tecnologías no son aplicaciones asesinas individuales, sino todo el ahorro de tiempo acumulado para los investigadores que pueden explorar los datos en lugar de escribir scripts ad hoc y configurar bases de datos SQL temporales y toda esta plomería.

Estaba impresionado con AceWiki . Es uno de los muchos proyectos de wiki que intentan organizar semánticamente la información que ingresa la gente.

Todavía es un trabajo en progreso y tiene algunas limitaciones. Por ejemplo, solo permite que las personas ingresen oraciones que se ajusten a un subconjunto de vocabulario y gramática en inglés.

Sin embargo, espero que estos despegue. Existe una gran cantidad de datos gratuitos (por ejemplo, Wikipedia) y no podemos crear programas para razonar sobre ellos porque el contenido es demasiado ruidoso.

La web semántica se basa en que los proveedores de contenido hacen el esfuerzo de anotar todo correctamente para que sea legible por máquina.

Eso es demasiado trabajo para la mayoría de las personas que no son bibliotecarios.

La verdadera aplicación asesina parece ser algo que puede derivar semántica del contenido no estructurado sin marcado especial. Mira el trabajo increíble que Google, por ejemplo, ha hecho con su motor de búsqueda.

Para que un sistema funcione, no debe imponer una pesada carga a sus usuarios.

Un término medio son los sistemas de etiquetado como aquí en . Funcionan bastante bien, a pesar de que las etiquetas son completamente ad hoc y en partes inconsistentes.

Protege es bueno para desarrollar ontologías.