rdf semantic-web microdata microformats rdfa

¿Cuál es la relación entre RDF, RDFa, Microformats y Microdata?



semantic-web (3)

<sarcasm> No puedo imaginar lo que encuentras tan confuso </sarcasm> (edición: estas etiquetas eran invisibles antes)

Muy corto:

  • Microformatos Una forma de usar páginas html como un documento legible por humanos y datos legibles por máquina , sin repetición (por ejemplo, pegando CSV en el elemento principal).
  • RDF Un modelo de datos diseñado para la web. Schemaless, utiliza URLs para nombrar tipos y relaciones.
  • RDFa Una forma de codificar (escribir) RDF en html, siguiendo el estilo de los microformatos (es decir, minimizando la repetición). Funciona agregando algunos atributos a html.
  • Microdatos Una alternativa a RDFa, utilizando diferentes atributos y un modelo de datos diferente.

Menos brevemente, RDF provino de intentos de hacer datos ''webby''. Incluso había un plug-in para navegar por el precursor de RDF MCF (de Apple, curiosamente). El modelo de datos se diseñó para que usted pueda escribir lo que quiera sin tener que organizar de antemano cómo los nombres de las columnas o los significados clave con todos los demás en la web. RDF fue escrito (serializado) de manera estándar utilizando XML (aunque hay otros formatos más agradables disponibles).

Por lo tanto, en este mundo, es posible que tenga una página de inicio legible ( me.html ) y una página de inicio de datos ( me.rdf ) para que las máquinas lo me.rdf . Esas máquinas no entenderán el significado de <p>I live in <a href="http://example.com/Chicago">Chicago</a></p> , pero podrían usar :me ex:livesIn <http://example.com/Chicago> si buscan ''livesIn''.

Los microformatos también intentan hacer que los datos sean ''webby'', o tal vez debería ser la web ''data-y''. La idea aquí es que hay una gran cantidad de datos en las páginas web, entre la prosa. Si tiene algunos consejos, una máquina puede descubrir que ese fragmento de html anterior es básicamente una dirección. Esos consejos son microformatos. Por lo general, usan convenciones alrededor de los nombres de clase html para indicar que el contenido es más que texto.

Así que los microformatos no necesitan una página web separada para las máquinas. Pero los microformatos solo cubren algunos tipos de datos (direcciones, enlaces de amigos, posición ...) debido a la forma en que funcionan. Cada una es una convención particular que debe ser acordada. Usados ​​sin cuidado también pueden mezclarse mal.

RDFa es un intento de obtener tanto la flexibilidad de RDF como la simplicidad de los microformatos. Los microdatos fueron una respuesta a RDFa, pero con un modelo de datos diferente (aproximadamente matrices y hashes en lugar de un modelo relacional). A diferencia de los microformatos, ninguno dicta qué tipo de información se proporciona, solo cómo se codifica.

Para completar lo que falta, ahora tenemos schema.org, que es una iniciativa de los grandes motores de búsqueda (Google, Bing, Yahoo, Yandex) para indexar datos web. schema.org coordina esos significados para que el motor de búsqueda sepa que, por ejemplo, los eventos tienen ubicaciones. Los microdatos fueron utilizados originalmente por schema.org, pero ahora ambos microdatos y RDFa son compatibles.

Ignoraría los microformatos en estos días y buscaría schema.org. Mi gusto personal es la codificación RDFa, pero o bien los microdatos deberían funcionar bien.

He investigado un poco, pero no puedo entender la relación exacta entre el 3. Además, ahora que W3C ha reconocido oficialmente RDFa, ¿lo recomendaría sobre Microdata, teniendo en cuenta que coincide con las características de Microdata y más?


Sugiero ignorar la web semántica. Los motores de búsqueda no te enviarán más visitantes debido a eso. En su lugar, utilizarán los datos perfectamente organizados para proporcionar la respuesta sin enviarte visitantes.

Hoy puede ver el problema con el siguiente ejemplo de "cuadro de película": https://www.google.com/search?q=The+Godfather

Se muestran las calificaciones de IMDb y Rotten Tomatoes. Un fragmento de Wikipedia también. Agradable para los usuarios, malo para esos sitios web. ¿O con qué frecuencia visitó IMDb en el pasado y hoy?

Y no lo olvides. Los datos mostrados no son solo de IMDb o Rotten Tomatoes. Las fechas, el director, los premios, la música, las imágenes, etc. se han recopilado de otros sitios. Por ejemplo, un motor de búsqueda puede buscar fácilmente en su base de datos "El Padrino" + "Director" y si 99 de los 100 sitios web incluyen el nombre "Francis Ford Coppola", es fácil verificar la respuesta sin ninguna interacción manual.

Finalmente, los motores de búsqueda pueden crear contenido propio sin pagar o mencionar a los autores. Y con la clasificación semántica te lo harás más fácil.


los tres son un intento de hacer que el contenido web sea más semántico.

rdfa enfrentó muchas barreras de entrada; compartió los mismos dolores de crecimiento que hizo xml (rdfa se basa en xml) en los primeros años de la web, probablemente más significativos porque había menos desarrolladores involucrados.

No sé lo suficiente sobre rdfa para recomendarlo sobre microdatos. Estoy predispuesto hacia los microdatos porque Google, Yahoo !, y Microsoft (ahora Bing) se juntaron y lo crearon. Se estaba desarrollando rdfa y se hizo la propuesta de microformatos. además, los microformatos ya estaban en producción y consumo masivo en la web. Así que los 3 grandes decidieron conspirar y crearon microdatos. Estoy un poco cansado, creo que porque no entiendo fundamentalmente por qué se abandonaron los microformatos. Suena como un montón de humo y espejos.

Así que recomiendo microformatos sobre todo. Son increíblemente fáciles. y tan impresionante. ¿Qué puede lograr con los microdatos que no puede con los microformatos?

Dicho esto .... Recogería microdatos sobre rdfa porque son igual de fáciles. y los atributos de datos son muy superiores a las clases html. En realidad, tal vez esa es la gran ventaja? atributos de datos? Al igual que su poco de investigación, he buscado detenidamente los razonamientos detrás de los microdatos, pero todo lo que puedo encontrar son mensajes normales y simples.