sirve recibir que para online lector español ejemplos como canal atom rss

recibir - Cómo determinar mediante programación si una fuente RSS es un feed completo o parcial



rss feed (3)

Necesitaría determinar programáticamente si una fuente RSS expone el contenido completo de sus artículos o solo extractos de ellos. ¿Como lo harias?


¿Por qué no seguir la URL de rss-feed y comprobar si hay más texto en esta página que en rss-feed? Necesitarás tomar un analizador html y poner algunas reglas generales.


Busque un enlace al final que diga "Más", "Continuación", "Artículo completo", "..." o similar. A menos que desee seguir todos los enlaces de la página y buscar el texto de la fuente más extra quizás.


No creo que haya una manera muy clara de hacerlo, pero aquí hay dos "hacky":

Analizaría el texto del RSS, y buscaría cualquier enlace que salga de él. De acuerdo, podría haber múltiples enlaces allí (algunos a otras publicaciones en el blog), pero si te centras en el último, y tratas de encontrar algunas palabras heurísticas para el título del enlace (es decir, "más", "leer completo" ", etc.), deberías poder obtener muchos de ellos. Para mayor confianza, solo puede mirar los enlaces que apuntan al blog original.

Un método más riguroso hará que siga todos los enlaces e intente comparar si el fragmento RSS es un subconjunto de la página que vuelve, o si existe una superposición sustancial. Sin embargo, esto puede no ser útil siempre que el sitio use un resumen verdadero en lugar del fragmento de la publicación completa.