quien - rss feed reader
¿Cómo obtiene Google Reader cada elemento en una fuente RSS? (4)
La fuente RSS de Slashdot es http://rss.slashdot.org/Slashdot/slashdot . Si descargo el archivo XML directamente, solo recibo algunas de las publicaciones de hoy. Sin embargo, si me suscribo a la fuente en Google Reader y sigo desplazándome hacia abajo en su interfaz de "desplazamiento infinito", parece que puedo obtener una cantidad arbitraria de publicaciones de Slashdot del pasado. ¿Tal vez pueda obtener todas las publicaciones de Slashdot alguna vez?
- ¿Cómo recupera Google Reader un número ilimitado de publicaciones de un canal RSS?
- ¿Cómo puedo hacer lo mismo?
Acabo de descubrir que si estás autenticado puedes hacer algo como:
http://www.google.com/reader/atom/feed/http://rss.slashdot.org/Slashdot/slashdot?n=100
para obtener una cantidad arbitraria de resultados de un feed.
Google sigue una instancia del feed para todos sus usuarios, por lo que han estado rastreando y almacenando artículos de Slashdot, por ejemplo, mucho antes de que un nuevo suscriptor comience a leer.
Para hacer lo mismo, debería sondear los canales RSS que desea a intervalos regulares y almacenar los artículos únicos que encuentre localmente.
Han estado indexando la web durante años y almacenan todo lo que encuentran. Por lo tanto, en el momento en que agrega un enlace "suscribirse a este" a su página, el rastreador de Google comenzará a indexar esa página y almacenarla.
Para RSS, también tienen la ventaja de tener varias personas suscribiéndose al mismo feed.
Por lo tanto, para su aplicación, sugiero que resuelva esto guardando los elementos descargados localmente, para que los nuevos suscriptores puedan volver al punto en el que el primer usuario se suscribió a ese canal. No le dará acceso ilimitado, pero con el tiempo le dará un archivo mucho más grande que solo los 20 últimos artículos.
Creé un servicio de archivo RSS que hace de lo que estás hablando ( https://app.pub.center ). Todo el RSS es de uso gratuito a través de REST. Si quieres notificaciones push, debes cambiar a un plan pago.
PubCenter diariamente sondea su catálogo de fuentes RSS y guarda en caché los artículos. Luego, puede obtener estos artículos en orden cronológico. Por ejemplo:
Página 1 de The Atlantic https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=1
Página 2 de The Atlantic https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=2