validator sirve que probar para lector español ejemplos check canales http rss atom-feed

http - sirve - rss feed español



política de votación rss (8)

  1. Hacer uso de la memoria caché HTTP. Enviar encabezados Etag y LastModified . Reconocer 304 Not modified Respuesta 304 Not modified . De esta manera puedes ahorrar mucho ancho de banda. Además, algunos scripts reconocen el encabezado LastModified y devuelven solo contenidos parciales (es decir, solo los dos o tres elementos más nuevos en lugar de los 30 aproximadamente).

  2. No sondee RSS de servicios que admitan RPC Ping (u otro servicio PUSH, como PubSubHubbub ). Es decir, si está recibiendo notificaciones PUSH de un servicio, no tiene que sondear los datos en el intervalo estándar; hágalo una vez al día para verificar si el mecanismo todavía funciona o no (el ping se puede desactivar, reconfigurar, dañar, etc). De esta manera, puede obtener RSS solo al recibir una notificación, no cada hora aproximadamente.

  3. Compruebe el TTL (en RSS) o los encabezados de control de caché ( Expires en ATOM), y no recupere hasta que caduque el recurso.

  4. Intente adaptarse a la frecuencia de los nuevos elementos en cada canal RSS único. Si en la última semana solo hubo dos actualizaciones en un feed en particular, no lo busque más de una vez al día. AFAIR Google Reader hace eso.

  5. Baje la tarifa en horas nocturnas u otras horas cuando el tráfico en su sitio sea bajo.

  6. Por fin, hazlo una vez por hora. ;)

Tengo una aplicación que sondea varias fuentes rss en la web.

¿Cuál es la etiqueta al sondear los servidores web de otros. ¿Con qué frecuencia a la encuesta, etc?

¿Cuáles son las mejores prácticas?


Bueno, voy a salir por ahí, ignorando las publicaciones que dicen "Google dice, nosotros sí", y digo: tan a menudo como sea necesario.

RSS está ahí para mantenerte al día. Si un feed publica 10 artículos por hora pero solo muestra cinco, perderá cinco de esos artículos y el feed no está cumpliendo su propósito. Bien podría no golpearlo en absoluto.

Por supuesto, no puede forzar al servidor con solicitudes, pero si se publican lo suficiente para que usted las solicite una vez por minuto, no veo que no sea razonable igualar esa tasa.


Esta no es una respuesta completa, pero busque alertas de inserción.

El blog RSS indica que una buena práctica es preguntar a weblogs.com sobre los blogs modificados.

También hay algunos, er, pubsub , sobre pubsub , una forma de suscribirse a las alertas de inserción que tiene cierto impulso.


FeedFetcher de Google afirma que sondea un feed RSS un poco menos de una vez por hora.

De: http://code.google.com/apis/ajaxfeeds/documentation/

Frecuencia de rastreo de alimentación

Como la API de alimentación de AJAX de Google utiliza Feedfetcher, los datos de la fuente de la API de alimentación de AJAX pueden no estar siempre actualizados. El rastreador de fuentes de Google ("Feedfetcher") recupera las fuentes de la mayoría de los sitios menos de una vez cada hora. Algunos sitios que se actualizan con frecuencia pueden actualizarse más a menudo.


Observo que Twitter utiliza (personalizado) X-RateLimit-Remaining y X-RateLimit-Limit (en la respuesta HTTP) para indicar el número máximo de encuestas autorizadas para los feeds Atom. De alguna manera es una lástima que no hayan usado el campo estándar de Expires (que se estableció hace 30 años: P) Supongo que su publicidad de Cache-Control: no-cache también descarta el tiempo de caducidad heursítica genérico definido en RFC 2616 (sección 13.2. *). Es aún más una pena que Atom no parezca proporcionar una forma estandarizada de decir con qué frecuencia se sugiere una para sondear el feed.


Rss tiene una configuración de ttl, así que en realidad solo debería sondear cuando caduque el TTL.

Pero supongo que si no ponen uno en su problema y usted debería encuestar algo como una vez por hora


Una vez que una hora es una frecuencia que he escuchado.


Una vez por hora , si solo quieres ir por regla general (pero el enlace explica algunas opciones mejores).