online headers example checker check http http-headers search-engine

headers - ¿Los motores de búsqueda respetan el campo de encabezado HTTP "Content-Location"?



show http headers online (5)

Me preguntaba si los motores de búsqueda respetan el campo de encabezado HTTP Content-Location .

Esto podría ser útil, por ejemplo, cuando desee eliminar el argumento ID de sesión de la URL:

GET /foo/bar?sid=0123456789 HTTP/1.1 Host: example.com … HTTP/1.1 200 OK Content-Location: http://example.com/foo/bar …

Aclaración:
No deseo redirigir la solicitud, ya que eliminar la ID de la sesión daría lugar a una solicitud completamente diferente y, por lo tanto, probablemente también a una respuesta diferente. Solo quiero decir que la respuesta adjunta también está disponible en su "URL principal".

Tal vez mi ejemplo no fue una buena representación de la intención de mi pregunta. Así que, por favor, eche un vistazo a ¿Cuál es el propósito del campo de encabezado HTTP "Content-Location"? .


La mayoría de los rastreadores decentes siguen Content-Location. Por lo tanto, sí, los motores de búsqueda respetan el encabezado Content-Location, aunque eso no garantiza que la URL que tiene el parámetro sid no se encuentre en la página de resultados.


Pruebe el encabezado "Ubicación:" en su lugar.


Además de usar "Ubicación" en lugar de "Ubicación del contenido", utiliza el código de estado HTTP adecuado en tu respuesta, dependiendo de tu razón para redirigir. Los motores de búsqueda tienden a favorecer el estado de redireccionamiento permanente (301) frente al estado temporal (302).


Creo que Google acaba de anunciar la respuesta a mi pregunta: la relación de enlace canonical para declarar la URL canónica .

Maile Ohye de Google escribió:

MickeyC dijo ...
Deberías haber usado el encabezado Content-Location en su lugar, de acuerdo con:
http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html
"14.14 Contenido-Ubicación"

@MikeyC: Sí, desde un punto de vista teórico que tiene sentido y ciertamente lo consideramos. Sin embargo, algunos puntos nos llevaron a elegir:

  1. Nuestros datos mostraron que el encabezado "Content-Location" está configurado incorrectamente en muchos sitios web. A veces, los webmasters proporcionan URLs largas y feas que ni siquiera son duplicadas, es probable que no sea intencional. Es probable que no sepan que su servidor web está enviando el encabezado Content-Location.

    Habría llevado mucho tiempo contactar a los propietarios de los sitios para limpiar los problemas de Ubicación de contenido en toda la web. Nos dimos cuenta de que si comenzábamos con un borrón y cuenta nueva, podríamos proporcionar la funcionalidad más rápidamente. Con Microsoft y Yahoo! a bordo para admitir este formato, los webmasters solo deben aprender una sintaxis.

  2. A menudo, los webmasters tienen dificultades para configurar sus encabezados de servidor web, pero pueden cambiar más fácilmente su HTML. rel = "canonical" parecía un atributo amistoso.

http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html?showComment=1234714860000#c8376597054104610625


En 2009 Google comenzó a buscar URI calificados como rel=canonical en el cuerpo de respuesta.

Parece que desde 2011, los enlaces formateados según RFC5988 también se analizan desde el campo de encabezado Link: También se menciona claramente en las Preguntas frecuentes sobre las Herramientas para webmasters de Google como una opción válida.

Supongo que esta es la forma más actualizada de proporcionar a los motores de búsqueda algunas rutas de exploración hipermedia adicionales, lo que permite mantenerlo alejado del cuerpo de respuesta cuando en realidad no necesita servirlo como contenido.