html - tag - se ha detectado la etiqueta·"noindex" en la metaetiqueta "robots"

¿Cómo evitar que los motores de búsqueda indexen una sola página de mi sitio web? (7)

Crea un archivo robots.txt y establece los controles allí.

Aquí están los documentos para google: http://code.google.com/web/controlcrawlindex/docs/robots_txt.html

No quiero que los motores de búsqueda indexen mi página de impresión. ¿Cómo podría hacer eso?

Hoy en día, el mejor método es usar una metaetiqueta de robots y establecerlo en noindex,follow :

<meta name="robots" content="noindex, follow">

Puede configurar un archivo robots.txt para probar y decirle a los motores de búsqueda que ignoren ciertos directorios.

here

Básicamente:

User-agent: * Disallow: /[directory or file here]

También puedes agregar la siguiente metaetiqueta en HEAD de esa página

<meta name="robots" content="noindex,nofollow" />

Un robot quiere ver la URL de un sitio web, por ejemplo, http://www.example.com/welcome.html . Antes de hacerlo, primero verifica http://www.example.com/robots.txt , y encuentra: puede rechazar explícitamente:

User-agent: * Disallow: /~joe/junk.html

Por favor, visite el siguiente enlace para más detalles.

Necesitas un archivo robots.txt simple. Básicamente, es un archivo de texto que le dice a los motores de búsqueda que no indexen páginas particulares.
No necesitas incluirlo en el encabezado de tu página; Mientras esté en el directorio raíz de su sitio web, será rastreado por los rastreadores.
Créelo en la carpeta raíz de su sitio web y coloque el siguiente texto en:

User-Agent: * Disallow: /imprint-page.htm

Tenga en cuenta que reemplazaría imprint-page.html en el ejemplo con el nombre real de la página (o el directorio) que desea evitar que se indexe.

¡Eso es! Si desea obtener más información, puede consultar here , here o here para obtener más información. Además, puede encontrar herramientas gratuitas en línea que generarán un archivo robots.txt para usted (por ejemplo, here ).

<meta name="robots" content="noindex, nofollow">

Solo incluye esta línea en tu etiqueta <html> <head> . Por qué le digo esto porque si usa el archivo robots.txt para ocultar sus URL que pueden ser páginas de inicio de sesión u otras URL protegidas que no mostrará a otra persona o motores de búsqueda.

Lo que puedo hacer es acceder al archivo robots.txt directamente desde su sitio web y ver qué URL tiene secretas. Entonces, ¿cuál es la lógica detrás de este archivo robots.txt?

La buena manera es incluir la metaetiqueta de arriba y mantenerse a salvo de cualquier persona.