seo - name - etiqueta<noindex> para Google
seo html (4)
Cree un archivo robots.txt en su nivel raíz e inserte algo como lo siguiente:
Bloquear Google:
User-agent: Googlebot
Disallow: /myDisallowedDir1/
Disallow: /myDisallowedPage.html
Disallow: /myDisallowedDir2/
Bloquea todos los bots:
User-agent: *
Disallow: /myDisallowedDir1/
Disallow: /myDisallowedPage.html
Disallow: /myDisallowedDir2/
Un útil generador de robots.txt:
Me gustaría decirle a Google que no indexe ciertas partes de la página. En Yandex (Rusia SE) hay una etiqueta muy útil llamada <noindex>
. ¿Cómo se puede hacer con Google?
No, Google no admite la etiqueta <noindex>
. Prácticamente nadie lo hace.
Puede evitar que Google vea partes de la página colocando esas partes en iframes bloqueados por robots.txt.
robots.txt
Disallow: /iframes/
index.html
This text is crawlable, but now you''ll see
text that search engines can''t see:
<iframe src="/iframes/hidden.html" width="100%" height=300 scrolling=no>
/iframes/hidden.html
Search engines cannot see this text.
En lugar de usar el uso de iframes, puede cargar el contenido del archivo oculto usando AJAX. Aquí hay un ejemplo que usa jquery ajax para hacerlo:
his text is crawlable, but now you''ll see
text that search engines can''t see:
<div id="hidden"></div>
<script>
$.get(
"/iframes/hidden.html",
function(data){$(''#hidden'').html(data)},
);
</script>
Según Wikipedia 1 , hay algunas reglas que siguen algunas arañas:
<!--googleoff: all-->
This should not be indexed by Google. Though its main spider, Googlebot,
might ignore that hint.
<!--googleon: all-->
<div class="robots-nocontent">Yahoo bots won''t index this.</div>
<noindex>Yandex bots ignore this text.</noindex>
<!--noindex-->They will ignore this, too.<!--/noindex-->
Desafortunadamente, parece que no pudieron ponerse de acuerdo en un solo estándar, y que yo sepa, no hay nada para mantener alejadas a todas las arañas ...
El comentario googleoff:
parece admitir diferentes opciones, aunque no estoy seguro de dónde hay una lista completa. Hay al menos:
- todos: ignorar completamente el bloque
- índice: el contenido no entra en el índice de Google
- ancla: el texto de ancla para los enlaces no se asociará con la página de destino
- fragmento: el texto no se utilizará para crear fragmentos para los resultados de búsqueda
Tenga en cuenta también que (al menos para Google) esto solo afectará el índice de búsqueda , no el ranking de la página, etc. Además, como señaló correctamente en su comentario a continuación, googleon
y googleoff
solo funcionan con el dispositivo de búsqueda de Google y no tienen Efecto en Googlebot normal , por desgracia.
También hay un artículo en la parte 2 de Yahoo (y un artículo que describe que Yandex también respeta <noindex>
6 ). En la googleoff:
parte, vea también esta respuesta y el artículo del que googleoff:
la googleoff:
parte de la información relacionada. 3
Además, las Herramientas para webmasters de Google recomiendan usar el rel=nofollow
4 para enlaces específicos (por ejemplo, anuncios o enlaces a páginas no accesibles / útiles para los robots, como el inicio de sesión / registro). Eso significa que los bots de Google deben respetar el HTML y el atributo rel , aunque se relaciona principalmente con el rango de la página, no con el índice de búsqueda en sí. Desafortunadamente, parece que no hay rel=noindex
5,7 . Tampoco estoy seguro de si este atributo podría usarse también para otros elementos (por ejemplo, <DIV REL="noindex">
); pero a menos que los rastreadores honren "noindex", eso tampoco tendría sentido.
Otras referencias:
- ¿Cómo noindexar partes de una página web?
- Excluyendo el rastreador de las secciones de las páginas (rastreador de Spiderline; verá, otros rastreadores podrían usar otros marcadores propietarios (vea también el rastreador AddSearch ). Me gustaría que simplemente hicieran de
REL="noindex"
un estándar en lugar de ser usado con cualquier etiqueta HTML como DIV / SPAN / P / A!) - Evitar que Google indexe el contenido de un div invirtiendo la cadena
- Métodos para evitar que los motores de búsqueda indexen contenido irrelevante en una página
1 Wikipedia: Noindex
2 ¿Qué secciones de sus páginas web podrían ignorar los motores de búsqueda?
3 Dígale a Google que no indexe ciertas partes de su página
4 Usa rel = "nofollow" para enlaces específicos
5 ¿Es una buena idea usar el nombre de <a href=“http://name.com” rel=“noindex, nofollow”>name</a>
?
6 Usando etiquetas HTML - Yandex.Help. Webmaster
7 valores REL existentes