tag name keywords etiquetas description content html seo googlebot

html - name - ¿Hay alguna manera de hacer que los robots ignoren cierto texto?



seo html (8)

Tengo mi blog (puede verlo si lo desea, desde mi perfil), y está actualizado, al igual que los resultados de los análisis de Google Robots.

Los resultados fueron alarmantes para mí. Al parecer, las 2 palabras más comunes en mi sitio son "rss" y "feed", porque uso texto para enlaces como "Comentarios RSS", "Post Feed", etc. Estas 2 palabras estarán presentes en cada publicación, mientras que otras palabras Será más raro.

¿Hay alguna manera de hacer que estos enlaces desaparezcan del análisis de Google? No quiero que los enlaces técnicos sean indexados. Solo quiero contenido, títulos, descripciones para ser indexados. Estoy buscando algo más que reemplazar este texto con imágenes.

Encontré algunas discusiones antiguas en Google, en 2007 (creo que en 3 años muchas cosas podrían haber cambiado, espero que esto también)

Esta pregunta no es sobre robots.txt y cómo hacer que Google ignore páginas. Se trata de hacer que ignore partes pequeñas de la página, o transformar las partes de tal manera que sean vistas por humanos e invisibles para los robots.


Aparte de los métodos del lado del servidor de sombrero negro, no hay nada que puedas hacer. Es posible que desee ver por qué tiene esas palabras tan a menudo y eliminar algunas de ellas del sitio.

Solía ​​ser que podías usar JS para "ocultar" cosas de googlebot, pero no puedes ahora que analiza JS. ( http://www.webmasterworld.com/google/4159807.htm )



El rastreador de Google es inteligente, pero alguien que los programa es el más inteligente. Human siempre ve lo que es sensato en la página, pasarán tiempo en un blog que tiene un contenido agradable, muy raro y único. Se trata del sentido común, de cómo las personas visitan tu blog y de cuánto tiempo pasan. Google mide el resultado de la búsqueda de la misma manera. El ranking de su página también aumenta a medida que aumentan las visitas diarias y el contenido del sitio mejora y se actualiza cada día. Esta página tiene palabras de "Respuesta" repetidas varias veces. No significa que no se indexará. Es lo útil que es para cada uno. Espero que te den una idea.


En primer lugar pensar en el tema. Si Google piensa que "RSS" es la palabra clave principal que puede sugerir que el resto de su contenido es un poco superficial y debe expandirse. Quizás este debería ser el foco de su atención. Si el resto de su contenido es rico, no me preocuparía el problema, ya que un motor de búsqueda debería saber de qué se trata la página a partir del título y los encabezados. Solo asegúrese de que RSS, etc. no esté en un encabezado o en una etiqueta en negrita o fuerte.

En segundo lugar, como bien ha mencionado, es probable que no desee utilizar imágenes, ya que no son evaluables para los lectores de pantalla sin texto alternativo y si tienen texto alternativo o texto de apoyo, agregue la palabra clave nuevamente. Sin embargo, aria live puede ayudarlo a moverse. Este problema, pero no soy un experto en accesibilidad.

Opciones :

  • Use JavaScript para escribir ese bit de contenido (tal vez, ajax después de cargarlo). Los motores de búsqueda como Google pueden ejecutar JavaScript, pero supongo que no valorará el contenido escrito de JS muy altamente.
  • Redacte el contenido o elimine los duplicados, un enlace de fuente RSS prominente puede ser mejor que varios más pequeños que se encuentran alrededor de la página.
  • Use el atributo de contenido css con pseudo: antes o: después para agregar su contenido. No estoy seguro de si los bots indizarán palabras en los atributos de contenido en CSS y sabrán que los valores tienen valor en relación con cada página, pero parece poco probable. Poner palabras como RSS en el CSS básicamente dice que es una cuestión de estilo y no de HTML, por lo tanto, incluso si los motores para indexarlo no le agreguen mucho valor. Por ejemplo, el HTML y el CSS podrían ser:

    <a href="/my-feed.rss" class="add-text"></a> .add-text:after { content:''View my RSS feed''; }

Tenga en cuenta que lo anterior no funcionará en versiones anteriores de IE, por lo que es posible que necesite algunos comentarios de la versión de IE si le importa.


No, realmente no hay nada de eso. Existen varias técnicas del lado del servidor, pero si Google lo descubre, le entrega un texto diferente a su bot del que le da a los visitantes del sitio web, lo penalizará.


Trabajo en un sitio con el ranking de Google top 3 para miles de nombres de escuelas en los EE. UU., Y trabajamos mucho para proteger nuestro SEO. Hay 3 cosas principales que puedes hacer (que probablemente sean una pérdida de tiempo, sigue leyendo):

  • Mueva las cosas que desea restar importancia a la parte inferior de su HTML y use CSS y / o colóquelo donde desee que los lectores lo vean. Esto no lo ocultará de los rastreadores, pero lo valorarán más bajo.
  • Reemplace esos enlaces con imágenes (usted dice que no quiere hacer eso, pero no explica por qué no)
  • Servir una página diferente a los rastreadores, con esos enlaces eliminados. No hay nada de negro en esto, siempre y cuando el contenido sea fundamentalmente el mismo que ve un navegador. Los motores de búsqueda le mostrarán si abre una página que es significativamente diferente de lo que ven los usuarios, pero si elimina los enlaces RSS de la versión del índice de rastreadores de páginas, no tendrá ningún problema.

Dicho esto, los rastreadores son inteligentes y usted no es el único sitio lleno de enlaces permanentes y enlaces RSS. Se preocupan por el contexto y buscan términos y frases en sus encabezados y texto del cuerpo. Saben cómo determinar que su blog es sobre tecnología y no RSS. Dudo mucho que esos enlaces tengan algún efecto negativo en tu SEO. ¿Qué problema estás tratando de resolver?

Si quieres construir SEO, averigua qué valor le das a los lectores y escribe sobre eso. Diga cosas interesantes que harán que otros se vinculen a su blog, y los rastreadores comprenderán que usted es una fuente de información que la gente valora. Piense más en lo que sus lectores ven y entienden, y menos en lo que cree que ve un rastreador.


tiene que detectar manualmente el "Google Bot" del agente de usuario de la solicitud y proporcionarle un contenido poco diferente del que normalmente sirve a su usuario.


Hay una forma sencilla de indicar a Google que no indexe partes de sus documentos, es decir, utilizando googleon y googleoff :

<p>This is normal (X)HTML content that will be indexed by Google.</p> <!--googleoff: index--> <p>This (X)HTML content will NOT be indexed by Google.</p> <!--googleon: index-->

En este ejemplo, el segundo párrafo no será indexado por Google. Observe el parámetro " index ", que se puede establecer en cualquiera de los siguientes:

  • index : el contenido rodeado por " googleoff: index " no será indexado por Google

    anchor : el texto de ancla para cualquier enlace dentro de un área " googleoff: anchor " no se asociará con la página de destino

    snippet : el contenido rodeado de " googleoff: snippet " no se utilizará para crear fragmentos para los resultados de búsqueda.

    all : el contenido rodeado por " googleoff: all " se trata con todo

source