tag habilitar google etiqueta esta create configuración anulación google-analytics statistics analytics protocol-buffers google-adwords

google-analytics - habilitar - google tag dashboard



Cómo decodificar google gclids (11)

Bueno, esta no es una respuesta, pero el enfoque es similar a cómo abordarías cualquier problema de criptografía.

Posibilidad 1: Son aleatorios, en cuyo caso, estás jodido. Esto es análogo a un pad de una sola vez.

Posibilidad 2: "significan" algo. En ese caso, debes controlar el entorno.

  1. Obtenga una buena base de datos de ellos. Encuentra gclids para tu sitio y otros. Registre todas las veces que ocurran todos los clics y cualquier otro dato potencialmente útil
  2. ¡Manos a la obra! Como ya ha comenzado, empiece a hacer una regresión de los datos recopilados con respecto a los conocidos y verifique si puede encontrar patrones utilizados para descifrar las técnicas
  3. Comience a robar random gclid''s, y vea a dónde lo llevan.

Sin embargo, no abrigaría la esperanza de que esto sea exitoso, ¡pero te deseo suerte!

Ahora, me doy cuenta de que la respuesta inicial a esto es "no se puede" o "usar análisis", pero continuaré con la esperanza de que alguien tenga más conocimiento que eso.

Las palabras clave de Google con "etiquetado automático" anexan un "gclid" (presumiblemente, "identificador de clic de Google") para vincularlo con el sitio que se anuncia. Aparece en el registro web porque es un parámetro de consulta y Analytics lo utiliza para vincular esa visita al anuncio / campaña.

Lo que me gustaría hacer es extraer cualquier información útil del gclid para hacer nuestro propio análisis de nuestro tráfico. Las razones para esto son:

  • Las estadísticas son imperfectas, pero si las estamos recopilando, sabemos exactamente qué suposiciones hemos hecho y cómo se calcularon.
  • Podemos vincular los datos con el resto de nuestros datos y generar estadísticas mucho más precisas con la tasa de conversión.
  • No tenemos que depender de JavaScript para las conversiones.

Ahora está claro que el gclid está codificado en base64 (o en alguna variante cercana) y algunas partes varían más que otras. Más allá de eso, no he podido determinar a qué se relaciona.

¿Alguien tiene alguna idea de cómo podría abordar la decodificación de esto, o alguien ya ha relacionado gclids de nuevo a sus compañas o incluso cuentas?

He hablado con un par de personas en Google, y a pesar de su lema de "no seas malo", no estaban dispuestos a discutir la posibilidad de divulgar esta información, incluso bajo un NDA. Parece que les gusta el monopolio que tienen sobre nuestras estadísticas web.


Con mucho, la solución más fácil es etiquetar manualmente sus enlaces con los parámetros de seguimiento de campaña de Google Analytics (utm_source, utm_campaign, utm_medium, etc.) y luego extraer esos datos.

El gclid depende de algo más que la cuenta / campaña de AdWords / etc. Si hace clic en el mismo anuncio de AdWords dos veces, podría darle diferentes gclids, porque también hay todo tipo de datos de sesión y costos asociados con ese clic en particular.

Gclid probablemente no sea 100% aleatorio, es cierto, pero me sorprendería mucho si le fuera posible extraer todos sus datos de Adwords de ese número. Eso sería un gran error de seguridad (es decir, un usuario arbitrario podría ver sus datos de Adwords). Lo más probable es que se genere un gclid pseudoaleatorio con cada impresión, y si se hace clic en ese anuncio, el gclid se registra en Adwords (de lo contrario, se descarta). Luego, Analytics usa ese número para reconciliar los datos con Adwords. Aparte de eso, no hay ningún valor intrínseco en el número de gclid en sí.

Con respecto a su último punto, intentar prohibir o aplicar ingeniería inversa a esta información está explícitamente prohibido en los Términos de Servicio de Google Analytics y Google Adwords, y es motivo de una prohibición permanente. Además, los TOS que acordó cuando se suscribió a estos servicios dicen que no se trata de utilizar sus datos de la forma que le apetezca. Google brinda un servicio gratuito, por lo que existen condiciones. Si no le gusta no tener control total sobre sus datos, entonces hay muchas otras soluciones disponibles. Sin embargo, pagará una prima por ese tipo de control.

Google gana casi todo su dinero vendiendo anuncios. Adwords es su mayor producto para hacer dinero. No le van a dar información confidencial sobre cómo funciona. No saben quién es usted o qué va a hacer con esa información. No importa si usted firma una NDA y tienen un recurso legal para demandarlo; Si regala esa información a un competidor, su vida no vale lo suficiente como para devolver el dinero que habrá perdido.

Lamento decírtelo, pero "Do not be Evil" o no, Google es una empresa, no una obra de caridad. No se convirtieron en una de las compañías más exitosas del mundo regalando su algoritmo de búsqueda al primer tipo que lo solicitó.


FYI, acabo de publicar un análisis rápido de algunos datos de glcid de mis sitios en esta publicación . Definitivamente hay algo de estructura en el gclid, pero es difícil de descifrar.


Un enfoque diferente es simplemente mirar los datos de referencia que, al menos, proporcionarán la palabra clave que se buscó.


Estoy de acuerdo con Ophir y Chris. Mi sensación es que se trata simplemente de un número de serie / identificador de clic único, que solo abre sus secretos cuando los sistemas Analytics y Adwords se comunican entre sí detrás de las escenas.

Sabiendo esto, recomendaría mirar la URL de referencia y sacar lo más posible de esto para usar en la configuración de seguimiento de clics en la parte de atrás.

Por ejemplo, vivo en Nueva Zelanda y estoy usando Firefox. Esta es una búsqueda de la barra de herramientas de Firefox Google para "desbordamiento de pila": http://www.google.co.nz/search?q=stack+overflow&ie=utf-8&oe=utf-8&aq=t&client=firefox-a&rlz=1R1GGLL_en -GB

Puedes ver que: a) estoy usando el dominio .NZ, b) mi palabra clave "stack + overflow", c) estoy ejecutando firefox.

Finalmente, si también oculta la URL completa de la página de destino, puede almacenar el GCLID, que le informará que el visitante proviene de pago, mientras que si no tiene un GCLID, entonces el usuario debe haber venido de la búsqueda natural (si la URL el etiquetado está habilitado por supuesto).

En teoría, esto te permitiría buscar la palabra clave en tu campaña y averiguar de qué grupo de anuncios provienen. Sin embargo, conocer la creatividad probablemente sería imposible, a menos que se dividan las URL de aterrizaje o se etiqueten de alguna manera.


También he estado trabajando en este problema en nuestra empresa. Nos gustaría poder tener una mejor idea de lo que está haciendo AdWords, pero estamos frustrados con las limitaciones en Analytics.

Nuestra solución actual es buscar en los registros de acceso de Apache para las solicitudes GET usando la expresión regular:

.*[?&]gclid=([^$&]*)

Si eso existe, entonces miramos la cadena del referer para obtener la palabra clave:

.*[?&]q=([^$&]*).*

Una opción alternativa es cambiar el registro web de Apache para iniciar el registro de la cookie __utmz que establece google, que debería tener una pieza para la palabra clave en utmctr. Google __utmz cookie y usted debería poder encontrar mucha información.

¿Qué tan precisa es la cadena del referer? No es 100% Los cortafuegos y los dispositivos de seguridad lo eliminarán. Pero analizarlo usted mismo le da más flexibilidad que Google Analytics. Sería una gran característica enviar el gclid a AdWords y recuperar datos, pero esa característica no parece estar disponible.

EDITAR: Desde que escribí esto, también hemos creado nuestras propias etiquetas que se añaden a cada url de destino como un parámetro de solicitud. Cada etiqueta es solo un hash md5 del texto, grupo de anuncios y nombre de la campaña. Lo tomamos usando expresiones regulares del registro de acceso y lo buscamos en una base de datos SQL.


Parece que mi representante es débil, así que solo publicaré otra respuesta en lugar de un comentario.

Esta no es una respuesta, claramente. Solo expresando algunos pensamientos.

Cuando habilita el etiquetado automático en Adwords, los parámetros gclid no se agregan a las URL de destino. En cambio, los servidores de seguimiento de clic de Google los anexan a las URL de destino en tiempo de ejecución. Entonces, una de dos cosas está sucediendo:

  1. Los servidores de clics están almacenando el gclid junto con los identificadores de entidad de Adwords para que Analytics los pueda buscar más adelante.

  2. Gclid tiene los identificadores de entidad codificados de alguna manera para que Analytics pueda decodificarlos.

Desde una perspectiva de rendimiento, parece poco probable que Google implemente algo similar a la opción 1. Forzar analíticas para "unir" el gclid a los ID de Adwords parece ser excepcionalmente ineficiente a escala.


El parámetro gclid está codificado en Protocolo Buffers , y luego en una variante de Base64.

Consulte esta guía para decodificar el gclid e interpretarlo, incluida una función de PHP (con licencia de Apache) que puede usar.

Básicamente hay 3 parámetros codificados en su interior, uno de los cuales es una marca de tiempo. Los otros 2 aún no se conocen.

En cuanto a la comprensión de lo que significan estos otros parámetros, puede ser útil compararlo con el parámetro ei , que está codificado de una manera extremadamente similar (básicamente Buffers de Protocolo con las claves eliminadas). El parámetro ei también tiene una marca de tiempo, con lo que parecen ser microsegundos y otros 2 enteros.



Esta es una forma no programática para decodificar el parámetro GCLID. Lo más probable es que simplemente intente descubrir la campaña, el grupo de anuncios, la palabra clave, la ubicación y el anuncio que generaron el clic y la conversión. Para ello, puede cargar el GCLID en AdWords como un tipo de conversión por separado y luego segmentar por tipo de conversión para acceder a los criterios que activaron la conversión. Estos pasos:

  1. En la interfaz de usuario de AdWords, vaya a Herramientas-> Conversiones-> Agregar conversión con la fuente "Importar desde clics"
  2. Visite el tema de ayuda de AdWords sobre la importación de conversiones https://support.google.com/adwords/answer/7014069 y cree un archivo de carga masiva con sus valores de GCLID, asignando las conversiones a su nuevo tipo de conversión "Importar desde los clics".
  3. Cargue las conversiones en AdWords en Herramientas-> Conversiones-> Acciones de conversión (Cargas) en la barra de navegación de la izquierda
  4. Vaya a la pestaña Campañas, Segmento-> Conversiones-> Nombre de conversión
  5. Encuentre su nuevo nombre de conversión en la lista de segmentos, aquí es de donde proviene la conversión. Continúe este mismo proceso en la pestaña de grupos de anuncios y palabras clave hasta que conozca los criterios de origen de GCLID.

Aquí hay una idea: ¿existe alguna posibilidad de que el gclid sea simplemente un hash criptográfico, un bit.ly u otro acortador de URL?

En cuyo caso, los contenidos del texto hash se escribirían en una base de datos y se reemplazarían con una identificación única.

Después de todo, el gclid está acortando un montón de texto largo.

Toma este ejemplo: www.example.com?utm_source=google&utm_medium=cpc

Se convierte a esto: www.example.com?gclid=XDF

como un acortador de URL.

Uno necesitaría un cifrado de sustitución para realizar ingeniería inversa del hash criptográfico ... tarea no tan fácil: https://crypto.stackexchange.com/questions/300/reverse-engineering-a-hash

Tal vez una excavación profunda en troncos, en busca de patrones, etc.