tutorial tag sesion managerç manager iniciar googletagmanager google español enlazar con acceder google-analytics alexa

google-analytics - managerç - iniciar sesion tag manager



¿Cómo registran Alexa y Google Analytics los datos demográficos? (3)

Investigué un poco, y aparentemente estos datos demográficos se rastrean de la misma manera en que se rastrean los datos demográficos de la audiencia televisiva. Hay personas que navegan con sus barras de herramientas (Alexa), que realiza un seguimiento de los sitios visitados. Estas personas voluntariamente (?) Proporcionan información como edad, sexo, etc. y Alexa extrapola los datos demográficos generales de esta muestra. Esto, por supuesto, deja espacio para el sesgo, pero ese es un problema con las estadísticas.

¿Cómo son capaces los servicios como Alexa y Google Analytics de rastrear la edad, el género, la educación universitaria, etc. de los visitantes?

http://www.alexa.com/siteinfo/stackoverflow.com


Alexa definitivamente obtiene su información de tráfico de los usuarios de su barra de herramientas. Como se trata de un grupo de personas relativamente pequeño y auto-seleccionador, esto inevitablemente conduce a una muestra sesgada (razón por la cual el tráfico de Alexa no coincide con el tráfico medido en los sitios que ejecuto). Incluso con las mejores técnicas estadísticas para reducir el sesgo, nunca puede deshacerse de él por completo cuando la distribución de muestreo no es uniforme.

No se sabe con certeza cómo lo hace Google, aunque podría implicar el seguimiento de las cookies.

Un proyecto en el que he estado trabajando recientemente tiene relación con esta pregunta.

Otra forma de hacer esto (que también tiene sesgos, pero diferentes) sería usar un servicio de ubicación IP para encontrar la latitud y la longitud aproximadas de cada visitante de su sitio. Luego use mi proyecto (divulgación completa: ejecuto ese sitio y es comercial):

http://askgeo.com

Para obtener información demográfica para esa ubicación. AskGeo en realidad proporciona información demográfica en varios niveles geográficos (estado, condado, subdivisión del condado, ciudad, código postal, sección censal (unas pocas miles de personas) y grupo de bloques censales (alrededor de mil personas). Es de suponer que desea utilizar el nivel más bajo (es decir, grupo de bloques del censo) para una latitud y longitud determinada.

El sitio devuelve una gran cantidad de variables demográficas. La idea sería usar conteos suaves de las variables demográficas proporcionadas en el nivel de grupo de bloque. Por poner un ejemplo, si está tratando de rastrear la distribución por edad de sus usuarios, entonces usaría los rangos de edad provistos en la respuesta AskGeo y para una muestra dada, agregaría un conteo suave fraccional a cada rango que corresponda al porcentaje de la población en ese grupo de bloques del rango de edad correspondiente. Por ejemplo, tome mi vecindario en San Francisco. Tiene la siguiente distribución por edad:

  • CensusAgePercent0To4: 7.3%
  • CensusAgePercent5To9: 3.5%
  • CensusAgePercent10To: 3.2%

... (omitiendo un poco, ya que probablemente entiendas la idea) ...

  • CensusAgePercentOver85: 1.5%

Si obtuvo una dirección IP que rastreó a ese grupo de bloques censales, agregaría cada uno de esos porcentajes (como una fracción de 0 a 1) a sus contadores (suaves) para esos rangos de edad. (Un contador blando es solo un contador que permite recuentos no enteros).

Podrías hacer lo mismo con la raza, el género, el nivel de ingresos, el valor de la casa, etc.

Este método también tiene prejuicios, desde luego, ya que supone que todas las personas de un grupo de bloques dado tienen la misma probabilidad de visitar su sitio. Pero es algo que puede hacer en su propio sitio, no solo Google y Alexa, y aún le daría una idea relativa de quién visita su sitio si sus cuentas blandas en una categoría determinada son más altas que el promedio nacional en ese categoría.

También es posible que una técnica más sofisticada que conteos directos simples pueda conducir a un resultado mucho más rico.


Alexa obtiene su información de las barras de herramientas del navegador que instala a propósito o como parte de un paquete con algún software. Hace preguntas para comprender los parámetros demográficos y también rastrea los sitios que visita. Si sabe que el 80% de los visitantes del sitio son mujeres y tiene un nuevo visitante que visita este sitio, puede pensar que hay una gran probabilidad de que esta persona sea una mujer. Si conoces muchos sitios que visita esta persona, puedes adivinar mucho.

Pero como http://netberry.co.uk/alexa-rank-explained.htm dice que puede confiar únicamente en la información de Alexa TOP100,000 porque entonces Alexa tiene suficiente información de una pequeña cantidad de usuarios que visitan estos sitios. Dicen "millones", pero es una pequeña parte del total