database - ecommerce - google tag managerç
Base de datos de Google Analytics (4)
AFAIK Google Analytics se deriva de Urchin. Como se ha dicho, es posible que, desde ahora, Analytics sea parte de la familia de Google y esté utilizando MapReduce / BigTable. Puedo suponer que Google había integrado el antiguo formato de Urchin DB con el nuevo BigTable / MapReduce.
Encontré estos enlaces que hablan de Urchin DB. Probablemente algunas de las cosas todavía están en uso en este momento.
http://www.advanced-web-metrics.com/blog/2007/10/16/what-is-urchin/
esto dice:
[snip] ... aún utiliza una base de datos patentada para almacenar datos de informes, lo que hace que las consultas ad-hoc sean un poco más limitadas, ya que debe usar las herramientas desarrolladas por Urchin en lugar de las herramientas SQL más flexibles.
http://www.urchinexperts.com/software/faq/#ques45
¿Qué tipo de base de datos usa Urchin?
Urchin utiliza una base de datos de archivos planos patentada para el almacenamiento de datos de informes. La arquitectura de base de datos de alto rendimiento maneja sitios de mucho tráfico de manera eficiente. Algunos de los beneficios de la arquitectura de la base de datos incluyen:
* Small database footprint approximately 5-10% of raw logfile size
* Small number of database files required per profile (9 per month of historical reporting)
* Support for parallel processing of load-balanced webserver logs for increased performance
* Databases are standard files that are easy to back up and restore using native operating system utilitiesv
Más información acerca de Urchin
http://www.google.com/support/urchin45/bin/answer.py?answer=28737
Hace mucho tiempo solía tener un rastreador y en su sitio estaban discutiendo sobre la normalización de datos: http://www.2enetworx.com/dev/articles/statisticus5.asp
Allí puede encontrar un poco de información sobre cómo reducir los datos en DB y quizás sea un buen comienzo en la investigación.
¿Alguien sabe cómo se organizan los datos en Google Analytics? Difícil selección de grandes cantidades de datos que realizan muy, muy rápido, ¿qué estructura de base de datos es?
Muchos lugares y aplicaciones en la cartera de Google utilizan el algoritmo MapReduce para el almacenamiento y procesamiento de grandes cantidades de datos.
Consulte las Publicaciones de investigación de Google en MapReduce para obtener más información y también vea la página 4 y la página 5 de este artículo de Baseline.
Publicación de Google: Chang, Fay, et al. " Bigtable: un sistema de almacenamiento distribuido para datos estructurados " . Transacciones de ACM en sistemas informáticos (TOCS) 26.2 (2008):
Bigtable es utilizado por más de sesenta productos y proyectos de Google , incluidos Google Analytics , Google Finance, Orkut, Búsqueda personalizada, Writely y Google Earth.
Supongo que usan su '' Big Table ''