what taste recommendations recommendation movielens grouplens based recommendation-engine netflix

recommendation-engine - recommendations - taste io movies



¿Por qué es tan desafiante el Premio Netflix? (4)

Creo que se han escrito algunos artículos sobre esto, pero no sé dónde están en este momento, así que lo explicaré aquí.

Cuando las personas compran libros en Amazon (por ejemplo), tienden a comprar libros de un tipo específico, por lo que puede ser fácil sugerir otros libros del mismo tipo.

Con las películas, las personas pueden hacer lo mismo, sin embargo, las personas generalmente no se limitan a un solo género. Las personas pueden ver una variedad mucho más amplia de películas: horror, comedia, acción, romance, etc.

Predecir lo que te gusta de esos géneros puede ser difícil de predecir si solo has alquilado una película hasta ahora, y esa película es un drama.

Si alguien tuviera un motor de recomendación muy inteligente, Netflix podría beneficiarse enormemente. Creo que están buscando principalmente un motor que pueda recomendar cosas basadas solo en una o dos películas. Los nuevos clientes que no saben mucho sobre Netflix tienen más posibilidades de quedarse si encuentran las películas que les gustan desde el principio sin tener que buscarlas.

En mi opinión, ya tienen un motor de recomendaciones a la par con Amazon. Creo que están buscando mejorarlo aún más.

Acabo de leer el artículo reciente en Wired , tengo curiosidad: ¿qué hay en el Premio Netflix que es tan desafiante? Lo digo de la manera más sincera posible, solo tengo curiosidad por las dificultades planteadas por el concurso. ¿La mayoría de los motores de recomendación en general son difíciles de mejorar? Si es así, ¿por qué es eso? O, ¿es Netflix inusualmente difícil de mejorar, y si este es el caso, qué tiene de especial Netflix que hace que esto sea mucho más desafiante que, digamos, Amazon?


Los sistemas de recomendación sufren problemas que son difíciles de solucionar:

  • Arranque en frío : en un nuevo sistema o con un nuevo usuario, no hay suficientes datos para crear un modelo estadístico preciso para una recomendación.
  • Sesgo de calificación : si basa las recomendaciones en las calificaciones de los usuarios, los usuarios que califican a menudo influyen en los resultados hacia su gusto. Si usted es el tipo de persona que no le gusta el paso adicional de calificación, es posible que a las personas con gustos similares tampoco les guste la calificación, por lo que sus opiniones están excluidas de las recomendaciones.
  • Los elementos que no están calificados tienen menos probabilidades de ser calificados: si selecciona y, por lo tanto, califica, los artículos en función de sus calificaciones, los elementos que no se califican son menos visibles y tendrán dificultades para obtener las calificaciones que necesitan para afectar las recomendaciones. En la otra dirección, los elementos populares tienen más visibilidad, se califican más a menudo y, por lo tanto, desempeñan un papel más importante en las recomendaciones.
  • Sesgo temporal : las calificaciones de los usuarios cambian con el tiempo. Con los cambios a largo plazo, puede compensar agregando un elemento de tiempo a sus recomendaciones. Los cambios a corto plazo son más difíciles de arreglar. Después de una maratón de Chuck Norris , es más probable que otorgues altas calificaciones a las películas de acción. Al día siguiente, después de reclamar a Magnolias de acero , es posible que tenga un sesgo temporal contra las películas de acción.
  • Motivos variados: en los sistemas de recomendación basados en artículos , el libro de punto que compró para el cumpleaños de su tía sesgará sus recomendaciones (si no se toma el tiempo para decirle al sistema que no lo use). Puede dar a una película de niños malos una calificación alta porque a sus hijos les encantó.

Todos juntos, esto hace que los sistemas de recomendación sean difíciles de mejorar en el pasado. Un sistema con 80% de precisión parece excelente, pero está equivocado 1 de cada 5 veces. Esto los hace más problemáticos de lo que valen para algunos usuarios.


Porque NetFlix ya tiene un motor de recomendación realmente bueno. Si supieran cómo mejorarlo fácilmente, ya lo habrían hecho. Todo su modelo de negocio se basa en la venta cruzada de productos (películas) a los consumidores. El algoritmo de recomendación es realmente el núcleo de su negocio. Cuanto mejor funcione, más dinero podrán ganar.


Yo y mi colega tomamos parte en ello. No tengo una sólida formación en inteligencia artificial, pero los motores de recomendación requieren un conocimiento profundo de los algoritmos de literatura existentes como el muestreo de Gibbs, el método K, el vecino más cercano, etc. Utilizamos el muestreo de Gibbs y puedo decir que apestamos :) en comparación con lo que Netflix ya tiene.