¿Por qué es tan inútil el sistema de clasificación de Netflix? (Después de desplazarse por 100 títulos aleatorios, todos excepto uno estaban en el rango de 2.9 y 4.)

Supongo que está hablando de la “calificación promedio” de los usuarios y no de la calificación “Nuestra mejor estimación para XXX”.

Sin saber más acerca de su metodología, no sé cómo “se desplazó a través de 100 títulos aleatorios”, pero ciertamente puedo decir que el sitio web y la interfaz de usuario del dispositivo no son muestras “aleatorias”. Se seleccionan en función de una serie de factores predictivos y pueden representar un conjunto de muestras muy sesgado. Además, la interfaz de usuario generalmente muestra la predicción de lo que podría calificar la película en lugar de lo que otros usuarios calificaron. Esos dos valores generalmente no son lo mismo.

Hace unos años, Netflix publicó un conjunto de datos de capacitación para el Premio Netflix, un desafío para encontrar un mejor algoritmo de recomendación. El conjunto de datos de entrenamiento era representativo de datos reales. La distribución de calificaciones por parte de los usuarios es bastante normal, aunque un poco plana alrededor de 3-3.5. De lo contrario, se distribuye principalmente de 1.5-4.5. Hay un sesgo definitivo hacia calificaciones más altas. Gráfico a través de la distribución de errores de diferentes algoritmos.

Echemos un vistazo a la distribución de calificaciones de IMDB, parece bastante concentrada dentro de 2-9 … o normalizando eso a un sistema 0-5, 1-4.5. No es tan plano en el medio, pero parece tener la mayoría de las calificaciones en una banda estrecha. También hay una inclinación hacia calificaciones más altas. Gráfico a través de Mining gold de Internet Movie Database, parte 1: decodificación de clasificaciones de usuarios

En términos relativos, creo que los dos sistemas de calificación no son sustancialmente diferentes (aunque la escala 0-10 puede dar la apariencia de una mejor granularidad).

Así que por diversión, hice el mismo experimento y miré un montón de películas en IMDB y Netlfix. No puedo decir que IMDB parecía mejor “distribuido” que Netflix. Tampoco creo que IMDB haya sido más “preciso” cuando lo comparé con otras fuentes, como metacrítico.

Pero entonces, estoy bastante seguro de que el tamaño de mi muestra es demasiado pequeño para sacar conclusiones significativas y mi percepción sufre un sesgo de confirmación o simplemente un muestreo sesgado.

Desarrollo web

¿Qué preguntas le harías a un desarrollador web para estimar qué tan buena es?

¿Por qué los buenos programadores dicen que el framework ASP.NET es tonto?

¿Qué es el marco de desarrollo de Android?

¿Cómo funcionan los sitios web?

¿Cuál es mejor: un salario alto en una pequeña empresa o un pequeño salario en una gran empresa?

¿Qué debo elegir para hacer una comunidad educativa? ¿Qué CMS?

De hecho, no tengo ningún problema con el sistema de calificación de Netflix, excepto por una cosa:
Cada vez que el sitio de DVD de Netflix ‘me ofrece’ una película, siempre muestra cuántas estrellas / qué número de clasificación piensan los algoritmos que le daré, “Nuestra mejor suposición para XXX” en lugar de mostrar las calificaciones promedio.

Hago un muy buen trabajo al elegir películas que me gustarán, pero soy terrible al calificarlas. Un gran porcentaje de las calificaciones que he ingresado son 5 o 4 estrellas, con la calificación ocasional de 3 estrellas. Otorgo muy pocas calificaciones de 1 o 2 estrellas. En todo caso, mi lista de clasificación (481 títulos hasta ahora) es más un recordatorio para mí. Incluso he dejado de calificar películas debido a esto.

Desafortunadamente, mi escasez de calificaciones ‘negativas’ en el sitio de Netflix sesga por completo lo que Netflix ‘adivina’ lo que pensaré de una película. Esto significa que tengo que realizar varios clics adicionales para cada película que estoy considerando solo para ver cuáles son las calificaciones promedio de una película. De lo contrario, todo lo que se me muestra tiende a tener 3.9 a 4.9 estrellas imaginarias (sin sentido); es decir, basado en “Nuestra mejor suposición para XXX”

Al elegir películas, me encantaría que me muestren la calificación promedio de Netflix y luego verifico a los actores, directores y reseñas antes de agregar una película a mi lista. El número de estrellas en una calificación promedio me dice mucho . Estrellas imaginarias? Bien podría estar contando estrellas en el cielo … no es un indicador real de nada sobre las preferencias de películas

Entonces … en este punto, ¿qué tal una opción para mostrar las calificaciones promedio? Está bien si Netflix quiere sugerir películas basadas en algunos análisis potencialmente útiles de las calificaciones que he ingresado. Esa parte del sistema es útil y parece ser el resultado de un trabajo realmente bueno.

Si puedo ofrecer una sugerencia más (por si alguien que trabaja en Netflix está leyendo esto) … El control de calidad en DVD y BluRays siempre ha tenido algunos problemas importantes. Por ejemplo, acabo de recibir un DVD que obviamente estaba roto y comenzaba a deslaminarse antes del envío. Tenía muchas ganas de verlo el jueves por la noche, pero no pude porque estaba destrozado. Lo informó en el sitio web el jueves por la noche a las 8:30. Al día siguiente llamé y hablé con un representante y me dijeron “un reemplazo se enviaría el viernes”. Hizo planes para verlo esta noche solo para descubrir que aún no se ha enviado (‘envío el lunes’ por el sitio de Netflix).

He recibido discos maltratados varias veces que parecen haber sido completamente desmarcados. Realmente se puede saber cuándo los arañazos en la superficie transparente de un DVD van a interferir con la reproducción. Tener que dejar de ver una película a mitad de reproducción y pasar tiempo tratando de avanzar rápidamente más allá del daño solo para encontrar que el disco es una montaña rusa realmente NO lo convierte en una experiencia de visualización inmersiva.

Me doy cuenta de que se necesita cierto esfuerzo y tiempo para manejar los discos como parte de un proceso de control de calidad. Por otro lado, cualquier tipo de proceso automatizado que podría hacer un procesamiento de imagen de un disco (tal vez mientras gira una revolución) y luego volver a ponerlo en una funda podría potencialmente ahorrarle mucho dinero a Netflix en costos de envío y soporte, al tiempo que aumenta enormemente la satisfacción del cliente .

He sido cliente de DVD de Netflix durante mucho tiempo durante al menos 10 años y he estado extremadamente feliz en su mayor parte. Por otro lado, me veo obligado a perder el tiempo en “Nuestra mejor suposición para XXX” y, esencialmente, la tarea de hacer el trabajo de control de calidad de Netflix (no remunerado) realmente me molesta.

James Schek

No soy Nate Silver, pero me arriesgaría a suponer que las calificaciones podrían ser positivas si las personas calificaran las películas después de verlas y detestaran admitir que habían desperdiciado por completo 2 horas de sus vidas.

Garrick Saito

Supongo que es porque estás viendo los artículos, bueno, al azar . Intenta ordenar por los más valorados.