¿Cómo hace YouTube un seguimiento de todos los videos que te gustaron?

No, tienes bastante razón. Cada vez que te gusta algo, se registra en su base de datos. Es seguro que es una gran base de datos, pero la cuestión es que Google tiene algo así resuelto.

Además de sus técnicas de optimización, como podrían hacerlo para que sus favoritos se almacenen en el servidor más cercano a su ubicación, y solo se copien a otro servidor si se mueve, por ejemplo, también tienen los recursos masivos de hardware necesarios para administrar esto.

Estamos hablando de los tipos que esencialmente administran la mayoría del tráfico de Internet del mundo, a través de su navegador, motor de búsqueda, DNS y otros servicios como YouTube. Tienen equipos de cien personas que trabajan en la creación, administración y monitoreo de los sistemas que administran estas bases de datos y otros servicios. Sin mencionar las docenas de ingenieros que trabajan en la optimización de estas bases de datos, los procesos y la red. Hay una buena razón por la que Google carga tan rápido.

Estoy seguro de que hay algunas personas de Google aquí con una mejor respuesta. Pero mientras tanto, mira esto: https://www.google.com/about/dat…

Si vino y se entrevistó en Google / SRE, podríamos hacerle esta misma pregunta (o tal vez algo similar). Supongamos que youtube tiene 500 millones de usuarios activos diarios. Digamos también que, en promedio, cada usuario hace clic en el botón Me gusta en 5 videos al día. Por último, supongamos que cada valor está representado por un uuid.

(descargo de responsabilidad completo: trabajo en Google, pero no tengo idea de cómo está diseñado YouTube, solo estoy inventando cosas aquí)

Sabemos que un uuid tiene un tamaño de 32 bytes. Entonces, resolviendo las matemáticas, eso termina siendo:

500 * 10 ^ 6 * 5 * 32 / (2 ^ 30) = 74.506 GiB / día

Solo para grabar los me gusta de video agrega ~ 75G de almacenamiento al día (asumiremos una base de datos eficiente). En un año, se requieren ~ 27T recurrentes de almacenamiento. Entonces, la pregunta es … en el lapso de un año, ¿son 27T de almacenamiento mucho? No.

Hoy puedo comprar discos de 8TB. Entonces, incluso agregando un poco de sobrecarga, todo lo que necesito hacer es comprar 4 discos duros físicos adicionales al año y encontrar un lugar para servirlos. ¿Eso parece difícil? No.

… Por supuesto, hablando de manera realista, hay muchas otras consideraciones que deben hacerse, como: latencia, consistencia global, tolerancia a fallas, mantenimiento, etc.… Pero, en términos de su pregunta planteada, esto podría parecer mucho , pero de hecho es una cantidad de datos bastante trivial.

Entonces, en una empresa como Google, ¿cuántos son muchos datos? Bueno, ve a buscar una insignia y ven a hablar conmigo :). Hay una especie de broma en Google: es posible que escuches una SRE de vez en cuando se ríe “… ¿esta cifra está en gigabytes?” Olvidé incluso contar tan bajo ”.

(de nuevo, no tengo idea de cómo funciona realmente YouTube)

Se almacenan unos pocos datos pequeños. Su identificación de usuario, la identificación del video, la carpeta y la fecha. Eso es todo. No estoy seguro de si hay más metadatos, pero no es un registro muy largo.