Discovery Engines: ¿Cómo puedo construir un sitio como StumbleUpon?

Déjame dividir en partes lo que necesitas lograr antes de continuar.

  1. El primero será obviamente un rastreador. Tendrá que rastrear el sitio web e indexarlos de la forma que desee. El manejo de datos tan grandes también es un requisito que se debe tener en cuenta. Siga la regla de la amabilidad, es decir, los sitios de rastreo que le permiten rastrear.
  2. Después del rastreo, será necesario que etiquete los sitios web de acuerdo con su contenido, básicamente categorías de ciencias, deportes o cosas aleatorias, etc.
  3. Luego vendrá la parte en la que deberá seleccionar aleatoriamente un sitio web de su base de datos, ya sea explícitamente al azar o en una categoría que el usuario haya especificado. Lo cual creo que será fácil una vez que pueda filtrar el contenido según las categorías.
  4. Y luego, en su sitio web, puede mostrar el sitio web que ha elegido su proyecto.

La implementación de un rastreador lo suficientemente rápido será un poco difícil. El manejo de la gran cantidad de datos definitivamente será un problema y, en última instancia, el etiquetado será una tarea totalmente diferente a medida que las personas realizan investigaciones sobre cómo etiquetar el contenido.

Nota: No es necesario almacenar el contenido de un sitio web. Todo lo que necesitas es la URL y las etiquetas para el sitio web.

More Interesting

¿Cuáles son los idiomas necesarios para desarrollar un sitio web?

¿Qué parte de una pila de tecnología es la más difícil de cambiar, similar a lo que le sucedió a Facebook en PHP?

¿Por qué PHP y sus marcos y paquetes asociados se consideran defectuosos en comparación con otros marcos como node.js?

¿Existen cursos o libros completos en línea sobre Node.js y Express TDD (Test Driven Development)? ¿Está usando Mocha, Chai, Supertest lo suficiente?

¿Cuál es el mejor costo efectivo para una empresa de diseño web en Qatar?

Cómo depurar un problema de JavaScript que no se puede volver a crear

¿Debo ir por Ruby on Rails o por Meteor JS?

¿Qué debo aprender o hacer después de conocer los conceptos básicos de jQuery?

¿Cuándo es apropiado usar un enlace "Diseñado por" en el pie de página de un sitio web que ha creado?

¿Cuántos botones hay en un cuadro de alerta de JavaScript?

Cómo volver a la programación (el desarrollo web para ser precisos) después de trabajar fuera del campo de TI durante 4 años

¿Qué es el desarrollo de Joomla? ¿Dónde puedo obtener este servicio?

¿Existe una alternativa de BitBucket donde los creadores del código puedan compartir su repositorio con otros desarrolladores y les permita editar / agregar código, pero no copiar / pegar el actual?

¿Cuál es la mejor manera de abrir un proyecto de código abierto?

¿Puedo editar el código HTML con WordPress.com o tengo que alojarlo en otro sitio y usar WordPress.org?