¿Cuáles son los buenos proyectos que uno puede hacer usando el web scraping?

Existen numerosos proyectos que se pueden construir a través del web scraping. Estos son algunos de los interesantes:

  • Indización de celebridades (según las menciones en los medios de comunicación y la participación en las redes sociales)
  • Sitio de noticias de solo texto (áreas de bajo ancho de banda bajo) donde agregaría fragmentos de noticias de sitios web que permitirían rastrear
  • Sitios web de comparación de precios que se actualizan en tiempo real

Hay muchos otros casos de uso también; echa un vistazo aquí – Casos de uso de rastreo web y estudios de casos.

El punto crucial a tener en cuenta aquí es que si su proyecto se basa completamente en los datos extraídos de la web, entonces es mejor ir con un proveedor de servicios de raspado web dedicado que pueda poseer completamente la tubería de adquisición de datos y mantener la continuidad del flujo de datos abordar cambios frecuentes en la estructura del sitio web.

Web Scraping es una de las cosas más divertidas para un novato en Python que realmente puede hacerte sentir increíble.

Algunos de los proyectos buenos y fáciles de llevar son:

  • Noticias : hay muchos sitios web. Puede raspar múltiples sitios y combinar los resultados. (He compartido script en mi blog, enlace a continuación)
  • Cricket : cricbuzz, cricinfo son algunos de los sitios más populares y completos. Puedes buscar registros, clasificaciones, horarios y puntajes. (También he compartido un script para esto en mi blog)
  • Canciones y gráficos : sitios de webscrape como Shawn y Gaana para extraer gráficos, canciones principales, etc. (Hice un guión en saavn y también lo compartí en mi blog)

Hay muchas más cosas para raspar web como

  • Fútbol : recoge puntuaciones, horarios y clasificaciones
  • Valores
  • Sitios de codificación : haga calendarios de codificación, bancos de preguntas y mucho más.
  • Sitios educacionales

Espero que disfrutes haciendo proyectos bajo web scraping.

Diviértete con Python.

P. S

Aquí está el enlace al blog donde comencé a compartir mis scripts de Python relacionados con la automatización, el raspado web y mucho más. A ver si eso te interesa.

Enlace del blog: Get Set Python

Enlace al canal de YouTube para ver la demostración de mis scripts de trabajo: Get Set Python

Si necesita ayuda, no dude en preguntar en los comentarios.

More Interesting

¿Cuáles son los aspectos positivos y negativos de trabajar como desarrollador web?

¿Es necesario que un desarrollador web aprenda el diseño de UI / UX?

¿Qué herramienta debo usar para el desarrollo web con Python?

¿Cómo obtiene datos appcomments.com, en particular las reseñas, de la tienda de aplicaciones de Apple?

¿Con qué frecuencia debe cambiar la contraseña en su base de datos?

¿Es factible publicar mi propio libro electrónico como un sitio web simple, omitiendo por completo a los editores?

¿Está bien usar RRHH en HTML?

¿Cómo funciona HARO? (funcionalmente)

¿Cuánto tiempo le llevará a un desarrollador web recrear Facebook.com? ¿Sería su versión de Facebook tan rentable como la real?

¿HTML5 dejará obsoletas las plataformas de aplicaciones empresariales móviles (MEAP) y otras herramientas de desarrollo multiplataforma? ¿El desarrollo de aplicaciones móviles en HTML5 es al menos tan rico en características / funciones como el uso de un MEAP? ¿Mejor?

¿Qué biblioteca PHP debo usar en el back-end de mi mini proyecto que será mejor que usar PHP simple sin ninguna biblioteca?

¿Cuáles son las principales diferencias entre Java 6 y Java 7?

¿Cuál es el diseño de la aplicación Spring MVC hibernate?

¿Cuál es la diferencia entre la forma de implementación de aplicaciones de Amazon OpsWorks en comparación con la forma de implementación de aplicaciones de Elasticbeanstalk?

¿Existe una alternativa de BitBucket donde los creadores del código puedan compartir su repositorio con otros desarrolladores y les permita editar / agregar código, pero no copiar / pegar el actual?