Aquí hay una lista de las mejores herramientas de raspado web.
- Scraper: Scraper es una extensión de Google Chrome para extraer datos de páginas web y hojas de cálculo.
- Documentación de Beautiful Soup: para extraer datos de un sitio web. Es una biblioteca basada en Python llamada Beautiful Soup.
- Apache Tika – Apache Tika – Para extraer HTML y texto.
- feedparser: para analizar fuentes RSS y Atom.
- Servicios de raspado web – Raspe los datos del sitio web
- Usebobik: un raspador web basado en web.
- Secuencias de comandos del navegador web y pruebas web y raspado web de iOpus
- Programa macro, software de automatización de Windows. Software Macro y Grabadora Macro. Macro de Windows y software de automatización.
- ScraperWiki
- Un marco de código abierto de raspado web para Python
- El | CommonCrawl
- Rastreadores web personalizados, rastreo web potente y extracción de datos
- PhantomJS | PhantomJS
- Convextra | Extracción de datos web: inteligente para usar un potente raspado web.
- Software y servicios de extracción de datos.
Además de estas herramientas enumeradas, puede echar un vistazo a un tablero llamado
Herramientas de datos aquí en Quora.
- ¿Cuál es el peor software ERP con el que has trabajado?
- ¿Qué software se usa típicamente para hacer películas CGI?
- ¿Puedo desarrollar buenas aplicaciones / software simplemente estudiando programación en Khan Academy y usando Stack Overflow?
- ¿Cuáles son los mejores softwares contables para molinos de arroz disponibles en el mercado?
- ¿Cuáles son algunos programas similares a Trello pero con chat integrado?