Bien, lo que entiendo es que desea obtener la imagen del artículo principal de esa página. AFAIK, no hay ninguna API o algoritmo para hacer eso, pero hay muchas herramientas que puede usar para lograr esto.
Básicamente, lo que está tratando de hacer es raspar la página web. Hay muchas herramientas para eso, pero hablaré sobre Scrapy: un marco de raspado y rastreo web rápido y potente (porque he usado esto).
En primer lugar, debe encontrar un selector para el elemento que desea raspar. Los selectores pueden ser Xpath o CSS. Si profundiza en la fuente del enlace que proporcionó, verá que la imagen principal se encuentra debajo de una etiqueta de ‘sección’ con ‘id = headline’ y una etiqueta de ‘enlace’ con ‘class = head-img’. (Esta es una manera CSS de hacer las cosas. Xpath es más complejo pero más robusto). Después de llegar a la imagen, debe rasparla / descargarla. Los términos (raspar, descargar) tienen diferentes significados en diferentes herramientas. Incluso podrían llamarse algo completamente diferente.
- Marcos de aplicaciones web: ¿Por qué a la gente ya no le gusta Struts 2? ¿Qué funciona mejor y por qué?
- ¿Es posible poner una aplicación Rails en Salesforce AppExchange?
- ¿Meteor sería una gran opción para construir una red social como Instagram?
- ¿Por qué el servidor Tomcat no actualiza el contenido HTML en una aplicación web de servlet cuando se realizan cambios?
- ¿Dónde puedo obtener más información sobre la implementación del lanzamiento de la aplicación?
Nunca encontrará un método generalizado para hacerlo porque cada página web tiene un diseño diferente y, por lo tanto, una ruta diferente (Xpath / CSS). Tendrá que escribir tales funciones para cada sitio web que desee raspar.
Espero que esto ayude. 🙂