Bueno, si está satisfecho con Python, le sugiero que use un paquete llamado BeautifulSoup y html parser.
Puede declarar una variable y escribirla en particular en cualquier archivo
importar xlsxwriter
importar urllib
desde bs4 import BeautifulSoup
calcetín = urllib.urlopen (“dirección del sitio web”)
htmlSource = sock.read ()
sopa = BeautifulSoup (htmlSource, ‘html.parser’)
- ¿Cuál es la mejor manera de editar archivos remotos desde Emacs?
- ¿Puede NodeJS reemplazar Apache más Python o paquete de PHP?
- ¿Debería poder escribir mis propios frameworks o bibliotecas antes de usar uno?
- ¿Cómo creo un buen sitio web interactivo que pueda actualizar y publicar datos regularmente?
- ¿Cuáles son algunas opiniones en mi sitio web de crecimiento personal en abundantawakening.com?
En la variable de sopa puede tener todo el código del sitio web, principalmente el código HTML.
Si está intentando acceder a javascript, entonces necesita ver si JAVASCRIPT, luego intente encontrar el atributo src del archivo
Utilizando
soup.find_all("attribute")
Luego importe JAVASCRIPT
Nota : algunos sitios web pueden bloquear los datos de análisis
Solución no profesional: inspeccione haciendo clic derecho en el sitio web y expandiendo el atributo individual y copiando los datos.
Codificación feliz