Cómo copiar un texto de un elemento en HTML con Python

El primer paso es analizar HTML para obtener el texto. Python proporciona un analizador HTML. Eche un vistazo al ejemplo completo de la página de documentación oficial de Python.

desde HTMLParser importar HTMLParser

# crear una subclase y anular los métodos del controlador
clase MyHTMLParser (HTMLParser):
def handle_starttag (self, tag, attrs):
print “Encontró una etiqueta de inicio:”, etiqueta

def handle_endtag (self, tag):
print “Encontró una etiqueta final:”, etiqueta

def handle_data (self, data):
print “Encontró algunos datos:”, datos

# instanciar el analizador y alimentarlo con HTML
analizador = MyHTMLParser ()
parser.feed (‘ Prueba

¡Analízame!

‘)

También puedes usar BeautifulSoup.

desde bs4 import BeautifulSoup
html_doc = “” “

Hola mundo

” “”
sopa = BeautifulSoup (html_doc, ‘html.parser’)
print soup.div.name

El resultado sería Hello World.

Esta es una tarea que se aplica más a JavaScript que a Python. Puede lograrlo copiando el elemento .innerHTML.