Utilice una buena biblioteca de procesamiento de CSS (consulte http://www.crummy.com/software/B… por ejemplo en Python). Hay bibliotecas similares para la mayoría de los lenguajes de programación (en realidad, incluso hay algunas utilidades de línea de comandos para extraer datos específicos también.) Con una biblioteca de este tipo, puede determinar la ubicación exacta de los datos (por lo que señala el div exacto, en lugar de depender de expresiones regulares complejas, que son propensas a romperse y bastante engorrosas para escribir en muchas ocasiones). , especialmente cuando se trata de HTML).
Además, si usa un lenguaje de programación lo suficientemente alto, o más precisamente, uno en el que se escriben muchas de estas funciones de utilidad (Javascript y Python son las dos que me parecen tener más funciones de “ayuda” disponibles, pero apuesto a que Ruby, Java y la mayoría de Lisps también los tendrían) esencialmente puede pasar una cadena y hacer que se identifique como información de tiempo y convertirla en algún momento que pueda pasar a SQL.
Entonces, si fuera usted, haría esto en Python o Node.js si tuviera ganas de jugar con estos idiomas. Si realmente quisiera que funcionara rápido sin importar qué, probablemente sacaría algo en Go usando la biblioteca de selector de cascadia y lo refinaría una vez que tuviera algo funcionando.
- ¿Debo usar Java o Python para la codificación del lado del servidor al hacer sitios web?
- ¿Cuál es la mejor manera de desarrollar con éxito un sitio web y una aplicación para la adopción a gran escala?
- Si uno encuentra difícil el uso de CSS / HTML, ¿eso significa que nunca será un programador de C ++ exitoso en una empresa, dado que la gente dice que HTML es 'muy fácil' y que cualquiera puede aprenderlo?
- Cómo rotar una imagen en HTML
- ¿Quiénes son algunos de los mejores desarrolladores de Node.js en los Estados Unidos?