Cómo hacer un hash de un sitio web y comparar los cambios en Android

¿Qué quieres decir con “cambios”?

Si simplemente “hash un sitio web” (¿te refieres a la fuente HTML de una página?), Entonces puedes encontrarte con un par de problemas:

  • contenido / etiqueta de JavaScript (por ejemplo, la visualización de anuncios) que es irrelevante para el “contenido real” (el que le interesaría a un lector)
  • el contenido que se señala a través de una uri puede cambiar aunque la uri sea la misma. Por ejemplo, imágenes, iframes. Debería obtener al menos el HEAD de estos recursos y verificar si cambiaron
  • contenido dinámico, por ejemplo, los productos recomendados. Puede que no implique necesariamente un cambio, pero a todos los efectos el HTML es diferente.

Lo que quiero decir es que, en esencia, no es un problema fácil de resolver dependiendo de lo que quiere decir con “cambio”. Si no le importa nada de lo anterior, tome el html del sitio (por ejemplo, con una solicitud http) y páselo a través de cualquier función de hash. Si el hash cambia la próxima vez que yo haga eso, significa que cambió.

¿Desea simplemente notificar que algo ha cambiado o desea notificar lo que ha cambiado?

Si es el primero, utilice ¿Cómo genero un resumen MD5 para una página web?

Para esto último, use los algoritmos Editar distancia.