¿Se puede realizar la extracción de datos en cualquier sitio web o existen algunas restricciones?

En resumen, si los datos están disponibles públicamente y no hay restricciones explícitamente establecidas, entonces cualquier información es un juego justo siempre que cumpla con las reglas específicas de licencia de los datos, la ley de derechos de autor, los términos de servicio, etc.

Básicamente, si los datos están disponibles y los términos del servicio no le impiden usarlos, puede usarlos. Por ejemplo, puede iniciar una biblioteca de extracción de datos personalizada, apuntarla a los mapas de Google, luego comenzar a tomar cuadros de imágenes satelitales y datos de carreteras para crear su propio servicio de mapeo, ya que esos datos tienen derechos de autor, pero si desea apuntarlos en OpenStreetMap porque estás haciendo un proyecto de estadísticas sobre la longitud promedio de las carreteras en Estados Unidos, hazlo.

Otro ejemplo podría ser Quora. Si desea hacer una infografía de los tipos de preguntas formuladas en Quora, puede enviarla aquí para tomar una muestra de los títulos de las preguntas y luego ordenar los datos por si es una lata / qué / por qué / dónde / cómo / quién tipo de pregunta, etc.