Si quisiera crear un sitio que comparara el precio de los lápices, ¿podría raspar legalmente sitios como Staples o Walmart para obtener precios diferentes?

No hay nada inherentemente ilegal en el raspado de datos puestos a disposición del público. Sin embargo, surgen complicaciones si ha firmado un acuerdo de usuario de algún tipo. Si ha acordado usar los datos que se le proporcionaron de cierta manera, especialmente cuando los datos son de propiedad exclusiva y los pagó con un contrato exclusivo, entonces será enormemente responsable del uso indebido de esos datos. Además, el riesgo legal (es decir, la consecuencia remunerativa / punitiva) aumenta dramáticamente si está tratando de obtener datos que tengan valor monetario para los propietarios.

Tenga en cuenta la advertencia y el descargo de responsabilidad en la parte inferior.

Déjame darte algunos ejemplos:

Usuario no exclusivo, sin acuerdo

Usted es un visitante que visitó un sitio web público y nunca tuvo que firmar un acuerdo de usuario que establezca el uso adecuado de los datos que desea raspar. En este caso, siempre que no haga nada para translacionar las leyes de derechos de autor que se aplican a ciertos tipos de análisis, debe tener la libertad de eliminarlas.

Usuario de firma de acuerdo no exclusivo

Usted es un visitante que visitó un sitio web público, sin embargo, para acceder a estos datos se le pidió que firmara un acuerdo de usuario. Incluso si los propietarios no parecen discriminar entre los usuarios a los que proporcionan acceso a los datos, si el acuerdo del usuario establece explícitamente que los datos no se pueden raspar o reproducir, entonces corre el riesgo de enfrentar acciones legales. Si no se está causando ningún daño monetario a los propietarios de los que extrajo los datos, es posible que solo se arriesgue a ser expulsado del sitio sin motivos reales para otras acciones legales, pero los ingresos no realizados también son una cosa y podrían interpretarse libremente en un sala de justicia.

Usuario exclusivo, de firma de acuerdos y de pago

Este es un territorio peligroso. Los datos que está raspando son claramente valiosos como un dispositivo propietario y los propietarios seguramente lo notarán si el uso compromete su modelo de negocio.

La legalidad del raspado web se aborda mucho más a fondo aquí. Te animo a que sigas leyendo si estás haciendo algún webcraping serio.

Ética

Ahora que hemos hablado sobre el riesgo legal, considere la ética. Si promete utilizar los datos de cierta manera, no es ético hacer lo contrario. Si está socavando el valor de la propiedad de otros injustamente, esto también es un comportamiento poco ético. Sorpresa, sorpresa. Resulta que muchas de las leyes en esta área coinciden con consideraciones éticas comunes.

Lo anterior es relevante solo para los datos de precios y transacciones. Otra información raspada puede estar sujeta a muchas otras cosas como la ley de derechos de autor / patentes, la ley de difamación / calumnia, etc.

No tengo licencia para dar asesoramiento legal. ¡Debe consultar a un abogado si siente curiosidad por los mecanismos que están en juego aquí!