Espere ver más recuperación de datos en línea, gracias a un fallo judicial malinterpretado

Espere ver más recuperación de datos en línea, gracias a un fallo judicial malinterpretado

Un tribunal de apelaciones de EE. UU., en un caso que involucra a LinkedIn, dictaminó recientemente que el raspado de datos de información visible públicamente no viola la Ley de Abuso y Fraude Informático.

Esta decisión, la toma de ZDNet está aquí, tiene un componente de realidad y un componente de percepción. En realidad, el fallo es deliciosamente estrecho y es poco probable que tenga mucho impacto legal. En cuanto a la parte de la percepción, aquí es donde los administradores web corporativos y sus colegas de TI probablemente sufran grandes dolores de cabeza. Lo mismo ocurre con los especialistas en marketing corporativo (pero la mayoría de ellos se lo merecen).

Realidad: La decisión no dice que el web-scraping de la competencia sea legal. Simplemente dijo que no estaba violando esa ley específica. Podría violar otras leyes penales y ciertamente algunas leyes civiles, pero el panel solo se pronunció sobre lo que se le presentó, como debería.

Pero la percepción de la mayoría de la gente, alentada por los titulares engañosos de que el tribunal ha dado luz verde legal a todos los scraping, es que la práctica ahora es legal y que los scrapers pueden proceder agresivamente. Aunque el tribunal no dijo tal cosa, es fácil predecir que impulsará un aumento en el rascado.

¿Cuánto aumento? Bueno, eso probablemente no será un gran aumento. ¿Por qué? Porque el tipo de personas que roban contenido rascando no son realmente respetuosos de la ley. No es como si hubiera un montón de vendedores que querían raspar pero sabiamente se contuvieron hasta que los tribunales dictaminaron sobre la legalidad del raspado.

Dicho esto, la mala interpretación de esta decisión alentará a los raspadores a raspar mucho más.

¿Qué puede y debe hacer TI? Dado que estas son generalmente páginas visibles públicamente, esto es un problema. Existen pocos métodos técnicos para bloquear raspadores que no causen problemas a los visitantes del sitio que la empresa desea.

Hace años, dirigí un medio que estaba dando un gran salto hacia el contenido premium, lo que ahora significa que los lectores tendrían que pagar por historias premium seleccionadas. Encontramos un problema. No podíamos permitir que las personas compartieran libremente contenido premium porque necesitábamos que las personas compraran esas suscripciones.

Esto significó que bloqueamos copiar y pegar y evitamos específicamente que alguien guardara la página como PDF. Pero esto significaba que estas páginas tampoco se podían imprimir. (Guardar en PDF es en realidad imprimir en PDF, por lo que bloquear las descargas de PDF significaba bloquear todas las impresoras). Solo pasaron unas pocas horas antes de que los nuevos suscriptores premium gritaran que pagaban por el acceso y que debían poder imprimir páginas y leerlas en casa. o en un tren. Después de que varios suscriptores amenazaron con cancelar sus suscripciones pagas, nos dimos por vencidos y restablecimos la capacidad de imprimir. (Y nuestros temores se confirmaron; los archivos PDF de nuestro contenido premium comenzaron a aparecer en todas partes).

Este dilema es similar a luchar con los esfuerzos de rascado. Y la mayoría de los usuarios de Internet concluirán rápidamente que simplemente aceptar raspadores es probablemente el mejor curso de acción.

Volviendo al caso de LinkedIn, diría que incluso citar la Ley de Abuso y Fraude Informático fue un argumento masivo y defectuoso de LinkedIn. Un mejor argumento, aunque quizás igual de improbable, sería la violación de los derechos de autor.

Los detalles de LinkedIn dificultan este argumento. A diferencia de los medios (como "Computerworld"), LinkedIn no paga dinero para crear contenido excelente. La abrumadora cantidad de contenido obtenido involucra lo que los clientes de LinkedIn escriben individualmente de forma gratuita. ¿Puede LinkedIn incluso afirmar sin rodeos que posee legítimamente toda la información de mi CV, que he publicado en mi página de LinkedIn?

Si LinkedIn me pagara por publicar comentarios y mensajes y detalles del historial de trabajo, tal vez eso podría afirmar la propiedad. Pero eso no es lo que hacen.

Sin embargo, ¿esperan los usuarios que el contenido que publican en LinkedIn solo aparezca en LinkedIn? Específicamente, ¿tienen estos usuarios expectativas realistas de permanecer en el lugar? Como muchos periodistas, a menudo he ido a una página de LinkedIn para verificar la información biográfica de una fuente o para verificar la información profesional de alguien para una columna o publicación que estoy escribiendo. ¿Alguien está cuestionando mi derecho a hacerlo?

¿Y dónde exactamente se debe trazar la línea sobre lo que constituye rascarse? ¿Hacer referencia a un título borrador? ¿Qué tal cuatro títulos anteriores de una persona, o 10? ¿O es información sobre más de 100 personas? Esto es un problema, porque si LinkedIn decide no preocuparse por las referencias de datos pequeños, compromete su capacidad para buscar referencias más grandes.

Aquí es donde entramos en el argumento del espacio público. Si publico algo sensible sobre mí en un foro público en un sitio de discusión importante, ¿tengo algún motivo para esperar privacidad? (En realidad, podría porque a nadie le importa lo que pienso, pero estoy divagando). Si hubiera querido que algo permaneciera en silencio, no lo habría hecho público.

Uno de los usos más interesantes de los periodistas con LinkedIn es examinar los detalles de la experiencia de alguien. ¿Por qué? Porque sabemos que muchos codificadores y otros talentos técnicos compartirán masivamente, detallando lo que han hecho en proyectos para su empleador, incluida mucha información muy confidencial sobre los sistemas en los que han trabajado, las aplicaciones compradas por su empleador e incluso los no anunciados. vulnerabilidades de seguridad que solucionaron.

La única acción legal es que sus empresas podrían despedirlos por filtrar información privilegiada. Pero el codificador que lo publicó no tiene pautas. Fue su elección.

En resumen, creo que todos podemos esperar más raspado y robo de contenido, y TI lamentablemente descubrirá que realmente no hay mucho que puedan hacer para detenerlo.

© 2022 IDG Communications, Inc.