La privacidad no es un bloqueador para el acceso de investigación "significativo" a los datos de la plataforma, dice el informe

La privacidad no es un bloqueador para el acceso de investigación “significativo” a los datos de la plataforma, dice el informe

Los legisladores europeos están considerando requisitos de transparencia vinculantes para las plataformas de Internet en una Ley de Servicios Digitales (DSA) que se redactará a finales de año. Pero la cuestión de cómo crear estructuras de gobernanza que brinden a los reguladores e investigadores un acceso significativo a los datos para que las plataformas puedan ser responsables del contenido que amplifican es compleja.

Los esfuerzos de las plataformas para abrir sus archivos de datos a los ojos externos se han marcado, por decir lo menos. En 2018, Facebook anunció la iniciativa Social Science One, diciendo que proporcionaría a un grupo selecto de académicos acceso a aproximadamente un petabyte para compartir datos y metadatos. Pero pasaron casi dos años antes de que los investigadores tuvieran acceso a cualquier información.

“Esta fue la cosa más frustrante en la que he estado involucrado, en mi vida”, dijo uno de los investigadores involucrados a Protocol a principios de este año, después de pasar unos 20 meses negociando con Facebook sobre exactamente lo que lanzaría.

La API de archivos de anuncios políticos de Facebook también ha frustrado a los investigadores. “Facebook hace que sea imposible obtener una imagen completa de todos los anuncios que se ejecutan en su plataforma (que es exactamente lo contrario de lo que dicen estar haciendo)”, dijo Mozilla el año pasado, acusando al gigante tecnológico de lavar la transparencia.

Mientras tanto, Facebook señala las regulaciones europeas de protección de datos y los requisitos de privacidad adjuntos a su negocio luego de las intervenciones de la FTC de los EE. UU. Para justificar el minucioso progreso en el acceso a los datos. Pero los críticos argumentan que esto es solo un escudo cínico contra la transparencia y la rendición de cuentas. Además por supuesto nEn primer lugar, una de estas regulaciones impidió que Facebook tomara los datos de las personas.

En enero, el principal regulador de protección de datos de Europa escribió una opinión preliminar sobre la protección de datos y la investigación que advirtió contra tal protección.

“Las obligaciones de protección de datos no deben ser malversados ​​como un medio para que los jugadores poderosos escapen de la transparencia y la responsabilidad”, escribió el SEPD Wojciech Wiewiorówski. “Por lo tanto, los investigadores que operan dentro de los marcos de gobernanza ética deberían poder acceder a la API y otros datos necesarios, con una base legal válida y sujetos al principio de proporcionalidad y garantías adecuadas”.

Tampoco es Facebook el único delincuente aquí, por supuesto. Google se marca a sí mismo como un “defensor de la privacidad” debido a lo apretado que mantiene el acceso a los datos de los usuarios, mediando en gran medida los datos que libera en áreas donde dice “transparencia”. Mientras que, durante años, Twitter despreciaba rutinariamente los estudios de terceros que buscaban comprender cómo fluye el contenido a través de su plataforma, diciendo que su API no proporcionaba acceso completo a todos los datos y metadatos de la plataforma, por lo que la investigación no pudo mostrar la imagen completa. Otro escudo conveniente para evitar la responsabilidad.

Más recientemente, la compañía ha hecho algunos ruidos alentadores a los investigadores, actualizando su política de desarrollo para aclarar las reglas y ofreciendo un conjunto de datos relacionados con COVID, aunque los tweets incluidos siguen siendo seleccionados. Por lo tanto, la mano mediadora de Twitter permanece en la caña de la investigación.

Un nuevo informe de AlgorithmWatch busca lidiar con el problemático problema de las plataformas que evaden la responsabilidad mediante la mediación del acceso a los datos, sugiriendo algunos pasos concretos para brindar transparencia y reforzar la investigación, incluso inspirándose en cómo se media el acceso a los datos médicos, entre otras estructuras de gobierno discutidas .

El objetivo: acceso de investigación “significativo” a los datos de la plataforma. (O como dice el título del informe: Operacionalización del acceso a la investigación en el gobierno de la plataforma: ¿qué aprender de otras industrias?)

“Tenemos reglas estrictas de transparencia para permitir la rendición de cuentas y el bien público en muchos otros sectores (alimentos, transporte, bienes de consumo, finanzas, etc.). Definitivamente lo necesitamos para las plataformas en línea, especialmente en COVID-19 veces, donde dependemos aún más de ellas para el trabajo, la educación, la interacción social, las noticias y el consumo de medios “, dice el coautor Jef Ausloos a TechCrunch.

El informe, que los autores apuntan a los legisladores de la Comisión Europea mientras reflexionan sobre cómo configurar un marco efectivo de gobernanza de plataforma, propone marcos obligatorios de intercambio de datos con una institución independiente de la UE que actúa como intermediario entre las empresas que revelan y los destinatarios de los datos.

No es la primera vez que se debate un regulador en línea, por supuesto, pero la entidad que se sugiere aquí está configurada más estrictamente en términos de propósito que algunos de los otros supervisores de Internet que se proponen en Europa.

“Dicha institución mantendría infraestructuras de acceso relevantes, incluidos entornos operativos seguros virtuales, bases de datos públicas, sitios web y foros. También jugaría un papel importante en la verificación y el procesamiento previo de los datos corporativos para garantizar que sean adecuados para la divulgación ”, escriben en un resumen del informe.

Al seguir discutiendo el enfoque, Ausloos argumenta que es importante alejarse del “pensamiento binario” para romper el actual punto muerto de confianza del “acceso a datos”. “En lugar de este pensamiento binario de revelación versus opacidad / ofuscación, necesitamos un enfoque más matizado y en capas con diversos grados de acceso / transparencia de datos”, dice. “Este enfoque en capas puede depender de los tipos de actores que solicitan datos y sus propósitos”.

Sugiere que un propósito de investigación de mercado solo podría tener acceso a datos de muy alto nivel. Mientras que la investigación médica de las instituciones académicas podría tener un acceso más granular, sujeto, por supuesto, a requisitos estrictos (como un plan de investigación, aprobación de revisión de la junta ética, etc.).

“Una institución independiente intermediaria podría ser vital para facilitar esto y generar la confianza necesaria. Creemos que es vital que el mandato de ese regulador esté separado de las agendas políticas específicas “, dice Ausloos. “Debería centrarse en ser un facilitador de transparencia / divulgación, creando el entorno técnico y legal necesario para el intercambio de datos. Esto puede ser utilizado por las autoridades de medios / competencia / protección de datos / etc. para sus posibles acciones de aplicación “.

Ausloos dice que muchas discusiones sobre la creación de un regulador independiente para plataformas en línea han propuesto demasiados mandatos o competencias, por lo que es imposible lograr el consenso político. Mientras que una entidad más delgada con un mandato limitado de transparencia / divulgación debería ser capaz de atravesar objeciones ruidosas, es la teoría.

El infame ejemplo de Cambridge Analytica ciertamente tiene gran importancia sobre el espacio de “datos para la investigación”, es decir, la compañía de datos deshonrada que pagó a un académico de la Universidad de Cambridge para usar una aplicación para recolectar y procesar datos de usuarios de Facebook para la orientación política de anuncios. Y Facebook no ha pensado en convertir este escándalo de uso indebido de datos de la plataforma masiva en un palo para rechazar las propuestas regulatorias con el objetivo de romper sus tesoros de datos.

Pero Cambridge Analytica fue una consecuencia directa de la falta de transparencia, responsabilidad y supervisión de la plataforma. También fue, por supuesto, una falla ética masiva, dado que no se buscó el consentimiento para la orientación política de las personas cuyos datos se obtuvieron. Por lo tanto, no parece un buen argumento contra la regulación del acceso a los datos de la plataforma. De lo contrario.

Con los puntos de discusión tecnológicos de “instrumento contundente” que los gigantes de la plataforma interesados ​​en el debate sobre la gobernanza, el informe AlgorithmWatch ofrece matices de bienvenida y sugerencias sólidas sobre cómo crear estructuras de gobernanza eficaces para los gigantes de datos modernos.

En el punto de acceso en capas, el informe sugiere que el acceso más granular a los datos de la plataforma sería el más altamente controlado, en la línea de un modelo de datos médicos. “El acceso granular solo se puede habilitar dentro de un entorno virtual cerrado, controlado por un organismo independiente, como lo hace actualmente Findata [Finland’s medical data institution]”, Señala Ausloos.

Otra estructura de gobernanza discutida en el informe, como un estudio de caso del que extraer información sobre cómo incentivar la transparencia y, por lo tanto, permitir la rendición de cuentas, es el Registro Europeo de Emisiones y Transferencias de Contaminantes (E-PRTR). Esto regula los informes de emisiones de contaminantes en toda la UE y da como resultado que los datos de emisiones estén disponibles gratuitamente para el público a través de una plataforma web dedicada y como un conjunto de datos independiente.

“La credibilidad se logra al garantizar que los datos informados sean auténticos, transparentes, confiables y comparables, debido a la presentación de informes consistentes. Se aconseja a los operadores que utilicen las mejores técnicas de informes disponibles para lograr estos estándares de integridad, consistencia y credibilidad ”, dice el informe en el E-PRTR.

“A través de esta forma de transparencia, el E-PRTR tiene como objetivo imponer la responsabilidad de los operadores de instalaciones industriales en Europa ante el público, las ONG, los científicos, los políticos, los gobiernos y las autoridades de supervisión”.

Si bien los legisladores de la UE han señalado la intención de colocar requisitos de transparencia legalmente vinculantes en las plataformas, al menos en algunas áreas menos polémicas, como el discurso de odio ilegal, como un medio para obtener responsabilidad sobre algunos problemas de contenido específicos, han establecido simultáneamente un plan radical impulsar la economía digital de Europa impulsando la reutilización de datos (no personales).

Aprovechar los datos industriales para apoyar la I + D y la innovación es un elemento clave de las prioridades políticas de la Comisión impulsadas por la tecnología para los próximos cinco años, como parte de una ambiciosa agenda de transformación digital.

Esto sugiere que cualquier movimiento regional para abrir los datos de la plataforma es probable que vaya más allá de la responsabilidad, dado que los legisladores de la UE están presionando por el objetivo más amplio de crear una estructura de soporte digital fundamental para permitir la investigación a través de la reutilización de datos. Entonces, si los marcos de intercambio de datos respetuosos de la privacidad pueden integrarse, una estructura de gobernanza de plataforma diseñada para permitir el intercambio de datos regulados casi por defecto comienza a parecer muy posible dentro del contexto europeo.

“Permitir la rendición de cuentas es importante, lo que abordamos en el estudio de caso de contaminación; pero permitir la investigación es al menos igual de importante “, argumenta Ausloos, quien realiza investigación postdoc en el Instituto de Derecho de la Información de la Universidad de Amsterdam. “Especialmente considerando que estas plataformas constituyen la infraestructura de la sociedad moderna, necesitamos la divulgación de datos para comprender la sociedad”.

“Cuando pensamos en cómo deberían ser las medidas de transparencia para el DSA no necesitamos reinventar la rueda “, agrega Mackenzie Nelson, líder del proyecto del Proyecto de Plataformas de Gobierno de AlgorithmWatch, en un comunicado. “El informe proporciona recomendaciones concretas sobre cómo la Comisión puede diseñar marcos que salvaguarden la privacidad del usuario al tiempo que permite el acceso de investigación crítica a los datos de las plataformas dominantes”.

Puedes leer el informe completo aquí.


Source link