Si tienes datos muy precisos y lo sabes todo de una persona, ¿entonces dónde queda su derecho a la privacidad?
 
Julián Salas Piñón, investigador mexicano, hace parte del grupo de investigadores del grupo K-riptography and Information Security for Open Networks (KISON), del Internet Interdisciplinary Institute (IN3) de la Universitat Oberta de Catalunya (UOC), y aunque vive actualmente en cataluña, mantiene un ojo puesto en la evolución del coronavirus en su país, al otro lado del Atlántico.
 
 
coronavirus hospital EEUU
 
En una situación de crisis sanitaria como la actual, herramientas como los macrodatos (big data) permiten a la administración obtener información muy sectorizada sobre la enfermedad, pero también implican poner en sus manos muchos datos privados. ¿Los macrodatos garantizan la privacidad de los pacientes al 100%?
Precisamente mi área de investigación sobre la privacidad tiene una dificultad: por un lado, la tecnología nos permite obtener cada vez más datos y, cuantos más datos obtengamos y más precisos sean, mejor funcionarán los algoritmos. Pero la privacidad va un poco en contra de este proceso. Si tienes datos muy precisos y lo sabes todo de una persona, ¿entonces dónde queda su derecho a la privacidad? La cuestión es saber usar los datos para la finalidad que nos interesa sin la necesidad de querer saber más de lo que necesitamos.
 
¿Se puede encontrar este equilibrio?
Sí. Por ejemplo, si quieres monitorizar la movilidad en una ciudad y saber cuánta gente se desplaza de un lugar a otro, no necesitamos saber todos los lugares en los que ha estado aquel vehículo antes de llegar al destino final. Basta con saber el punto de origen y el destino final. Uno de los últimos estudios que hemos llevado a cabo en la UOC consistía en obtener mapas de movilidad de personas sin tener las trayectorias individuales, porque estas trayectorias te pueden reidentificar.
 
¿Nuestro derecho a la protección de los datos personales puede ser un obstáculo ahora en la lucha contra el coronavirus?
A mí me parece que no, pero tal vez tendremos que esforzarnos más para poder utilizar los datos. Es decir, tendremos que aplicar algoritmos para colocarlos anónimos, en otras palabras, para eliminar la posibilidad de identificar a la persona titular de los datos antes de utilizarlos.
 
En China, los macrodatos han permitido implementar un sistema de control de la propagación del coronavirus, pero este sistema genera dudas sobre la violación de la privacidad. Una aplicación que puede descargarse mediante programas como WeChat, la red social más grande de China, permite que una base de datos central recopile datos sobre el movimiento y el diagnóstico de los ciudadanos y les otorga un código verde, que les permite circular libremente; naranja, que significa que tienen restringida la circulación en el ámbito local, o rojo, que les obliga a seguir la cuarentena. Esta aplicación hace una recopilación centralizada de las redes de contacto en tiempo real de los usuarios a partir de tres aspectos: la proximidad entre teléfonos móviles, la ubicación por GPS y el escaneo de códigos QR en la entrada y la salida de los edificios. Esta base de datos es analizada por un algoritmo de inteligencia artificial que genera los tres colores.
 
¿Sería viable hacer en cualquier país de América Latina lo que han hecho en China?
En principio, si das tu consentimiento, se pueden recoger este tipo de datos. Otra cosa es si hay que saber la localización de todos en todo momento. Un buen ejemplo de protección de la privacidad es la aplicación TraceTogether de Singapur, que detecta qué usuarios han estado cerca y guarda estos datos durante 21 días en el móvil del usuario, que solo los debe revelar si da positivo en coronavirus. De este modo, tan solo recoge la información necesaria durante el tiempo necesario y la revela sólo cuando es imprescindible.
 
¿La inteligencia artificial es una gran herramienta para anticiparnos a futuras nuevas epidemias? ¿Nos puede ayudar a prever tratamientos eficaces?
Mediante la inteligencia artificial aprovechamos las capacidades de los ordenadores para procesar enormes cantidades de datos y hacer modelos predictivos muy precisos. Los macrodatos pueden ser una herramienta para el bien común, pero todavía hay muchos retos por resolver, tales como garantizar los intereses de las empresas propietarias de los datos y al mismo tiempo hacer que los algoritmos sean transparentes y explicables.
 
Diferentes países están desarrollando aplicaciones para ver en dónde se concentran mayoritariamente los enfermos de coronavirus. ¿Esto no generará dudas en cuanto a la privacidad? 
La máxima privacidad es no recoger datos y la máxima utilidad es tener los datos de todos en todo momento. La cuestión es encontrar el equilibrio entre estos dos extremos. Nosotros intentamos desarrollar algoritmos en diferentes situaciones que nos puedan dar más garantías de privacidad y seguridad. No es necesario que tengamos todos los datos de alguien para poder reidentificarlo, mucha gente piensa que los datos son anónimos porque no tienen ni nombres ni apellidos, pero lo que realmente debería significar ser anónimo es que no se te pudiera reidentificar.
 
¿Los ciudadanos podemos estar seguros de que los datos que proporcionamos cuando, por ejemplo, nos registramos en un sitio web son anónimos?
Todo el mundo debería conocer esta historia: Una estudiante del Instituto de Tecnología de Massachusetts (MIT) logró identificar el registro médico del gobernador mediante tres parámetros: el código postal, el sexo y la fecha de nacimiento, a partir de una lista de registros que él mismo hizo pública porque pensaba que los datos eran anónimos porque no aparecían nombres ni apellidos.
 
¿Podemos evitar ser reidentificados, es decir, que nos pongan nombres y apellidos, a partir del análisis de bases de datos supuestamente anónimos?
Hay algoritmos que lo intentan proteger. Ahora bien, debemos ser conscientes de que esto tiene unos costes, en el sentido de que la protección de la privacidad nos hace perder precisión. Lo que ganas por un lado lo pierdes por otro. Pero me parece que tenemos que cambiar la perspectiva: es deseable obtener la máxima precisión posible, respetando siempre el derecho a la privacidad.
 
¿Cree que los ciudadanos somos conscientes de que dejar nuestros datos tiene un precio? ¿De qué registrarse en un sitio web implica que regalas información que luego se utilizará para hacer negocios?
No. Deberíamos ser conscientes de todos los datos que generamos con el ordenador, Facebook, Twitter, etc., de cómo se pueden utilizar y quién puede tener acceso. Puesto que muchas de estas acciones las hacemos en casa, tenemos la sensación de que lo que explicamos es privado, pero deberíamos saber dónde va a parar toda esta información y quién puede tener acceso. Cuando interactuamos con una página web o usamos las redes sociales, todo lo que hacemos queda almacenado.
 
¿Qué riesgos supone revelar nuestras ubicaciones?
Por ejemplo, con el GPS del móvil, podemos saber dónde vive una persona, donde está en cada momento del día, a qué hora sale de casa, dónde trabaja, qué intereses tiene, si ha pasado una época en la que ha tenido que ir con frecuencia en el hospital... Hay aplicaciones de móvil que te piden la ubicación. Entonces, todo el mundo que tiene esta ubicación tiene la posibilidad de saber qué haces en cada momento.
 
Estamos vigilados por todos lados. Todo esto da un poco de miedo...
Yo estoy a favor de los macrodatos, pero debe haber un límite: la privacidad de los usuarios. Las empresas que recogen datos deberían ser transparentes y explicar para qué las usan; debería ser posible auditar los algoritmos con los que las han protegido y nos deberían informar cuando nuestros datos han sido incluidos en una base de datos.
 
¿Cuál es el principal reto tecnológico para los expertos que trabajan en la anonimización de datos?
En el mundo hay cada vez más sensores, como los de los móviles o el internet de las cosas, y eso hace que cada vez sea más difícil mantener la privacidad. Nuestro reto, precisamente, es encontrar un equilibrio en el que se respete nuestro derecho a la privacidad con la utilidad de los datos. El otro reto es generar conciencia entre la gente...