Jesús López Fidalgo, matemático: “Se puede manipular usando datos de manera perversa, pero es más fácil hacerlo sin ellos”


En la guerra de Crimea morían más soldados por las malas condiciones sanitarias que en el campo de batalla. Lo demostró a partir de la estadística la dama victoriana Florence Nightingale (Florencia, 1820-Londres, 1910), considerada la precursora de la enfermería moderna. Es un ejemplo histórico de cómo el mundo de los datos está presente en todas las actividades de la vida para salvarla, facilitarla, entenderla o dirigirla. Mucho más allá de los algoritmos que marcan las redes sociales o nos llevan de compras, los macrodatos hacen posible el mundo actual. Diseñan redes de tuberías, aportan eficacia a procesos industriales, distribuyen el tráfico o el flujo de turistas o están detrás del primer mensaje que leemos cada mañana en el móvil o de la primera luz encendida. La lista es interminable. “En un solo día”, según Rafael Pardo, director de la Fundación BBVA, “se genera hoy tanta información como de manera agregada en los cinco milenios desde el despegue de la escritura”.

El pasado miércoles se entregaron los primeros premios Sociedad de Estadística e Investigación Operativa (SEIO)-Fundación BBVA, que reconocen las aportaciones más innovadoras de la investigación realizada en España en este campo. Los galardonados han aplicado la ciencia de los datos al ámbito sanitario, al energético, a la industria e incluso a detectar violencia machista desapercibida. Jesús López Fidalgo, leonés de 58 años, presidente de la SEIO y director del Instituto de Ciencia de los Datos e Inteligencia Artificial de la Universidad de Navarra, advierte: “La estadística y la investigación operativa, con sus modelos y algoritmos, están, como el aire, en todos los sitios, aunque no los veamos”.

Pregunta. ¿Los algoritmos gobiernan nuestro mundo?

Respuesta. Están presentes en nuestro actuar diario. Aunque no nos demos cuenta, hay muchas decisiones que tomamos de modo automático, sin pensarlo mucho, pero haciendo uso de un algoritmo sencillo. Por ejemplo, cuando uno va al supermercado y, en el momento de pagar, evalúa sin en la fila precedente hay personas con más o menos productos o si son mayores o jóvenes. Casi sin querer, aplicamos un modelo estadístico para tomar esa decisión. Si esto lo trasladamos a problemas más complejos que elegir entre tres filas en un supermercado, necesitamos la ayuda de los ordenadores y de modelos estadísticos más sofisticados.

P. Los premios de la sociedad que preside y la fundación BBVA abarcan el uso de datos en todos los aspectos de nuestras vidas.

R. La estadística y la investigación operativa, con sus modelos y algoritmos, están, como el aire, en todos los sitios. Aunque no los veamos, están ahí cuando usamos el móvil, cuando abrimos una aplicación o buscamos en Google.

P. Además de gobernar nuestro presente, ¿pueden predecir el futuro?

R. De hecho, es una parte importante de la modelización: tratar de predecir. No es saber qué me va a ocurrir mañana, sino más bien hacer predicciones generales, por ejemplo, para ayudar a los gobernantes a tomar una decisión u otra pensando en un bien general.

El poder de los datos depende, en buena medida, de lo que nosotros les dejemos hacer

P. ¿Y podrán llegar los algoritmos a condenar en un juicio o determinar una posible reincidencia?

R. El poder de los datos depende, en buena medida, de lo que nosotros les dejemos hacer. Aquí se plantean problemas éticos muy importantes y que yo diría que no están totalmente resueltos porque esto va demasiado rápido. Los juristas van un poco a rastras y quienes trabajan en cuestiones éticas, también. Pero insisto en que, en buena medida, los datos hacen lo que nosotros les dejamos hacer. Suelo decir que todo lo que puede hacer un ordenador lo podría hacer un humano siempre y cuando tuviera tiempo y memoria suficiente. La revolución de la informática nos permite hacer esos cálculos y tomar decisiones de forma muy rápida, pero hay un problema filosófico para el que es difícil dar una respuesta. Un coche de conducción autónoma puede tomar decisiones que, a lo mejor, nosotros no hubiéramos tomado. Este es un ejemplo de cómo los datos nos pueden llevar hacia donde no queremos ir. Pero la responsabilidad humana va a estar ahí siempre.

P. Porque los números no tienen moral.

R. Efectivamente. De hecho, los llamados algoritmos sesgados llevan a decisiones poco deseadas como, por ejemplo, la contratación de una persona en función de un género determinado. Al final, basta investigar un poco y entrar en las tripas del algoritmo para darnos cuenta de que no está haciendo otra cosa que lo que la sociedad hace: si la sociedad es sexista, tomará una decisión con ese sesgo. De eso aprendemos y estamos tratando de desentrañarlo, desde el punto de vista matemático, para explicar por qué toman unas decisiones y no otras.

Los llamados algoritmos sesgados llevan a decisiones poco deseadas como, por ejemplo, la contratación de una persona en función de un género determinado

P. Algunos ejemplos hacen dudar de la ciencia de los datos, como las encuestas electorales o muchos de los modelos de predicción de la pandemia, que se han demostrado erróneos.

R. Lo primero que hay que decir es que, cuando interviene el factor humano, hacer predicciones es muy difícil porque somos bastante impredecibles. Cuando se trata de procesos físicos es más fácil. Saber cómo va a evolucionar un tumor o cómo se va a comportar una máquina es, hasta cierto punto, sencillo. Pero, cuando interviene el factor humano, la cosa se complica muchísimo. Además, cualquier resultado que se publica de unas encuestas electorales influye después en el voto. Podríamos decir que un sondeo muestra la opinión de los electores en el momento en el que se hizo, pero luego cambia por el propio sondeo o por otros motivos. Aunque no me gusta el verbo, es importante cocinar los datos. No significa manipular sino hacer retoques en unas estimaciones para corregir la falta de representatividad de una muestras, de modo que se ajusten mejor a la realidad. Sobre la covid, ha habido un problema fundamental con la calidad de los datos. No hay que echarle las culpas a nadie. Es simplemente que nos ha pillado de repente. La prioridad ha sido curar a las personas y prevenir más que recoger datos de calidad ante algo desconocido y tan novedoso cómo ha sido la pandemia en un mundo globalizado y con una movilidad como no ha habido nunca en la historia. Todos nos hemos visto desbordados, muy en espacial lo sanitarios y los que debían tomar las decisiones.

Cuando interviene el factor humano, hacer predicciones es muy difícil porque somos bastante impredecibles. Cuando se trata de procesos físicos es más fácil

P. ¿Los datos nos pueden manipular?

R. Es muy fácil manipular con datos utilizando modelos estadísticos o algoritmos de optimización de una manera perversa. Pero es más fácil manipular sin datos. Mientras haya datos, algo podemos hacer, pero sin ellos podemos manipular lo que nos dé la gana.

P. ¿Para entender a Dios hay que estudiar estadística, como decía Nightingale?

R. Lo que está claro es que nos ayuda a conocer mejor el mundo, la naturaleza y cómo funcionan las cosas. Ella era una persona muy creyente y se dedicó a la enfermería y a la estadística. Lo que venía a decir es que, si queremos entender por qué Dios ha hecho este mundo y por qué lo ha hecho de esta manera, la estadística nos puede ayudar.

Nightingale decía que, si queremos entender por qué Dios ha hecho este mundo y por qué lo ha hecho de esta manera, la estadística nos puede ayudar

P. También recurre a George Box, que decía: “Cuanto más trabajo más suerte tengo”

R. Picasso decía también que la inspiración siempre le pillaba trabajando. Uno puede pensar que llega paseando por el jardín o en el metro, pero la inspiración viene trabajando, muchas veces, en cosas que no tienen una aplicación clara de modo inminente.

P. Por lo tanto, el azar no existe, como se titula su libro.

R. Este título viene de un pequeño enfado porque se negaban a poner estadística en el título y dije: ‘pues pon El azar no existe’. Es el comienzo de la famosa frase que se atribuye a Einstein y que sigue: ‘Dios no juega a los dados’. La clave es que quien trabaja, al final, tiene su recompensa y que, cuando las cosas se estudian, se van entendiendo mejor y lo que antes llamábamos azar ahora somos capaces de explicarlo.

P. ¿La estadística no tiene efectos adversos?

R. Un ejemplo serían las compañías de seguros, que han utilizado mucha estadística siempre porque, cuánto mejor conocemos qué le puede ocurrir a una persona, mejor podemos predecir la probabilidad de que vaya a tener un episodio que a la compañía le suponga un coste alto. Esto lleva a que a muchas personas no se les haga el seguro. En España tenemos la ventaja de tener un sistema de salud universal, pero en otros países, como Estados Unidos, a veces, se dan situaciones terribles de falta de atención por no tener seguro. Está muy bien que la compañía de seguros haga la estadística para ajustar sus primas, pero debe prevalecer el principio de solidaridad para, entre todos, poder ayudar a alguien que lo necesita.

Nuestros datos sirven para alimentar los modelos. Lo perverso es que se utilicen en nuestra contra, pero ahí no interviene la estadística

P. También tiene efectos positivos…

R. Hay que destacarlos por encima de todo. Cuando hay quejas por un supuesto control permanente, hay que tener en cuenta que nuestros datos sirven para alimentar los modelos. Lo perverso es que se utilicen en nuestra contra, pero ahí no interviene la estadística, que es una ciencia de la población, no del individuo, aunque luego repercute en el bien de cada uno. Hay una cuestión legal y ética muy importante, evidentemente, pero no es consecuencia de la de la estadística.

P. Puede ser una herramienta o un arma.

R. Sí. Una vez más, es determinante la capacidad humana de utilizar eso de una manera o de otra.

P. Está claro que es una ciencia en auge porque en matemáticas no hay paro.

R. Nunca lo hubo. Últimamente tenemos más alumnos en las carreras de matemáticas y estadística, pero no lo suficiente y tenemos un problema muy importante porque no llegan demasiados a nuestras titulaciones, a pesar de que últimamente sí que ha habido un bum. Tenemos también el problema adicional de que no tenemos gente suficiente para formarlos. Además, apenas se explica la estadística y la investigación operativa en la enseñanza no universitaria y eso tiene consecuencias a la hora de elegir carrera. Es muy difícil que alguien elija algo que desconoce. En Secundaria y Bachillerato apenas se ensaña la estadística, salvo excepciones, y así resulta difícil hacerla atractiva. También son profesionales de otras áreas los que acaban dando esta formación y creo que un estadístico siempre podrá enseñar esta ciencia con más entusiasmo. Además, lo que no se evalúa se devalúa y en términos prácticos se podría decir que la estadística apenas se evalúa en las pruebas de acceso a la universidad. Es una cuestión esencial. Tenemos un concurso que se llama Incubadora de sondeos y experimentos dirigido a los profesores y a los alumnos y es increíble lo que son capaces de hacer los chavales incluso de primero de la ESO cuando se les da la oportunidad.

Puedes escribirnos a rlimon@elpais.es, seguir a EL PAÍS TECNOLOGÍA en Facebook y Twitter y apuntarte aquí para recibir nuestra newsletter semanal

Contenido exclusivo para suscriptores

Lee sin límites




Source link