La información del modelo de IA ayuda a los astrónomos a proponer una nueva teoría para observar mundos lejanos

Los modelos de aprendizaje automático aumentan cada vez más los procesos humanos, ya sea realizando tareas repetitivas más rápido o proporcionando una visión sistemática que ayuda a poner el conocimiento humano en perspectiva. Los astrónomos de UC Berkeley se sorprendieron al descubrir que ambos ocurren después de modelar eventos de microlente gravitacional, lo que lleva a una nueva teoría unificada para el fenómeno.

La lente gravitacional ocurre cuando la luz de estrellas lejanas y otros objetos estelares se dobla alrededor de uno más cercano directamente entre él y el observador, brindando brevemente una vista más brillante, pero distorsionada, del más lejano. Dependiendo de cómo se doble la luz (y de lo que sepamos sobre el objeto distante), también podemos aprender mucho sobre la estrella, el planeta o el sistema alrededor del cual se dobla la luz.

Por ejemplo, un pico momentáneo en el brillo sugiere un cuerpo planetario en tránsito en la línea de visión, y este tipo de anomalía en la lectura, llamada “degeneración” por alguna razón, se ha utilizado para detectar miles de exoplanetas.

Debido a las limitaciones de observarlos, es difícil cuantificar estos eventos y objetos más allá de un puñado de nociones básicas como su masa. Y generalmente se considera que las degeneraciones caen bajo dos posibilidades: que la luz distante pasó más cerca de la estrella o del planeta en un sistema dado. Las ambigüedades a menudo se reconcilian con otros datos observados, como que sabemos por otros medios que el planeta es demasiado pequeño para causar la escala de distorsión observada.

El estudiante de doctorado de UC Berkeley, Keming Zhang, buscaba una manera de analizar y categorizar rápidamente tales eventos de lentes, ya que aparecen en gran número a medida que examinamos el cielo con más regularidad y con mayor detalle. Él y sus colegas entrenaron un modelo de aprendizaje automático con datos de eventos conocidos de microlentes de gravedad con causas y configuraciones conocidas, y luego lo liberaron en un montón de otros menos cuantificados.

Los resultados fueron inesperados: además de calcular hábilmente cuándo un evento observado caía dentro de uno de los dos tipos principales de degeneración, encontró muchos que no lo hacían.

“Las dos teorías anteriores de degeneración se ocupan de casos en los que la estrella de fondo parece pasar cerca de la estrella de primer plano o del planeta de primer plano. El algoritmo de IA nos mostró cientos de ejemplos no solo de estos dos casos, sino también de situaciones en las que la estrella no pasa cerca de la estrella o el planeta y no puede explicarse con ninguna de las teorías anteriores”, dijo Zhang en un comunicado de prensa de Berkeley.

Ahora, esto muy bien podría haber sido el resultado de un modelo mal ajustado o uno que simplemente no tenía la confianza suficiente en sus propios cálculos. Pero Zhang parecía convencido de que la IA había registrado algo que los observadores humanos habían pasado por alto sistemáticamente.

Como resultado, y después de un poco de convencimiento, ya que se tolera pero quizás no se fomenta que un estudiante de posgrado cuestione la doctrina establecida, terminaron proponiendo una nueva teoría “unificada” de cómo se puede explicar la degeneración en estas observaciones, de la cual las dos teorías conocidas eran simplemente los casos más comunes.

Diagrama que muestra una simulación de una solución de degeneración de 3 lentes.

Examinaron dos docenas de artículos recientes que observaban eventos de microlente y descubrieron que los astrónomos habían estado categorizando erróneamente lo que vieron como un tipo u otro cuando la nueva teoría se ajustaba a los datos mejor que ambos.

“La gente estaba viendo estos eventos de microlente, que en realidad exhibían esta nueva degeneración, pero simplemente no se daban cuenta. Realmente fue solo el aprendizaje automático que observaba miles de eventos en los que era imposible pasar por alto”, dijo Scott Gaudi, profesor de astronomía de la Universidad Estatal de Ohio y coautor del artículo.

Para ser claros, la IA no formuló ni propuso la nueva teoría, eso se debió completamente a los intelectos humanos. Pero sin los cálculos sistemáticos y seguros de la IA, es probable que la teoría simplificada y menos correcta hubiera persistido durante muchos años más. Así como las personas aprendieron a confiar en las calculadoras y las computadoras posteriores, estamos aprendiendo a confiar en algunos modelos de IA para generar una verdad interesante libre de ideas preconcebidas y suposiciones, es decir, si no hemos codificado nuestras propias ideas preconcebidas y suposiciones en ellos.

La nueva teoría y la descripción del proceso que conduce a ella se describen en un artículo publicado en la revista Nature Astronomy. Probablemente no sea una novedad para los astrónomos entre nuestros lectores (fue una preimpresión el año pasado), pero los expertos en aprendizaje automático y ciencias en general pueden apreciar este interesante desarrollo.

Source link