
Un estudio revela cómo aprenden las redes neuronales a partir de distribuciones a gran escala de galaxias
Un estudio revela cómo aprenden las redes neuronales a partir de distribuciones a gran escala de galaxias
Mediante el uso de herramientas de aprendizaje automático interpretable, pudieron identificar qué elementos de los datos estaba aprendiendo la red neuronal, arrojando luz sobre por qué era capaz de clasificar correctamente entre los dos modelos
En un nuevo estudio, publicado recientemente en la prestigiosa revista Physical Review Letters, un equipo de físicos ha introducido una innovación clave en la aplicación del aprendizaje automático a la cosmología. Los investigadores usaron técnicas de interpretabilidad en el aprendizaje automático que les permitieron comprender cómo hacen predicciones las redes neuronales.
La investigación, llevada a cabo por Indira Ocampo, George Alestas y Savvas Nesseris del Instituto de Física Teórica UAM-CSIC, junto con Domenico Sapone de la Universidad de Chile, demuestra que el uso de redes neuronales puede mejorar el análisis de datos observacionales (o simulados) para probar modelos más allá del modelo cosmológico estándar (^CDM). En este caso particular, lograron diferenciar entre el modelo ^CDM y modelos alternativos de gravedad modificada, como el modelof(R) de Hu-Sawicki.
Mediante el uso de herramientas de aprendizaje automático interpretable, pudieron identificar qué elementos de los datos estaba aprendiendo la red neuronal, arrojando luz sobre por qué era capaz de clasificar correctamente entre los dos modelos. Este aspecto de interpretabilidad es crucial no sólo para comprender los mecanismos subyacentes en el proceso de clasificación, sino también para entender la física detrás de las «regiones más relevantes de datos».
El modelo ^CDM (Lambda Cold Dark Matter) es el estándar en cosmología, explicando la expansión acelerada del universo mediante la energía oscura (representada por la constante cosmológica ^) y la materia oscura fría (^CDM). Además, este modelo describe con éxito la formación de estructuras a gran escala y las propiedades de la radiación cósmica de fondo de microondas.
Sin embargo, presenta ciertas discrepancias con observaciones recientes, como la determinación de la constante de Hubble, que describe la tasa de expansión del universo; y anomalías en la distribución de materia a gran escala, como irregularidades en cómo se distribuye la materia en el universo a grandes distancias. Por ello, para resolver estas discrepancias, se están explorando modelos más allá de ^CDM.
Por otro lado, una clase interesante de modelos alternativos son los denominados modelos f(R), que modifican la teoría de la relatividad general de Einstein, base de nuestra comprensión de la gravedad. A escalas más pequeñas, como en el Sistema Solar, los modelos f(R) pueden recuperar la Relatividad General, pero a escalas cosmológicas pueden imitar la energía oscura o la materia oscura al modificar las ecuaciones de Einstein.