Ir al contenido

Biblioteca de la Universidad Complutense de Madrid

Martes, 24 de noviembre de 2020

Inicio | ¿Quiénes somos? | Editar mi portal

La IA ha resuelto un rompecabezas matemático clave para entender nuestro mundo

Las ecuaciones diferenciales parciales pueden describir todo, desde el movimiento planetario hasta la tectónica de placas, pero son notoriamente difíciles de resolver.

A menos que seas un físico o un ingeniero, no hay muchas razones para que sepas sobre las ecuaciones diferenciales parciales. Lo sé. Después de años de analizarlas en la universidad mientras estudiaba ingeniería mecánica, nunca las he usado desde entonces en el mundo real.

Pero las ecuaciones diferenciales parciales, o EDP, también son algo mágicas. Son una categoría de ecuaciones matemáticas que son realmente buenas para describir el cambio en el espacio y el tiempo, y por lo tanto muy útiles para describir los fenómenos físicos en nuestro universo. Se pueden utilizar para modelar todo, desde las órbitas planetarias hasta la tectónica de placas y la turbulencia del aire que perturba un vuelo, lo que a su vez nos permite hacer cosas prácticas como predecir la actividad sísmica y diseñar aviones seguros.

 

El problema es que los EDP son notoriamente difíciles de resolver. Y aquí, el significado de "resolver" es quizás mejor ilustrado por un ejemplo. Digamos que estás tratando de simular una turbulencia de aire para probar un nuevo diseño de avión. Hay un PDE conocido llamado Navier-Stokes que se utiliza para describir el movimiento de cualquier fluido. "Resolver" Navier-Stokes permite tomar una instantánea del movimiento del aire (también conocido como condiciones de viento) en cualquier momento y modelar cómo continuará moviéndose, o cómo se movía antes.

Estos cálculos son altamente complejos y de gran intensidad computacional, por lo que las disciplinas que utilizan muchos DPE a menudo dependen de supercomputadoras para hacer las cuentas. También es por eso que el campo de la IA ha tomado un interés especial en estas ecuaciones. Si pudiéramos utilizar el aprendizaje profundo para acelerar el proceso de resolución de las mismas, podría hacer mucho bien a la investigación científica y a la ingeniería.

Ahora los investigadores de Caltech han introducido una nueva técnica de aprendizaje profundo para resolver EDP que es dramáticamente más precisa que los métodos de aprendizaje profundo desarrollados anteriormente. También es mucho más generalizable, capaz de resolver familias enteras de EDP, como la ecuación de Navier-Stokes para cualquier tipo de fluido, sin necesidad de entrenamiento. Finalmente, es 1.000 veces más rápido que las fórmulas matemáticas tradicionales, lo que facilitaría nuestra dependencia de las supercomputadoras e incrementaría nuestra capacidad de cálculo para modelar problemas aún más grandes. Así es. Adelante.

Tiempo de martillo
Antes de que nos sumerjamos en cómo los investigadores hicieron esto, primero apreciemos los resultados. En el gif de abajo, se puede ver una demostración impresionante. La primera columna muestra dos instantáneas del movimiento de un fluido; la segunda muestra cómo el fluido continuó moviéndose en la vida real; y la tercera muestra cómo la red neural predijo que el fluido se movería. Básicamente parece idéntica a la segunda.

Cuando la función encaja
Lo primero que hay que entender aquí es que las redes neuronales son fundamentalmente aproximadores de funciones. Cuando se entrenan en un conjunto de datos de entradas y salidas emparejadas, en realidad están calculando la función, o serie de operaciones matemáticas, que se transpondrán una a la otra. Piensa en construir un detector de gatos. Estás entrenando la red neuronal alimentándola con muchas imágenes de gatos y cosas que no son gatos (las entradas) y etiquetando cada grupo con un 1 o un 0, respectivamente (las salidas). La red neuronal busca entonces la mejor función que pueda convertir cada imagen de un gato en un 1 y cada imagen de todo lo demás en un 0. Así es como puede mirar una nueva imagen y decirte si es o no un gato. Utiliza la función que encontró para calcular su respuesta y si su entrenamiento fue bueno, lo hará bien la mayor parte del tiempo.

Convenientemente, este proceso de aproximación a la función es lo que necesitamos para resolver un PDE. En última instancia, estamos tratando de encontrar una función que describa mejor, digamos, el movimiento de las partículas de aire sobre el espacio físico y el tiempo.

Ahora aquí está el quid de la cuestión. Las redes neuronales suelen estar entrenadas para aproximar funciones entre entradas y salidas definidas en el espacio euclidiano, su clásico gráfico con los ejes x, y, z. Pero esta vez, los investigadores decidieron definir las entradas y salidas en el espacio de Fourier, que es un tipo especial de gráfico para trazar las frecuencias de las ondas. La intuición que sacaron del trabajo en otros campos es que algo como el movimiento del aire puede describirse en realidad como una combinación de frecuencias de onda, dice Anima Anandkumar, una profesora de Caltech que supervisó la investigación junto con sus colegas, los profesores Andrew Stuart y Kaushik Bhattacharya. La dirección general del viento a nivel macro es como una baja frecuencia con ondas muy largas y letárgicas, mientras que los pequeños remolinos que se forman a nivel micro son como altas frecuencias con ondas muy cortas y rápidas.¿Por qué importa esto? Porque es mucho más fácil aproximar una función de Fourier en el espacio de Fourier que luchar con los DPE en el espacio euclidiano, lo que simplifica enormemente el trabajo de la red neuronal. Además de su enorme ventaja de velocidad sobre los métodos tradicionales, su técnica logra una tasa de error 30% menor al resolver Navier-Stokes que los anteriores métodos de aprendizaje profundo.

Todo esto es extremadamente inteligente, y también hace que el método sea más generalizable. Los anteriores métodos de aprendizaje profundo tenían que ser entrenados por separado para cada tipo de fluido, mientras que éste sólo necesita ser entrenado una vez para manejar todos ellos, como se confirma en los experimentos de los investigadores. Aunque todavía no han intentado extender esto a otros ejemplos, también debería ser capaz de manejar cada composición de la tierra cuando se resuelvan los EDP relacionados con la actividad sísmica, o cada tipo de material cuando se resuelvan los EDP relacionados con la conductividad térmica.

Supersimulación
Los profesores y sus estudiantes de doctorado no hicieron esta investigación sólo por diversión teórica. Quieren llevar la IA a más disciplinas científicas. Fue a través de hablar con varios colaboradores en la ciencia del clima, la sismología y la ciencia de los materiales que Anandkumar decidió por primera vez abordar el reto del PDE con sus colegas y estudiantes. Ahora están trabajando para poner en práctica su método con otros investigadores de Caltech y el Laboratorio Nacional Lawrence Berkeley.

Un tema de investigación que a Anandkumar le entusiasma especialmente: el cambio climático. El Navier-Stokes no sólo es bueno para modelar la turbulencia del aire, sino que también se utiliza para modelar los patrones climáticos. "Tener buenas predicciones meteorológicas de grano fino a escala global es un problema muy difícil", dice, "e incluso en las mayores supercomputadoras, no podemos hacerlo a escala global hoy en día". Así que si podemos usar estos métodos para acelerar todo el oleoducto, eso sería tremendamente impactante".

También hay muchas, muchas más aplicaciones, añade. "En ese sentido, el cielo es el límite, ya que tenemos una forma general de acelerar todas estas aplicaciones."

Fuente:

https://www.gadgetsyreviews.com/

https://www.technologyreview.com/

Género al que pertenece la obra: Narrativa
Bookmark and Share

Comentarios - 0

No hay comentarios.


Escritores complutenses 2.0. es un proyecto del Vicerrectorado de Innovación de la Universidad Complutense de Madrid
Sugerencias