El futuro del aprendizaje por refuerzo profundo, nuestro superhéroe de IA contemporáneo

El futuro del aprendizaje por refuerzo profundo, nuestro superhéroe de IA contemporáneo

Rish es empresario e inversor. Anteriormente, fue VC en Gradient Ventures (el fondo de inteligencia artificial de Google), cofundó una startup de tecnología financiera que crea una plataforma de análisis para las presentaciones de la SEC y trabajó en investigación de aprendizaje profundo como estudiante de posgrado en ciencias de la computación en el MIT.

Más publicaciones de este colaborador Habilitación del movimiento de robots humanoides con aprendizaje por imitación e imitación de comportamientos animales Es hora de construir contra las pandemias

No hace mucho tiempo, el mundo vio al Campeón Mundial de Ajedrez Garry Kasparov perder un partido decisivo contra una supercomputadora. Deep Blue de IBM incorporó el estado del arte a fines de la década de 1990, cuando una máquina que derrotaba a un campeón mundial (humano) en un juego complejo como el ajedrez aún era inaudito.

Avance rápido hasta hoy, y no solo las supercomputadoras han superado con creces a Deep Blue en el ajedrez, sino que han logrado lograr un rendimiento sobrehumano en una serie de otros juegos, a menudo mucho más complejos que el ajedrez, que van desde Go a Dota a los títulos clásicos de Atari.

Muchos de estos juegos se han dominado solo en los últimos cinco años, lo que indica un ritmo de innovación mucho más rápido que las dos décadas anteriores. Recientemente, Google trabajo publicado en Agent57que por primera vez mostró un rendimiento superior a los puntos de referencia existentes en los 57 juegos de Atari 2600.

La clase de algoritmos de IA que subyacen a estas hazañas (aprendizaje de refuerzo profundo) ha demostrado la capacidad de aprender a niveles muy altos en dominios restringidos, como los que ofrecen los juegos.

Las hazañas en los juegos han brindado información valiosa (para la comunidad de investigación) sobre lo que el aprendizaje de refuerzo profundo puede y no puede hacer. Ejecutar estos algoritmos ha requerido una potencia informática gigantesca, así como un ajuste fino de las redes neuronales involucradas para lograr el rendimiento que hemos visto.

Los investigadores están buscando nuevos enfoques, como el entrenamiento en múltiples entornos y el uso de modelos de lenguaje para ayudar a habilitar el aprendizaje en múltiples dominios, pero sigue abierta la pregunta de si el aprendizaje de refuerzo profundo nos acerca a la veta madre: la inteligencia general artificial (AGI). ) — de cualquier manera extensible.

Si bien hablar de AGI puede volverse bastante filosófico rápidamente, el aprendizaje de refuerzo profundo ya ha demostrado un gran rendimiento en entornos restringidos, lo que ha estimulado su uso en áreas como la robótica y la atención médica, donde los problemas a menudo vienen con espacios y reglas definidos donde las técnicas pueden ser efectivamente aplicada.

En robótica, ha mostrado resultados prometedores en el uso de entornos de simulación para entrenar robots para el mundo real. Se ha desempeñado bien en el entrenamiento de robots del mundo real para realizar tareas como recoger y caminar. Se está aplicando a una serie de casos de uso en el cuidado de la salud, como la medicina personalizada, la gestión de cuidados crónicos, el descubrimiento de fármacos y la programación y asignación de recursos. Otras áreas que están viendo aplicaciones incluyen procesamiento de lenguaje natural, visión por computadora, optimización algorítmica y finanzas.

La comunidad de investigación todavía está en una etapa temprana de la comprensión total del potencial del aprendizaje por refuerzo profundo, pero si nos basamos en lo bien que le ha ido en los juegos en los últimos años, es probable que veamos avances aún más interesantes en otras áreas. dentro de poco.

Entonces, ¿qué es el aprendizaje de refuerzo profundo?


Source link