Los robots que dependen de la IA para aprender una nueva tarea generalmente requieren un proceso de entrenamiento laborioso y repetitivo. Los investigadores de Berkeley están intentando simplificar y acortar eso con una técnica de aprendizaje innovadora que hace que el robot llene los vacíos en lugar de comenzar desde cero.
El equipo compartió varias líneas de trabajo con TechCrunch para mostrar en TC Sessions: Robotics hoy y en el video a continuación puede escuchar sobre ellas, primero del investigador de Berkeley Stephen James.
“La técnica que estamos empleando es una especie de configuración de aprendizaje contrastivo, donde toma el video de YouTube y parchea un montón de áreas, y la idea es que el robot está tratando de reconstruir esa imagen”, James explicado. “Tiene que entender lo que podría haber en esos parches para luego generar la idea de lo que podría haber detrás, tiene que entender muy bien lo que está pasando en el mundo”.
Por supuesto, no aprende solo viendo YouTube, por más común que sea en el mundo humano. Los operadores tienen que mover el robot, ya sea físicamente o mediante un controlador de realidad virtual, para darle una idea general de lo que está tratando de hacer. Combina esta información con su comprensión más amplia del mundo obtenida al completar las imágenes de video y, eventualmente, también puede integrar muchas otras fuentes.
El enfoque ya está dando resultados, dijo James: “Normalmente, a veces puede tomar cientos de demostraciones para realizar una nueva tarea, mientras que ahora podemos dar un puñado de demostraciones, tal vez diez, y puede realizar la tarea”.
Alejandro Escontrela se especializa en diseñar modelos que extraen datos relevantes de videos de YouTube, como movimientos de animales, personas u otros robots. El robot usa estos modelos para informar su propio comportamiento, juzgando si un movimiento dado parece o no algo que debería estar probando.
En última instancia, intenta replicar los movimientos de los videos de modo que otro modelo que los vea no pueda saber si es un robot o un pastor alemán real persiguiendo esa pelota.
Curiosamente, muchos robots como este aprenden primero en un entorno de simulación, probando movimientos esencialmente en realidad virtual. Pero como explica Danijar Hafner, los procesos se han vuelto lo suficientemente eficientes como para saltarse esa prueba, permitiendo que el robot juegue en el mundo real y aprenda en vivo de interacciones como caminar, tropezar y, por supuesto, ser empujado. La ventaja aquí es que puede aprender mientras trabaja en lugar de tener que volver al simulador para integrar nueva información, lo que simplifica aún más la tarea.
Creo que el santo grial del aprendizaje de los robots es aprender todo lo que puedas en el mundo real y tan rápido como puedas”, dijo Hafner. Ciertamente parecen estar moviéndose hacia ese objetivo. Mira el video completo del trabajo del equipo aquí.
Source link