Los robots tienen dificultades para improvisar y encontrar una superficie u obstáculo inusual generalmente significa una parada abrupta o una caída brusca. Pero los investigadores han creado un nuevo modelo de locomoción robótica que se adapta en tiempo real a cualquier terreno que encuentre, cambiando su forma de andar sobre la marcha para seguir moviéndose cuando golpea arena, rocas, escaleras y otros cambios repentinos.
Aunque el movimiento robótico puede ser versátil y exacto, y los robots pueden “aprender” a subir escalones, cruzar terrenos accidentados, etc., estos comportamientos son más como habilidades individuales entrenadas entre las que el robot cambia. Aunque los robots como Spot pueden recuperarse de ser empujados o pateados, el sistema realmente solo está trabajando para corregir una anomalía física mientras sigue una política de caminar sin cambios. Hay algunos modelos de movimiento adaptativo, pero algunos son muy específicos (por ejemplo, este basado en movimientos de insectos reales) y otros tardan lo suficiente en funcionar, por lo que el robot seguramente se habrá caído cuando surta efecto.
El equipo, de Facebook AI, UC Berkeley y Carnegie Mellon University, lo llama Rapid Motor Adaptation. Proviene del hecho de que los seres humanos y otros animales pueden cambiar rápida, eficaz e inconscientemente la forma en que caminan para adaptarse a diferentes circunstancias.
“Digamos que aprendes a caminar y por primera vez vas a la playa. Tu pie se hunde y para sacarlo tienes que aplicar más fuerza. Se siente extraño, pero en unos pocos pasos caminarás naturalmente como lo haces en un terreno duro. ¿Cuál es el secreto ahí? preguntó el investigador principal Jitendra Malik, afiliado a Facebook AI y UC Berkeley.
Ciertamente, si nunca antes se ha encontrado con una playa, pero incluso más tarde en la vida, cuando lo haya hecho, no está entrando en un “modo de arena” especial que le permite caminar sobre superficies blandas. La forma en que cambia su movimiento ocurre automáticamente y sin ningún conocimiento real del entorno externo.
Visualización del entorno de simulación. Por supuesto, el robot no percibiría nada de esto visualmente. Créditos de imagen: Berkeley AI Research, Facebook AI Research y CMU
“Lo que está sucediendo es que su cuerpo responde a las diferentes condiciones físicas al sentir las diferentes consecuencias de esas condiciones en el cuerpo mismo”, explicó Malik, y el sistema RMA funciona de manera similar. “Cuando caminamos en nuevas condiciones, en muy poco tiempo, medio segundo o menos, hemos tomado suficientes medidas para que estemos estimando cuáles son estas condiciones y modificamos la política de caminar”.
El sistema se entrenó completamente en simulación, en una versión virtual del mundo real donde el pequeño cerebro del robot (todo se ejecuta localmente en la unidad de cómputo limitada a bordo) aprendió a maximizar el movimiento hacia adelante con la mínima energía y evitar caídas al observar y responder de inmediato. a los datos provenientes de sus juntas (virtuales), acelerómetros y otros sensores físicos.
Para resaltar la interioridad total del enfoque RMA, Malik señala que el robot no utiliza ninguna entrada visual. Pero las personas y los animales sin visión pueden caminar sin problemas, así que ¿por qué no debería hacerlo un robot? Pero dado que es imposible estimar las “externalidades” como el coeficiente de fricción exacto de la arena o las rocas sobre las que camina, simplemente se vigila de cerca.
“No aprendemos sobre la arena, aprendemos sobre el hundimiento de los pies”, dijo el coautor Ashish Kumar, también de Berkeley.
En última instancia, el sistema termina teniendo dos partes: un algoritmo principal que se ejecuta siempre y que realmente controla la marcha del robot y un algoritmo adaptativo que se ejecuta en paralelo y que monitorea los cambios en las lecturas internas del robot. Cuando se detectan cambios significativos, los analiza (las piernas deberían estar haciendo esto, pero lo están haciendo, lo que significa que la situación es así) y le dice al modelo principal cómo ajustarse. A partir de ese momento, el robot solo piensa en cómo avanzar en estas nuevas condiciones, improvisando efectivamente un andar especializado.
Créditos de imagen: Berkeley AI Research, Facebook AI Research y CMU
Después de entrenar en simulación, tuvo un gran éxito en el mundo real, como lo describe el comunicado de prensa:
El robot pudo caminar sobre arena, barro, senderos para caminatas, hierba alta y un montón de tierra sin una sola falla en todas nuestras pruebas. El robot bajó las escaleras con éxito a lo largo de una ruta de senderismo en el 70% de las pruebas. Navegó con éxito una pila de cemento y una pila de guijarros en el 80% de las pruebas a pesar de que nunca vio el suelo inestable o hundido, la vegetación obstructiva o las escaleras durante el entrenamiento. También mantuvo su altura con una alta tasa de éxito al moverse con una carga útil de 12 kg que equivalía al 100% de su peso corporal.
Puedes ver ejemplos de muchas de estas situaciones en videos aquí. o (muy brevemente) en el gif de arriba.
Malik asintió con la cabeza a la investigación de Profesora de la Universidad de Nueva York Karen Adolph, cuyo trabajo ha demostrado cuán adaptable y libre es el proceso humano de aprender a caminar. El instinto del equipo era que si quieres un robot que pueda manejar cualquier situación, tiene que aprender a adaptarse desde cero, no tener una variedad de modos para elegir.
Así como no puede construir un sistema de visión por computadora más inteligente etiquetando y documentando exhaustivamente cada objeto e interacción (siempre habrá más), no puede preparar un robot para un mundo físico diverso y complejo con 10, 100, incluso miles de parámetros especiales para caminar sobre grava, barro, escombros, madera húmeda, etc. Es posible que ni siquiera desee especificar nada más allá de la idea general del movimiento hacia adelante.
“No preprogramamos la idea que tiene para las piernas, ni nada sobre la morfología del robot”, dijo Kumar.
Esto significa que la base del sistema, no el completamente entrenado, que finalmente se moldeó a sí mismo a los pasos cuadrúpedos, puede potencialmente aplicarse no solo a otros robots con patas, sino a dominios completamente diferentes de la inteligencia artificial y la robótica.
“Las piernas de un robot son similares a los dedos de una mano; la forma en que las piernas interactúan con los entornos, los dedos interactúan con los objetos ”, señaló el coautor Deepak Pathak, de la Universidad Carnegie Mellon. “La idea básica se puede aplicar a cualquier robot”.
Aún más, sugirió Malik, la combinación de algoritmos básicos y adaptativos podría funcionar para otros sistemas inteligentes. Las casas inteligentes y los sistemas municipales tienden a depender de políticas preexistentes, pero ¿y si se adaptaran sobre la marcha?
Por ahora, el equipo simplemente presenta sus hallazgos iniciales en un documento en la Robótica: ciencia y sistemas conferencia y reconocer que hay una gran cantidad de investigación de seguimiento por hacer. Por ejemplo, construir una biblioteca interna de los pasos improvisados como una especie de memoria a “mediano plazo”, o usar la visión para predecir la necesidad de iniciar un nuevo estilo de locomoción. Pero el enfoque RMA parece ser un nuevo enfoque prometedor para un desafío duradero en robótica.
Source link