Malas noticias para los papás: los robots pueden asar perros calientes ahora

Malas noticias para los papás: los robots pueden asar perros calientes ahora

1950 PICNIC FAMILIA BAR-B-C ...

H. Armstrong Roberts / ClassicStock

  • En un nuevo artículo publicado en la revista. Ciencia Robótica, Los investigadores de la Universidad de Boston describieron el proceso mediante el cual le enseñaron a un robot cómo asar un hot dog.
  • El equipo utilizó el aprendizaje por refuerzo, que toma prestados conceptos del término de psicología del mismo nombre. En cualquier caso, robot o humano, el refuerzo, o recompensa, se utiliza para fomentar un comportamiento.
  • No es la primera vez que un robot aprende a manejar la parrilla (o el horno): en el pasado, ya hemos visto robots entrenados para voltear hamburguesas y hacer pizzas.

    Gracias a un par de caninos salivadores, los cocineros de alevines pueden preparar un impresionante hot dog. Esto se debe a que tanto los perros como los robots tienen una conexión con el aprendizaje por refuerzo, un concepto en psicología humana que usa refuerzo o recompensa para condicionar las respuestas biológicas de un organismo dado.

    Un nuevo artículo publicado en la revista científica. Ciencia Robótica describe el trabajo realizado por los investigadores de la Universidad de Boston Xiao Li, Zachary Serlin, Guang Yang y Calin Belta. Para enseñar a los dos robots, llamados Baxter y Jaco, a dar la vuelta a la carne de res, el equipo se basó en un tipo diferente de aprendizaje de refuerzo del mundo de la psicología.

    En la jerga informática, el aprendizaje por refuerzo es una rama del aprendizaje automático que utiliza software para recopilar más información sobre su entorno mediante la repetición continua de ensayos y la recompensa de los intentos exitosos. Una vez que se ha desarrollado en el lado del software, aquí, a través de una miríada de simulaciones, la máquina, en el mundo real, debería ser capaz de realizar las funciones que su software ha dejado de funcionar.

    Así es como el equipo logró guiar a los robots reales a través de la tarea de hacer y armar un hot dog. Se basa en el trabajo previo que los investigadores han llevado a cabo en el campo del aprendizaje de refuerzo robótico, aplicado a las tareas de fabricación de alimentos humanos.

    "Este trabajo es un intento de cerrar la brecha entre la representación del conocimiento simbólico y el razonamiento con una planificación basada en la optimización, al tiempo que permite que el sistema general mejore de forma continua y segura interactuando con su entorno", investigador doctoral de la Universidad de Boston y primer autor del artículo, Xiao Li, dijo en un comunicado de prensa: "Esperamos que dicha arquitectura pueda ayudarnos a impartir nuestros conocimientos y objetivos al robot, y mejorar nuestra comprensión de lo que ha aprendido, lo que conducirá a sistemas robóticos más capaces".

    Refuerzo a través de la simulación

    En el campo de la psicología, el aprendizaje por refuerzo se remonta al fisiólogo ruso Ivan Pavlov. En su famoso experimento, Pavlov entrenó perros para asociar el sonido de una campana con la comida. Después de muchas pruebas con la comida y el anillo posterior, los perros comenzaron a salivar cuando escucharon el sonido del timbre.

    Entonces, ¿cómo aprovecharon los científicos de la Universidad de Boston el aprendizaje por refuerzo en el ámbito del aprendizaje automático? Prepararon una tarea de prueba de concepto entrenando a Baxter y Jaco para cocinar, armar y servir hot dogs.

    Por supuesto, hicieron gran parte del trabajo pesado a través de pruebas de simulación. Estos se configuraron mediante un conjunto de fórmulas que los investigadores utilizaron para especificar y combinar tareas como:

    ?"Recoge el hot dog y colócalo en la parrilla".

    ?"Siempre evite colisiones," para cumplir con los requisitos de seguridad.

    ?"No puedes recoger otro hot dog si ya tienes uno," para incorporar conocimiento previo general, que damos por sentado como humanos.

    Para entrenar a Jaco y Baxter a través de ensayos de simulación, los científicos enfatizaron lo que llamaron un "lenguaje de especificación formal" que ayuda a entrenar el software. El objetivo es crear descripciones de tareas fáciles de entender.

    Y a través de la tarea de cocinar y ensamblar perros calientes, los autores encontraron que su lenguaje de especificación formal fue un éxito. En el documento, escriben que era "fácilmente interpretable desde el principio porque el idioma es muy similar al inglés simple".

    No solo hot dogs, sino también hamburguesas y pizza

    Baxter y Jaco no están solos en el mundo de los maestros de parrilla robótica. Sony, por su parte, está trabajando con la Universidad Carnegie Mellon para construir robots con la destreza y la precisión requeridas para manejar la preparación de alimentos, la cocción y la entrega. La manipulación robótica en el mundo de los alimentos es infamemente difícil, pero CMU ya se demostró en 2013 a través de Herb, un robot que puede separar con mucho cuidado una galleta Oreo de su relleno cremoso.

    imagenPizza Zume

    Eso se relaciona muy bien con un robot llamado Vincenzo, que trabaja para Zume Pizza en Mountain View, California, para hacer que el lugar de trabajo sea más seguro para sus compañeros de trabajo humanos. Vincenzo elimina las pizzas calientes de los hornos para ayudar a reducir las lesiones humanas, por lo general, en las pizzerías, son quemaduras de leves a severas.

    Y también hay un robot de patty-flipping llamado, por supuesto, Flippy que sirve la parrilla en un restaurante de comida rápida de California. Flippy utiliza imágenes térmicas y óptica 3D para detectar cuándo la hamburguesa se cocina a la temperatura deseada antes de voltearla y retirarla. Espero que tengamos un bot Philly Cheesesteak a continuación.


    Source link