Resolviendo los desafíos de hacer pizza con robots |  Noticias del MIT

Resolviendo los desafíos de hacer pizza con robots | Noticias del MIT


Imagina un pizzero trabajando con una bola de masa. Podría usar una espátula para levantar la masa sobre una tabla de cortar y luego usar un rodillo para aplanarla en un círculo. ¿solo bien? No cuando ese pizzero es un robot.

Trabajar con un objeto deformable como la masa es difícil para un robot porque la forma de la masa puede cambiar de muchas maneras que son difíciles de representar con una ecuación. Además, crear una nueva forma a partir de esta masa requiere múltiples pasos y el uso de diferentes herramientas. Es particularmente difícil para un robot aprender una tarea de manipulación con una larga secuencia de pasos donde hay muchas opciones, ya que el aprendizaje a menudo se realiza a través de prueba y error.

Investigadores del MIT, la Universidad Carnegie Mellon y la Universidad de California en San Diego han encontrado una mejor manera. Crearon un marco para un sistema de manipulación robótica que utiliza un proceso de aprendizaje de dos pasos que podría permitir que un robot realice tareas complejas de manipulación de masa durante un largo período de tiempo. Un algoritmo de «maestro» resuelve cada paso que el robot debe dar para completar la tarea. Luego entrena un modelo de aprendizaje automático de «estudiante» que aprende ideas abstractas sobre cuándo y cómo se realiza cada habilidad que necesita durante la tarea, como usar un rodillo. Con este conocimiento, el sistema considerará cómo realizar las habilidades para completar toda la tarea.

Los investigadores muestran que este método, al que llaman DiffSkill, puede realizar tareas de manipulación complejas en simulaciones, como cortar y esparcir masa o juntar trozos de masa alrededor de una tabla de cortar, mientras supera a otros métodos de aprendizaje automático.

Más allá de la elaboración de pizzas, este método podría aplicarse en otros entornos en los que un robot necesite manipular objetos deformables, como B. un robot de cuidado que alimenta, baña o viste a personas mayores o con discapacidad motora.

“Este método se acerca más a cómo los humanos planificamos nuestras acciones. Cuando un ser humano completa una tarea a largo plazo, no anotamos todos los detalles. Tenemos un planificador de alto nivel que nos dice aproximadamente cuáles son las etapas y algunos de los objetivos intermedios que debemos lograr en el camino, y luego los ejecutamos”, dice Yunzhu Li, estudiante de posgrado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial. (CSAIL) y autor de un artículo que presenta DiffSkill.

Los coautores de Li incluyen al autor principal Xingyu Lin, estudiante graduado de la Universidad Carnegie Mellon (CMU); Zhiao Huang, estudiante de posgrado de la Universidad de California, San Diego; Joshua B. Tenenbaum, Profesor de Desarrollo de Carrera Paul E. Newton de Ciencias Cognitivas y Computación en el Departamento de Cerebro y Ciencias Cognitivas del MIT y miembro de CSAIL; David Held, Profesor Asistente en CMU; y el autor principal Chuang Gan, científico investigador del MIT-IBM Watson AI Lab. Los resultados de la investigación se presentarán en la Conferencia Internacional sobre Representaciones de Aprendizaje.

estudiantes y profesores

El «maestro» en el marco de DiffSkill es un algoritmo de optimización de trayectoria que puede resolver problemas de horizonte corto en los que el estado inicial y la ubicación de destino de un objeto están muy juntos. El optimizador de trayectoria funciona en un simulador que modela la física del mundo real (conocido como simulador de física diferenciable, que pone «Diff» en «DiffSkill»). El algoritmo del «maestro» usa la información en el simulador para aprender cómo debe moverse la masa en cada fase, una a la vez, y luego genera esas trayectorias.

Luego, la red neuronal del «estudiante» aprende a imitar las acciones del maestro. Como entradas, toma dos imágenes de cámara, una que muestra la masa en su estado actual y la otra que muestra la masa al final de la tarea. La red neuronal crea un plan de alto nivel para determinar cómo se pueden vincular diferentes habilidades para lograr el objetivo. Luego genera trayectorias específicas a corto plazo para cada habilidad y envía comandos directamente a las herramientas.

Los investigadores utilizaron esta técnica para experimentar con tres tareas diferentes de manipulación de masa simulada. En una tarea, el robot levanta la masa sobre una tabla de cortar con una espátula y luego la aplana con un rodillo. En otro caso, el robot usa una pinza para recoger la masa del otro lado del mostrador, colocarla en una espátula y transferirla a una tabla de cortar. En la tercera tarea, el robot corta una pila de masa por la mitad con un cuchillo y luego transporta cada pieza a diferentes lugares con una pinza.

robots en el trabajo
Los investigadores han desarrollado un sistema de manipulación robótica que puede realizar tareas complejas de manipulación de masa utilizando herramientas en simulaciones como B. Reúna la masa y colóquela en una tabla para cortar (izquierda), corte un trozo de masa por la mitad y separe las mitades (centro), y levante la masa sobre una tabla para cortar y luego aplánela con un rodillo (derecha). Su técnica puede realizar con éxito estas tareas mientras que otros métodos de aprendizaje automático fallan.

Un corte por encima del resto

DiffSkill pudo superar las técnicas comunes que se basan en el aprendizaje por refuerzo, donde un robot aprende una tarea a través de prueba y error. De hecho, DiffSkill fue el único método que pudo completar con éxito las tres tareas de manipulación de la masa. Curiosamente, los investigadores descubrieron que la red neuronal del «estudiante» podría incluso superar el algoritmo del «profesor», dice Lin.

“Nuestro marco ofrece a los robots una oportunidad novedosa para adquirir nuevas habilidades. Estas capacidades luego se pueden encadenar para resolver tareas más complejas que superan las capacidades de los sistemas robóticos anteriores», dice Lin.

Debido a que su método se centra en el control de las herramientas (espátula, cuchillo, rodillo, etc.), podría aplicarse a diferentes robots, pero solo si utilizan las herramientas específicas definidas por los investigadores. En el futuro, planean incorporar la forma de una herramienta al razonamiento de la red «estudiante» para que pueda aplicarse a otros dispositivos.

Los investigadores pretenden mejorar el rendimiento de DiffSkill mediante el uso de datos 3D como entradas en lugar de imágenes, que son difíciles de transferir de la simulación al mundo real. También quieren hacer que el proceso de planificación de redes neuronales sea más eficiente y recopilar datos de entrenamiento más diversos para mejorar la capacidad de DiffSkill de generalizar a nuevas situaciones. A largo plazo, esperan poder aplicar DiffSkill a una variedad más amplia de tareas, incluida la manipulación de telas.

Este trabajo cuenta con el apoyo parcial de la National Science Foundation, LG Electronics, el MIT-IBM Watson AI Lab, la Oficina de Investigación Naval y el programa Machine Common Sense de la Agencia de Proyectos de Investigación Avanzada de Defensa.

Related post

Una guía completa para la gestión de las relaciones con los clientes

Una guía completa para la gestión de las relaciones…

Cuando se trata de administrar un negocio, una de las cosas más importantes es mantener contentos a sus clientes. No hay…
Nanotechnology Now – Comunicado de prensa: De afuera hacia adentro: Un método de evaluación celular general rápido y preciso: Investigadores del Instituto de Ciencia y Tecnología de Nara muestran que el uso de cuatro frecuencias de voltaje aplicado puede mejorar la medición del tamaño y la forma de las células durante la citometría de impedancia. es

Nanotechnology Now – Comunicado de prensa: De afuera hacia…

Inicio > Prensa > De afuera hacia adentro: un método rápido y preciso de evaluación celular general: Investigadores del Instituto de…
Nanotechnology Now – Comunicado de prensa: Nodos cuánticos con átomos calientes

Nanotechnology Now – Comunicado de prensa: Nodos cuánticos con…

Inicio > Prensa > Nodo cuántico con átomos calientes Una partícula de luz de la fuente de fotones individuales (abajo) se…

Leave a Reply

Tu dirección de correo electrónico no será publicada.