Una forma más fácil de enseñar nuevas habilidades a los robots – ScienceDaily

Una forma más fácil de enseñar nuevas habilidades a los robots – ScienceDaily


Con los pedidos de comercio electrónico entrantes, un robot de almacenamiento toma vasos de un estante y los coloca en cajas para su envío. Todo está zumbando hasta que el almacén procesa un cambio y el robot ahora tiene que agarrar vasos más altos y estrechos que se almacenan boca abajo.

Reprogramar este robot requiere escribir a mano miles de imágenes que le muestren cómo agarrar estos nuevos vasos y luego volver a entrenar el sistema.

Pero una nueva técnica desarrollada por investigadores del MIT solo requeriría un puñado de demostraciones humanas para reprogramar el robot. Este método de aprendizaje automático permite que un robot recoja y coloque objetos nunca antes vistos que están en poses aleatorias que nunca ha encontrado. Dentro de 10 a 15 minutos, el robot estaría listo para realizar una nueva tarea de recoger y colocar.

La técnica utiliza una red neuronal diseñada específicamente para reconstruir las formas de objetos 3D. Con solo unas pocas demostraciones, el sistema utiliza lo que la red neuronal ha aprendido sobre la geometría 3D para capturar nuevos objetos similares a los de las demostraciones.

En simulaciones y usando un brazo robótico real, los investigadores demuestran que su sistema puede manipular de manera efectiva tazas, tazones y botellas nunca antes vistos dispuestos en poses aleatorias, usando solo 10 demostraciones para enseñarle al robot.

“Nuestra principal contribución es la capacidad general de enseñar nuevas habilidades de manera mucho más eficiente a los robots que necesitan trabajar en entornos menos estructurados donde puede haber mucha variabilidad. El concepto de generalización por construcción es una habilidad intrigante porque este problema suele ser mucho más difícil», dice Anthony Simeonov, estudiante de doctorado en Ingeniería Eléctrica y Ciencias de la Computación (EECS) y coautor principal del artículo.

Simeonov coescribió el artículo con el coautor principal Yilun Du, estudiante de doctorado de EECS; Andrea Tagliasacchi, investigadora asociada de Google Brain; Joshua B. Tenenbaum, Profesor de Desarrollo de Carrera Paul E. Newton de Ciencias Cognitivas y Computación en el Departamento de Cerebro y Ciencias Cognitivas y miembro del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL); Alberto Rodríguez, Profesor Asociado de la Promoción de 1957 en el Departamento de Ingeniería Mecánica; y los autores principales Pulkit Agrawal, profesor de CSAIL, y Vincent Sitzmann, posible profesor asistente de EECS. Los resultados de la investigación se presentarán en la Conferencia Internacional sobre Robótica y Automatización.

entender geometría

Se puede entrenar a un robot para que recoja un artículo específico, pero cuando ese artículo está de costado (tal vez caído), el robot ve esto como un escenario completamente nuevo. Esta es una de las razones por las que es tan difícil para los sistemas de aprendizaje automático generalizar a nuevas orientaciones de objetos.

Para superar este desafío, los investigadores crearon un nuevo tipo de modelo de red neuronal, un campo descriptor neuronal (NDF), que aprende la geometría 3D de una clase de objetos. El modelo calcula la representación geométrica de un elemento determinado utilizando una nube de puntos 3D, que es un conjunto de puntos de datos o coordenadas en tres dimensiones. Los puntos de datos se pueden obtener de una cámara de profundidad que proporciona información sobre la distancia entre el objeto y un punto de vista. Si bien la red se entrenó en un gran conjunto de datos de formas 3D sintéticas en simulación, se puede aplicar directamente a objetos en el mundo real.

El equipo diseñó el NDF con una propiedad conocida como equivarianza. Si al modelo con este rasgo se le muestra una imagen de un vaso en posición vertical y luego una imagen del mismo vaso de lado, entiende que el segundo vaso es el mismo objeto, solo que girado.

«Esta equivarianza nos permite manejar con mucha más eficacia los casos en los que el objeto observado tiene una orientación arbitraria», dice Simeonov.

A medida que el NDF aprende a reconstruir formas de objetos similares, también aprende a asociar partes relacionadas de esos objetos. Por ejemplo, aprende que las asas de las tazas son similares, aunque algunas tazas son más altas o más anchas que otras, o tienen asas más pequeñas o más largas.

“Si quisieras hacer esto usando un enfoque diferente, tendrías que escribir a mano todas las piezas. En cambio, nuestro enfoque reconoce automáticamente estas partes a partir de la reconstrucción de la forma”, dice Du.

Los investigadores utilizan este modelo NDF entrenado para enseñarle a un robot una nueva habilidad con solo unos pocos ejemplos físicos. Mueven la mano del robot a la parte de un objeto que quieren agarrar, como el borde de un tazón o el asa de una taza, y registran las posiciones de las yemas de los dedos.

Debido a que el NDF ha aprendido tanto sobre geometría 3D y reconstrucción de formas, puede inferir la estructura de una nueva forma, lo que permite que el sistema aplique las demostraciones a nuevos objetos en cualquier pose, explica Du.

selección de un ganador

Probaron su modelo en simulaciones y en un brazo robótico real con tazas, tazones y botellas como objetos. Su método tuvo una tasa de éxito del 85 por ciento para las tareas de recoger y colocar que involucran nuevos objetos en nuevas orientaciones, mientras que la mejor línea de base solo pudo lograr una tasa de éxito del 45 por ciento. El éxito significa agarrar un nuevo objeto y colocarlo en una ubicación de destino, como B. tazas colgantes en un estante.

Muchas líneas base utilizan información de imágenes 2D en lugar de geometría 3D, lo que dificulta que estos métodos integren la equivarianza. Esta es una de las razones por las que la técnica NDF funciona mucho mejor.

Si bien los investigadores estaban contentos con el rendimiento, su método solo funciona para la categoría específica de objeto en el que fue entrenado. Un robot al que se le ha enseñado a recoger vasos no podrá recoger cajas o auriculares porque estos objetos tienen características geométricas muy diferentes de las que se entrenó a la red.

«En el futuro, sería ideal expandirlo a muchas categorías o abandonar por completo la noción de categoría», dice Simeonov.

También planean adaptar el sistema para objetos no rígidos y, a más largo plazo, permitir que el sistema realice tareas de recoger y colocar cuando cambie el área objetivo.

Este trabajo cuenta con el apoyo parcial de la Agencia de Proyectos de Investigación Avanzada de Defensa, la Agencia de Ciencia y Tecnología de Defensa de Singapur y la Fundación Nacional de Ciencias.

Related post

Cómo la IA ayudará a abordar los problemas de exceso de existencias del mañana

Cómo la IA ayudará a abordar los problemas de…

El mundo cadena de suministro no es fácil de manejar. Líneas complejas conectan piezas fabricadas y piezas de casi todas las…
Cómo los objetos tecnológicos brillantes distraen la atención de la política climática

Cómo los objetos tecnológicos brillantes distraen la atención de…

Soy ingeniero de formación y me encantan las cosas nuevas. Los últimos gadgets, ideas, diseños. Pero cuando se trata del clima,…
El programa interactivo de los científicos informáticos ayuda a planificar el movimiento para entornos con obstáculos – ScienceDaily

El programa interactivo de los científicos informáticos ayuda a…

Al igual que nosotros, los robots no pueden ver a través de las paredes. A veces necesitan un poco de ayuda…

Leave a Reply

Tu dirección de correo electrónico no será publicada.