Los datos «falsos» ayudan a los robots a aprender más rápido (con video)

Los datos «falsos» ayudan a los robots a aprender más rápido (con video)


29 de junio de 2022

(Noticias de Nanowerk) En un paso hacia los robots que pueden aprender sobre la marcha como los humanos, un nuevo enfoque amplía los conjuntos de datos de entrenamiento para robots que trabajan con objetos blandos como cuerdas y telas o en entornos desordenados.

Desarrollado por investigadores de robótica de la Universidad de Michigan, podría reducir el tiempo de aprendizaje de nuevos materiales y entornos a unas pocas horas en lugar de una semana o dos.

En las simulaciones, el conjunto de datos de entrenamiento ampliado mejoró la tasa de éxito de un robot que enrolla una cuerda alrededor de un bloque de motor en más del 40 % y casi duplicó las tasas de éxito de un robot físico para una tarea similar.

Esta tarea es una de las que un mecánico de robots debe completar con facilidad. Pero con los métodos actuales, aprender a manipular cualquier manguera o correa desconocida requeriría una gran cantidad de datos, probablemente recopilados durante días o semanas, dice Dmitry Berenson, profesor asociado de robótica en la UM y autor principal de un artículo («Aumento de datos para la manipulación ”). ) presentado en Robotics: Science and Systems en la ciudad de Nueva York.

Durante este tiempo, el robot jugó con la manguera, estirándola, acoplando los extremos, enrollándola alrededor de obstáculos, etc., hasta que entendió cómo se podía mover la manguera.

«Si el robot tiene que jugar con la manguera durante mucho tiempo antes de poder instalarla, eso no funcionará para muchas aplicaciones», dijo Berenson.

Usando técnicas tradicionales, entrenar robots a menudo requiere cientos de horas de datos, pero esta no es una forma práctica de entrenar robots para cada variación de una tarea. Los investigadores de la UM utilizaron el aumento de datos para desarrollar un método que amplía estos conjuntos de datos.

De hecho, la mecánica humana probablemente no se inmutaría si un compañero robot tomara tanto tiempo. Entonces, Berenson y Peter Mitrano, un estudiante graduado en robótica, modificaron un algoritmo de optimización para permitir que una computadora haga algunas de las generalizaciones que hacemos los humanos, al predecir cómo la dinámica observada en un caso podría replicarse en otros.

En un ejemplo, el robot empujó cilindros sobre una superficie llena de gente. En algunos casos, el cilindro falló, mientras que en otros chocó con otros cilindros y estos se movieron en respuesta.

Si el cilindro no ha golpeado nada, este movimiento se puede repetir en cualquier parte de la mesa donde la trayectoria no lo lleve a otros cilindros. Esto es intuitivo para un humano, pero un robot necesita obtener estos datos. Y en lugar de ejecutar experimentos que consumen mucho tiempo, el programa de Mitrano y Berenson puede crear variaciones sobre el resultado de ese primer experimento que sirven al robot de la misma manera.

Se centraron en tres cualidades para sus datos fabricados. Tenía que ser relevante, diversa y válida. Por ejemplo, si solo se trata de que el robot mueva cilindros sobre la mesa, los datos del suelo no son relevantes. La desventaja es que los datos deben ser diversos: se deben examinar todas las partes de la tabla, todos los ángulos.

«Si maximiza la diversidad de los datos, no será lo suficientemente relevante. Pero si maximizas la relevancia, no habrá suficiente diversidad”, dijo Mitrano. «Ambos son importantes».

Y por último, los datos deben ser válidos. Por ejemplo, cualquier simulación en la que dos cilindros ocupen el mismo espacio no sería válida y tendría que identificarse como no válida para que el robot sepa que esto no sucederá. Peter Mitrano demuestra un experimento de manipulación de cuerdas Peter Mitrano demuestra un experimento de manipulación de cuerdas. El software que él y Berenson desarrollaron puede ampliar los conjuntos de datos de entrenamiento para desafíos como la manipulación de cuerdas y duplicar la tasa de éxito del robot. (Imagen: Dan Newman, Michigan Robotics)

Para la simulación y el experimento de la cuerda, Mitrano y Berenson ampliaron el conjunto de datos extrapolando la posición de la cuerda a otras ubicaciones en una versión virtual de un espacio físico, siempre que la cuerda se comportara exactamente como lo hizo en el primer caso. Usando solo los datos de entrenamiento iniciales, el robot simulado enganchó la cuerda alrededor del bloque del motor el 48% del tiempo. Después de entrenar con el conjunto de datos ampliado, el robot tuvo éxito el 70 % de las veces.

Un experimento que examinó el aprendizaje espontáneo utilizando un robot real sugirió que la tasa de éxito del robot al expandir cada intento de esta manera casi se duplica en el transcurso de 30 intentos, con 13 intentos exitosos en lugar de siete.



Related post

Tesla agrega la variante Model Y con baterías de hoja BYD en Alemania

Tesla agrega la variante Model Y con baterías de…

Según Alemania Tesla Mag, nuevos paquetes de baterías estructurales de BYD están llegando a la planta de Tesla en Grünheide, Alemania.…
Sí, los vehículos eléctricos son más ecológicos que los de gasolina

Sí, los vehículos eléctricos son más ecológicos que los…

Es razonable preguntarse cuáles son estas emisiones y cómo podrían reducirse. Desafortunadamente, sin embargo, el debate inteligente sobre el tema se…
WiTricity recauda $63 millones en una nueva ronda de financiamiento (con video)

WiTricity recauda $63 millones en una nueva ronda de…

WiTricity, la empresa de Massachusetts líder mundial en tecnología de carga inalámbrica, anunció esta semana que acaba de recaudar $63 millones…

Leave a Reply

Tu dirección de correo electrónico no será publicada.