General

Los robots están aprendiendo rápidamente a explorar el mundo como los humanos


Representación artística del algoritmo en acciónMIT News

Cada día, el ser humano promedio toma miles de decisiones, especialmente cuando se trata de adónde ir y cómo llegar. Los investigadores del MIT están trabajando para ayudar a los robots a superar esas mismas opciones en la navegación.

Un nuevo modelo de planificación de movimiento y una red neuronal ayudan a los robots a descubrir cómo llegar a su objetivo final absorbiendo más de su entorno. El algoritmo crea un "árbol" de posibles decisiones que se siguen ramificando hasta que un robot encuentra una ruta óptima de navegación.

Esto podría significar que los robots del futuro no tengan que usar tanta potencia informática y puedan llegar a donde queramos más rápido y más seguro que antes. En la Conferencia Internacional IEEE / RSJ sobre Robots y Sistemas Inteligentes se presentó un documento que detalla el nuevo algoritmo.

Arreglando las viejas formas de navegación automática

Los viejos algoritmos se detuvieron en la metodología de la rama. Nunca ayudaron a un robot a "aprender" de sus errores. Tampoco recuerdan cómo actuaron en instancias anteriores en entornos similares. Esta 'memoria a corto plazo' es lo que el equipo del MIT quería arreglar.

“Al igual que cuando se juega al ajedrez, estas decisiones se ramifican hasta que [los robots] encuentran una buena forma de navegar. Pero a diferencia de los jugadores de ajedrez, [los robots] exploran cómo se ve el futuro sin aprender mucho sobre su entorno y otros agentes ”, dice el coautor Andrei Barbu, investigador del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL) y el Centro para Brains, Minds, and Machines (CBMM) dentro del Instituto McGovern del MIT.

"La milésima vez que atraviesan la misma multitud es tan complicada como la primera", continuó. "Siempre están explorando, rara vez observando y nunca usando lo que sucedió en el pasado".

Ahí es donde entra en juego la red neuronal del equipo. La red permite que el sistema guíe a un robot a través de entornos abarrotados o complicados y luego continúa aplicando esas estrategias en otras situaciones.

"Cuando los humanos interactúan con el mundo, vemos un objeto con el que hemos interactuado antes, o estamos en algún lugar en el que hemos estado antes, así que sabemos cómo vamos a actuar", dice Yen-Ling Kuo, Estudiante de doctorado en CSAIL y primer autor del artículo. "La idea detrás de este trabajo es agregar al espacio de búsqueda un modelo de aprendizaje automático que sepa, por experiencias pasadas, cómo hacer que la planificación sea más eficiente".

Enseñar a un robot direcciones

Los investigadores tuvieron que encontrar una forma de probar su nuevo modelo. Necesitaban construir un entorno que enseñara al modelo a aprender. "Que cuando estás atrapado en un entorno y ves una puerta, probablemente sea una buena idea atravesar la puerta para salir", dijo Barbu.

Desarrollaron una simulación conocida como la "trampa de insectos" en la que un robot 2D tenía que escapar de una cámara interior a través de un canal estrecho que conducía a una habitación más grande. Una vez que el robot 2D escapó por primera vez, el equipo le presentó otra trampa.

Luego introdujeron el modelo a múltiples elementos en movimiento, como en una intersección de tráfico o una calle concurrida. En este ejemplo particular, los investigadores usaron una rotonda, algo con lo que incluso los mejores autos autónomos continúan luchando en tiempos de alto tráfico.

“Situaciones como rotondas son difíciles, porque requieren razonamiento sobre cómo los demás responderán a sus acciones, cómo responderá usted a las suyas, qué harán a continuación, etc.”, dice Barbu. “Con el tiempo, descubre que su primera acción fue incorrecta, porque más adelante conducirá a un probable accidente. Este problema empeora exponencialmente cuanto más coches tienes que lidiar ".

El modelo aprendió a manejar lo que iban a hacer los otros autos de la misma manera que lo haría cualquier humano, explicaron los investigadores. Si bien es aterrador pensar en la robótica tipo Terminator con esta navegación de alta potencia, los investigadores dicen que las aplicaciones prácticas y seguras son numerosas.

Esto podría algún día ayudar a los autos autónomos, como un Tesla Model S, a manejar mejor el paso por una intersección o incorporarse al tráfico. El modelo incluso podría aprender a manejar conductores agresivos y cautelosos.


Ver el vídeo: CLASE 15 LyC GR12 2021 01 21 14 07 07 (Octubre 2021).