General

Este nuevo sistema de robótica puede aprender fácilmente una nueva tarea


Se diseñó un sistema de robótica de inteligencia artificial para aprender una nueva tarea con solo verla realizada una vez. La empresa de investigación de inteligencia artificial sin fines de lucro, OpenAI, ha entrenado el sistema robótico solo a partir de la simulación y lo ha aplicado en un robot físico. La misión de la compañía es construir inteligencia artificial general segura y garantizar que sus beneficios se distribuyan abiertamente.

[Fuente de imagen: OpenAI]

El sistema robótico

Una red de visión y una red de imitación alimentan el sistema, lo que permite al robot aprender un nuevo comportamiento que fue demostrado por un simulador. El sistema robótico puede luego replicar ese comportamiento específico en diferentes configuraciones dentro del mundo real. Una cámara incorporada dentro del robot captura una imagen que es ingerida por la red de visión y posteriormente genera un estado que representa la posición de un objeto. Siguiendo el trabajo previo del grupo de investigación, la red de visión se entrena con cientos de miles de imágenes virtuales que tienen diversas perturbaciones de iluminación, texturas y objetos. Sin embargo, la red de visión no practica ni se entrena con imágenes reales.

La red de imitación funciona exactamente como sugiere su nombre. Al observar una demostración, la red procesa los movimientos visualizados y luego imita la intención de la tarea desde una configuración inicial. Esto permite que la red redondee la demostración a una nueva configuración.

[Fuente de imagen: OpenAI]

Para cada tarea, se utilizan miles de demostraciones para entrenar la red de imitación. Una sesión de formación consta de dos demostraciones que realizan exactamente la misma tarea. La primera demostración se da a la red que luego tiene que observar la segunda demostración sólo una vez. El aprendizaje supervisado se pone en práctica para predecir la acción del demostrador en esa observación. El robot es capaz de predecir acciones de manera eficaz al aprender a inferir la sustancia principal de la tarea utilizando la primera demostración.

Gracias al trabajo continuo del equipo, la red de imitación recibió un nuevo algoritmo llamado aprendizaje de imitación de una sola vez. Este algoritmo permite a un humano realizar una nueva tarea al realizarla en realidad virtual. A partir de una única demostración, el sistema robótico puede resolver la misma tarea partiendo de una configuración aleatoria.

Tarea de apilamiento de bloques

Equipado con las redes de visión e imitación, el robot se puso a prueba consiguiendo que realizara una rutina de apilamiento de bloques demostrada a través de la realidad virtual controlada por un humano. El equipo suministró al robot datos de entrenamiento que consisten en pares de trayectorias que apilan bloques en un conjunto correspondiente de torres en el mismo orden pero comenzando desde un estado de inicio diferente.

El equipo tuvo que introducir algo de ruido en las salidas de la política programada del sistema para que la red de imitación aprendiera una política sólida. Mediante el uso de datos de ruido, el sistema robótico pudo demostrar cómo reagruparse cuando algo sale mal. Esto resultó en una red de imitación más inteligente que aborda las anomalías y perturbaciones de una política de escritura imperfecta.

Si estás interesado en formar parte de este proyecto de robótica, puedes unirte a OpenAI en su sede en San Francisco.

Fuente: OpenAI

VEA TAMBIÉN: ¿La inteligencia artificial significará el fin de la inteligencia humana?


Ver el vídeo: Música para Estudiar y Concentrarse y Memorizar. Música Clásica para Estudiar y Concentrarse Violin (Diciembre 2021).