Facebook desarrolla robots que aprenden por sí solos a partir de su interacción autónoma con el entorno

Los investigadores de inteligencia artificial (IA) de Facebook han compartido sus avanzas en el desarrollo de robots que aprenden por sí solos a partir de su interacción autónoma con el entorno, lo que ha dado lugar a un robot que ha aprendido a andar solo o a aprender de forma más eficiencia a través de la curiosidad.

El equipo de facebook ha desarrollado numerosos robots de aprendizaje autónomo, un hexápodo que ha aprendido a andar solo, un brazo articulado que explora el entorno movido por la ‘curiosidad’ y un robot con sensores táctiles para interactuar con el entorno, como explica la compañía en un comunicado.

Los experimentos que han llevado a cabo se han centrado en el aprendizaje por refuerzo autónomo, que se basa en la recogida de estímulos del entorno y una serie de pruebas supervisadas que permite a los robots aprender a moverse de manera autónoma, explorar su entorno e interactuar con los objetos con los que se encuentran.

La aplicación de estos métodos de aprendizaje por refuerzo autónomo, en inglés ‘reinforcement learning’, ha dado lugar a un robot de seis piernas capaz de aprender de manera autónoma a caminar, sin ninguna instrucción o comando externo, y sin tener información sobre sus capacidades o el entorno.

El proceso depende de los sensores localizados en las articulaciones de las piernas del robot y de un algoritmo de aprendizaje por refuerzo autónomo. El robot recoge información con la que optimiza el modelo para lograr su meta, y mejora su rendimiento con el tiempo.

La complejidad radica en que el robot debe tener en cuenta su equilibrio, su ubicación en el espacio y su localización geográfica, y el ruido que generan los sensores dificulta la estimación y la precisión de los estímulos recogidos.

El equipo FAIR (Facebook Artificial Intelligence Researchers) ha desarrollado estos experimentos con el fin de obtener un robot capaz de aprender a moverse solo con el menor número de interacciones posible y que el proceso de automatización se reduzca a unas horas, en vez de días o semanas.

El equipo de investigación IA, bajo el enfoque de la curiosidad, ha trabajado también en un modelo de un brazo robotizado. El robot intenta reducir la incertidumbre de las situaciones y obstáculos de su entorno a través de la exploración estructurada, y motivado por su ‘curiosidad’, en lugar de hacerlo de forma aleatoria.

Con esta aproximación, el robot optimiza las acciones y reduce la incertidumbre del modelo, de tal forma que puede enfrentarse a nuevas tareas, ya que de esta exploración motivada por la ‘curiosidad’ obtiene una gran cantidad de datos nuevos y variados, con los que aprende. Así, el robot puede realiza las tareas más rápidamente, y le permite aprender a evitar trabarse y a esquivar determinados peligros del entorno.

Por último, también han aplicado el método de aprendizaje autónomo a un tercer robot para que, a través del tacto, sea capaz de realizar su tarea si un objeto le estorba la vista. Para ello, se ha empleado un modelo predictivo de vídeo y un un mapa de altas dimensiones proporcionado por un sensor táctil de alta resolución, para que el robot decida cuál es la secuencia óptima de acciones para realizar una determinada tarea. Con este método de predicción, el robot ha logrado realizar numerosas tareas, como hacer rodar una pelota, mover un ‘joystick’ o identificar un dado de 20 caras.