Hace apenas unos días, el Prof. David Scaramuzza, líder del equipo de Robotics and Perception Group de la University of Zurich, Zürich, Switzerland, presentó (Nature, Vol 620, págs 982–987) los impresionantes resultados de sus drones en el contexto de la competencia contra pilotos humanos de drones, conocida como FPV. En el ámbito de los drones, FPV es el acrónimo de “First Person View”, traducido como “Visión en Primera Persona”. Este término se refiere a la capacidad de pilotar un dron desde la perspectiva del propio dispositivo, en lugar de hacerlo desde una posición terrestre.
La carrera de drones (FPV) es un deporte televisado en el cual profesionales compiten pilotando aeronaves a alta velocidad a través de un circuito tridimensional. Esta modalidad no solo ha revolucionado el vuelo en el mundo de los drones, sino que también ha influido en otros vehículos de radiocontrol, como coches, permitiendo conducir o maniobrar en lugares donde la visibilidad directa es limitada o nula. El FPV implica que pilotos altamente entrenados lleven drones al límite en maniobras ágiles y a alta velocidad.
Durante una carrera, los drones ejercen alcanzando velocidades superiores a los 100 km/h y aceleraciones múltiples veces la gravedad. Aunque se ha avanzado mucho, la mayoría de los sistemas todavía dependen de sistemas de captura de movimiento externo (exteroceptivos) lo que hace desigual la comparación con los pilotos humanos. Los intentos de crear sistemas autónomos que igualen el rendimiento de los pilotos humanos se remontan al primer campeonato de carreras de drones autónomos en 2016.
Cada piloto visualiza el entorno desde la perspectiva de su dron gracias a un vídeo transmitido por una cámara a bordo. Llegar al nivel de los pilotos profesionales con un dron autónomo es un reto, ya que el robot debe volar a sus límites físicos, estimando su velocidad y ubicación en el circuito exclusivamente, a través de sensores (propioceptivos) a bordo.
Scaramuzza explica cómo Swift, un sistema autónomo, puede competir con vehículos físicos al nivel de los campeones mundiales humanos. Swift compitió contra tres campeones humanos, incluyendo a los campeones mundiales de dos ligas internacionales. Este sistema combina el aprendizaje profundo por refuerzo (deep reinforcement learning - DRL) en simulación con datos recopilados en el mundo real. Swift ganó varias carreras y registró el tiempo de carrera más rápido jamás grabado. Este logro marca un verdadero hito en robótica móvil e inteligencia artificial, que podría inspirar la implementación de soluciones basadas en aprendizaje híbrido en otros sistemas físicos.
Swift es un sistema autónomo que, gracias al software embebido, ha demostrado poder competir a nivel de campeones humanos usando solamente sensores y cómputo embebido a bordo. Swift se compone de dos módulos clave: un sistema de algoritmos de percepción que traducen datos en información visual e inercial y algoritmos de control que capturan esta información y producen acciones de control de velocidad en los rotores del dron.
El aprendizaje profundo por refuerzo ha posibilitado avances recientes en inteligencia artificial. Estrategias entrenadas con DRL han superado a humanos en juegos complejos, como Atari, Go, ajedrez, StarCraft, Dota 2 y Gran Turismo. Sin embargo, estas demostraciones se han limitado principalmente a simulaciones y juegos de mesa. Superar esta limitación y mostrar un rendimiento de nivel campeón en competencias físicas es un desafío persistente en robótica autónoma móvil e inteligencia artificial.
Este logro en el uso de la inteligencia artificial en la robótica no solo destaca el potencial de los drones autónomos, sino que también abre un amplio campo de posibilidades para futuras aplicaciones y desarrollos de la programación de algoritmos de aprendizaje profundo con refuerzo en el mundo real.