Computer vision techniques for autonomous vehicles applied to urban underground railway

  1. ETXEBERRIA GARCIA, MIKEL
Dirigida por:
  1. Nestor Arana Arejolaleiba Director
  2. Maider Zamalloa Aquizu Codirector/a

Universidad de defensa: Mondragon Unibertsitatea

Fecha de defensa: 06 de julio de 2022

Tribunal:
  1. Viviane Thérèse Marie Cadenat Presidente/a
  2. Daniel Maestro Watson Secretario/a
  3. Gorka Sorrosal Yarritu Vocal
  4. Dimitrios Chrysostomos Chrysostomou Vocal
  5. Josef Cernohorsky Vocal

Tipo: Tesis

Teseo: 787193 DIALNET lock_openTESEO editor

Resumen

La presencia de vehículos autónomos se está convirtiendo en una realidad en la vida cotidiana, con coches de conducción autónoma en la carretera, trenes GOA3-GOA4 en el ámbito ferroviario o vehículos guiados automatizados en el ámbito industrial. Estos sistemas autónomos deben ejecutar tareas complejas para percibir el entorno y tomar decisiones con una interacción humana limitada o incluso sin ella. Siendo esto así, la localización y la estimación del movimiento son tareas críticas para las operaciones que debe realizar un vehículo autónomo. La información sobre la posición es esencial para identificar el contexto del vehículo y su entorno y moverse o actuar en consecuencia. Los enfoques basados en la visión artificial (CV) han mostrado resultados prometedores en la robótica móvil, los drones o los coches autónomos. Sin embargo, la aplicación y evaluación de las soluciones basadas en CV son más limitadas en el ámbito ferroviario, especialmente en entornos desafiantes en cuanto a características visuales. En esta investigación, se realiza un estado del arte (SOTA) de los algoritmos de Odometría Visual (VO) y SLAM Visual (vSLAM). En el SOTA, los algoritmos VO/vSLAM analizados suelen evaluarse en escenarios exteriores y no consideran las retadoras características perceptuales que pueden encontrarse en los escenarios ferroviarios subterráneos urbanos, con condiciones de baja iluminación y zonas sin texturas en los túneles y cambios de iluminación significativos entre los túneles y las estaciones ferroviarias. Además, no existe ningún dataset de referencia en la comunidad VO/vSLAM con estas características, lo que ha planteado la necesidad de generar un conjunto de datos propio. Teniendo en cuenta la falta de señales GPS en escenarios subterráneos, se propone un método para generar un dataset de imágenes con datos verificados sobre el terreno de posiciones en escenarios ferroviarios subterráneos urbanos. El proceso de generación se basa en la sincronización de coordenadas geodésicas, los datos de ATP del tren registrados desde los sensores de radar y codificadores, y un mapa de gradiente ferroviario proporcionado por el administrador de la infraestructura ferroviaria. Se han probado dos enfoques VO/vSLAM de última generación y recientemente propuestos (ORB-SLAM2 y DF-VO) en los datasets generados. Estos algoritmos han logrado un buen rendimiento en datasets estándar como KITTI y representan dos tipos de algoritmos VO/vSLAM distintos: geométricos y basados en el aprendizaje. Sin embargo, los resultados muestran que las características de iluminación del escenario afectan significativamente al rendimiento de los algoritmos VO/vSLAM. Para afrontar las difíciles condiciones de iluminación del ámbito ferroviario subterráneo, se ha considerado la aplicación de una técnica de mejora de datos (EnlightenGAN). Como la calibración es fundamental para los algoritmos geométricos VO/vSLAM, también se ha analizado el impacto de EnlightenGAN en los parámetros de calibración de la cámara. Los resultados demuestran que EnlightenGAN no afecta considerablemente a esos parámetros. Además, mejora el rendimiento de ambos enfoques VO/vSLAM en escenarios difíciles.