Contributions to hyperspectral image processing from lattice computing and computational intelligence
- VEGANZONES BODON, MIGUEL ANGEL
- María del Carmen Hernández Gómez Director
- Manuel Graña Romay Director
Universidade de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 15 de xuño de 2012
- Ángel Pascual del Pobil Ferré Presidente/a
- Francesco Corona Secretario/a
- Francesc Josep Ferri Rabasa Vogal
- Josep Blat Gimeno Vogal
- Erzebet Merenyi Vogal
Tipo: Tese
Resumo
El marco de trabajo en el que se desarrolla esta Tesis es el procesamiento de imágeneshiperespectrales. Existen actualmente numerosas misiones de distintas agencias espaciales para eldespliegue de sensores hiperespectrales que permitan una sustancial mejora en nuestra capacidadpara el reconocimiento remoto y la observación terrestre. Este hecho tendrá un fuerte impacto en eldesarrollo de aplicaciones en numerosos campos de estudio, tales como Geología, Mineralogía,Ciencias Forestales, Ciencias Marinas, y otros. A su vez, el análisis de este nuevo tipo de imágenesmanifiesta nuevos retos y dificultades.Esta Tesis se vertebra a lo largo de dos líneas de trabajo. La primera se centra en la idea dedesarrollar sistemas de recuperación de imágenes basados en contenido (RIBC) para bases de datosde imágenes hiperespectrales. La segunda se centra en la aplicación de la Computación Reticular alas diversas tareas computaciones que requiere el procesamiento de imágenes hiperespectrales.Sistemas de recuperación de imágenes basados en contenidoLos sistemas RIBC permiten interrogar bases de datos de imágenes en función del propio contenidode las imágenes, en lugar de los tradicionales métodos basados en la búsqueda sobre metadatosasociados a las imágenes. La motivación principal de esta línea de investigación viene dada por elenorme aumento en la cantidad de imágenes captadas por sensores remotos hiperespectrales. Ladefinición de sistemas RBIC para bases de datos de imágenes hiperespectrales requiere:¿ La definición de un proceso de extracción de características que se beneficien lo máximoposible de toda la información contenida en la imagen. Originalmente, teníamos interés enexplotar la información espectral contenida en las imágenes hiperespectrales.¿ La definición de una función de similitud en base a las características extraídas que permitainterrogar la base de datos a partir de una búsqueda dada. Esta función de similitud puedeser una distancia en el espacio de características.¿ La definición de una estrategia de búsqueda, que puede ser directa o disponer de un procesode retroalimentación basada en la evaluación iterativa por parte del usuario de la relevanciade las imágenes devueltas (el término técnico en Inglés es Relevance Feedback).Extracción de característicasEn esta Tesis hemos seguido distintas aproximaciones en la definición de un proceso de extracciónde características para imágenes hiperespectrales. En primer lugar, con el objetivo de incidir en laimportancia de la información espectral contenida en dichas imágenes, hemos definido las firmasespectrales inducidas (¿endmembers¿) como las características de la imagen. En tal caso, el procesode extracción de características consiste en un algoritmo de inducción de endmembers. En trabajossucesivos, hemos incluido información espacial en la caracterización de las imágenes. Estascaracterísticas espaciales se calculan sobre las imágenes de abundancia fracional correspondientes acada endmember inducido en la imagen, y que indican la distribución espacial a lo largo de laimagen de los materiales encontrados. Asumimos que las imágenes de abundancia representan unaversión de dimensionalidad reducida de las imágenes originales, tal que la correlación entre ellas dauna buena medida de la similitud espacial de las imágenes originales.Siguiendo una filosofía completamente distinta, hemos definido y probado un proceso de extracciónde características basado en el uso de algoritmos genéricos de compresión de imágenes. Enconcreto, hemos usado como características de las imágenes los diccionarios extraídos mediante unalgoritmo de compresión sin perdida. Esta aproximación es ciega en el sentido de que se usa toda lainformación de las imágenes independientemente de su significado espectral o espacial.Funciones de similitudEn esta Tesis proponemos medidas de similitud específicas para los espacios de característicasdefinidos para la representación de imágenes hiperespectrales. Para las características espectraleshemos propuesto una distancia que combina la similitud entre cada uno de los endmembersindividuales inducidos para las imágenes. Comparamos esta distancia espectral con otras medidasconvencionales de similitud sobre bases de datos de imágenes hiperespectrales sintéticas y reales.Extendernos a un espacio de características espectral y espacial nos ha llevado a considerar adaptaruna función de similitud del tipo ¿Earth-moving¿ en la que combinamos la ya mencionada distanciaespectral con la información espacial. Finalmente, para las características basadas en diccionarioshemos considerado funciones de similitud ya existentes basadas en la intersección de losdiccionarios, definidos como un conjunto de palabras.Estrategia de búsquedaEn la mayor parte de nuestro trabajo en esta Tesis, la estrategia de búsqueda en la base de datoshiperespectral es directa: comparamos todas las imágenes en la base de datos con la imagen criteriode búsqueda, calculamos sus similitudes y devolvemos aquellas imágenes que sean las más cercanasa la imagen criterio. La Tesis incluye algunos experimentos y resultados obtenidos mediante el usode un proceso de relevance feedback basado en el uso de espacios de disimilitud y un clasificadorentrenado usando las imágenes etiquetadas por el usuario en un proceso iterativo. Estaaproximación introduce una adaptación de la topología del espacio de características de acuerdo alas preferencias del usuario.Computación ReticularLa Computación Reticular ha sido definida como la construcción de algoritmos en el anillo definidopor los números reales, los operadores reticulares infimum y supremum como operadores aditivos,y la adicción de los números reales como operador multiplicativo. Esta definición contiene diversaslíneas de investigación en inteligencia computacional, incluyendo las memorias morfológicasasociativas y otras formas de sistemas difusos. En esta Tesis, la Computación Reticular ha sidoaplicada al análisis de imágenes hiperespectrales en dos formas específicas:¿ La formulación de algoritmos de inducción de endmembers.¿ La formulación de Morfología Matemática Multivariante para la segmentación de imágeneshiperespectrales.Inducción de endmembersMediante el demezclado espectral (Spectral Unmixing), es posible obtener resultados del análisis deimágenes hiperespectrales a una resolución sub-pixel. Para ello, es necesario conocer las firmasespectrales de los materiales en la imagen, que pueden ser dados a-priori o inducidos de la propiaimagen mediante algoritmos de inducción de endmembers. El grupo de investigación había definidopreviamente algunos algoritmos de inducción de endmembers siguiendo una aproximación basadaen la Computación Reticular. Esta Tesis contribuye con un nuevo algoritmo que combina lainducción de endmembers mediante Memorias Reticulares Auto-Asociativas (MRAA) con unalgoritmo genético multi-objetivo para la selección óptima de endmembers a partir de la colecciónde endmembers provista por las MRAAs.Morfología Matemática MultivarianteLa definición de Morfología Matemática en vectores espaciales viene dificultada por lacomplicación de definir una relación de orden apropiada que construya retículos completos(Complete Lattices). Una aproximación relevante es la definición de un orden tal en base a laclasificación de los píxeles de la imagen usando datos de entrenamiento específicos y clasificadoresapropiados cuya salida provee el orden requerido. Esta Tesis construye tal orden usando la distanciade la respuesta de las MRAAs como una salida de un proceso de clasificación, manteniendo así laMorfología Matemática Multivariante dentro del terreno de la Computación Reticular.ContribucionesLas contribuciones de la Tesis desde un punto de vista metodológico son las siguientes:1. Provee una revisión del estado del arte en dos áreas de investigación: los algoritmos deinducción de endmembers y los sistemas de recuperación de imágenes basados encontenido.2. La metodología experimental que hemos empleado para obtener los resultadosexperimentales es exhaustiva y está libre de análisis circular. En el caso de los experimentoscon sistemas RIBC, las medidas de rendimiento fueron computadas mediante característicasobtenidas independientemente para cada imagen. En el caso de los experimentos declasificación, hemos sido cuidadosos para asegurar que los datos de test fuerancompletamente independientes de los datos de entrenamiento.3. Provee una metodología para la generación de imágenes hiperespectrales sintéticas. Laimplementación de la metodología está disponible libre y gratuitamente.4. Provee una metodología de validación de sistemas RIBC en ausencia de verdad del terreno.5. Provee pruebas formales de algunos aseveraciones, tales como la naturaleza de las funcionesde disimilitud.6. Se proveen resultados en imágenes hiperespectrales reales, algunas de estas imágenes hansido profusamente utilizadas en la literatura para la validación experimental cualitativa ycuantitativa.Desde un punto de vista computacional, las contribuciones de esta Tesis son las siguientes:1. Un innovador algoritmo de inducción de endmembers (WM-MOGA) basada enComputación Reticular y algoritmos genéticos multi-objetivos.2. La extensión del paradigma RIBC al dominio de las imágenes hiperespectrales.3. La definición de una distancia sobre imágenes hiperespectrales basada en la caracterizaciónespectral mediante un conjunto de endmembers inducidos.4. La definición de una distancia sobre imágenes hiperespectrales basada en la caracterizaciónespectral y espacial mediante un conjunto de endmembers inducidos y sus correspondientesimágenes de abundancia fraccional.5. La definición de distancias basadas en diccionarios para imágenes hiperespectrales.6. La formulación de una estrategia de relevance feedback para sistemas RIBC hiperespectralesbasada en espacios de disimilitud.7. La definición de una Morfología Matemática Multivariante basada en la respuesta de lasmemorias reticulares auto-asociativas, incluyendo la definición de un gradiente morfológicoy el uso de algoritmos de segmentación watershed para la segmentación de imágeneshiperespectrales.