Modelos neuronales auto-organizativos para la representación de objetos y de su movimiento en escenas realistas
- Francisco Flórez Revuelta Director
- Juan Manuel García Chamizo Director
Universidad de defensa: Universitat d'Alacant / Universidad de Alicante
Fecha de defensa: 05 de junio de 2009
- Manuel Graña Romay Presidente/a
- Andrés Fuster Guilló Secretario
- Emilio Santiago Corchado Rodríguez Vocal
- Luis Javier Herrera Maldonado Vocal
- Miguel Cazorla Quevedo Vocal
Tipo: Tesis
Resumen
En este trabajo de investigación se estudia el problema de la representación y seguimiento de objetos bajo restricciones temporales para el análisis del movimiento, Se enmarca en el proyecto de investigación de I+D financiado parcialmente por la Generalitat Valenciana Servicios de visión en entornos domésticos. Interfaces amigables para el usuario y continúa con la línea de investigación abierta en la tesis doctoral (Flórez, 2001) en la que se proponía un modelo de representación y procesamiento del movimiento para el diseño de arquitecturas de tiempo real especializadas. La aplicación de técnicas de visión por computador en condiciones realistas es complicada. Así mismo, los requisitos/requerimientos en muchas tareas de procesamiento a frecuencia de video sugieren la necesidad de diseñar sistemas capaces de proporcionar respuesta en un tiempo limitado y con una calidad aceptable. Partiendo del estudio desarrollado en (Flórez, 2001) sobre las capacidades de representación de diferentes sistemas neuronales auto-organizativos, se plantea una evolución de dicho modelo de representación, denominada GNG acelerada, que permite la parametrización del modelo para mantener la calidad de representación en función del tiempo disponible. Para ello, se ha realizado un estudio detallado para obtener los parámetros ideales que permitan mantener la velocidad y calidad de representación necesarias en función del tiempo disponible. Para realizar dicho estudio se ha introducido el producto topográfico-geodésico, una nueva medida capaz de cuantificar la preservación de la topología. Esto es, la capacidad de las redes auto-organizativas para representar espacios de entrada no lineales. Siendo objetivo del estudio la representación y seguimiento de personas u objetos en secuencias de video para la posterior interpretación del movimiento, se ha empleado la representación obtenida mediante los gases neuronales para esta tarea, resolviendo el problema de correspondencia mediante la propia estructura de los mapas y añadiendo al sistema capacidades de predicción a diferentes niveles. Estas modificaciones han dado lugar a una nueva funcionalidad para el seguimiento de objetos a la que se ha denominado GNG-Sec o Growing Neural Gas para secuencias. Se ha presentado, así mismo, un diseño del sistema sobre dispositivos reconfigurables para conseguir incrementar la velocidad de procesamiento que adecúe el sistema para incrementar la velocidad de adaptación independientemente de las restricciones temporales existentes. Finalmente, se ha comprobado la validez de la propuesta sobre aplicaciones relacionadas con el seguimiento y análisis del movimiento de múltiples personas u objetos para la interacción hombre-máquina o el reconocimiento gestual. El trabajo desarrollado tiene aplicaciones en un amplio rango de problemas relacionados con la visión artificial: el aprendizaje y representación de mapas topológicos para la navegación de robots autónomos en entornos cambiantes o la compresión y síntesis de objetos en movimiento a alta velocidad son ejemplos representativos.