Extracción de opiniones sobre característicasun enfoque práctico adaptable al dominio.
- Cruz Mata, Fermín
- José Antonio Troyano Jiménez Director/a
Universidad de defensa: Universidad de Sevilla
Fecha de defensa: 04 de octubre de 2011
- José Miguel Toro Bonilla Presidente/a
- Mariona Taulé Delor Secretario/a
- Luis Alfonso Ureña López Vocal
- Manuel Palomar Sanz Vocal
- Horacio Rodríguez Hontoria Vocal
Tipo: Tesis
Resumen
En el contexto de la Web 2.0, las opiniones volcadas por los usuarios a través de las redes sociales, foros y otros servicios, acerca de productos, política u otras temáticas, conforman una interesantísima información con un gran potencial practico de cara a l ... as empresas, las administraciones y los ciudadanos. Siendo el texto libre el principal vehículo de dicha información en Internet, las Tecnologías del Lenguaje y el Procesamiento del Lenguaje Natural ocupan un papel protagonista de cara al tratamiento y análisis automático de la misma. De manera más concreta, recientemente diversos investigadores se han venido ocupando del tratamiento computacional de las opiniones, los sentimientos y otros fenómenos subjetivos del lenguaje. Dentro de esta disciplina, en el presente trabajo de tesis abordamos el problema de la extracción de opiniones sobre características, tarea cercana a la extracción de información y consistente en extraer representaciones estructuradas de las opiniones individuales contenidas en los textos, incluyendo la identificación de las características concretas del objeto sobre las que se vuelcan las opiniones, y la polaridad positiva o negativa de dichas opiniones. Los aspectos fundamentales de nuestro acercamiento son dos: la consideración del dominio de aplicación en cada una de las fases de la resolución del problema, y el uso de taxonomías de características, que permiten que el conjunto de opiniones extraídas sean fácilmente agregables y visualizables.En la presente memoria, definiremos un conjunto de recursos de apoyo a la tarea de extracción de opiniones sobre características, adaptables al dominio; propondremos una metodología para la generación de los mismos, proporcionando las herramientas y algoritmos necesarios para minimizar la participación manual en el proceso; y describiremos un sistema de extracción de opiniones sobre características modular y adaptable al dominio, al que hemos denominado TOES (Taxonomy-based Opinion Extraction System). Los resultados de la experimentación que llevaremos a cabo nos permitían afirmar la importancia del dominio en el problema que nos ocupa, y la utilidad de las opiniones extraídas de cara a una aplicación de agregación y visualización de opiniones.