Análisis de sentimientos supervisado utilizando skipgrams y su aplicación a medios sociales
- Patricio Martínez Barco Zuzendaria
- Yoan Gutiérrez Vázquez Zuzendaria
Defentsa unibertsitatea: Universitat d'Alacant / Universidad de Alicante
Fecha de defensa: 2024(e)ko otsaila-(a)k 28
- Rafael Valencia García Presidentea
- Estela Saquete Boró Idazkaria
- Eugenio Martínez Cámara Kidea
Mota: Tesia
Laburpena
Las redes sociales han revolucionado la creación y difusión de contenido, permitiendo a los usuarios no solo consumir sino también producir y compartir información a una escala sin precedentes. Esto ha resultado en una enorme cantidad de datos disponibles en la web, que incluyen no solo hechos y datos objetivos, sino también opiniones, emociones y valoraciones personales. Esta información subjetiva es de gran valor, pero su aprovechamiento efectivo no es sencillo debido a la escala y diversidad de los datos generados en las redes sociales, lo que hace prácticamente imposible un análisis manual. En este contexto, surge la necesidad de utilizar herramientas automatizadas para la monitorización, extracción, procesamiento y análisis de información subjetiva a gran escala en tiempo real. Este es el objetivo del análisis de sentimientos, un área dentro del procesamiento del lenguaje natural (PLN) que se enfoca en identificar y clasificar opiniones expresadas en textos de forma automática. Sin embargo, el trabajo con información subjetiva en redes sociales a gran escala presenta varios desafíos que subrayan la importancia de investigar y desarrollar nuevas metodologías que sean eficientes en el uso de recursos computacionales, para hacer el análisis de sentimientos más accesible y democratizado. Los objetivos de investigación de este trabajo se centran en dos aspectos principales. El primero consiste en diseñar y evaluar una metodología de análisis de sentimientos que sea eficaz y al mismo tiempo no consuma excesivos recursos computacionales. Se busca determinar si es posible obtener una efectividad aceptable con una utilización reducida de recursos y evaluar en qué contextos es más eficaz. Para ello se propone una propuesta que utiliza aprendizaje automático supervisado donde las unidades de información son skipgrams, términos de más de una palabra que no aparecen adyacentes explícitamente en los textos. La innovación de la propuesta reside en el método de generación controlada del vocabulario y un sistema de pesado que tiene en cuenta la distancia entre las palabras. Esta propuesta consigue unos resultados aceptables con un uso reducido de recursos. El segundo consiste en aplicar esta metodología a diferentes problemas reales en el contexto de los medios sociales, utilizando la información subjetiva para generar valor, ayudando a comprender el pasado, analizar el presente y tomar decisiones mejor informadas para el futuro. A través de una aplicación desarrollada durante el transcurso de la tesis, se aplica el análisis de sentimientos a diferentes contextos en medios sociales, como la detección de temas e incidentes, predicciones electorales o descubrimiento de factores que aumentan viralidad o compromiso entre los usuarios.