Detecting deception, partisan, and social biases
- SÁNCHEZ JUNQUERA, JUAN JAVIER
- Manuel Montes Gómez Director/a
- Paolo Rosso Director/a
- Simone Paolo Ponzetto Director/a
Universidad de defensa: Universitat Politècnica de València
Fecha de defensa: 27 de julio de 2022
- Raquel Martínez Unanue Presidente/a
- David Tomás Díaz Secretario
- Éric SanJuan Vocal
Tipo: Tesis
Resumen
Hoy, el mundo político tiene tanto o más impacto en la sociedad que la sociedad en el mundo político. Los líderes políticos, o representantes de partidos políticos, utilizan su poder en los medios de comunicación para modificar posiciones ideológicas y llegar a la gente con el fin de ganar popularidad en las elecciones gubernamentales. Mediante un lenguaje engañoso, los textos políticos pueden contener sesgos partidistas y sociales que socavan la percepción de la realidad. Como resultado, la polarización política dañina aumenta porque los seguidores de una ideología, o miembros de una categoría social, ven a otros grupos como una amenaza o competencia, lo que termina en agresiones verbales y físicas con resultados desafortunados. La comunidad de Procesamiento del Lenguaje Natural (NLP) tiene nuevos aportes todos los días con enfoques que ayudan a detectar discursos de odio, insultos, mensajes ofensivos e información falsa, entre otras tareas computacionales relacionadas con las ciencias sociales. Sin embargo, muchos obstáculos impiden erradicar estos problemas, como la dificultad de contar con textos anotados, las limitaciones de los enfoques no interdisciplinarios y el desafío agregado por la necesidad de soluciones interpretables. Esta tesis se centra en la detección de sesgos partidistas y sociales, tomando como casos de estudio el hiperpartidismo y los estereotipos sobre los inmigrantes. Proponemos un modelo basado en una técnica de enmascaramiento que puede detectar lenguaje engañoso en temas controvertidos y no controvertidos, capturando patrones relacionados con el estilo y el contenido. Además, abordamos el problema mediante la evaluación de modelos basados en BERT, conocidos por ser efectivos para capturar patrones semánticos y sintácticos en la misma representación. Comparamos estos dos enfoques (la técnica de enmascaramiento y los modelos basados en BERT) en términos de su desempeño y la explicabilidad de sus decisiones en la detección de hiperpartidismo en noticias políticas y estereotipos de inmigrantes. Para identificar estereotipos de inmigrantes, proponemos una nueva taxonomía apoyada en la teoría de la psicología social y anotamos un conjunto de datos de intervenciones partidistas en el parlamento español. Los resultados muestran que nuestros modelos pueden ayudar a estudiar el hiperpartidismo e identificar diferentes marcos en los que los ciudadanos y los políticos perciben a los inmigrantes como víctimas, recursos económicos o amenazas. Finalmente, esta investigación interdisciplinaria demuestra que los estereotipos de inmigrantes se utilizan como estrategia retórica en contextos políticos.