The influence of context during the categorization and discrimination of Spanish and Portuguese person names
- Kozareva, Zornitsa
- Vázquez, Sonia
- Montoyo Guijarro, Andrés
ISSN: 1135-5948
Año de publicación: 2007
Número: 39
Páginas: 81-88
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
Este artículo presenta un nuevo método para la categorización y la discriminación de nombres propios utilizando como fuente de información la similitud semántica. Para establecer las relaciones semánticas entre las palabras que forman el contexto donde aparece la entidad que queremos categorizar o discriminar, nuestro método utiliza la semántica latente. Se han realizado diferentes experimentos donde se ha estudiado la influencia del contexto y la robustez de nuestra aproximación sobre distintos números de ejemplos. La evaluación se ha realizado sobre textos en español y portugués. Los resultados obteniendos son 90% para español y 82% para portugués en categorización y un 80% para español y un 65% para portugués en discriminación.