The influence of context during the categorization and discrimination of Spanish and Portuguese person names
- Kozareva, Zornitsa
- Vázquez, Sonia
- Montoyo Guijarro, Andrés
ISSN: 1135-5948
Ano de publicación: 2007
Número: 39
Páxinas: 81-88
Tipo: Artigo
Outras publicacións en: Procesamiento del lenguaje natural
Resumo
Este artículo presenta un nuevo método para la categorización y la discriminación de nombres propios utilizando como fuente de información la similitud semántica. Para establecer las relaciones semánticas entre las palabras que forman el contexto donde aparece la entidad que queremos categorizar o discriminar, nuestro método utiliza la semántica latente. Se han realizado diferentes experimentos donde se ha estudiado la influencia del contexto y la robustez de nuestra aproximación sobre distintos números de ejemplos. La evaluación se ha realizado sobre textos en español y portugués. Los resultados obteniendos son 90% para español y 82% para portugués en categorización y un 80% para español y un 65% para portugués en discriminación.