The influence of context during the categorization and discrimination of Spanish and Portuguese person names

  1. Kozareva, Zornitsa
  2. Vázquez, Sonia
  3. Montoyo Guijarro, Andrés
Journal:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Year of publication: 2007

Issue: 39

Pages: 81-88

Type: Article

More publications in: Procesamiento del lenguaje natural

Abstract

Este artículo presenta un nuevo método para la categorización y la discriminación de nombres propios utilizando como fuente de información la similitud semántica. Para establecer las relaciones semánticas entre las palabras que forman el contexto donde aparece la entidad que queremos categorizar o discriminar, nuestro método utiliza la semántica latente. Se han realizado diferentes experimentos donde se ha estudiado la influencia del contexto y la robustez de nuestra aproximación sobre distintos números de ejemplos. La evaluación se ha realizado sobre textos en español y portugués. Los resultados obteniendos son 90% para español y 82% para portugués en categorización y un 80% para español y un 65% para portugués en discriminación.