The influence of context during the categorization and discrimination of Spanish and Portuguese person names

  1. Kozareva, Zornitsa
  2. Vázquez, Sonia
  3. Montoyo Guijarro, Andrés
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Any de publicació: 2007

Número: 39

Pàgines: 81-88

Tipus: Article

Altres publicacions en: Procesamiento del lenguaje natural

Resum

Este artículo presenta un nuevo método para la categorización y la discriminación de nombres propios utilizando como fuente de información la similitud semántica. Para establecer las relaciones semánticas entre las palabras que forman el contexto donde aparece la entidad que queremos categorizar o discriminar, nuestro método utiliza la semántica latente. Se han realizado diferentes experimentos donde se ha estudiado la influencia del contexto y la robustez de nuestra aproximación sobre distintos números de ejemplos. La evaluación se ha realizado sobre textos en español y portugués. Los resultados obteniendos son 90% para español y 82% para portugués en categorización y un 80% para español y un 65% para portugués en discriminación.