Diseño y construcción de un corpus oral multidialectal. El corpus amaresco

  1. Carcelén Guerrero, Andrea 1
  2. Uclés Ramada, Gloria
  1. 1 Universitat de València
    info

    Universitat de València

    Valencia, España

    ROR https://ror.org/043nxc105

Revista:
Normas: revista de estudios lingüísticos hispánicos

ISSN: 2174-7245

Año de publicación: 2019

Volumen: 9

Número: 1

Páginas: 17-36

Tipo: Artículo

DOI: 10.7203/NORMAS.V9I1.16007 DIALNET GOOGLE SCHOLAR lock_openDialnet editor

Otras publicaciones en: Normas: revista de estudios lingüísticos hispánicos

Resumen

En este artículo se describe el protocolo que se ha seguido para la construcción del corpus Ameresco (América Español Coloquial). La recopilación de un corpus multidialectal presenta una serie de retos. Por una parte, la gestión de un gran número de equipos externos requiere un proyecto que metodológicamente sea sólido. Por otra parte, la metodología debe ser coherente con los objetivos del proyecto y con los parámetros esenciales en el diseño de corpus como es establecer las características de las grabaciones, el sistema de transcripción y etiquetado y aspectos relacionados con la anonimización de datos sensibles. Todas estas cuestiones deben provenir de una decisión razonada que garantice que el corpus cumpla con unos estándares de calidad aceptables por la comunidad científica.