CORPUS

El corpus está formado por 60 horas de grabación realizadas a hablantes monolingües de español y bilingües quichua/quechua- español, toba-español y guaraní-español, llevadas a cabo en la sierra ecuatoriana, Buenos Aires y Resistencia. Las entrevistas que componen la muestra son semidirigidas, basadas en narraciones de historias de vida. Para el tratamiento y digitalización de las 60 horas de grabación se ha empleado ELAN, que permite simultanear texto y sonido en formatos accesibles. Se han etiquetado las transcripciones correspondientes para facilitar la búsqueda por secuencias de texto o etiquetas. Estas transcripciones serán de libre acceso en fragmentos representativos de texto y sonido.

El corpus se ha dividido en función de las áreas de recogida de los datos (sierra ecuatoriana, Buenos Aires y Resistencia). Se han seleccionado algunos fragmentos que aluden a historias, mitos, leyendas, tradiciones del lugar de origen del informante y experiencias en el país o zona de acogida. En estos fragmentos de libre acceso, se ha realizado una transliteración ortográfica para facilitar su lectura.

 

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.