Corpus lingüísticos de habla infantil y representatividad: el valor de los datos en repertorios de habla en desarrollo
Other Titles: 
Linguistic Corpus and Representativeness: The Usefulness of Data in Child Language Corpus
Keywords: 
Inventarios de adquisición de la lengua
Datos significativos de habla infantil
Registros verbales evolutivos
Composición de corpus de habla en desarrollo
Corpus-driven vs. Corpus-oriented
Lenguaje infantil
Issue Date: 
2020
Publisher: 
Servicio de Publicaciones de la Universidad de Navarra
ISSN: 
0213-2370
Citation: 
Fernández-Pérez, M. (Milagros). "Corpus lingüísticos de habla infantil y representatividad: el valor de los datos en repertorios de habla en desarrollo". Rilce. Revista de Filología Hispánica. 36 (2), 2020, 651 - 73
Abstract
This paper emphasizes the importance of composition over quantity in child language corpora. The ‘representativeness’ guaranteed in corpora of spoken language usually concerns only the quantitative aspects of the data, the qualitative properties associated to the nature of those corpora being not always well defined. Particularly, they are barely considered in language development corpora. The present, theoretical-methodological contribution explains the need of attributing relevance to child language samples, by using qualitative criteria related to the peculiar characteristics of the language- in-process. Child language is not documented enough, so rather than “reference corpora”, guaranteed to be quantitatively representative, child language corpora are valuable due to the meaning of the samples and their peculiar properties. More concretely, three aspects are argued to be of relevance in the data of a language acquisition corpus: (a) evolutionary records of longitudinal data; (b) variables of idiomatic context and usual environment, responsible of the input; and (c) dense sampling, or with a diversity of individuals, that can reveal relevant patterns and not only the most frequent ones.
Este trabajo destaca la importancia de la composición sobre la cantidad en los inventarios de datos de habla infantil. Las garantías de representatividad exigidas a catálogos de muestras verbales suelen ceñirse a la dimensión cuantitativa, de modo que las propiedades cualitativas ligadas a la naturaleza del propio repertorio no siempre parecen bien definidas y, de manera particular, apenas se contemplan en fuentes de habla en desarrollo. Nuestra contribución, de orden teórico-metodológico, justifica la necesidad de atribuir relevancia a las muestras de habla infantil sobre criterios cualitativos que alcanzan a características genuinas de la lengua-en-proceso. El lenguaje de los niños no está suficientemente documentado, así que antes que “corpus de referencia” con garantías de representatividad cuantitativa, los inventarios de habla infantil sustentan su valor en el significado de las muestras por sus propiedades idiosincrásicas. En concreto, defendemos tres dimensiones requeridas para la pertinencia de los datos en un corpus de adquisición de la lengua: (a) que contengan registros evolutivos de datos longitudinales; (b) que incluyan variables de contexto idiomático y de entorno habitual que canalizan el input; y (c) que se trate de compilaciones densas de muestras, o de compilaciones con diversidad de sujetos, para que en todo caso revelen los patrones interesantes y no solo los frecuentes.
Appears in Collections:

Files in This Item:
Thumbnail
File
rhereder, 12.pdf
Description
Size
122.19 kB
Format
Adobe PDF


Statistics and impact

Items in Dadun are protected by copyright, with all rights reserved, unless otherwise indicated.