Abstract
This paper presents an acoustic analysis of vowels pronounced by a group of Costa Rican children, aged between six and twelve years. These analyses aim to achieve a better understanding of the speech characteristics produced by this particular group and thus provide important information for the improvement of automatic speech recognizers and speaker identification. For this purpose, a database consisting of isolated words was built, which contains the phonemes according to various stages of language development in children. Additionally, a strategy for interaction with them was developed. The results confirm and complement the results reported in the literature, showing that a greater variability of speech parameters such as formants, tone, and duration are present in children in comparison to adults. The results allow the characterization of these speech sounds and the possibility of establishing future research in areas such as speech recognition and its dependence on gender and age in this community.
References
Calvo Shadid, A. (2008). Las semiconsonantes y semivocales en los diptongos del español: propuesta de análisis fonológico. Revista de Filología y Lingüística de la Universidad de Costa Rica, 34(2), 107-142.
Coto-Jiménez, M., Goddard-Close, J. y Martínez-Licona, F. M. (2014a). Quality Assessment of HMM-Based Speech Synthesis Using Acoustical Vowel Analysis. En A. Ronzhin, R. Potapova y V. Delic (Eds), Speech and Computer (pp. 368-375). Suiza: Springer.
Coto-Jiménez, M., Martínez-Licona, F. M. y Goddard-Close, J. (2014b). Acoustic Vowel Analysis in a Mexican Spanish HMM-based Speech Synthesis. Research in Computing Science, 86, 53-62.
Delgado, C. (2014). Viajando a Ítaca por los mares cuantitativos. Manual de ruta para investigar en grado y postgrado. Salamanca, España: Ediciones Amarú.
Díaz, S., Cisternas, P. y López, I. (2015). Características acústicas de las vocales del español de Chile producidas por sujetos residentes en la ciudad de Santiago. Revista Chilena de Fonoaudiología, 14, 92-102.
Gerosa, M., Giuliani, D. y Brugnara, F. (2007). Acoustic variability and automatic recognition of children’s speech. Speech Communication, 49(10-11), 847-860.
Goldman, J. P. y Schwab, S. (2014). Easyalign Spanish: An (Semi-)Automatic Segmentation Tool Under Praat. En Y. Martín Congosto, M. L. Montero Curiel y A. Salvador Plans (Eds.), Fonética Experimental, Educación Superior e Investigación (5 vol.) (629-640). Madrid: Arco Libros. doi: https://doi.org/10.5167/uzh-107124.
Hagen, A., Pellom, B. y Cole, R. (2003). Children's speech recognition with application to interactive books and tutors. 2003 IEEE Workshop on Automatic Speech Recognition and Understanding (pp. 186-191). doi: 10.1109/ASRU.2003.1318426.
Hernández Sampieri, R., Fernández Collado, C. y Baptista Lucio, M. P. (2010). Metodología de la Investigación. (5 ed.) México D.F.: McGraw-Hill.
Leinonen, T. N. (2010). An acoustic analysis of vowel pronunciation in Swedish dialects. (Tesis de doctorado). Universidad de Groningen.
Li, Q. y Russell, M. J. (setiembre, 2002). An analysis of the causes of increased error rates in children's speech recognition. Conferencia llevada a cabo en la 7th International Conference on Spoken Language Processing. Interspeech: Denver, EE.UU.
Marín Gálvez, R. (1995). La duración vocálica en español. ELUA: Estudios de Lingüística Universidad de Alicante, (10), 213-226.
Martínez Celdrán, M. (1995). En torno a las vocales del español: análisis y reconocimiento. Estudios de fonética experimental, 7, 195-218.
Martínez-Licona, F. M., Goddard-Close, J. y Coto-Jiménez, M. (2013). Acoustic Analysis of Spanish Vowels in Emotional Speech. En C. Manfredi (Ed), Models and Analysis of Vocal Emissions for Biomedical Applications. 8th International workshop. Firenze: Firenze University Press.
Morales, M. (2010). De los sonidos a las palabras: métodos y técnicas para la estimulación y corrección del lenguaje oral 1. San José, Costa Rica: EUNED.
Petrović-Lazić, M., Babac, S., Vuković, M., Kosanović, R. y Ivanković, Z. (2011). Acoustic voice analysis of patients with vocal fold polyp. Journal of Voice, 25(1), 94-97.
Potamianos, A. y Narayanan, S. (2003). Robust recognition of children’s speech. IEEE Transactions on speech and audio processing, 11(6), 603-616.
Safavi, S., Najafian, M., Hanani, A., Russell, M. J., Jancovic, P. y Carey, M. J. (setiembre, 2012). Speaker recognition for children's speech. Conferencia llevada a cabo en la 13th Annual Conference International Speech Communication Association. Interspeech: Portland, EE. UU.
Salamanca Gutiérrez, G. F. y Valverde San Martín, A. L. (2009). Prestigio y estigmatización en variantes anteriorizadas y posteriorizadas de las vocales del español de Chile. Literatura y lingüística, 20, 125-140.
Schwab, S. (2015). Las variables temporales en el español de Costa Rica y de España: un estudio comparativo. Revista de Filología y Lingüística de la Universidad de Costa Rica, 41(1), 127-139.
Serrano, J. (2006). En torno a las vocales caedizas del español mexicano: una aproximación sociolingüística. En P. M. Butragño (Ed.), Líderes lingüísticos: Estudios de variación lingüística (pp. 37-59). Ciudad de México: El colegio de México.
Skodda, S., Visser, W. y Schlegel, U. (2011). Vowel articulation in Parkinson's disease. Journal of voice, 25(4), 467-472.
Soto Barba, J. (2007). Variación del F1 y del F2 en las vocales del español urbano y rural de la provincia de Ñuble. RLA. Revista de Lingüística Teórica y Aplicada, 45(2), 143-165.
You, H., Alwan, A., Kazemzadeh, A. y Narayanan, S. (setiembre, 2005). Pronunciation variations of Spanish-accented English spoken by young children. Conferencia llevada a cabo en la 9th European Conference on Speech Communication and Technology. Interspeech: Lisboa, Portugal.