Resumen
Los métodos y técnicas computacionales de reconocimiento automático del habla son herramientas que poco a poco se incorporan en la vida cotidiana. Una de sus principales ventajas es que permiten a las personas registrar texto rápidamente usando uno de los medios que mejor saben usar: su voz. Desafortunadamente, esta tecnología aún no es perfecta y los errores de transcripción son comunes. En el idioma español, uno de los errores más comunes de esta tecnología, es la omisión de la tilde diacrítica. Esto se debe en gran medida a que las técnicas utilizadas en el reconocimiento automático del habla ignoran el acento, es decir, la sílaba acentuada de una palabra, que en el idioma español no tiene un patrón fijo, como en otras lenguas. Esto se debe a que estas técnicas fueron desarrolladas inicialmente para el idioma inglés, en el cual no hay tildes y el acento juega un papel menor en la diferenciación de las palabras. Nuestra propuesta es incorporar el análisis del tono en el reconocimiento automático del habla para mejorar la marcación de tildes diacríticas en un texto. Ensayos previos han mostrado que la creencia extendida de que la sílaba acentuada es siempre la más fuerte (la más intensa) es falsa. Por tanto, la intensidad, por sí sola, no es un buen indicador de la ubicación o presencia de la sílaba acentuada que debe ser tildada, sino que el tono también ha de ser considerado. En esta investigación se muestra que el tono puede ayudar a determinar la sílaba que debe ser tildada según nuestra convención gráfica.
Citas
Bogert, B. P., M. J. R. Healy y J. W. Tukey. 1963. «The quefrency analysis of time series for echoes: Cepstrum, Pseudo-Autocovariance, Cross-Cepstrum and Saphe Cracking». En: Proceeding of the Symposium on Time Series Analysis: 209-243.
Bradlow, A. R. 1994. «A comparative acoustic study of English and Spanish vowels».
En: Journal of the Acoustical Society of America XCVII (3): 1916-1924.
Cantero, F. J. 2002. Teoría y análisis de la ento- nación. Barcelona: Edicions Universitat Barcelona.
Fant, G. 1960. Acoustic Theory of Speech Production: With Calculations Based on X-Ray Studies of Russian Articulations. La Haya: Mouton Publishers.
Klapury, A. y M. Davy. 2007. Signal Processing Methods for Music Transcription. Londres: Springer-Verlag.
Real Academia Española. 2005. Diccionario panhispánico de dudas. http://lema.rae. es/dpd/?key=tilde. Consulta: 21 de julio de 2015.
Stevens, S. S., J. Volkmann y E. B. Newman. 1937. «A scale for the measurement of the psychological magnitude pitch». En: Journal of the Acoustical Society of America VIII (3): 185–190.