Cuestionario de opinión para la Evaluación del desempeño docente en la
UNAN-MANAGUA, Nicaragua, FAREM-Chontales
Questionnaire for evaluating teacher performance in UNAN-MANAGUA,
FAREM-Chontales
Tonys Romero Díaz1
1 Profesor de Matemática y Estadística en la Universidad Nacional
Autónoma de Nicaragua, UNAN-MANAGUA. Estudiante del Doctorado en Educación e Intervención
Social. Dirección electrónica: tonyromerong@hotmail.comDirección para correspondencia
Resumen
El artículo expone la metodología empleada para desarrollar un
cuestionario de evaluación docente para la Facultad Regional
Multidisciplinaria de Chontales (FAREM), Nicaragua, al que nombramos
CEDUCH, y los resultados obtenidos durante la investigación. El
cuestionario consta de 30 preguntas distribuidas en ocho dimensiones o
categorías las cuales se obtuvieron de un pilotaje mediante el Análisis
Factorial exploratorio. Estas dimensiones mostraron estar altamente
correlacionadas positivamente entre sí, confirmando que el cuestionario
es multidimensional. Se utilizó una escala Likert de 5 adjetivos de
respuesta, y para la valoración final se construyó una escala de 3
calificativos. Se aplicó una muestra probabilística de 453 estudiantes
en la institución en donde los análisis realizados ítem-test e
ítem-ítem mostraron correlaciones significativas que demuestran que las
preguntas discriminan de acuerdo con el constructo medido. La validez
de contenido del constructo arrojó un índice de 0.933; la consistencia
interna mostró resultados altos e iguales a 0.967 el coeficiente theta
y de 0.975 el coeficiente omega; la confiabilidad de la prueba se
determinó mediante el Alfa de Cronbach donde se obtuvo un coeficiente
de 0.966. Dado que el desempeño docente es multidimensional, se
recomienda complementar el cuestionario con otro tipo de metodología
que permita valorar holísticamente el actuar docente.
Palabras clave: Análisis Factorial, Desempeño Docente,Educación
Superior, Cuestionarios, Evaluación, Nicaragua
Abstract
The article presents the methodology used to develop a teacher
evaluation questionnaire for Multidisciplinary Regional
School Chontales (FAREM), Nicaragua, which
named CEDUCH, and the results
obtained during the investigation. The questionnaire consists of 30
questions divided into eight dimensions or categories that were
obtained from a pilot using exploratory Factor Analysis. These
categories are shown to have a high positive correlation with one
another, confirming that the questionnaire is in fact multidimensional.
We use a Likert scale of five response adjectives, and for the final
score we use a scale of three qualifiers. The questionnaire
was given to a random sample of
453 students at CEDUCH; the
item-test and item-item analyses showed significant
correlations, which demonstrates that the questions discriminate in
accordance with the construct being measured. The content validity of
the construct yielded an index of 0.933; the internal consistency
results were greater than or equal to 0.967 and 0.975 for the theta and
omega coefficients, respectively. The test reliability was determined
by Cronbach's alpha coefficient, which had a value of 0.966. As teacher
performance is multidimensional, it is recommended to supplement the
questionnaire with other holistic methodology to assess the teaching
act.
Key words: Factor Analysis, Teacher Performance, Higher Education,
Questionnaires, Evaluation, Nicaragua.
1.Introducción
Si bien es cierto que la evaluación de la docencia, por parte de los
estudiantes y mediante el uso de cuestionario, es un tema muy estudiado
en todas las universidades del mundo, en Nicaragua es un tema poco
abordado desde el punto de vista de publicación. Está claro que la
evaluación de la docencia en nuestras universidades se hace de algún
modo, pues de otro modo carecería de sentido la premiación a profesores
o el cambio de categoría docente, o la nueva contratación por el cese
de actividades de algún compañero. Lo que no queda claro en algún
documento oficial es el instrumento de evaluación y la metodología de
aplicación, así como el uso que tiene la información.
En este contexto se propone la implementación del primer instrumento de
evaluación docente llamado CEDUCH (Cuestionario de Evaluación Docente
Unan Chontales), el cual servirá de apoyo al seguimiento y mejoramiento
de la práctica docente en la Facultad. Este cuestionario presenta alta
validez y confiablidad, porque ha sido sometido a tres pruebas y dos
evaluaciones de expertos (Anexo 1).
Será la primera vez que la Facultad cuente con un instrumento validado
y probado en la misma Facultad, mediante el cual se obtendrán
valoraciones confiables de los estudiantes y esto soportará decisiones
del tipo académicas que se hagan con los docentes, en beneficio de un
mejor ejercicio académico como es el de enseñar.
Este instrumento constituye el primer aporte teórico para nuestra
universidad y además es novedoso en cuanto al estilo y la forma de
recogida de la información, ya que el estudiante podrá evaluar a dos
docentes simultáneamente y permitirá comparar sus aportes a la
evaluación simultáneamente con lo cual el instrumento se vuelve más
objetivo y eficaz.
Es así que ante las razones expuestas, se añade la necesidad de que los
docentes podamos tener en cuenta los aportes de los estudiantes acerca
de nuestro desempeño en el aula de clases y permita mejorar la misma
práctica, ante lo cual surge la siguiente pregunta, ¿Por qué no
utilizar la encuesta de medición del desempeño para estimar la
satisfacción del estudiante sobre nuestro trabajo docente?
Evidentemente, la negación de esta actividad haría que nuestra forma de
trabajar siga siendo la misma de siempre y no encontraríamos puntos de
inflexión en la docencia universitaria. Posturas como la negación de
esta propuesta solo
provocaría retrasos del orden competencia y actualidad universitaria
que tanto necesita nuestra universidad en estos momentos de
acreditación y competitividad internacional.
2. Breve referente teórico
La docencia es una de las actividades más complejas al momento de
pretender evaluar el desempeño laboral de un docente, sea este
administrativo o académico; la presente investigación propone un modelo
de evaluación del tipo académica para docentes basado en un
cuestionario de opinión por parte de los estudiantes. ¿Por qué solo por
los estudiantes? En primer lugar, porque es la técnica de evaluación
más usada por las universidades en el mundo y, al mismo tiempo, la más
estudiada, existen más de dos mil trabajos publicados en relación a los
cuestionarios de opinión docente (Luna y Torquemada, 2008). Aunque
mucho se critique la centralidad que tienen los cuestionarios, hay
muchas experiencias que muestran que la construcción de una adecuada
escala para las preguntas y otra para la respuesta proporciona
resultados confiables (González, Mendiola y Stack, 2010).
Los procesos de autoevaluación dentro de las instituciones
universitarias son de los más importantes, ya que dan cuenta del
funcionamiento interno de la organización, a través de ellos, se pueden
establecer fortalezas y debilidades que retroalimentan la calidad de la
educación ofrecida, y contribuyen significativamente a su mejora en
todos los aspectos del quehacer universitario (Patiño, 2006); por tal
motivo, este instrumento pretende ser un insumo para el proceso de
autoevaluación institucional.
Hay muchas razones por las que se debiera tomar muy en cuenta la
opinión de los estudiantes: primero, porque con ellos es con quienes el
docente realiza todo el trabajo asignado; segundo, el tiempo que
interactúan con el docente es el más largo posible que con cualquier
otro involucrado; el alumno es un observador constante de la actividad
docente; el alumno es afectado directamente
por cualquier decisión que
el docente realice en la asignatura
correspondiente, se podría
enumerar más razones y todas afirmarán que el estudiante es el actor
más involucrado con la actividad docente.
La opinión de los alumnos sobre el desempeño de sus docentes representa
un indicador muy importante a considerar en las tareas de evaluación.
Por ello, el desarrollo sistemático de instrumentos como el que se
presenta es una actividad no sólo deseable sino necesaria (Valenzuela,
2002).
Para la evaluación del desempeño docente existen muchas alternativas
metodológicas, entre las más usadas están los cuestionarios de opinión,
la entrevista cualitativa, los grupos de discusión con estudiantes,
entre otras. Por ejemplo, se pueden usar pequeños grupos de estudiantes
para recoger información, por medio de entrevistas informales para
analizar las percepciones de los estudiantes sobre el actuar docente.
Al respecto, Vásquez y Gabalán (2006) nos señalan que debe evitarse el
medir la labor del docente en términos meramente cuantitativos, así
como el establecer comparaciones con respecto a otros maestros, es
decir, no abusar ni creer únicamente los resultados que arrojen los
cuestionarios.
La evaluación debe orientarse a la obtención de un perfil del docente
con respecto al modelo educativo, por ello, es conveniente hacer uso de
varias evaluaciones al momento de considerar la implementación de un
modelo de desempeño docente en la universidad: “La evaluación no sólo
consiste en la recopilación de datos sobre su desempeño, sino que
también conlleva la elaboración de juicios de valor sobre aspectos
relevantes de la institución. Por eso, es una labor de carácter
cuantitativo y cualitativo” (Aguilar, 2002, p. 10).
La inclinación al desarrollo de una metodología exclusivamente
cuantitativa en el presente trabajo obedece a que constituye el primer
acercamiento del problema en nuestra facultad, evidentemente
como se señala en los párrafos anteriores,
la metodología cuantitativa debe complementarse con la
cualitativa para obtener un modelo integral al desempeño docente, sobre
esta última se presentarán avances en los próximos meses, lo que le
dará continuidad a la construcción del modelo de evaluación al
desempeño docente en nuestra universidad.
Cuando se desea medir el desempeño es importante identificar que no se
va a medir el desempeño en general, sino que se debe medir
específicamente el desempeño de las funciones específicas, en este
sentido como lo menciona Chiavenato (2000): “no estamos interesados en
el desempeño general, sino en el desempeño del cargo, en el
comportamiento de rol del ocupante del cargo”, en esta medida es
importante medir las actividades, tareas, procesos entre otros, lo que
conlleva a un resultado propio de las funciones del cargo, pero este
último no se mide en sí (p. 357).
Por su parte, Romero y González (2009) plantean que no se pretende que
el docente sea un ser “perfecto” conocedor y solucionador de todos los
problemas. Por el contrario, se requiere un ser humano, capaz de
reflexionar en su propia práctica, corrigiendo errores, aceptando
nuevas formas de concebir el mundo, dando apertura a todas las
corrientes del pensamiento, utilizando el discurso
argumentativo para erigirse en
un líder de renovada factura,
convirtiéndose en un ejemplo
de ciudadano mediante el
cumplimiento de sus funciones y destacando con real
humildad los elementales valores del hombre.
La evaluación del desempeño es un mecanismo que tiene como propósito la
búsqueda de la calidad
y del funcionamiento eficiente de las organizaciones orientadas
a prestar servicios o producir bienes para el desarrollo de la
sociedad.
La dinámica social genera cambios profundos que logran alterar el orden
socioeconómico, político, la tecnología y hasta los procesos de
enseñanza y de aprendizaje, generando crisis, las cuales se deben
solventar. He aquí la importancia de la evaluación para la
autorregulación que incorporan las universidades, a fin de asegurar la
calidad de los servicios que presta (Matos y Guadrón, 2008), más si
esta evaluación está reglamentada permitiría que el proceso sea más
efectivo.
En el diseño del cuestionario se ha considerado la experiencia de
evaluación docente en universidades de países como México, España, los
Estados Unidos y Venezuela. En estos países la aplicación de
cuestionarios ha dado éxitos; sin embargo, es destacable que en estas
universidades, aunque la evaluación se hace con fines de mejora de la
práctica docente, también sirve como método para promoción y
contratación de profesores. En este sentido, la propuesta en la FAREM
Chontales es que sea un instrumento que permita evaluar el desempeño
docente en el aspecto académico en beneficio de tener cambios que
mejoren la práctica docente y el rendimiento en las asignaturas.
Por lo anterior, se ha concluido que la evaluación docente del
departamento académico se haga por medio de un cuestionario. Dicho
cuestionario ha pasado todas las pruebas de confiabilidad en sus tres
etapas de validación.
3. Metodología
3.1. Tipo de estudio
El modelo adoptado en la investigación es de naturaleza exploratoria,
descriptiva y correlacional. Esto es, se pretende explorar cuáles son
las opiniones y criterios mediante el cual los estudiantes caracterizan
el desempeño docente de la Facultad. Describir las dimensiones del
trabajo académico en que se puede dividir el desempeño docente en la
facultad por medio de este cuestionario. Correlacionar las diferentes
dimensiones del instrumento, estableciendo una debida escala que
justifique el uso del CEDUCH como instrumento de medición válido y
confiable para evaluar la actuación docente.
La orientación predominante es correlacional, ya que tiene el propósito
de evaluar la relación existente entre
diversas variables y constructos acerca del desempeño docente (Hernández, Fernández
y Baptista, 2004) y, sobre todo, se pretende dar a conocer cómo se
comportan algunas de las variables involucradas, conociendo el
comportamiento de las otras.
Por esta razón, optamos por una metodología de investigación centrada
en el empleo de técnicas cuantitativas que se complementan y que nos
permiten acceder al trabajo de campo con una visión más amplia, que se
justifica con la aplicación del instrumento en
cuestión y el respectivo análisis de
datos, con el único objetivo
de responder mejor al propósito de esta investigación.
3.2. Fase de diseño/adaptación
Primeramente, se aplicó el instrumento a cuatro grupos de clases que
hacen un total de 34 estudiantes de distintos turnos. El objetivo en su
primera versión, era entre cosas la de validar el instrumento,
determinar si éste tenía un buen índice de discriminación y determinar
mediante el análisis factorial exploratorio en cuántas dimensiones se
podía agrupar el instrumento que medía el desempeño docente.
Inicialmente, el instrumento contaba con 20 preguntas, las que, de
acuerdo a nuestro criterio, servían para medir el desempeño docente,
así como otras preguntas de aspectos generales de las asignaturas, que
en total hacían al instrumento tener 32 preguntas.
El procedimiento fue entregar en cada uno de los cuatros grupos el
instrumento a los tres estudiantes con rendimiento más alto (más de 80
puntos) y otros tres cuestionarios a los estudiantes de rendimiento
bajo (menos de 60 puntos) y dos cuestionarios a dos estudiantes de
rendimiento medio, mediante una forma que ellos no podían saber, porque
habían sido seleccionados (en dos de los grupos se pidió también la
colaboración del presidente de sección). Se les dijo que era el
resultado del muestreo y, una vez que entregaban el instrumento, el
encuestador colocaba una clave al dorso del cuestionario e indicaba a
qué grupo pertenecía. Este procedimiento se consideró así, porque se
quería estar seguro que ninguna de las preguntas serviría de
diferenciación para evaluar el desempeño docente2. Una vez completado
el instrumento, se obtuvieron los siguientes resultados:
Como se puede apreciar en la Tabla 1, la consistencia interna del
instrumento resultó ser alta (Alfa de Cronbach = 0.916), lo que sirvió
para proceder con el resto de análisis estadísticos.
La Tabla 2 muestra el alfa de Cronbach por cada ítem, así como la
correlación de cada ítem respecto al instrumento en general; el
criterio acá es que aquellos ítems que obtengan valores inferiores a
0.3 deben de ser eliminados. En nuestro caso, el criterio fue
eliminarlos con valores inferiores a 0.4. ¿Por qué?, sencillamentem
porque estos presentan dificultad en su llenado o la forma de responder
no es la adecuada, por tal razón, se decidió eliminar del
cuestionario las preguntas: P3, P4, P5, P6, P7, P8, P9, P14, P31 y P32;
del mismo modo, se replanteó la pregunta número quince (P15) por estar
en el valor del límite establecido como criterio.
En su criterio, Ebel y Frisbie (1991), a partir del análisis del
comportamiento de ítems, sostienen que el coeficiente de dificultad y
el índice de discriminación de un ítem están estrechamente relacionados
y que aquellos ítems que tienen un coeficiente de dificultad medio (en
el caso del ejemplo anterior entre 0.4 y 0.6) son los que mejor
discriminan y, por
tanto, proporcionan mayor información sobre las diferencias de nivel
de competencia evaluado entre los participantes.
De esta forma, el cuestionario en su primera versión original y como
propuesta contendría 21 preguntas. En el cuestionario el estudiante
respondió en una escala numérica del 1 al 10, otorgando 1 al peor
desempeño en cada pregunta y 10 al mejor de los desempeños, porque
medir del 1 al 10 da mejores diferencias que de 1 al 5.
El nivel de confianza seleccionado fue del 0.05, por ser el más usado
para las ciencias sociales. Después de esto se creó una variable que
contenía la suma de las preguntas P10 a la
P29, entonces, dividiendo
por dos quedaba la calificación
del estudiante dado a la asignatura impartida
por un docente con una escala porcentual (del 1 al 100). Esta variable
determinaría el tipo de distribución estadística que se usaría, con lo
cual se probó la hipótesis de normalidad usando primero un gráfico P-P,
Q-Q, y las pruebas de normalidad de Kolmogorov-Smirnov junto con la de
Shapiro-Wilk para el caso en que el tamaño muestral es menor a 50
(Merino y Díaz, 2005).
H0: Los datos extraídos proceden de poblaciones normales.
H1: Los datos extraídos no proceden de poblaciones normales.
En la tabla 3 se aprecia que el estadístico de Shapiro-Wilk en los tres
grupos fue superior a 0.05 con lo cual se acepta la hipótesis nula que
las datos extraídos se comportan de acuerdo a la distribución normal
(Se rechaza la hipótesis nula de normalidad en el caso que el valor de
significancia sea inferior a 0.05). Mientras tanto, el gráfico 1 y el
gráfico 2 confirman la hipótesis de normalidad en la variable
calificación.
Entonces, una vez confirmado la normalidad de la variable calificación,
se procedió a realizar el análisis de varianza de un factor. Para ello,
se usó la variable calificación versus el rendimiento del estudiante.
Esto para comprobar que el instrumento no diferencia lo suficiente en
grupos diferentes y que en tales se pueden encontrar los mismos
resultados para evaluar el desempeño, tanto para calificaciones bajas
como altas.
Un supuesto necesario para el ANOVA es el homocedasticidad o la
igualdad de varianza, así que se utilizó el estadístico de Levene, con
el cual la el planteamiento de hipótesis quedaría de la siguiente
manera:
H0: Las varianzas en los grupos son iguales.
H1: Las varianzas en los
grupos son diferentes.
En suma, “La prueba de Levene consiste en llevar a cabo un análisis de
varianza de un factor utilizando como variable dependiente la
diferencia en valor absoluto entre cada puntuación individual y la
media (o la mediana recortada) de su grupo” (Merino y Díaz, 2005, p.
275).
Tal como lo muestra la Tabla 4, las variaciones en cuanto a las
calificaciones obtenidas mediante el instrumento mostraron que son
iguales en los tres grupos. Es decir, se aceptó la hipótesis nula.
El planteamiento para la hipótesis en el ANOVA es la siguiente:
H0: Las
medias en la calificación en los grupos son iguales.
H1: Las medias en la calificación en los grupos son diferentes.
Del mismo modo, la Tabla 5, donde está contenido el resumen del ANOVA,
muestra que el promedio obtenido en las calificaciones es igual en los
diferentes grupos. De hecho, El nivel de significancia es mayor al
valor crítico 0.05, por tanto se acepta la hipótesis nula.Así mismo, se realizó un análisis post hoc para el ANOVA,
específicamente la prueba de Tukey asumiendo homogeneidad en las
varianzas para determinar si la prueba agrupaba en grupos diferentes
los promedios de la calificación obtenidos. Como se puede apreciar, en
la Tabla 6 solo un subconjunto puede ser extraído de todos los grupos,
lo que confirma la prueba de hipótesis realizada con el ANOVA.
Con todo lo anterior, se superaba la primera etapa de determinar si el
instrumento no diferenciaba
claramente entre los estudiantes de distintos grupos y rendimiento, porque
podría pensarse que si el instrumento cayese en manos de
estudiantes de bajo rendimiento, estos calificarían mal el desempeño
docente y viceversa, pero las pruebas han demostrado que tanto
estudiantes con alto, medio o bajo rendimiento asignan puntajes en el
instrumento independientes a su
grupo de pertenencia, esto evitará que los
resultados obtenidos al
momento de aplicar el cuestionario estén sesgados anticipadamente.
La segunda parte de este análisis exploratorio era conocer en cuántos
factores se pueden dividir el trabajo docente de acuerdo al
cuestionario planteado. Aunque, debido a la muestra, los resultados
deben de tomarse muy en consideración y aceptarlos solo si están bien
alejados de los valores límites.
Uno de los requisitos que debe cumplirse para que el Análisis Factorial
tenga sentido es que estas variables están altamente
intercorrelacionadas. Por tanto, si las correlaciones entre todas las
variables son bajas, el Análisis Factorial no es apropiado.
Por lo general, el análisis factorial exploratorio se utiliza para
analizar las interrelaciones lineales dentro de un conjunto de
indicadores observados, contados o medidos para cada
individuo en un grupo, postulando que un conjunto
reducido de factores comunes es
suficiente para explicar las interrelaciones existentes entre
indicadores. Debido a su función de exploración no asume modelo de
medición. Su único propósito es reducir la dimensionalidad. Tampoco hay
una cuota mínima de la varianza total explicada por el factor de
estructura. Por lo tanto, diferentes criterios pueden ser usados como
un criterio para un corte. Los métodos de rotación diferentes pueden
dar lugar a diferentes interpretaciones (Barreto De Bem, Lanzer,
Tambosi, Sanchez y Bernardi Junior, 2011).
Por tal razón, se aplicó el test de esfericidad de Bartlett que plantea
la hipótesis nula de que la matriz de correlaciones es la identidad, y
si eso es así, las intercorrelaciones entre las variables es cero. Para
conformar el test, también se usó una medida de adecuación de la
muestra, una de las formas más usadas es la Medida de adecuación de la
Muestra KMO propuesta por Kaiser, Meyer y Olkin, (Vallejo, 2011) los
cuales aconsejan que si KMO ≥ 0.75 la idea de realizar un análisis
factorial es buena, si 0.5 ≤ KMO < 0.75 es aceptable, y si es
menor que 0.5 es inaceptable.
La Tabla 7 muestra que tanto el test KMO como la prueba de Bartlett
sugieren que se realice un análisis factorial, puesto KMO es mayor a
0.5 y el test de Bartlett rechaza la hipótesis de matriz de
intercorrelaciones igual a la identidad, lo que significa que si hay
intercorrelaciones entre los factores a extraer del cuestionario.El Gráfico 3 de sedimentación muestra que los seis primeros factores
tienen autovalores superiores a 1, por lo tanto, de manera empírica
podrían seleccionarse seis factores. Pero una vez aplicada la rotación
de factores para su extracción mediante el análisis de componentes
principales y el método de rotación Normalización Varimax con Kaiser,
el resultado muestra claramente que son cuatro los factores que
explican el desempeño docente mediante la aplicación de este
instrumento.
3.3 Fase de validación del cuestionario
Para la segunda parte del diseño del cuestionario y superados los
planteamientos de la primera etapa, se decidió revisar cuidadosamente
la literatura respecto a la construcción de escalas para el diseño de
cuestionarios de evaluación docente, encontrándose que casi todos usan
la escala Likert con cinco puntuaciones y luego se tiene que crear una
escala para la valoración del instrumento (Apodaca, 2002), por lo que
el instrumento quedó determinado del mismo modo; además, al tomar la
decisión sobre cuántos factores debería contener el instrumento, se
encontró que el mínimo de factores era cuatro y lo más sobresaliente
estaba entre seis y ocho factores, razón por la cual se agregaron más
preguntas, para finalmente quedar en 30 preguntas divididas en ocho
factores, el doble de lo planteado en el estudio exploratorio.
Esta vez, para validar el instrumento se sometió al juicio de cuatro
profesores especialistas en temas de educación y que tienen vasta
experiencia en la aplicación de instrumentos de evaluación tanto a
estudiantes como a profesores.
Se puede hablar de dos tipos de validez del instrumento, uno
relacionado a la consistencia interna (validez y confiabilidad) y otro
relacionado a la validez del contenido, en tal caso, no se obtuvieron
críticas negativas a la forma del instrumento y la cantidad de
preguntas; se mejoró solo en cuestiones de redacción de cuatro
preguntas, por lo que el CVC (índice referido a la validez del
coeficiente de contenido) resultó ser muy alto, CVC = 0.9333, con lo
cual, de acuerdo con Nieto (2000), el instrumento mide lo que debe
medir.
La encuesta se aplicó en cinco grupos, con un tamaño de 52 encuestas de
la modalidad sabatina del área de ciencias de la Educación, se
seleccionó a estos grupos, porque la mayoría de ellos son docentes y
están muy familiarizados con la evaluación mediante encuestas.
Esta vez el instrumento resultó igual altamente confiable, de hecho, la
Tabla 8 muestra que el alfa de Cronbach para este instrumento fue del
0.933; también se aplicó la prueba de dos mitades para medir el alfa de
Cronbach:
Como se puede apreciar en la Tabla 9, los estadísticos del instrumento
al dividirse este en dos partes (pares e impares) también resultó por
encima de lo exigido por la estadística, (el alfa de Cronbach se
considera óptima con resultados por encima de 0.7), junto con los otros
estadísticos que acompañan la prueba.
Para la construcción del instrumento, como se mencionó, se rediseñó en
ocho factores que miden, de la mejor forma, el desempeño docente; para
constatar esto, se realizó otra vez el análisis factorial y se pudo
comprobar que, efectivamente, estos ocho factores explicaban más del 80
% de la varianza compartida del instrumento. (Tabla 11)
También, para verificar la prueba de normalidad en la calificación
obtenida en el cuestionario, se procedió nuevamente a aplicar la prueba
Shapiro-Wilk, Tabla 10, donde se confirmó el test de normalidad para el
instrumento.
Por todo lo mencionado hasta este momento, se puede argumentar que las
bases para llevar a cabo la evaluación de los docentes, por medio del
cuestionario (CEDUCH), mediante el número de factores propuestos y con
la debida escala para cada ítem es adecuada, y se está en condiciones
para aplicar el instrumento a un buen grupo de estudiantes de nuestra
facultad de distintas carreras y departamentos académicos,
confiadamente y con la seguridad que los resultados encontrados se
corresponderán con los que el instrumento pretende medir.
3.4 Construcción de las escalas
Se construyó una escala Likert para el instrumento que constaba de
cinco alternativas, con los puntajes, 1=Deficiente, 2=Regular, 3=Bueno,
4=Muy bueno, 5=Excelente o Sobresaliente para cada pregunta del
cuestionario. Se escogió esta escala, porque es la más utilizada en los
estudios de desempeño docente y porque nuestros estudiantes están muy
familiarizados el medir con estos valores.
Así mismo, para los resultados finales se diseñó una escala para
evaluar el buen o mal desempeño, la cual no es igual a la planteada,
porque tenemos que recordar que la escala Likert presenta dificultades
en cuanto a la tendencia al valor medio, por tanto autores como
González et al., (2010), han construido y validado escalas a partir de
una muestra de 20136 cuestionarios y 919 docentes/asignaturas para
medir el desempeño final, donde una vez que se han procesado todos los
instrumentos han desarrollado y validado el mismo de acuerdo al
siguiente criterio: “Excelente o Muy Bien” si las calificaciones son
4.5 o mayores a este. Las calificaciones
comprendidas entre 4 y 4.5 como “Bien o
Aceptables” y todas aquellas inferiores a
4 puntos como “Insatisfactorias o Deficientes”.
3.5 Fase de Aplicación y confirmación
El CEDUCH se aplicó en el séptimo encuentro del Primer Bimestre del
Primer Semestre, esto porque los estudiantes ya estaban por finalizar
el primer Bimestre (solo les quedaba pendiente un encuentro) y tenían
conocimiento de todos los aspectos evaluados en el cuestionario. Se
planificó encuestar a 22 grupos de clases del turno sabatino, pero al
momento de aplicar el instrumento dos grupos de clases no se
encontraban en la Facultad y
se decidió completar con dos grupos de
clases del turno dominical los cuales se
seleccionaron
aleatoriamente.
Se obtuvo respuesta de 453 cuestionarios, un número muy considerable
para realizar todo tipo de estadística, sea ésta descriptiva o
inferencial. En cada cuestionario el estudiante marcaba un número que
se correspondía con la escala Likert construida de la siguiente manera:
o Deficiente o “1” cuando el docente exhibe este desempeño entre 0 a 19
%.
o Regular o “2” cuando el docente exhibe este desempeño entre 20 a
39 %.
o Bueno o “3” cuando el docente exhibe este desempeño entre 40 a
59 %.
o Muy bueno o “4” cuando el docente exhibe este desempeño entre 60 a 79
%.
o Excelente o “5” cuando el docente exhibe este desempeño entre 80 a
100 %.
El instrumento estaba compuesto por 30 reactivos, lo que requiere que
el estudiante emita su opinión sobre el desempeño de sus profesores,
distribuido en ocho dimensiones básicas del quehacer docente frente a
un grupo de clases. Estas dimensiones del trabajo docente están
sustentadas en el análisis factorial exploratorio realizado en el
segundo pilotaje y en base al trabajo realizado
por García (1997), donde hace una comparación de los principales
instrumentos utilizados para medir el desempeño docente en 20
universidades distintas de España, con muestras de que van desde 3456
hasta 97249 estudiantes. Los instrumentos analizados fueron: SEEQ,
Endeavor, CEQ, E.E.P.A, CEDA-MOD; las dimensiones evaluadas en este
trabajo concluye que varían entre cinco y nueve dimensiones, aunque las
diferencias entre las distintas dimensiones, tienen que ver con el modo
de ver la enseñanza universitaria, donde encontró que todos los
instrumentos hacen referencia a:
Dominio de contenidos-dominio de la asignatura.
Claridad en la
exposición y desarrollo del programa.
Comunicación con los alumnos
tanto individual como grupal.
Programación- planificación- organización de la enseñanza. Adecuada
carga de trabajo.
Evaluación-calificación-exámenes. (Rendimiento del
alumno).
Entusiasmo del profesor-motivación al alumno-incremento del interés.
Es por eso que, de alguna manera, todos estos componentes están
presentes en el diseño del cuestionario en esta investigación. En
relación con el número de reactivos usados en los instrumentos de
evaluación se sugiere que no sea menor de 20 ni mayor de 50 reactivos
(Cantarero, Deus y Paz, 2002), donde proponen qué una dimensión o
componente del desempeño docente debe tener entre tres y nueve
reactivos, por tal razón se justifica el número de reactivos usados en
la construcción del CEDUCH.
La metodología para la aplicación fue tomar entre 10 y 12 estudiantes
de cada grupo de clases, en cada aplicación se superó el 90% de la
asistencia y tanto al estudiante como al docente que estaba no se les
avisaba, sino hasta el momento de la aplicación, esto con el objetivo
de evitar preparación anticipada a las respuestas del mismo.
El instrumento ha sido realizado también tomando en cuenta los trabajos
de Marsh y Overall (1980) y Marsh (1982), donde presentan un modelo
para evaluar el desempeño docente al que denominan “Evaluación de la
Calidad de la Educación por el Estudiante” (SEEQ: Students’ Evaluation
of Education Quality), el cual ha sido usado por más de treinta años y
ha dado excelentes resultados, a tal modo que se le considera el
instrumento por excelencia para medir desempeños tanto de maestros y
estudiantes, y se ha probado y validado en muestras hasta de hasta un
millón de cuestionarios.
El modelo incluye un cuestionario conformado por reactivos diseñados
para medir siete dimensiones de la enseñanza efectiva. Cada reactivo
incluye un aspecto específico a evaluar. Estos se responden en una
escala tipo Likert de cinco alternativas, diseñada para evaluar la
calidad de algún aspecto expresado en cada reactivo. Los valores de la
escala son “Muy mal”, “Mal”, “Moderado”, “Bien” y “Muy Bien”, que como
resultado obtienen siete factores que definen el desempeño docente:
Entusiasmo/Interés, Amplitud en el enfoque, Organización,
Interacción, Valor del
aprendizaje, Exámenes y calificaciones, Carga
de trabajo/Nivel de dificultad (Marsh, 1982).
Por esta razón, las ocho dimensiones en las que finalmente se
estructuró el instrumento fueron: responsabilidad formal, metodología,
comunicación, materiales, actitud ante la clase, evaluación, motivación
y satisfacción del estudiante. La descripción de estas dimensiones se
muestra a continuación:
Responsabilidad Formal: cumplimiento cabal de todas las actividades que
involucran las funciones del profesor.
Metodología: habilidad para desarrollar los contenidos y buena
organización para hacer cumplir lo programado en el curso.
Comunicación: destreza del profesor para hacer saber a sus alumnos de
manera clara, eficiente y lógica las normas, reglas, políticas y
actividades que se manejan en su clase y en la institución.
Materiales: uso de recursos didácticos-metodológicos que favorecen la
claridad y desarrollo del curso.
Actitud ante la docencia: consideración de creencias y expectativas del
profesor, su visión o posición sobre el contenido, su modo de
enseñarlo, el clima del aula que genera su actuación, la opinión sobre
sí mismo, sobre el proceso de enseñanza y sobre sus alumnos.
Evaluación: el uso de pruebas para acumular, la entrega a tiempo de los
resultados, la correspondencia en los exámenes con lo desarrollado y la
calificación justa de estos.
Motivación: contagia entusiasmo y crea un
buen ambiente de trabajo, es personal y potencia todas las dimensiones
restantes del instrumento.
Satisfacción del estudiante: consideración de creencias y expectativas
planteadas sobre el profesor, su visión o posición sobre el contenido,
su modo de enseñarlo, el clima del aula que
genera su actuación, la
opinión sobre sí mismo,
sobre el proceso de enseñanza y sobre sus
alumnos.
4. Resultados
La Tabla 12 muestra la correlación entre cada factor del instrumento,
se observa que todos los factores están relacionados positivamente
entre sí; todas las correlaciones son significativas bilateralmente al
0.05, lo cual es de esperarse, dado que para que exista una buena
práctica docente todos los aspectos deben estas relacionados entre sí,
ningún aspecto es más importante que otro, todos se complementan, lo
que da lugar a un desempeño docente integral.
Las correlaciones más altas se dan entre las dimensiones
actitud-comunicación- satisfacción y la más alta correlación le
corresponde a motivación-satisfacción. Estos resultados son
consistentes con los trabajos desarrollados por Guzmán, Lara y García
(2010) al referirse que el estudiante busca establecer una adecuada
cordinación entre la actitud y la habilidad de comunicación del maestro
como indicadores de una satisfacción general del curso.
Para comprobar si el instrumento discriminaba adecuadamente, se
extrajeron los rendimientos obtenidos por carrera por cada uno de los
aspectos que medía el instrumento, donde, como puede observarse en la
tabla 13, en muchas carreras los ochos aspectos son sobresalientes y
aceptables. Sin embargo, las carreras 3 y 10 presentan desempeños
deficientes en tres aspectos del instrumento, lo que indica que el
instrumento y la escala constituyen buenos constructos para medir el
desempeño docente en la facultad.
Se ha visto en los párrafos anteriores que el instrumento en lo general
cumple todos los coeficientes de fiabilidad y validez, por tal motivo
se analizaron factor por factor estos mismos índices, presentados en la
tabla 14 y como resultado, una vez agrupadas las variables de cada
aspecto en el instrumento junto con las pruebas del análisis factorial,
se obtuvieron coeficientes altos y muy estables en relación a su
medida, lo que nos confirma que la estructura propuesta es la más
indicada. Asimismo, la Tabla 15 muestra la confiabilidad total de los
treinta ítems que componen el instrumento, muy alta, razón por la cual
hemos de esperar que los estadísticos descriptivos que arroje el
instrumento una vez puesto en marcha como insumo para la autoevaluación
en la facultad sean confiables y consistentes.
Una vez calculado el coeficiente alfa del instrumento, también, se
calcularon los coeficientes theta (θ) y omega (Ω), que están basados en
el análisis factorial de los ítems, son indicadores de la consistencia
interna similares al coeficiente alfa de Cronbach. El coeficiente theta
fue desarrollado por Carmines y Zeller en 1979, y el coeficiente omega
fue desarrollado por Heise y Bohrnstedt en 1970, (Muñiz, 1998). Entre
estos coeficientes se debe de cumplir la relación α <
θ < Ω
.
El cálculo del alfa de Cronbach se realizó con el SPSS, mientras los
otros dos coeficientes de fiabilidad se realizaron manualmente con el
empleo de las fórmulas correspondientes.
Donde n es el número de ítems de la escala; λ1 es el valor propio
mayor, es decir la varianza explicada por el primer factor antes de la
rotación correspondiente a la matriz de correlaciones; h1 es la
comunalidad de cada uno de los ítems; y rij la correlación
entre cada par de ítems.
Por lo antes expuesto, se puede ver que este instrumento cumplió con
los requisitos del análisis factorial, de consistencia interna y es
altamente confiable al comprobarse la relación (0.966< 0.967 < 0.975) ya citada.
5. Conclusiones
Con el proceso presentado para la construcción del cuestionario y las
escalas de medidas, queremos hacer énfasis en el uso de este
cuestionario como una necesidad para incluirlo como insumo en los
procesos de autoevaluación.
Para la mejora de la práctica docente y el buen desempeño del
profesorado es necesario contar con un buen modelo de evaluación. Ese
ha sido el tema central de este trabajo, que ha girado en el desarrollo
del cuestionario de evaluación docente por parte del
alumno, dentro del paradigma positivista, donde
ha sido necesario tomar en cuenta un
sistema de fundamentos metodológicos, que han sido consultados en los
trabajos más importantes que se desarrollaron en universidades de gran
prestigio y que hasta el momento desarrollan este modelo de evaluación.
El instrumento y sus escalas fueron sometidas a un riguroso proceso de
validación y fiabilidad, mediante tres etapas de implementación del
mismo, tiempo durante el cual el CEDUCH mostró ser muy consistente y
estable.
La escala propuesta para la medición de cada uno de los factores y del
instrumento en particular debe servir para fomentar la cultura de
evaluación del profesorado para mostrar desempeños por encima de la media esperada, con la
finalidad de mejorar la práctica docente.
La estructura interna de la prueba construida presentó muchos elementos
a favor para ser incluido como instrumento de evaluación interna de la
facultad, entre los que destacamos:
Un coeficiente de Cronbach de 0.96 es muy alto y refleja la
consistencia del cuestionario. En el análisis factorial se
obtuvieron ocho factores que miden el desempeño docente de la facultad.
En relación con el índice de discriminación medido por la correlación
ítem-test fue superior a 0.4 en todas las preguntas del cuestionario,
(r > 0.4) En este sentido, los reactivos que componen el
instrumento tienen niveles adecuados de discriminación.
Comparando los ochos aspectos que mide el instrumento, los resultados
mostraron claramente una alta confiabilidad que tiene la prueba, pues
el menor valor obtenido al eliminarse una de estos aspectos es 0.939;
así mismo, estas categorías discriminaron adecuadamente en el
instrumento.
La estructura factorial indicada junto con la solución rotada de la
misma aporta suficiente evidencia que son ocho factores los que
explican más del 70% de la varianza del instrumento; además, los
coeficientes theta y omega que acompañan al análisis factorial se
corresponden con lo indicado en la literatura, los resultados de estos
fueron 0.967 y 0.975, valores que junto al alfa de Cronbach
mencionado afirman la confianza de utilizar este instrumento en la facultad para
medir el desempeño docente.
El instrumento da números consistentes de fiabilidad: 0.91 para
muestras entre 20 y 29 estudiantes; 0.933 para tamaños entre 30 y 50;
finalmente 0.96 para muestras superiores a 50 estudiantes. Similares a los resultados que obtuvo Marsh (2011).
Por último, el instrumento comprueba que la práctica docente es
multidimensional, por lo tanto, se destaca que se debe seguir
profundizando al mismo tiempo en otras metodologías que incluyan
técnicas cualitativas para la evaluación del desempeño docente,
ya que el cuestionario no se justifica como única técnica que
cubra todas las manifestaciones de una actividad tan compleja como la
docencia.
Citas y notas
2 Queremos mencionar que este fue el procedimiento planificado antes de
aplicar los cuestionarios, pero el día de la recolección de los datos
hubo variación en la asistencia y en los tamaños de muestra, en algunos
gru pos no se pudo cumplir con lo
establecido y se tuvo que completar con otros
estudiantes de los mismos grupos seleccionados, Ver
Anexo 2.
6. Referencias
Aguilar Hernández, Marielos.
(2002). La evaluación
institucional de las universidades.
Tendencias y desafíos. Recuperado de
http://www.6congreso.ucr.ac.cr/eval_inst.html.
Apodaca, Pedro. (2002). Análisis dimensional de las opiniones de los
alumnos universitarios sobre profesores: Comparación entre técnicas
paramétricas y no paramétricas. Redie, 20(2), 385-409.
Barreto De Bem, Amilton, Lanzer, Edgar Augusto, Tambosi Filho, Elmo,
Sanchez, Octavio Próspero, y Bernardi Junior, Plinio. (2011). Validade
e confiabilidade de instrumento de avaliacao de docencia sob a óptica
dos modelos de equacao estructural. Revista da Avaliacao da Educacao
Superior (16), 375-401.
Cantarero Muñoz, José Miguel; Deus Ríos, María Paula y Paz, Eduardo
Abalde. (2002). Evaluación Docente vs. Evaluación dela Calidad. Revista
ELectrónica de Investigación y EValuación Educativa, 8(2), 103-134.
Chiavenato, Ignacio. (2000). Administración de
recursos humanos (5a. ed.).
Bogotá, Colombia: McGraw-Hill.
Ebel, Randolf Lee, y Frisbie, Dan August. (1991). Essentials of
Educational Measurement (5a. ed.). New Jersey: Prentice Hall.
García, José Manuel. (1997). Valoración de la competencia docente del
profesor universitario.Una aproximación empírica. Revista Complutense
de Educación, 8(2), 81-108.
González Martínez, Adrián, Mendiola Sanchéz, Melchor y Stack Martíinez,
Jorge. (2010). Los cuestionarios de opinión del estudiantes sobre el
desempeño docente. Una estrategia institucional para la evaluación de
la enseñanza en Medicina. Revista Electrónica de Investigación, 12(1),
7-8.
Guzmán Zambrano, Rogelio; Lara, Rosa Meda y García Lara, Baudelio.
(2010). Evaluación de profesores universitarios por parte de los
alumnos mediante el Cuestionario de Evaluación de Desempeño Docente
(CEDED). Guadalajara: Universidad.
Hernández Sampieri, Roberto, Fernández, Carlos y Baptista, Pilar.
(2004). Metodología de la Investigación (3a. ed.). México D.F: Mc
Graw-Hill.
Luna, Edna, y Torquemada, Alma. (2008). Los cuestionarios de evaluación
de la docencia por los alumnos: balance y perspectivas de su agenda.
Revista Electrónica de Investigación Educativa (Especial), 1-15.
Marsh, Herbert. (1982). Reliable, Valid and Useful Instrument for
Collection Students´ Evaluations Of University Teaching. Brithish
Journal of Education Psychology (52), 77-95.
Marsh, Herbert. (2011). Student's Evaluations of University Teaching:
Ratings of Teacher, Universities and Departaments. Londres: Univesity
of Oxford.
Marsh, Herbert, y Overall, John. (1980). Validaty of student's
evaluations of teaching effectiveness: cognitive and effective
criteria. Journal of Educational Psychology, 72(4), 468-475.
Matos Guerreo, Waldemar y Guadrón, Luis José. (2008). La evalaución en
la praxis docente universitaria como mecanismo para asegurar la
calidad. ORBIS(4), 110-142.
Merino Pardo, Antonio, y Díaz, Miguel Angel. (2005). Análisis de datos
con SPSS 13 Base. Madrid: Mc Graw-Hill.
Muñiz, José. (1998). Fiabilidad: Teoría Clásica de los test (5a. ed.).
Madrid: Pirámide.
Nieto Hernández, Rafael. (2000). Instrumentos de Recolección de Datos
en Ciencias Sociales y Ciencias Biomédicas. Mérida: Universidad de los
Andes.
Patiño, Luis Enrique. (2006). Análisis psicométrico de la escala de
evaluación docente de la corporación universitaria iberoamericana. Suma
Pisológica (194), 193-215.
Romero, Nerylena y González, Lorena. (2009). Competencias del docente de educación
superior como mediador en los procesos de investigación y evaluación de
los aprendizajes. Omnia (15), 39-55.
Valenzuela, Jesús Ernesto. (2002). Evaluación del desempeño docente a
partir de la opinión de los alumnos. Sonora: Universidad de Sonora.
Vallejo Morales, Pedro. (2011). El análisis factorial en la
construcción e interpretación de test, escalas y cuestionarios. Madrid:
Universidad Pontificia Comillas.
Vásquez Rizo, Fredy Eduardo y Gabalán Coello, Jesús (2006).
Percepciones estudiantiles y su influencia en la evaluación del
profesorado. Un caso en la Universidad Autónoma de Occidente, Cali–Colombia. RELIEVE, 12(2). Recuperado en
http://www.uv.es/RELIEVE/v12n2/RELIEVEv12n2_3.htm.Correspondecia a:
Tonys Romero Díaz: Profesor de Matemática y Estadística en la Universidad Nacional
Autónoma de Nicaragua, UNAN-MANAGUA. Estudiante del
Doctorado en Educación e Intervención
Social. Dirección electrónica: tonyromerong@hotmail.com
Artículo recibido: 2 de setiembre, 2013 Devuelto para corrección: 4 de
marzo, 2014 Aprobado: 15 de mayo, 2014