Entre lo observable y lo latente: modelos de ecuaciones estructurales e investigación social

Between the observable and the latent: structural equations models and social research

 

Andrés Castillo Vargas

Universidad de Costa Rica, San José, Costa Rica

andres.castillo@ucr.ac.cr

http://orcid.org/0009-0003-5794-3616

 

Andrés Ruiz Sánchez

Universidad de Costa Rica, San José, Costa Rica

andres.ruiz@ucr.ac.cr

http://orcid.org/0000-0003-2473-4626

 

Fecha de recepción:  12 de enero del 2024

Fecha de aceptación: 21 de agosto del 2024

 

Cómo citar:

Castillo Vargas, Andrés y Andrés Ruiz Sánchez. 2025. Entre lo observable y lo latente: modelos de ecuaciones estructurales e investigación social. Revista Reflexiones. 104 (2). DOI 10.15517/ rr.v104i2.58268

 

 

Resumen

 

Introducción: El desarrollo de modelos y teorías que aborden los fenómenos socioculturales ha sido un reto para la investigación empírica en Ciencias Sociales, pues al trabajar con conceptos no experimentales y poco controlables, se ha vuelto necesaria la creación de metodologías más certeras para el estudio de conceptos no físicos y abstractos, entre las cuales se encuentran los Modelos de Ecuaciones Estructurales (MEE).

Objetivo: El objetivo es analizar el potencial de los MEE para mejorar la comprensión de fenómenos socioculturales en disciplinas pertenecientes a las Ciencias Sociales.

Método y técnica: En primera instancia, se realizó una revisión bibliográfica en torno a los orígenes de los MEE. Posteriormente, se detalló la estructura y etapas para su construcción, lo cual fue seguido de un análisis sobre las contribuciones que estos modelos ofrecen a la investigación social.

Resultados: Los MEE permiten comprender relaciones complejas entre variables propias de las Ciencias Sociales y considerar los errores de medición en los datos. Esto posibilita analizar simultáneamente varias relaciones de dependencia, a diferencia de otros enfoques como la regresión múltiple o análisis multivariantes.

Conclusiones: Los MEE favorecen la actividad investigativa y propician la generación de nuevos aprendizajes que contribuyen al entendimiento e interpretación de diversos fenómenos. Esto enfatiza la importancia de avanzar constantemente en el conocimiento de las complejidades inherentes a los procesos sociales, en aras de develar la relación existente entre lo observable y lo latente.

Palabras claves: Idealizaciones, Variables latentes, Relaciones causales, Teorías científicas, Modelos estadísticos.

 

Abstract

 

Introduction: The development of models and theories addressing sociocultural phenomena has been a challenge for empirical research in Social Sciences. Working with non-experimental and less controllable concepts has made it necessary to create more accurate methodologies for studying non-physical and abstract concepts, among which Structural Equation Models (SEM) are found.

Objective: The aim is to analyze the potential of SEM to enhance the understanding of sociocultural phenomena within disciplines belonging to the Social Sciences.

Method and technique: Initially, a bibliographic review was conducted regarding the origins of SEM. Subsequently, the structure and stages for their construction were detailed, followed by an analysis of the contributions these models offer to social research.

Results: SEM allows for the understanding of complex relationships among variables inherent to social sciences and accounts for measurement errors in data. This enables the simultaneous analysis of multiple dependency relationships, unlike other approaches such as multiple regression or multivariate analysis.

Conclusions: SEM is favorable for investigative activity and fosters the creation of new insights that contribute to the understanding and interpretation of various phenomena. This emphasizes the importance of constantly advancing knowledge related to the inherent complexities of social processes, to unveil the relationship between the observable and the latent.

Keywords: Idealizations, Latent variables, Causal relationships, Scientific theories, Statistical models.

 

 

 

 

 

 

Introducción

 

Tradicionalmente, uno de los elementos que impulsan el avance de la ciencia es el desarrollo de metodologías que establecen criterios mínimos de excelencia y rigurosidad en la búsqueda del conocimiento. No obstante, existe un componente esencial dentro de este proceso, al cual se le ha otorgado poca atención y, sin embargo, es indispensable en el perfeccionamiento de teorías y modelos científicos; este elemento es conocido como las idealizaciones.

Las idealizaciones consisten en asumir un hecho como real con el objetivo de explicar una teoría científica. Esta noción de gran utilidad cuando se carece de determinados datos o de teorías auxiliares que fortalezcan o validen un modelo a estimar (Laymon 1989; Cuevas y Martínez 2011). Las idealizaciones no solo son necesarias porque ayudan a la producción de conocimiento científico y a construir teorías, sino también porque facilitan el acercamiento a un objeto de estudio en particular. Permiten obtener predicciones o explicaciones con base en circunstancias o modelos idealizados.

En cierta manera no habría progresividad científica sin el uso de las idealizaciones, pues las mismas evidencian como gracias a la identificación de un mundo, contexto o característica “ideal” es posible comprender el mundo real y acceder al conocimiento científico, es decir, son una manera “poco compleja o simplificada” de comprender las teorías y modelos científicos (Laymon 1989). Ahora bien, aunque las idealizaciones son importantes en el desarrollo de la ciencia, su uso debe ser prudente, pues como expone Laymon (1989), puede que no se conozca con certeza si las idealizaciones propuestas se encuentran muy cerca o muy lejos de la verdad. De allí, surge la importancia de realizar idealizaciones cada vez más realistas, a pesar de lo contradictorio del adjetivo, que contribuyan al establecimiento de predicciones más exactas en relación con una teoría científica determinada.

Considerando la relación existente entre las idealizaciones, la ciencia y los modelos científicos, las teorías científicas pueden ser entendidas de dos maneras; como «un conjunto (generalmente infinito) de enunciados –hipótesis y leyes- sobre un aspecto de la realidad, ordenados sistemáticamente mediante relaciones de deductibilidad que pueden someterse a contrastación» (Cuevas y Martínez 2011, 26); o como «sistemas ideales constituidos, mediante definición, por [un] conjunto de enunciados o leyes teóricas que afirman o niegan que un sistema real empírico está de acuerdo o no con el modelo [teórico de referencia]» (Cuevas y Martínez 2011, 27).

De acuerdo con Bunge (1981), las teorías científicas son sistemas lógicos y deductivos que permiten hacer predicciones comprobables por medio de la observación y la experimentación. Para dicho investigador, las teorías son afines a los modelos científicos, los cuales son definidos como una posible representación conceptual, esquemática e hipotética de una cosa o de una sustancia real o, así, presumida. Al respecto, Guevara y Valdez (2004) argumentan que la característica principal de un modelo es ser una construcción imaginaria que reemplaza a un elemento de la realidad con el fin de representar de una manera simplificada un aspecto de un sistema teórico.

Los modelos tienen una función central en el desarrollo de teorías pues, permiten establecer relaciones entre el lenguaje y los objetos por medio de enunciados, indicadores, ecuaciones o diagramas, representados de manera conceptual o gráfica (Cuevas y Martínez 2011). Es así, que un modelo debe facilitar la visualización o comprensión conceptual del objeto o cosa modelada (Guevara y Valdez 2004). Por ejemplo, en las teorías relacionadas con la lógica existen modelos de árboles deductivos; en la teoría atómica existen diagramas de densidad de probabilidades; y en biología matemática se encuentran grafos dirigidos que enlazan distintas funciones biológicas.

El desarrollo de modelos y teorías que aborden los fenómenos socioculturales ha sido un reto para la investigación empírica en Ciencias Sociales, pues al trabajar con conceptos no experimentales y poco controlables, se ha vuelto necesaria la creación de distintas metodologías y análisis de datos que permitan un acercamiento cada vez más certero a todos aquellos conceptos no físicos y abstractos, conocidos comúnmente como constructos (Casas Guillén 2002). Precisamente, una de estas metodologías son los Modelos de Ecuaciones Estructurales (MEE), los cuales son un buen ejemplo de cómo las idealizaciones, las teorías y los modelos científicos convergen empíricamente dentro de la investigación social; justo en las siguientes líneas se caracterizarán algunos aportes que este tipo de modelos han realizado al estudio del comportamiento humano. Tomando en consideración el papel que los MEE emplean actualmente en las Ciencias Sociales, este artículo analiza el potencial de los MEE para mejorar la comprensión de fenómenos socioculturales en disciplinas pertenecientes a las Ciencias Sociales, con particular énfasis en los modelos CB-SEM (modelos de covarianza).

Con la finalidad de organizar la presentación de los fundamentos, reflexiones y conclusiones esbozadas en este artículo, se inicia con un breve recorrido en torno a los orígenes de los MEE. Posteriormente, se detalla la estructura y etapas para su construcción, seguido de un análisis sobre las contribuciones ofrecidas de estos modelos a la investigación social. Finalmente, se concluye resaltando su utilidad para la indagación empírica en Ciencias Sociales.

 

 

Metodología

 

La presente investigación se desarrolló a partir de un enfoque cualitativo. Se llevó a cabo un análisis descriptivo basado en la revisión, evaluación y síntesis crítica de fuentes bibliográficas vinculadas con los MEE. Esta revisión de antecedentes posibilitó analizar el potencial de estos modelos para mejorar la comprensión de fenómenos socioculturales en disciplinas pertenecientes a las Ciencias Sociales. La ejecución de este estudio se llevó a cabo en tres etapas investigativas. En primer lugar, se volcó la atención a los orígenes de los MEE, con particular interés en su utilización dentro de investigaciones sociales. En la segunda etapa, se consultó una diversidad de fuentes bibliográficas que versaban en torno a la estructura y pasos a seguir para la construcción de un MEE, contrastándolas con el objetivo de plantear una secuencia típica en la elaboración de estos modelos. En la tercera y última etapa, se generaron reflexiones que resaltaron los beneficios, limitaciones y aportes de los MEE dentro de la investigación social.

La columna vertebral de la metodología consistió en la búsqueda y selección de material bibliográfico en línea, vinculado con los temas centrales del estudio escritos tanto en español como inglés. Debido a que en esta investigación se contempla una breve revisión histórica sobre la creación y utilización de los MEE, las fuentes bibliográficas datan de 1921 (uno de los primeros textos en los que se plantea este tipo de modelos), hasta el año 2024; en este sentido, la fecha de publicación no constituyó un criterio de exclusión. Para localizar las fuentes de interés para el estudio, se utilizaron motores de búsqueda en línea (como por ejemplo repositorios de artículos científicos y bibliotecas digitales) en los cuales se introdujeron palabras clave vinculadas con los temas centrales de la investigación, permitiendo así la identificación, clasificación y análisis de los textos que sirvieron como materia prima para la elaboración de este artículo.

            El análisis de estas fuentes consistió en la síntesis de las ideas y argumentos centrales de cada uno de los textos consultados, los cuales fueron agrupados en categorías preestablecidas de acuerdo con su pertinencia para cada uno de los apartados de interés en el estudio. Una vez categorizada esta información, se procedió a la construcción del cuerpo de cada uno de estos apartados, entrelazando y contrastando las ideas clave de las autorías consultadas.

 

 

Origen y características de los modelos de ecuaciones estructurales

 

El término genérico “modelos de ecuaciones estructurales” (MEE) [SEM por sus siglas en inglés] ha sido utilizado en los procesos de investigación empírica desde hace muchos años, datándose desde la década de 1920 (Tarka, 2018). Hace referencia al procedimiento analítico que «designa aproximaciones varias al análisis de la causalidad entre una serie de variables independientes y dependientes, con la particularidad de incluir distintas interrelaciones entre ellas y diferenciar entre variables observadas y latentes» (Cea D’Ancona 2002, 515).

Dicho concepto se introdujo hace más de 80 años por el genetista estadounidense Sewall Wright (1921), quien:

 

trabajando sobre patrones de covariación entre varias características de cobayas, desarrolló una forma de romper las correlaciones observadas en un sistema de ecuaciones que matemáticamente describían su hipótesis respecto a las relaciones causales. Las relaciones entre variables fueron representadas [posteriormente por dicho investigador] en un pathdiagram (diagrama de ruta, senderos o trayectoria), por lo que su método llegó conocerse como pathanalysis, [constituyéndose en uno de los primeros métodos de investigación que utilizaban como recurso un modelo gráfico] (García Veiga 2011, 17).

 

 

Justamente, Maruyama (1997) comenta que en un inicio los MEE fueron llamados pathanalysis, pues tomaban como referencia el nombre utilizado por Wright (1921) en sus investigaciones. No obstante, con la inclusión del término en las Ciencias Sociales y el desarrollo de las nuevas tecnologías de la información y la comunicación, este paso a denominarse “modelado causal”. Este término luego fue reemplazado por uno menos controversial y más descriptivo que no produjera tanto debate y discusión en la comunidad científica respecto al tipo de causalidad referida; este fue “ecuación estructural”. Dicho concepto es muy apropiado, según Ruiz, Pardo y San Martín (2010) pues «el nombre que reciben los modelos de ecuaciones estructurales es debido a que es necesario utilizar un conjunto de ecuaciones para representar las relaciones propuestas por la teoría» (35).

Por otra parte, los MEE son como una familia de modelos estadísticos que buscan explicar las relaciones existentes entre múltiples variables, por medio de la estructura de las interrelaciones expresadas mediante un conjunto de ecuaciones similares a un grupo de regresiones (Hair et al. 2006; Tarka 2018). Esta característica ha hecho argumentar a distintos científicos sociales, que uno de los principales alcances de estos modelos es estimar la fuerza y direccionalidad de todas las relaciones hipotetizadas entre las variables previstas en un modelo teórico (Maruyama 1997). En palabras de Ruiz, Pardo y San Martín:

 

la gran ventaja de este tipo de modelos es que permiten proponer el tipo y dirección de las relaciones que se espera encontrar entre las diversas variables contenidas en él, para pasar posteriormente a estimar los parámetros[1] que vienen especificados por las relaciones propuestas a nivel teórico. Por este motivo se denominan también modelos confirmatorios, ya que el interés fundamental es “confirmar” mediante el análisis de la muestra, las relaciones propuestas a partir de la teoría explicativa que se haya decidido utilizar como referencia (2010, 34).

 

Sobre esta misma línea discursiva, Gutiérrez Doña (2008, 11) opina que los MEE ofrecen la posibilidad de realizar análisis complejos al unir un análisis factorial confirmatorio con una regresión lineal, permitiendo de este modo el estudio de estructuras latentes. Es decir, «los constructos hipotéticos se definen como variables latentes, que son operacionalizados por varios indicadores, de manera que es posible estimar el error de medición de los indicadores individualmente y analizar las regresiones libres de error entre los constructos hipotéticos». Ciertamente por esta cualidad, Ruiz, Pardo y San Martín (2010) defienden que los MEE son un grupo de modelos estadísticos multivariantes que permiten estimar el efecto y las relaciones entre distintas variables de una manera relativamente sencilla y eficaz.

Para Kesteren (2021), los MEE constituyen una herramienta útil para el estudio de variables latentes. Casas Guillén comparte esta idea, argumentando que «estos modelos no prueban la causalidad, pero ayudan al [personal] investigador en la toma de decisiones, rechazando las hipótesis (…) cuando se contradicen con los datos, esto es, con la estructura de covarianzas o correlaciones subyacente entre las variables» (2002, 1).

Específicamente, sobre el término “causal”:

 

en las ciencias sociales hace referencia al conjunto de estrategias y técnicas de elaboración de modelos (…) que explican los fenómenos con objeto de contrastarlos empíricamente. Sus orígenes se encuentran en el path-analysis, literalmente traducido como análisis de senderos [de ruta o trayectorias], cuyo objeto es el estudio de los efectos de unas variables consideradas como causas sobre otras tomadas como efectos (…) El análisis path es una técnica similar a la regresión pero con poder explicativo, que estudia los efectos directos e indirectos en el conjunto de las variables observables, asumiendo la existencia de relaciones lineales entre ellas, [así como] la incorrelación de los errores de regresión y la ausencia de errores de medición de las variables (Casas Guillén 2002, 2).

 

Puede afirmarse que el término “causalidad” es utilizado en estos modelos como una forma de explicar una relación empírica sin necesidad de poseer un diseño experimental, es decir, alude al contraste que se logra establecer entre la teoría y las técnicas utilizadas sin presentarse una manipulación directa de las variables. En términos más sencillos, hipotetiza una relación causa-efecto. Ruiz, Pardo y San Martín explican esta característica, justificando que «la especificación teórica del modelo permite proponer estructuras causales entre las variables, de manera que unas variables causen un efecto sobre otras variables que, a su vez, pueden trasladar estos efectos a otras variables, creando [así diversas] concatenaciones de variables» (2010, 34).

Una vez conocidos a grandes rasgos los orígenes de esta metodología, es indispensable especificar el tipo de variables que se pueden distinguir dentro de estos modelos. Ruiz, Pardo y San Martín (2010, 36) realizan una muy buena descripción de estas, la cual vale la pena transcribir:

 

·         Variable observada o indicador: mide a los sujetos [de investigación]. Por ejemplo, las preguntas de un cuestionario referidas a conductas realizadas.

·         Variable latente: característica que se desearía medir, pero que no se puede observar y que está libre de error de medición. Por ejemplo, una dimensión de un cuestionario o un factor en un análisis factorial exploratorio.

·         Variable error: representa tanto los errores asociados a la medición de una variable como el conjunto de variables que no han sido contempladas en el modelo y que pueden afectar a la medición de una variable observada. Se considera que son variables de tipo latente por no ser observables directamente. El error asociado a la variable dependiente representa el error de predicción.

·         Variable de agrupación: variable categórica que representa la pertenencia a las distintas subpoblaciones que se desea comparar. Cada código representa una subpoblación.

·         Variable exógena [indicadora]: afecta a otra variable [a la vez que] no recibe efecto de ninguna variable. Las variables independientes de un modelo de regresión son exógenas, [en un diagrama de ruta estas variables son las que no reciben ninguna flecha].

·         Variable endógena [criterio]: recibe efecto de otra variable. La variable dependiente de un modelo de regresión es endógena. Toda variable endógena debe ir acompañada de un error, [en un diagrama de trayectoria estas variables son las que reciben las flechas].

 

Ahondando un poco en la descripción anterior, García Veiga (2011, 18) expone que «cualquier efecto estructural se representa como una flecha recta y unidireccional, cuyo origen es la variable indicadora y cuyo final, donde se encuentra la punta de la flecha, es la variable dependiente».

Asimismo, para efectos de la diagramación de dichas variables y el establecimiento de las posibles relaciones entre ellas, es importante considerar la siguiente simbología presente en la Tabla 1, con el objetivo interpretar adecuadamente los gráficos resultantes de un MEE (Cea D’Ancona 2002; García Veiga 2011):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Tabla 1. Simbología utilizada en el diagrama de un Modelo de Ecuaciones Estructurales

  Criterio

Símbolo

Las variables observadas (indicadores) se representan en un cuadrado.

Las variables latentes (constructos) figuran en un círculo o elipse.

Las flechas rectas indican relaciones causales entre las variables conectadas (asociación mediante regresión).

 

Las flechas curvas y de doble dirección denotan correlaciones (covariación).

 

La varianza de una variable puede representarse utilizando una flecha de doble cabecera desde una variable a misma.

 

Las líneas discontinuas indican trayectorias o senderos no significativos.

  

A cada flecha se le asocia un coeficiente.

0.5

 

La inexistencia de flecha significa que dichas variables no están directamente relacionadas (independencia condicional).

 

Fuente: elaboración propia con base en Cea D’Ancona (2002) y García Veiga (2011).

 

Por otra parte, como complemento a la Tabla 1, la Figura 1 ilustra algunas de las relaciones que pueden presentarse en un diagrama de senderos:

 

Diagrama

Descripción generada automáticamente

Figura 1. Relaciones entre variables de un Modelo de Ecuaciones Estructurales

Fuente: Elaborado con base en Casas Guillén (2002, 2).

 

 

Estructura de un MEE

 

Los MEE están conformados por dos partes fundamentales o submodelos: un modelo de medida y un modelo de relaciones estructurales. De acuerdo con Gutiérrez Doña (2008) y Tarka (2018), en la estructuración de estos modelos se procede de lo general a lo particular, es decir, primero se hace un planteamiento teórico basado en un ejemplo gráfico que exponga el modelo de medición para especificar posteriormente el modelo estructural. En dicho contexto, el modelo de regresión es especificado como el modelo estructural, mientras que el análisis de factores es especificado como el modelo de medición. Para Cea D’Ancona (2002), las características principales de dichos submodelos son las siguientes:

 

Modelo de medida o de medición (análisis de factores)

Incluye las relaciones de las variables latentes con las variables empíricas que los representan. Por medición se entenderá el proceso por el que un concepto se ve representado en una variable latente y esta se vincula a variables observadas. Su ecuación se expresa de la siguiente forma en el caso de variables endógenas:

 

 

Y=Λyη+ε

·         Y= variables observadas dependientes.

·         𝛬𝑦 = matriz de coeficientes factoriales de Y. Muestra la relación de 𝜂 a Y.

·         𝜂 = es un vector de variables no observadas o latentes.

·         𝜀 = error de medición de los indicadores endógenos.

Para variables exógenas:

X=Λxζ(xi​)+δ

·         X= sería un vector de variables observadas independientes o exógenas.

·         𝛬𝑥 (lambda) = es una matriz de pesos factoriales que relaciona las variables manifiestas con las latentes.

·         ζ (xi) = es un vector de variables exógenas latentes.

·         δ (delta) = es un vector de errores de medición.

 

En este sentido, vale agregar que Cea D’Ancona destaca que «el modelo de medición incluye las relaciones de las variables latentes (o constructos) con sus indicadores (o variables empíricas)» (2002, 529); y que la finalidad última de este modelo es poder comprobar la adecuación de los indicadores elegidos en la medición de los términos conceptuales de interés.

 

Modelo estructural (análisis de regresión)

Es el modelo que describe relaciones causales entre variables latentes. Su ecuación se expresa de la siguiente manera:

η=Γζ(xi​)+Bη+ζ

Donde cada elemento de la ecuación representa:

·         𝜂 (𝑒𝑡𝑎) = vector de variables endógenas latentes.

·         𝛤 (gamma) es una matriz de coeficientes [gamma (𝛾)] que relaciona las variables latentes exógenas (𝜉) con las endógenas (𝜂).

·         𝜉 (xi)= vector de variables exógenas latentes (indicadoras).

·         𝛽 = matriz con relaciones de las variables latentes endógenas entre sí.

·         𝜁 (zeta)= errores o perturbación

Dada la complejidad que puede representar el entendimiento de los signos y la nomenclatura empleada en las ecuaciones de estos modelos; la Tabla 2 esquematiza los principales símbolos utilizados en esta labor, con el objetivo de brindar una mejor comprensión de estos:

 

 

 

 

 

Tabla 2. Significado de la simbología en las ecuaciones de un Modelo de Ecuaciones Estructurales

Símbolo

Significado

ξ

(xi)

Variables latentes exógenas (o independientes) representadas por las X.

η

(eta)

Variables latentes endógenas (o dependientes) representadas con las Y.

γ

(coeficientes gama)

Coeficientes que miden el efecto directo de las ξ (variables latentes exógenas) sobre las η (variables latentes endógenas).

β

(coeficientes beta)

Son los efectos de las η (variables latentes endógenas) sobre las η (variables latentes endógenas).

φ

(Coeficientes phi)

Son las correlaciones entre las variables exógenas latentes.

λ

(coeficientes lambda)

Son coeficientes de regresión que relacionan cada variable observable

con su parte no observable o latente.

ε

(coeficientes epsilon)

Son coeficientes sobre errores de medición en las variables endógenas observables; es decir, son los errores de medición de las Y (variables

dependientes).

δ

(coeficientes delta)

Son coeficientes sobre errores de medición en variables exógenas

observadas; es decir, son los errores de medición de las X (variables independientes).

 

ζ

(zeta)

Es el término de error de medición para cada ecuación que relaciona un grupo de variables endógenas y exógenas explicativas, con una variable endógena criterio. En otras palabras, son los errores de medición de cada  ecuación lineal estructural.

Fuente: Elaboración propia con base en Gutiérrez Doña (2008, 14).

 

 

Etapas en la construcción de un MEE

 

De acuerdo con Casas Guillén los MEE analizan las relaciones causales y no causales entre distintas variables por medio de indicadores de medida de los constructos (o factores) identificados teóricamente, en donde la persona investigadora diseña un modelo que intenta representar de forma sencilla las relaciones existentes entre las variables latentes y observadas. «La hipótesis de partida de todos estos modelos es que reproducen exactamente la estructura de varianzas y covarianzas de las variables objeto de estudio» (2002, 3), siguiendo una metodología que pasa por diferentes etapas: especificación, identificación, estimación de parámetros, evaluación del ajuste, reespecificación del modelo e interpretación de resultados (Tabla 3).

 

Tabla 3. Etapas para elaborar un Modelo de Ecuaciones Estructurales

                                        Etapa

1.   Especificación del modelo teórico a utilizar.

2.   Identificación de parámetros.

3.   Medición de variables observadas (fase de estimación).

4.   Valoración de ajuste del modelo (fase de ajuste).

5.   Evaluación del modelo (fase de evaluación e interpretación).

Fuente: Elaboración propia con base en Casas Guillén (2002) y Cea D’Ancona (2002).

 

A continuación, se presenta una breve descripción de los pasos que deben seguirse para elaborar un MEE (Casas Guillén 2002; Ruiz, Pardo y San Martín 2010, Stoffels et al. 2023). Si bien, dicha descripción busca ser detallada, es importante aclarar que no pretende ser exhaustiva.

 

Estimación del modelo y formulación de la teoría que lo sustenta

Alude a la identificación de variables de acuerdo con una teoría y tema en particular. De acuerdo con Ruiz, Pardo y San Martín:

 

dicha teoría debe estar formulada de manera que se pueda poner a prueba con datos reales. En concreto, debe contener las variables que se consideran importantes y que deben medirse a los sujetos. El modelo teórico debe especificar las relaciones que se espera encontrar entre las variables (correlaciones, efectos directos, efectos indirectos, bucles). Si una variable no es directamente observable, deben mencionarse los indicadores que permitan medirla. Lo normal es formular el modelo en formato gráfico; a partir de ahí es fácil identificar las ecuaciones y los parámetros (2010, 39).

 

En palabras de Casas Guillén:

 

En esta fase el investigador aplica sus conocimientos teóricos del fenómeno estudiado al planteamiento de las ecuaciones matemáticas relativas a los efectos causales de las variables latentes y a las expresiones que las relacionan con los indicadores o variables observables. Del mismo modo, la claridad del modelo se encontrará determinada por el grado de conocimiento teórico que posea el investigador sobre el tema de estudio, si la información es poco exhaustiva o detallada, la asignación de los parámetros será confusa a priori, por lo que el investigador debe realizar diversos análisis exploratorios de los datos hasta configurar el modelo, y efectuar [posteriormente] el análisis confirmatorio del mismo (2002, 3).

 

Identificación de parámetros

Una vez formulado el modelo teórico, cada parámetro debe ser identificado y definido correctamente (Stoffels et al. 2023). Igualmente, debe ser derivable de la información contenida en la matriz de varianzas-covarianzas. Este es un proceso complejo que debe realizarse cuidadosamente para no incurrir en errores que afecten posteriormente el análisis del modelo. En este sentido, una de las reglas o estrategias más utilizadas para saber si un modelo está identificado «es la regla de los grados de libertad, obtenidos como la diferencia entre el número de varianzas y covarianzas (ecuaciones) y el número de parámetros a estimar» (Casas Guillén 2002, 5). Byrne afirma que:

 

Los modelos estructurales pueden ser identificables (just-identified model), sobre identificados (over-identified model) o sub identificados (under identified model). Un modelo identificable es aquel en el cual existe una correspondencia de uno-a-uno entre los datos y los parámetros estructurales, [en donde los grados de libertad son positivos - df = 0 - ], (…) un modelo sobre identificado es aquel en el cual el número de parámetros a ser estimados es menor que el número de varianzas y covarianzas de las variables observadas, (…) [y] un modelo sub identificado es aquel en el cual el número de parámetros a ser estimados es mayor que el número de varianzas y covarianzas, [lo cual equivaldría a decir que la cantidad de parámetros estimados libremente en el modelo es mayor que el número de datos conocidos] (1998, 9).

 

Fase de estimación

Una vez seleccionadas las variables que formarán parte del modelo, se decide cómo se medirán las variables observables (Thakkar 2020). La importancia de estas mediciones radica en que gracias a ellas se obtienen las varianzas y las covarianzas sobre las cuales se basa la estimación de los parámetros. García Veiga opina que los MEE «se basan en las correlaciones existentes entre las variables medidas en una muestra de sujetos de manera transversal. Por tanto, para poder realizar las estimaciones, basta con medir a un conjunto de sujetos en un momento dado (…). [Del mismo modo], hay que tener en cuenta que las variables deben permitir el cálculo de las correlaciones [a realizar], por ello deben ser variables cuantitativas [preferiblemente] continuas» (2011, 21).

Por otra parte, sobre la estimación del modelo, vale rescatar los siguientes métodos que además tienden a ser los más utilizados en esta etapa:

·         Mínimos cuadrados no ponderados (ULS por sus siglas en inglés): busca minimizar una mitad de la suma de los cuadrados de cada elemento de la matriz residual. Así, según Cea D’Ancona (2002), se da un peso empíricamente determinado a cada residuo cuadrado antes de producirse la suma. Suele ser un método adecuado cuando otros métodos han fallado.

·         Mínimos cuadrados generalizados (GLS por sus siglas en inglés): es una variante del método de mínimos cuadrados no ponderados. Al igual que el anterior, busca la minimización de los residuos. En este proceso de estimación, se otorgan pesos desiguales a los diversos residuos, lo cual conlleva la ponderación distinta de las observaciones para corregir las varianzas-covarianzas desiguales de los términos de error. Funciona de manera más óptima cuando hay normalidad en los datos (Cea D’Ancona 2002).

·         Máxima verosimilitud (ML por sus siglas en inglés): es el método de estimación de parámetros más utilizado (Cea D’Ancona 2002; Tabachnick y Fidell 2007). Se trata de un método que maximiza la probabilidad de los parámetros a partir de los datos empíricos. Mediante este procedimiento se buscan los valores de los parámetros que con mayor probabilidad han ocasionado las covarianzas o correlaciones observadas, de manera que exige el cumplimiento del supuesto de normalidad, homocedasticidad[2] e independencia de los residuos. De acuerdo con Cea D’Ancona (2002), este método junto al GLS pueden obtener estimaciones carentes de sesgo a partir de las 100 unidades de análisis.

 

Fase de ajuste

Una vez estimados los parámetros del modelo se procede inicialmente a valorar su ajuste (Thakkar 2020). «La etapa de diagnóstico de la bondad del ajuste se refiere a la exactitud de los supuestos del modelo especificado para determinar si el modelo es correcto y sirve como aproximación al fenómeno real, precisando así su poder de predicción» (Casas Guillén 2002, 2). En otras palabras, es la comprobación del ajuste global de los datos observados, lo cual consiste en contrastar las varianzas y covarianzas predichas con las inicialmente observadas (Stoffels et al. 2023).

Según expone Cea D’Ancona (2002), dicho procedimiento consiste en restar a cada celda de la matriz observada la celda correspondiente de la matriz esperada (o residual), si el resultado es igual a cero [0] significará que existe un ajuste perfecto, de forma que entre más ceros posea la matriz residual mejor será el ajuste.

Para estimar y valorar la bondad del modelo, en esta etapa se han identificado tres tipos de índices:

·         Índice de ajuste global: es utilizado para comprobar el ajuste global del modelo considerando las diferencias existentes entre la matriz de varianza-covarianzas observadas y la predicha (matriz residual). El indicador más utilizado es la razón de verosimilitud 𝜒2 (Cea D’Ancona 2002; Tabachnick y Fidell 2007).

·         Índice de ajuste incremental: compara el modelo trazado con el modelo nulo, es decir, compara el modelo propuesto con el modelo más sencillo posible, en el cual no se especifica ninguna relación entre las variables y todos los senderos son fijados a cero. Los indicadores que se incluyen en el ajuste incremental son varios, no obstante, todos comparten la característica de oscilar en un rango de 0 a 1 [entre más cercano este a uno se dice que hay mejor ajuste] (Cea D’Ancona 2002; Tabachnick y Fidell 2007).

·         Índice de ajuste de parsimonia: se busca obtener un modelo sencillo, en el cual haya pocos parámetros y al mismo tiempo muchos grados de libertad. En este sentido, entre más parámetros libres haya es más probable que el modelo tenga un buen ajuste (Cea D’Ancona 2002; Tabachnick y Fidell 2007).

En la siguiente Tabla 4 se pueden apreciar los indicadores más utilizados de acuerdo con cada índice de bondad de ajuste:

 

Tabla 4: Indicadores según índices de bondad de ajuste y cortes aceptables

Ajuste global o absoluto

Valor de ajuste esperado

(puntos de

cortes aceptables)

Índice de razón de verosimilitud χ2

Estadísticamente no significativo (p>0,05), que coincida con un valor pequeño (χ2= 0,0 ajuste perfecto)

Bondad de ajuste (GFI)

Grande ≥0,90

Raíz cuadrada de la media de los

residuos (RMSR)

Pequeño (0,0 ajuste perfecto)

Índice de centralidad (CI)

Grande ≥0,90

Ajuste incremental

Valor de ajuste esperado

Tucker-Lewis (TLI)

   Elevados ≥0,90

Ajuste relativo (RFI)

Ajuste Normado (NFI)

Ajuste incremental (IFI)

Ajuste comparativo (CFI)

Índice de no centralidad relativa (RNI)

Ajuste de parsimonia

Valor de ajuste esperado

 

 

Ajuste parsimonioso (PFI)

No posee valor referencial, no obstante, se sugieren valores de 0,06 y 0,90 como indicador de diferencias

sustanciales entre los modelos comparados

χ2 normado

< 2,0

Bondad de ajuste ajustado (AGFI)

≥0,90

De bondad de ajuste de parsimonia (PGFI)

≥0,90

Error de la raíz cuadrada media de aproximación (RMSEA)

0,05

Información de Akaike (AIC)

Pequeño

Estadístico N crítico (CN)

200

Fuente: Elaboración propia con base en Cea D’Ancona (2002).

 

Fase de evaluación e interpretación

Una vez realizados los procedimientos de ajuste necesarios, se procede a hacer una valoración técnica de los valores estimados para los parámetros con el objetivo de interpretar el modelo en todas sus partes y conocer su capacidad predictiva (Cea D’Ancona 2002). Este análisis permitirá la identificación de conclusiones y recomendaciones importantes vinculadas al tema de investigación elegido, o en su defecto, —si el modelo no fuera válidocontribuiría a sentar las bases para su rediseño (Thakkar 2020).

De igual manera, una vez identificadas las distintas etapas en la elaboración de un MEE, se vuelve significativo señalar los aportes de Cea D’Ancona (2002) respecto a los supuestos básicos que deben considerarse cuando se construye un modelo de este tipo, los cuales destacan que todas las variables deben encontrarse estandarizadas (según la “métrica que le demos al modelo”), es decir, medidas como desviaciones de su media; los errores de medición deben tener un valor esperado igual a cero y no estar correlacionados. Además, los errores de medición deben cumplir los supuestos de homocedasticidad (varianza constante) y las correlaciones teóricas deben ser viables tanto entre indicadores exógenos (X) como endógenos (Y).

Con respecto a los tipos de análisis que se utilizan en los MEE, es importante resaltar los supuestos básicos del análisis de regresión lineal, pues son estas premisas las que guían, en gran parte, las etapas de valoración establecidas en dichos modelos, por ello, Cea D’Ancona (2002) recomienda tener en consideración los siguientes supuestos:

1.      Tamaño muestral: la importancia de estimar de manera correcta el tamaño de la muestra a utilizar es un dato relevante, pues «la fiabilidad de la mayoría de los índices de ajuste aumenta, cuando se incrementa el tamaño de la muestra» (Cea D’Ancona 2001, 519) de ahí que se recomiende que debe de haber 10 veces más casos que variables observadas. Aunque este requisito actualmente se ha flexibilizado bastante.

2.      Normalidad multivariable: «su existencia es imprescindible para garantizar que los valores críticos que determinan la significatividad de cada coeficiente del modelo, y la del modelo en su conjunto, sean correctos» (Cea D’Ancona 2002, 520).

3.      Las variables observadas y latentes han de ser continuas: este supuesto es de gran relevancia pues en ciencias sociales es muy común encontrar variables nominales y ordinales, estas últimas por lo general se trabajan como continuas, lo que hace que se incumpla este supuesto y el supuesto anterior [aunque en la actualidad existe la tecnología necesaria para soportar análisis con datos categóricos u ordinales].

4.      Ausencia de colinealidad entre las variables: la colinealidad hace referencia a la correlación que hay entre las variables independientes, por lo tanto, es esperado que esta sea la mínima posible, de no ser así se incurre en la dificultad de aumentar la magnitud del error típico.

Todos los supuestos anteriores son relevantes no solo para el uso de programas estadísticos que analicen los datos recolectados, sino también para que él o la investigadora puedan discernir la información más relevante que deben reportar.

En síntesis, la utilidad de los MEE para la investigación empírica en Ciencias Sociales reside en el carácter global que muestran respecto a la relación existente entre las variables de estudio o interés investigativo (Tarka 2018), Esto facilita el agrupamiento de grandes cantidades de información en algunos pocos datos, los cuales pueden representarse de una manera visualmente sencilla y agradable. Asimismo, al carecer del error de medición son ideales en el estudio de constructos no medibles directamente, como lo pueden ser las actitudes y la intención conductual (Cea D’Ancona 2002; Gutiérrez Doña 2008; Ruiz, Pardo y San Martín 2010).

En esa dirección, Ruiz, Pardo y San Martín (2010) consideran que las fortalezas principales de estos modelos son:

·         permiten su representación gráfica,

·         facilitan la posibilidad de hipotetizar efectos causales entre las variables,

·         admiten la concatenación de efectos entre variables y

·         contribuyen a identificar relaciones recíprocas entre variables.

En lo que respecta al estudio de la causalidad o predictibilidad, los MEE no sólo facilitan los análisis estadísticos, sino también contribuyen a la toma de decisiones por parte del personal investigador, al lograr identificar modelos e indicadores que explican diversos fenómenos de la realidad humana (Shaheen et al. 2017). Finalmente, recapitulando las principales características de los MEE, la Figura 2 presenta a continuación un mapa conceptual que integra los aspectos fundamentales desarrollados con anterioridad.

Figura 2. Mapa conceptual sobre modelos de ecuaciones estructurales.

Fuente: Elaboración propia con base en Cea D’Ancona (2002), Gutiérrez Doña (2008) y Ruiz, Pardo y San Martín (2010).

 

 

 

 

 

Aportes de los MEE en la investigación social: alcances y limitaciones

 

Como parte de la sociedad, resulta fundamental poder identificar y comprender diversos procesos, estructuras y dimensiones, especialmente, cuando existen variables latentes que no cuentan con una denominación precisa y estas, al igual que otras variables, ayudan a explicar y describir la realidad social circundante. Por tanto, es necesario contar con sistemas y métodos que puedan darles sentido.

Alaminos et al (2015) exponen que los MEE son como una narración para intentar explicar un fenómeno o proceso social; donde se seleccionan un conjunto de personajes, llamados variables que son considerados relevantes para una historia. Estos interactúan entre sí, y sus acciones están conectadas y explicadas dentro de la trama. Algunas acciones de personajes se explican por las de otros, estableciendo relaciones causales entre ellos. Asimismo, puede haber personajes cuyas acciones están explicadas con detalle dentro de la historia, aunque su impacto en los demás personajes puede no ser relevante en ese momento específico de la narrativa. Esta es una forma creativa de comprender los aportes de los modelos de ecuaciones estructurales para la investigación en Ciencias Sociales.

Dentro de la investigación social, la versatilidad de estos modelos en la exploración de conexiones complejas entre variables, tanto observables como no observables, los convierte en una herramienta esencial para la comprensión de fenómenos en entornos no experimentales (Ghaleb y Murat 2024). A diferencia de enfoques tradicionales, como la regresión múltiple, los MEE son capaces de abordar diversas relaciones de dependencia al mismo tiempo, haciéndose útiles para investigar situaciones donde múltiples variables interactúan entre sí.

Sin embargo, a pesar de estas fortalezas, los MEE también tienen ciertas áreas de mejora que deben ser consideradas a la hora de ser aplicados. En las siguientes líneas se explorarán con detenimiento estas limitaciones, para ello se brindarán ejemplos de aplicación y señalamientos relevantes de distintas personas autoras, con el fin de potenciar aún más el impacto de los MEE y sus aportes en el ámbito de la ciencia.

Los MEE son una herramienta importante para la investigación social, utilizada en diversas Ciencias Sociales como la Psicología, la Educación y la Sociología. «Una de las ventajas de los SEM es que permiten proponer el tipo y dirección de las relaciones que se esperan encontrar entre las variables continuas en estudio para realizar la verificación de relaciones propuestas a nivel teórico» (González Martínez 2018, 3). Estos modelos permiten comprender relaciones complejas entre variables y considerar los errores de medición en los datos; lo cual posibilita analizar simultáneamente varias relaciones de dependencia, a diferencia de otros enfoques. Algunas de estas otras técnicas incluyen la regresión múltiple, análisis de factores, análisis multivariantes y el análisis discriminante, las cuales solamente pueden examinar una relación a la vez. Esto puede representar un desafío a la hora de investigar fenómenos complejos a nivel social que involucran múltiples variables interconectadas (Cupani 2012; Ghaleb y Murat 2024).

De acuerdo con González Martínez (2018), cuando las variables están interconectadas, los MEE muestran cómo una puede tener influencia en otras, y como está varía en fuerza y dirección. Esto puede ser especialmente útil cuando los efectos no son uniformes y las interacciones entre variables son necesarias para entender el panorama completo. Además, los MEE permiten evaluar qué tan bien se ajusta el modelo teórico a los datos observados utilizando diferentes índices de ajuste, lo cual es fundamental para determinar si el modelo teórico refleja la realidad con precisión, lo que contribuye a la construcción de modelos más sólidos (González Martínez 2018; Shaheen et al. 2017). En este sentido, la construcción de modelos sólidos es fundamental para la progresividad de la ciencia y el conocimiento científico en el estudio de variables humanas o sociales.

Los MEE se destacan por estimar y evaluar relaciones entre variables latentes, es decir, aquellas que representan constructos teóricos que no son observables directamente, como la inteligencia o la satisfacción (Kesteren 2021). A diferencia de otras técnicas que utilizan una única medida para representar constructos y no modelan el error de medición, los MEE permiten el uso de múltiples medidas para representar un constructo, controlando así el error de medición específico de cada variable. Todo esto ayuda a evaluar la validez de los constructos medidos (Cupani 2012).

A la hora de interpretar resultados dentro de los MEE, es necesaria una evaluación de diversas pruebas con el fin de determinar si la estructura teórica propuesta se ajusta adecuadamente a los datos empíricos, lo cual implica comparar los valores de los parámetros estimados con la matriz observada de covarianzas. A pesar de su potencial para evaluar modelos teóricos, los MEE no establecen causalidades en sí mismas, sino que ayudan a seleccionar hipótesis causales basadas en evidencia empírica, permitiendo que se rechacen modelos causales que contradigan los datos recopilados. Su valor está en la especificación previa de relaciones complejas entre variables y en la evaluación de cuántas de estas relaciones concuerdan con los datos recopilados empíricamente (Cupani 2012).

En áreas como la Psicología Educativa (como en otras Ciencias Sociales), por ejemplo, los MEE tienen dos principales propósitos: por un lado, desarrollar y validar instrumentos de medición relacionados con constructos de interés, y por otro, estudiar y probar relaciones entre variables latentes en modelos estructurales. Esta capacidad de comprender y evaluar modelos teóricos a través de MEE ha permitido tener un enfoque más profundo y sofisticado en la investigación, lo que resulta en una comprensión más precisa de los fenómenos estudiados (Rigo y Donolo 2018).

Un ejemplo de aplicación corresponde al estudio de Vargas Hernández y Montero Rojas (2016) en el cual utilizaron modelos de ecuaciones estructurales para examinar los posibles factores causales que influían en el rendimiento académico en cursos de matemáticas en la Universidad Nacional de Ingeniería de Nicaragua. Su variable dependiente fue el rendimiento académico en un curso de Matemáticas, el cual midieron en una escala de 0 a 100. Utilizaron distintas variables independientes para analizar su relación con el rendimiento académico, incluyendo la inteligencia fluida de las personas estudiantes, sus hábitos de estudio y sus actitudes negativas hacia las matemáticas. Asimismo, se consideraron factores relacionados con las personas docentes, como la edad, su nivel académico y la participación en cursos pedagógicos. También se tomaron en cuenta variables como la estabilidad emocional, las técnicas de enseñanza, el grado de trabajo, la asistencia a clases y medidas de apoyo académico.

Los resultados mostraron que tres variables del estudiantado, la inteligencia fluida, los hábitos de estudio y las actitudes negativas hacia las matemáticas, influyen de forma significativa en su despeño. Además, las primeras dos, no solo impactan directamente en el rendimiento académico en matemáticas, sino que también tienen incidencia en las actitudes negativas hacia la asignatura; por lo que tanto, los hábitos de estudio como la inteligencia fluida influyen en el comportamiento de las actitudes negativas hacia las matemáticas (Vargas Hernández y Montero Rojas 2016).

Por otra parte, las variables de la persona docente, tales como la edad, el nivel académico y la asistencia a cursos pedagógicos, también mostraron efectos directos de relevancia en el rendimiento académico de las y los estudiantes (Vargas Hernández y Montero Rojas 2016). Estudios como este destacan la utilidad de los MEE para analizar relaciones complejas en ámbitos naturales como lo es el educativo y su capacidad para identificar factores determinantes dentro de estos.

Manzano Patiño (2017) señala que si bien los MEE tienen distintas ventajas, existen también algunas limitaciones relevantes. Una de ellas es la necesidad de contar con “muestras grandes” para su uso, por ejemplo, n > 200; lo cual puede ser un desafío en investigaciones con recursos y tiempo limitados. Además, menciona que, para cada variable observada, se recomienda tener al menos diez casos en la muestra; por lo que, si se desean evaluar modelos complejos con diversas variables y parámetros, se requeriría una muestra aún más grande, lo que puede ser costoso y difícil de obtener en la práctica.

Otra limitación importante está relacionada con la formulación del modelo, debido a que plantear un modelo de MEE requiere un profundo conocimiento teórico del fenómeno estudiado. Sin una base teórica sólida, pueden desarrollarse modelos que se ajusten bien a los datos, pero que no tengan suficiente sustento teórico; lo cual puede dar paso a conclusiones erróneas o a la construcción de modelos sin suficiente relevancia en el contexto real (Manzano Patiño 2017).

La confiabilidad de las variables latentes es otro aspecto que destacar; ya que, si se emplean variables latentes poco confiables, los resultados del MEE pueden no tener mucha confiabilidad y solidez. Finalmente, el conocimiento sobre estadística es fundamental para aplicar el MEE, incluyendo la comprensión profunda de conceptos y técnicas de modelado; sin esto, es posible que la metodología sea utilizada de manera errónea o los resultados no se interpreten correctamente, lo que a su vez representa un obstáculo para la persona investigadora (Manzano Patiño 2017).

Medrano y Muñoz Navarro (2017) por su parte, expresan que si bien los MEE se corresponden a una metodología sólida para trabajar con datos no experimentales, su eficacia y utilidad están ligadas directamente a la existencia de un modelo teórico sólido que los respalde. Destacan que es común observar un uso inadecuado de esta metodología, donde las personas investigadoras incluyen o excluyen parámetros en función de la mejora del ajuste del modelo sin una base teórica sólida. Esto genera limitaciones significativas, ya que la solidez de un modelo no depende solo del ajuste estadístico, sino también de su coherencia interna con la teoría.

Por otro lado, una limitación común que estos destacan también es la insistencia por el ajuste estadístico en detrimento de la fundamentación teórica; resaltando que el fin del MEE no es solamente ajustar bien los datos, sino contrastar teorías y conceptualizaciones, y la pérdida del razonamiento teórico en favor del ajuste estadístico puede ser perjudicial. En esta línea, Medrano y Muñoz Navarro señalan que:

 

ausencia de un criterio externo puede llevar a que muchos modelos SEM sean simplemente un modelo estadístico que explique la covariación entre diferentes constructos teóricos. En efecto, muchos investigadores construyen modelos “ciegos” o “mecánicos” donde se “crean” una o varias variables latentes para explicar las variaciones causales, sin un criterio externo que permita contrastar dicho modelo (2017, 237).

 

Resulta pertinente mencionar que los modelos MEE deben estar anclados en la realidad, vinculando las variables observables con conceptos o fenómenos de relevancia práctica (Tarka 2018). La falta de este anclaje puede convertir a estos modelos en construcciones estadísticas desvinculadas de la realidad, explicando la covariación entre constructos teóricos sin un claro vínculo con el contexto real (Barrett 2007, como se citó en Medrano y Muñoz Navarro 2017).

Dentro de las recomendaciones para abordar las limitaciones identificadas en el uso de los MEE se encuentran establecer conexiones claras entre las variables observables y fenómenos con relevancia práctica. Esto no solo fortalecerá la aplicabilidad de los resultados, sino que también proporcionará una base más sólida para la toma de decisiones. Además, se recomienda un enfoque más riguroso en la identificación y discusión de modelos que presenten deficiencias; la transparencia en la presentación de resultados, incluso cuando estos no cumplen con las expectativas, es de carácter esencial para el progreso de la producción de conocimiento científico. Esta comunidad puede verse beneficiada al abordar con apertura las limitaciones y reforzar un diálogo que conduzca a mejoras en la metodología y la comprensión de los fenómenos sociales.

Igualmente, otra recomendación podría ser explorar nuevos enfoques y desarrollar modelos más flexibles que respondan a necesidades contextualizadas y pertinentes que se adapten a los fenómenos que se buscan estudiar. También, la aplicación de los MEE en contextos culturales con mayor diversidad y adaptar esta metodología a realidades más amplias podría diversificar su utilidad y relevancia global, así como, generar nuevas preguntas y enfoques de investigación; enriqueciendo con ello la comprensión de determinados objetos de estudio bajo distintas perspectivas.

 

 

Conclusiones

 

Los MEE representan herramientas sumamente valiosas en la investigación social, el explorar y trabajar con conexiones complejas entre variables, los convierte en estrategias fundamentales para entender cómo estas se relacionan en distintos contextos. Más allá de confirmar supuestos teóricos, los MEE juegan un rol esencial al refinar y ajustar teorías científicas ya establecidas, robusteciendo de manera sustancial la investigación realizada por las Ciencias Sociales.

Estos modelos no solo permiten representar de forma gráfica las relaciones entre variables y brindar una narrativa visual que facilite la interpretación de los fenómenos, sino que además establecen hipótesis causales que enriquecen la comprensión de distintas dinámicas socioculturales.

La flexibilidad que otorgan los MEE al poder estudiar relaciones simultáneas de dependencia resulta especialmente valiosa al analizar procesos complejos que involucran múltiples variables interrelacionadas; tal y como sucede con frecuencia en la investigación social.

Indudablemente, los MEE favorecen la actividad investigativa y propician la generación de nuevos aprendizajes que contribuyen al entendimiento e interpretación de diversos fenómenos. Subrayan con especial énfasis la importancia de avanzar constantemente en el conocimiento de las complejidades inherentes a los procesos sociales, en aras de develar la intrincada y cautivadora relación existente entre lo observable y lo latente.

 

Contribución de las personas autoras

El Dr. Andrés Castillo Vargas y el M.Sc. Andrés Ruiz Sánchez contribuyeron por igual a la redacción de este artículo. Ambas personas aportaron en el proceso de investigación, así como en la revisión y aprobación de la versión final del artículo.

Este artículo se desprende del proyecto de investigación titulado: “Actitudes hacia la difusión y la divulgación de la ciencia en la investigación académica: un modelo estructural desde la teoría de la acción razonada”, tesis para optar por el grado de Doctor en Ciencias Sociales y de la Comunicación por la Universidad de Salamanca, España, realizado por el Dr. Andrés Castillo Vargas, autor de este artículo. Y del proyecto de investigación 723-C1-304: “Actitudes y prácticas de personas investigadoras hacia la divulgación de la ciencia” desarrollado por los autores en el Instituto de Investigaciones Psicológicas de la Universidad de Costa Rica.

Apoyo financiero

Los proyectos de los cuales se desprende este artículo contaron con el apoyo financiero de la Universidad de Costa Rica, la Universidad de Salamanca y la Fundación Carolina.

Agradecimientos

Agradecemos el significativo apoyo brindado por las personas asistentes de investigación Nathalia Vásquez Navarro y Sebastián “Teo” Ramírez Estrada.

 

Referencias

Alaminos, Antonio et al. 2015. Introducción a los modelos estructurales en investigación social. Cuenca, Ecuador: Pydlos Ediciones.

Bunge, Mario. 1981. Teoría y realidad. Barcelona, España: Editorial Ariel.

Byrne, Barbara. 1998. Structural equation modeling with LISREL, PRELIS and SIMPLIS. Londres, Inglaterra: Psychology Press.

Casas Guillén, Mercedes. 2002. «Los modelos de ecuaciones estructurales y su aplicación en el Índice Europeo de Satisfacción del Cliente». Ponencia presentada en las X Jornadas Madrid 2002. Asociación Española de Profesores Universitarios de Matemáticas para la Economía y la Empresa, Madrid, España, setiembre.

Cea D’Ancona, María Ángeles. 2002. Análisis multivariable. Teoría y práctica en la investigación social. Madrid, España: Editorial Síntesis.

Cuevas Badallo, Ana, y Oscar Martínez Ortubay. 2011. «Tema 1. Introducción a la noción de ciencia». Manuscrito inédito. Máster Oficial en Estudios Sociales de la Ciencia, Escuela de Ciencia, Centro de Altos Estudios Universitarios (OEI), Madrid, España.

Cupani, Marcos. 2012. «Análisis de Ecuaciones Estructurales: conceptos, etapas de desarrollo y un ejemplo de aplicación». Revista Tesis 1: 186-199. https://www.researchgate.net/publication/274716879_Analisis_de_Ecuaciones_Estructurales_conceptos_etapas_de_desarrollo_y_un_ejemplo_de_aplicacion

Ghaleb Marwan y Murat Yaslioglu. 2024. «Structural Equation Modeling (SEM) for Social and Behavioral Sciences Studies: Steps Sequence and Explanation». Journal of Organizational Behavior Review 6(1): 69-108. https://www.researchgate.net/publication/377776329_Structural_Equation_Modeling_SEM_for_Social_and_Behavioral_Sciences_Studies_Steps_Sequence_and_Explanation

García Veiga, María Ángeles. 2011. «Análisis causal con ecuaciones estructurales de la satisfacción ciudadana con los servicios municipales». Tesis de maestría inédita, Universidad de Santiago de Compostela, Santiago de Compostela, España. http://eio.usc.es/pub/mte/descargas/proyectosfinmaster/proyecto_610.pdf

González Martínez, Edgar Santiago. 2018. «Aplicación de un modelo de ecuaciones estructurales en un estudio observacional». Reporte práctico técnico para optar por diplomado, Universidad Veracruzana. https://www.uv.mx/personal/jorggomez/files/2021/11/Gonzalez-Martinez-2018-APLICACION-DE-UN-MODELO-DE-ECUACIONES-ESTRUCTURALES-EN-UN-ESTUDIO-OBSERVACIONAL.pdf

Guevara, Minerva, y Ricardo Valdéz. 2004. «Los modelos en la enseñanza de la química: algunas de las dificultades asociadas a su enseñanza y a su aprendizaje». Educación química 15(3): 243-247. https://doi.org/10.22201/fq.18708404e.2004.3.66181

Gutiérrez Doña, Benicio. 2008. Modelos lineales estructurales: conceptos básicos, ecuaciones y programación con LISREL. San José, Costa Rica: Instituto de Investigaciones Psicológicas de la Universidad de Costa Rica. https://iip.ucr.ac.cr/sites/default/files/contenido/cuamet2.pdf

Hair, Joseph et al. 2006. Multivariate Data Analysis. 6.a ed. New Jersey, Estados Unidos: Prentice Hall.

Kesteren, Erik-Jan van. 2021. Structural equations with latent variables: computational solutions for modern data problems. Ultrecht, Países Bajos: Utrecht University. https://doi.org/10.33540/130

Laymon, Ronald. 1989. «Applying Idealized Scientific Theories to Engineering». Synthese 81(3): 353-371. https://doi.org/10.1007/BF00869321

Manzano Patiño, Abigail Patricia. 2017. «Introducción a los modelos de ecuaciones estructurales». Investigación en Educación Médica 7(25): 67-72. https://doi.org/10.1016/j.riem.2017.11.002

Maruyama, Geoffrey. 1997. Basics of structural equation modeling. Londres, Inglaterra: Sage Publications.

Medrano, Leonardo Adrián, y Roger Muñoz Navarro. 2017. «Aproximación Conceptual y Práctica a los Modelos de Ecuaciones Estructurales». Revista Digital de Investigación en Docencia Universitaria 11(1): 219-239. http://dx.doi.org/10.19083/ridu.11.486

Rigo, Daiana Yamila, y Danilo Donolo. 2018. «Modelos de ecuaciones estructurales: usos en investigación psicológica y educativa». Revista Interamericana de Psicología 3(52): 345-357. https://doi.org/10.30849/rip%20ijp.v52i3.388

Ruiz, Miguel, Antonio Pardo y Rafael San Martín. 2010. «Modelos de ecuaciones estructurales». Papeles del Psicólogo 31(1): 34-45. https://www.redalyc.org/articulo.oa?id=77812441004

Shaheen Farhat et al. 2017. «Structural equation modeling (SEM) in social sciences & medical research: a guide for improved analysis. ». International Journal of Academic Research in Business and Social Sciences 7(5): 132-143. http://dx.doi.org/10.6007/IJARBSS/v7-i5/2882

Stoffels Malou et al. 2023. «Steps and decisions involved when conducting structural equation modeling (SEM) analysis» Medical teacher 45(12):1343-1345. https://pubmed.ncbi.nlm.nih.gov/37813119/#:~:text=DOI%3A-,10.1080/0142159X.2023.2263233,-No%20abstract%20available

Tabachnick, Barbara, y Linda Fidell. 2007. Using Multivariate Statistics. 5.a ed New York, Estados Unidos: Pearson. https://hisp.htmi.ch/pluginfile.php/77114/mod_resource/content/0/Using%20Multivariate%20Statistics%20%28Tabachnick%20and%20Fidell%29.pdf

Thakkar Jitesh. 2020. «Procedural Steps in Structural Equation Modelling». En: Structural Equation Modelling. Studies in Systems, Decision and Control, vol 285. Singapore: Springer. https://doi.org/10.1007/978-981-15-3793-6_3

Tarka, Piotr. 2018. «An overview of structural equation modeling: its beginnings, historical development, usefulness and controversies in the social sciences»Qual Quant 52: 313–354. https://doi.org/10.1007/s11135-017-0469-8

Vargas Hernández, Marcia Mercedes, y Eiliana Montero Rojas. 2016. «Factores que determinan el rendimiento académico en Matemáticas en el contexto de una universidad tecnológica: aplicación de un modelo de ecuaciones estructurales». Universitas Psychologica 15(4). https://doi.org/10.11144/Javeriana.upsy15-4.fdra

Wright, Sewell. 1921. «Systems of mating. I. The biometric relations between parent and offspring». Genetics 6(2): 111-123. https://doi.org/10.1093/genetics/6.2.111



[1] Un parámetro estadístico es una medida poblacional, es decir, son las características de la población que serán calculadas y probadas dentro del MEE.

[2] La homocedasticidad refiere a que la varianza de error de los residuos es constante (Cea D’Ancona 2002).