Processing math: 75%
Typesetting
RIDE. Revista Iberoamericana para la Investigación y el Desarrollo Educativo
Esperanza del cuadrado medio. Una explicación didáctica
Dec 31 2024
Resumen
La Esperanza del Cuadrado Medio (ECM) es un referente que se considera importante en el análisis de varianza; su utilidad radica en el análisis de variaciones entre grupos en diseños de investigación vía experimento. Dicho análisis debe considerar las nociones de factor fijo, aleatorio, cruzado o anidado, así como los modelos identificados. Esto permitirá generar la ECM que, a su vez, ayudará a realizar los contrastes de hipótesis necesarios para resolver el modelo. De esta manera, decidir sobre el rechazo o no de la hipótesis planteada es clave en las conclusiones que se presenten en la investigación que se desarrolla. Es un estudio documental que explora y explica el proceso de la ECM y responde a la pregunta ¿cómo ofrecer una explicación didáctica a través de exposición de reglas y sus aplicaciones para el cálculo de la ECM? Se concluye haciendo énfasis en la importancia de seguir recomendaciones y reglas para obtener la ECM.
Introducción
En el presente escrito se desarrolla el tema Esperanza de los Cuadrados Medios (ECM), el cual requiere aprendizajes previos del modelo estadístico con todas sus implicaciones: concepto de población o universo, manejo de variables, escalas de medición, suposiciones del modelo como de normalidad, homogeneidad de varianzas, independencia de los errores; en sí, son conocimientos estadísticos relacionados con la metodología de la investigación y, en este caso la ECM es de uso, en particular, en la investigación experimental.
Se especifica que la ECM, ha sido de uso casi exclusivo de los genetistas; esto es así porque en genética es muy frecuente en sus modelos la presencia de variables o factores aleatorios. Su uso se requiere en ciertas circunstancias especiales; por ejemplo, cuando se hace muestreo en las unidades experimentales de un diseño de bloques completos al azar y también, cuando en ciertas circunstancias que se presentan al describir el proceso de recuperación de la información ínter bloque en los diseños bloques incompletos (Martínez, 1988).
Se afirma lo anterior porque las observaciones muestrales en las unidades experimentales no están aleatorizadas; es decir, las muestras en las unidades experimentales no son independientes, lo cual tiene repercusiones en la estructura de los modelos, como es la generación de un Error de Restricción (EdeR); o sea, el modelo presenta restricción para su buen funcionamiento de aleatorizar los bloques y, al no estar aleatorizados surge ese EdeR y desde luego la ECM funciona para ver la variación entre los grupos; desconocerla conlleva a no dar una adecuada interpretación de resultados y no saber qué hipótesis rechazar y cuál no rechazar. (Martínez, 1988).
El uso de la ECM no sólo se debe a la presencia de factores aleatorios en el modelo, sino que principalmente a que los tratamientos por su ubicación sistemática dentro de los bloques, por alguna circunstancia no han sido aleatorizados y también a que los bloques tampoco están aleatorizados, lo que ocurre principalmente en el sector agropecuario y también en otras áreas del conocimiento como en zootecnia, biología, medicina, en la industria. Sin embargo, la concepción de que los bloques están aleatorizados, se arrastra erróneamente desde Fisher (1936).
Consecuentemente, la presencia de factores aleatorios y la no aleatorización de uno o más de dichos factores incluyendo a los bloques, conduce en ambos casos al uso del EdeR y a la ECM y, a los proyectos de investigación pseudo experimentales (observacionales y comparativos). Ello permite hacer pruebas de hipótesis adecuadas (saber qué rechazar y qué no rechazar).
Cuando los tratamientos han sido debidamente aleatorizados no es necesario el EdeR. La manipulación o transformación del material de investigación también es necesaria para que exista el experimento. Sin embargo, aunque este último se dé, no habiendo aleatorización el experimento deja de serlo.
¿Contemplan esta situación los genetistas e investigadores en general cuando hacen investigación? Porqué se puede estar trabajando con experimentos cuando en realidad no lo son. ¿En cuántas tesis académicas se usan estas técnicas y en cuántas no se usan debiendo usarse? Percatarse de esta situación, es necesario.
Conceptos metodológicos fundamentales
Es necesario que la metodología y la estadística, sean enseñadas en forma dependiente, según sea el tipo de investigación. Asesores, docentes, metodólogos, estadísticos e investigadores en general deben trabajar las técnicas estadísticas y su aplicación a los procedimientos metodológicos, con ello se aplica correctamente las técnicas metodológicas a la estadística. Por lo cual se puntualiza brevemente en lo siguiente:
  • Practicar el buen uso de la estadística y de la investigación en general y en particular la investigación vía experimento (Tabla 1), y así en el resto de los diez tipos o proyectos de investigación (Tabla 2), con los pasos metodológicos que se requieran.
  • Manejo adecuado de la aleatorización y los bloques.
  • Manejo adecuado del EdeR, ECM, factor de confusión, pruebas de hipótesis y muchas otras técnicas clásicas que se presentan muy frecuentemente en el campo de la investigación científica.
Algunas aplicaciones y precisiones de tipo metodológico y estadístico inherentes a las tesis y proyectos de investigación, se derivan del contenido de lo que se llama matriz de investigación científica (Tabla 2 y 3), fundamentadas en cuatro criterios dicotómicos (Tablas 1 y 2), que al ser combinados dan origen a los diez tipos o proyectos de investigación científica, temas que se describen brevemente enseguida.
El protocolo 1 y 2 son a la vez D (encuesta) y C (no experimento no pseudo experimento).
El protocolo 3 y 4, son a la vez D (encuesta) y B (pseudo experimento).
El protocolo 5 y 8 es C (no experimento ni pseudo experimento).
El protocolo 6,7 y 9 son B (pseudo experimento)
El Protocolo 10 es A (experimento).
Son 14 proyectos, en esta nueva clasificación (Tabla 3), en lugar de 10 (Tabla 2), porque:
  • Un proyecto es experimento (A), y comparativo.
  • Cinco Proyectos son pseudo experimentos (B) y, además, comparativos.
  • Hay cuatro, no experimentos ni pseudo experimentos (C), además monogrupales
  • Dos son encuestas (D) monogrupales y dos comparativas.
Ahora bien, si investigación conlleva a investigar, entonces experimentación a experimentar. Veamos: El primero (investigación), se encuentra presente en toda la Tabla 2 (los diez proyectos), cuyo nombre común se encuentra en la columna 5. El segundo (experimentación), en la parte inferior del cuadro 2 (el experimento). Es decir, cuando se ejecuta experimento se hace investigación; pero, la investigación puede hacerse o no con experimentos. Es importante diferenciar el concepto de investigación al de experimentación y aplicar este, para casos en que el proyecto sea realmente experimento.
El experimento debe cumplir con el requisito de aleatorizar tratamientos y con la manipulación, transformación o modificación del material de investigación. Aleatorizar significa dar a cada participante o tratamiento la misma probabilidad de ser incluido en el experimento. Debe quedar claro que lo experimental se refiere al criterio, el experimento al nombre del proyecto y lo observacional se refiere al criterio, resultando nueve tipos de proyectos.
Sí no hay aleatorización no existe el experimento. Esto lleva al criterio observacional y en particular (como estudio comparativo) al pseudo experimento; lleva también al EdeR, ECM y, consecuentemente a la manera de realizar pruebas de hipótesis, para saber qué rechazar, qué no rechazar. La aleatorización, es una característica inseparable del experimento.
Por otro lado, sólo en los proyectos comparativos (dos o más poblaciones) se presentan factores de confusión. Su contraparte es el criterio monogrupal. Ambos criterios (comparativo y monogrupal), los define y determina el investigador.
Otros autores le llaman al criterio monogrupal, criterio descriptivo, interpretándolo como el hecho de estudiar una población, cuando su función más importante es el de describir. Al respecto, lo descriptivo no es privativo de un grupo, de una población, los proyectos comparativos también se describen. En cambio, el criterio monogrupal (de monogrupo), se explica por sí solo. Lo anterior en forma breve y resumida, constituye la materia prima necesaria y suficiente, para que el lector asimile el tema ECM, cuyas reglas se tratan enseguida.
Reglas para calcular la ECM: Valores Esperados (VE), Componentes de Varianza (CV)
Se presentan reglas fáciles para calcular ECM, que hasta el momento ha sido común en la práctica de la investigación, el uso de modelos fijos, para probar hipótesis mediante el cociente de cuadrados medios: Relación del Cuadrado Medio del factor bajo hipótesis (como numerador), al cuadrado medio del error del modelo completo (como denominador). Relación que se llama F calculada (Fc). Matemáticamente se expresa así:
Fc=CM(delfactorbajohipótesis)CME(delmodelocompleto)=CM/HoCME~FtablasGl.(numerador)Gl.(denominador)
El valor Fc, se compara con el valor F de tablas, entrando con los grados de libertad del numerador, grados de libertad (Gl) del denominador y cierto nivel de significancia alfa (α), que no necesariamente debe ser 5% ó 1%, como se acostumbra, porque podría ser, de acuerdo a necesidades del fenómeno estudiado de 4%, 7%..., para enseguida usar las siguientes reglas de decisión:
  • Sí, Fc ≥ Ftablas ⇒ Rechazar Ho: τ1= τ2 = τ3 =... = τt = τ
  • Sí, Fc < Ftablas ⇒ Rechazar Ho: τ1= τ2 = τ3 =... = τt = τ
Estas reglas sólo son válidas para modelos estándar o clásicos (de efectos fijos), siempre y cuando el factor de variación bajo Hipótesis, haya sido aleatorizado; pueden presentarse dos casos:
  • Se construye un modelo de efectos fijos, aleatorios o mixto, en cuanto a la presencia o no de factores aleatorios (decisión del investigador).
  • Se construye (por necesidades del fenómeno estudiado), el modelo con uno o más factores no aleatorizados. Se originan entonces, pseudo experimentos, (observacionales y comparativos), que obliga inyectar al modelo el EdeR.
Necesario en ambos casos calcular ECM, con la finalidad de resaltar y hacer visibles la prueba de las hipótesis involucradas en la investigación y en el segundo caso, además, inyectar al modelo uno o más errores de restricción.
El investigador debe darse cuenta, desde la planeación de su investigación de las situaciones a y b mencionadas, que le ayudan a definir el diseño de investigación, modelo estadístico-matemático, técnicas y pruebas estadísticas.
Caso específico del diseño completamente al azar (CaA):
Es éste un caso muy especial, cuando los tratamientos no han sido aleatorizados (ubicados en forma sistemática). Se presenta con frecuencia esta situación en estudios agro ecológicos, biológicos, agrícolas, pecuarios, forestales, medicina e industria, entre otros. Los tratamientos no aleatorizados, suelen interpretarse erróneamente como repeticiones verdaderas e independientes (Martínez, 1988). No lo son porque están correlacionadas, originándose pseudo experimentos o cuasi experimentos, con EdeR; siendo obligado el cálculo de la columna (ECM), para efectuar pruebas de Hipótesis. Para ejecutar investigaciones se recomienda lo siguiente:
  • Definir en función de la teoría (conocimiento profundo del fenómeno estudiado), el modelo representativo de la población.
  • Definir la tabla del análisis de varianza (AdeV). En principio con las columnas de fuente de variación (FV), grados de libertad (GL), cuadrado medio (CM) y ECM. ¿Cómo definir ECM, para cada fuente de variación?
Se recomienda escribir, de acuerdo a Santizio (1974), lo siguiente:
  • El nombre: Tabla del AdeV.
  • Tipo de diseño: Nombre común, estándar o no.
  • Indicar niveles o tratamientos para cada factor de variación.
  • Acompañar a cada término del modelo, de lo siguiente:
    • Abajo del término: El símbolo de su correspondiente CV.
    • Arriba del término: Indicar si es fijo o aleatorio, así como el número que le corresponda, de acuerdo al número de término del modelo (en un círculo).
Se recomienda con fines didácticos, practicar estos incisos para investigadores de poca experiencia. Pero es preferible usarlos en todos los casos, con el fin de no cometer errores en el manejo teórico de la investigación. Además:
  • Escribir) los subíndices simbólicos: i, j, k… y los reales: a, b, r...
  • Describir para cada tesis o proyecto las suposiciones del modelo:
    • Tipo de distribución de los datos
    • Homogeneidad de los datos
    • Independencia de los errores.
  • Escribir el nombre de la variable dependiente generalmente simbolizada como Y, a la izquierda, en la parte superior de la tabla.
  • Presentar si es posible (con fines didácticos), la gráfica del modelo.
Modelo 1. Bifactorial aleatorio (α, β y su interacción αβ.), para calcular ECM. Nótese en tabla 1: Todos los coeficientes de variación (CV), se quedan. ¿Por qué?, porque los factores de variación son todos aleatorios.
  • i = 1, 2, 3...a, niveles del factor αi aleatorio
  • j = 1, 2, 3...b, niveles del factor βj aleatorio
  • k = 1, 2, 3...r, repeticiones de cada combinación de tratamientos (caso balanceado).
  • i, j, k, son los subíndices simbólicos
  • a, b, r, son los subíndices reales
Descripción de las reglas: Al leer estas reglas es necesario tener a la vista el modelo (1). Se supondrá (en todos los ejemplos), que todo está aleatorizado (sin EdeR). La aplicación de las reglas para calcular ECM, se ejemplifican en principio con un modelo bifactorial aleatorio, lo cual significa que ambos factores y su interacción (cuando exista), son aleatorios:
  • Regla 1. En el AdeV, columna ECM, se escribe el coeficiente de variación (CV) σ2ε como primer término para todas las fuentes de variación. En el modelo en cuestión, el error εk(ij), (épsilon k, dentro de ij), es aleatorio y jerárquico o anidado en ij.
  • Regla 2. Para cada fuente de variación se escriben en la columna ECM los CV, del modelo con la siguiente condición: El Subíndice(s) del factor en cuestión, por ejemplo, el subíndice i de αi, debe(n) estar en dichos CV.
  • Regla 3. Automáticamente, de acuerdo a la regla 2, quedan definidos para cada CV seleccionado, los suscritos que no están, cuyos valores se colocan como coeficientes de dichos componentes, además del coeficiente r (número de repeticiones), que no son más que los tamaños de muestra (número de niveles o tratamientos); es decir, los tamaños de muestra se substituyen por su valor real al efectuar las pruebas de hipótesis correspondientes.
  • Regla 4. En la columna ECM, no todos los CV así seleccionados quedan en la hilera correspondiente al factor de variación en cuestión; es decir, los CV pueden quedar o no en dicha hilera. De acuerdo con esta regla (de los componentes que deben o no quedar en la hilera correspondiente), para saberlo, se aplican los siguientes criterios. (Ver Tabla 5).
    • Por ejemplo, en la hilera del factor αi, y situados (en la columna ECM), en cada uno de los CV correspondientes. Así, en el CV, σ2ijde los suscritos ij, ignoro i (porque se está en la hilera del factor αi), quedando j; de tal manera que si j es fijo el término desaparece; pero si j es aleatorio, el término se queda. El mismo criterio se aplica para el resto de los CV. Es una regla práctica, que se puede seguir con interés.
    • Regla alternativa a la regla 4, aún más práctica que la anterior: los CV del modelo cuyo subíndice(s), coincidan exactamente con el del factor de variación en cuestión, se quedan en la hilera correspondiente (sean fijos o aleatorios). Es el caso del factor de variación αi y de βj
Nótese que en la Tabla 5, los CV de cada FV se quedan (por ser todas las fuentes de variación aleatorias). Este ejemplo comprende o comprime a todos los casos. Para aplicar reglas, centrar la atención en lo siguiente:
  • En los términos del modelo.
  • En los subíndices simbólicos (i, j, k...), para el modelo en cuestión.
  • En los subíndices reales (a, b, r...), porque toman cierto valor.
  • En las columnas; FV, GL, Ftablas y ECM.
  • En los CV correspondientes a cada término del modelo.
  • En las hileras que contienen los CV en la columna ECM.
  • Conveniente asignar un número a los términos del modelo y tabla del AdeV, dando el número 1 al error y los que siguen al resto de los términos de izquierda a derecha.
  • Definir para cada término del modelo, los que sean fijos y los que sean aleatorios.
Bifactorial aleatorio (α, β e interacción αβ), para aplicar reglas y calcular ECM:
Aplicación de la regla 1: En todas las hileras (ya se explicó), se escribe como primer CV el error σ2ε
Aplicación de la regla 2: Que define los CV para la hilera correspondiente: La aplicación de esta regla se ejemplifica (para cada factor de variación), en función de la tabla del AdeV (Tabla 5), así:
  • En la primera hilera: El factor de variación αi cuyo suscrito es i, aparece en los términos ② y ④ del modelo, cuyos CV, σ2i y σ2ij se escriben en la hilera de dicho factor, además, del CV, σ2ε
  • En la segunda hilera: El factor de variación βj cuyo suscrito es j, aparece en los términos ③ y ④ del modelo, cuyos CV son σ2j y σ2ij, se escriben en la hilera de dicho factor, además del CV σ2ε
  • En la tercera hilera: En el factor de interacción (αβ)ij, los suscritos ij, aparecen solamente en el término ④ del modelo, cuyo CV σ2ijse escribe (por tal razón) en dicha hilera, además del CV σ2ε
  • En la cuarta hilera: Los suscritos k(ij) del error aparecen solamente en el término ① del modelo, cuyo CV σ2ε se escribe en la hilera correspondiente al error.
Aplicación regla 3. Que define (en la columna ECM), para cada hilera, los coeficientes de cada CV. Siendo uno de los ellos siempre "r", excepto para σ2ε
Cómo proceder para cada factor de variación:
  • En la primera hilera, correspondiente al factor de variación αi: En el CV, rσ2ij están presentes todos los suscritos, por lo que no existen coeficientes que escribir (sólo r).
  • En la misma hilera, del factor αi, El CV rbσ2i tiene como coeficiente rb ¿Por qué? Porque en dicho CV no está el suscrito j = 1, 2, 3...b, siendo este nivel b, el que se coloca como coeficiente, además de r; es decir: rb.
  • En la segunda hilera, correspondiente al factor βj: En el CVσ2ij sí están presentes todos los suscritos, por lo que no existen coeficientes que escribir (sólo r).
  • En la misma hilera correspondiente al factor βj,: El CV raσ2jsu coeficiente es ra, ¿Por qué? Porque en dicho CV, no está el suscrito i =1, 2,…a, siendo éste nivel a, el que se coloca como coeficiente, además de r, es decir: ra.
  • En la tercera hilera correspondiente a la interacción (αβ)ij,: En el CVσ2ij sí están presentes todos los suscritos, por lo que no existen coeficientes que escribir (sólo r).
  • En la cuarta hilera, para el factor de variación error experimental, sólo se escribe su CV: σ2ε
Aplicación de la regla 4. Define en cada hilera en la ECM, qué CV, se queda y cual desaparece o se elimina. Quizá sea ésta la regla más importante. Se presentan cuatro casos: Se explica, en función de que todos los CV son aleatorios; es decir, que la materia prima es la Tabla 5.
Se recomienda, para cualquier modelo en cuestión, presentarlo como si todos los términos del mismo, fuesen aleatorios y luego ir aplicando las reglas correspondientes.
  • α y β aleatorios ⇒ Modelo aleatorio. Queda como la Tabla 5.
  • α y β, fijos ⇒ Modelo fijo, tradicional, estándar o clásico (el más usado).
  • α fijo β aleatorio ⇒ Modelo mixto aleatorio
  • α aleatorio β fijo ⇒ Modelo mixto aleatorio
Para ejemplificar estos casos, seguimos usando como patrón al modelo 1.
Ilustración del caso a: αi, βj aleatorios ⇒ Modelo aleatorio
Es común que a estos modelos se señalen como de clase II o modelo II. Para este caso, en función del modelo (1), se deriva la Tabla 5, cuyos CV, se explican enseguida:
  • En todas las hileras de las ECM, se escribe, como primer CV: σ2ε
  • En la primera hilera: En el CV rσ2ijcorrespondiente a la hilera del factor αi, de los suscritos ij, ignoro i, (porque estamos en la hilera del factor αi), quedando j. Como j es aleatorio, el CV rσ2ij, se queda (no se elimina).
  • En el CV rbσ2ide la hilera αi, cuyo suscrito es i, por coincidir exactamente con el suscrito del factor αi, el CV rbσ2ipermanece. Sea fijo o aleatorio. A esta regla se le considera como una regla alternativa.
  • En la segunda hilera: En el CV, rσ2ijcorrespondiente a la hilera del factor βj; de los suscritos ij, ignoro j (porque estamos en la hilera de βj; quedando i). Como i de αi, es aleatorio el CV rσ2ijse queda.
  • En el CV raσ2jde la misma hilera (de βj), cuyo suscrito es j, por coincidir exactamente con el del factor βj, dicho CV se queda. Sea fijo o aleatorio. A esta regla se le considera como una regla alternativa.
  • En la tercera hilera, para la interacción: El CV rσ2ijcorrespondiente a la hilera del factor interacción (αβ)ij cuyos suscritos son ij, por coincidir exactamente ambos; el CV se queda. Sea fijo o aleatorio. A esta regla se le considera también como una regla alternativa.
Nótese en tabla 5, como todos las FV son aleatorias, todos los CV se quedan.
Ahora, las pruebas de hipótesis para αi, βj (cuyos CVσ2i, σ2j), pueden verse claramente con las ECM correspondientes, con relación a la ECM de la interacción (αβ)ij. La interacción puede hacerse con relación a la ECM, lo cual se ve claramente en la tabla del AdeV, de la Tabla 5.
Prueba de hipótesis para el factor αi,:
H0:σ2i=0VSH1:σ2i0
Fc=(ECM)α(ECM)αβ=σ2ε+rbσ2i+rσ2ijσ2ε+rσ2ij=rbσ2i
Prueba de hipótesis para el factor βj:
H0:σ2j=0VSH1:σ2j0
Fc=(ECM)β(ECM)αβ=σ2ε+raσ2j+rσ2ijσ2ε+rσ2ij=raσ2j
Prueba de hipótesis para el factor de interacción (αβ)ij :
H0:σ2ij=0VSH1:σ2ij0
Fc=(ECM)αβ(ECM)ε=σ2ε+rσ2ijσ2ε=rσ2ij
Consecuentemente, para modelos aleatorios, las pruebas ya no se hacen con los CM como si los efectos fuesen fijos: Se hacen mediante la relación de la ECM, para saber qué rechazar y qué no rechazar.
Ilustración del caso b: αi fijo, βj fijo, ⇒ Modelo fijo.
Suelen señalar a estos modelos, como de clase 1 o modelo 1. En función de la Tabla 5 y aplicando regla 4, se deriva la Tabla 7. En todas las hileras, sólo aparecen dos CV, ¿Por qué no aparecen el resto? Veamos:
  • En todas las hileras de las ECM, se escribe σ2ε como primer CV.
  • Para la primera hilera correspondiente a la hilera del factor de variación αi, (Tabla 5): En el CV rσ2ij,), de los suscritos ij, ignoro i (porque estamos en la hilera del factor αi, quedando j. Como j es fijo, el CV rσ2ij, desaparece.
  • En la misma hilera correspondiente al factor αi, El CV rbσ2i cuyo suscrito es i, por coincidir exactamente con el del factor αi, el CV rbσ2i permanece, sea fijo o aleatorio. A esta regla se le considera como una regla alternativa.
  • En la segunda hilera correspondiente al factor βj, (tabla 1): En el CV rσ2ijde los suscritos ij, ignoro j, (porque estamos en la hilera de βj), quedando i. Como i es fijo el CV rσ2ijdesaparece.
  • En la misma hilera correspondiente al factor βj,: El CV raσ2jcuyo suscrito j, por coincidir con el del factor βj, se queda, sea fijo o aleatorio. A esta regla se le considera como una regla alternativa.
  • En la tercera hilera correspondiente a la interacción (αβ)ij: cuyo CV rσ2ij, por coincidir exactamente ambos suscritos ij, el CV rσ2ijse queda, sea fijo o aleatorio. A esta regla se le considera como una regla alternativa. Consecuentemente la Tabla 6 y 7, quedan de la siguiente manera:
  • i = 1, 2, 3... a, niveles del factor αi Fijo.
  • j = 1, 2, 3... b, niveles del factor βj. Fijo.
  • k =1, 2, 3... r, repeticiones de cada combinación de tratamientos (caso balanceado)
  • i, j, k: Son los subíndices simbólicos.
  • a, b, r: Son los subíndices reales.
En la primera columna de la Tabla 5, se ubican todos los CV que deben estar cuando todos los términos son aleatorios, de acuerdo a las reglas establecidas. Ahí se manipulan las reglas para definir ECM en la Tabla 7 (caso b).
Importante: Es común usar como subíndices, la letra que indica el nombre del factor: σ2A, σ2B, σ2AB, en lugar de σ2i, σ2j, σ2ij. Siendo consistentes, recomendable usar subíndices simbólicos porque el modelo se explica con mayor claridad en función de dichos subíndices, razón más que suficiente. Además, porque en función de ellos se hacen muchas otras cosas:
  • Se define la columna grados de libertad (GL), en la tabla del AdeV.
  • Se definen en la columna suma de cuadrados, las expresiones que sirven para calcular dicha suma de cuadrados, para cada factor de variación.
  • Se definen los CV en la columna ECM.
  • Se define tamaño de muestra.
Es importante hacer notar que las pruebas para factores con modelos todos de efectos fijos, se hacen en forma tradicional: Relación de cuadrados medios. Además, las interacciones (significativas), son más importantes que los efectos principales, situación relevante en modelos factoriales.
Ilustración del caso c: αi fijo, βj, aleatorio ⇒ Modelo Aleatorio Mixto.
De la Tabla 4, modelo 1, y aplicando reglas ya explicadas, se deriva la Tabla 9. La presencia o ausencia de los CV (si se quedan o no) se explica enseguida:
  • En todas las hileras de las ECM, se escribe σ2ε,como primer CV.
  • En la primera hilera de la tabla 1: En el CV rσ2ij, en la hilera del factor αi, de los suscritos ij, ignoro i, (porque se está en la hilera de αi), quedando j. Como j es aleatorio, el CV rσ2ij, queda (no desaparece).
  • En la misma hilera del factor αi,: El CV rbσ2i, cuyo suscrito es i, por coincidir con el del factor αi, el CV rbσ2i, queda, sea fijo o aleatorio.
  • Segunda hilera del factor βj: En el CV rσ2ijde los suscritos ij. ignoro j, por estar en la hilera de βj, quedando i. Como i de αi, es fijo el CV desaparece.
  • En la misma hilera del factor βj: El CV raσ2i, cuyo suscrito es j, por coincidir con el del factor βj, se queda, sea fijo o aleatorio.
  • Tercera hilera para la interacción (αβ)ij: El CVσ2ij, cuyos suscritos son ij, por coincidir ambos, el CVσ2ij, se queda (sea fijo o aleatorio).
  • i = 1, 2, 3...a niveles del factor αi , Fijo.
  • J = 1,.2, 3...b niveles del factor βj, Aleatorio
  • J = 1,.2, 3...r repeticiones (caso balanceado)
  • i, j. k, son los subíndices simbólicos.
  • a, b, r, son los subíndices reales
La primera columna corresponde a Tabla 4, que es donde se manipulan las reglas para definir la última columna, correspondiente a Tabla 9; con práctica, esto ya no es necesario hacerlo. Se trabaja directamente con los términos del modelo.
Pruebas de significancia: Nótese en Tabla 9: Las pruebas de significancia para el factores βj e Interacción (αβ)ij, se hacen en forma tradicional así:
Fc.=(CM)β/(CM)εyFc.=(CM)αβ/(CM)ε
Más no así la prueba de significancia para el factor de variación αi, que tendrá que determinarse con la siguiente relación de ECM, donde (ECM)αβ se toma como el término de error.
H0:σ2i=0VSH1:σ2i0
Fc=(ECM)α(ECM)αβ=σ2ε+rbσ2i+rσ2ijσ2ε+rσ2ij=rbσ2i
Ilustración del caso d: αi aleatorio βj fijo: Modelo mixto Aleatorio.
Caso contrario al anterior. ¿Cómo quedan las ECM, en cada una de las hileras? Siguiendo el mismo razonamiento de la Tabla , generándose las Tablas 10 y 11:
  • i = 1, 2, 3... a, niveles del factor αi . Aleatorio
  • j = 1, 2, 3... b, niveles del factor βj Fijo
  • k =1, 2, 3... r, repeticiones (Caso balanceado)
  • i, j, k: Subíndices simbólicos.
  • a, b, r: Subíndices reales.
Pruebas de significancia para los factores αi e int. (αβ)ij, con relación al CV σ2ε en forma tradicional, así: Fc=(CM)β/(CM)ε y Fc=(CM)αβ/(CM)ε
Más no así para el factor de variación βj , que tendrá que hacerse con la siguiente relación de ECM, dónde (ECM)αβ se toma como el término de error:
H0:σ2j=0VSH1:σ2j0
Fc=(ECM)β(ECM)αβ=σ2ε+raσ2j+rσ2ijσ2ε+rσ2ij=raσ2i
Modelos más complicados. Cálculo de las ECM
Se muestra un primer ejemplo: suponer el siguiente modelo trifactorial (α, β, γ, todos aleatorios con 4, 2 y 5 niveles). Estructura: factorial alojada en un BaA con 3 bloques, caso balanceado (ver Tabla 13, modelo 5).
  • i = 1, 2…a = 4 niveles del factor αi: aleatorio
  • j = 1, 2…b = 2 niveles del factor βj: aleatorio
  • k = 1, 2....c = 5 niveles del factor γk: aleatorio
  • l = 1, 2....r = 3 repeticiones ρ1: aleatorio
  • i, j, k, l: subíndices simbólicos.
  • a, b, c, r: subíndices reales.
Como todos los factores principales son aleatorios, las interacciones también lo son. Pero, se recuerda que los factores de variación pueden ser fijos o aleatorios. Observar que la anotación correspondiente se ubica en las siguientes partes:
  • Arriba y abajo de cada término del modelo correspondiente.
  • En la parte en que se definen los niveles simbólicos y reales.
  • En la columna FV, en la tabla del AdeV.
Con esta práctica, el investigador en formación recuerda o tiene presente constantemente, qué factores son fijos y qué factores son aleatorios, lo que facilita enormemente, el manejo de los subíndices para determinar qué CV, quedan o no quedan en la columna ECM, para saber qué hipótesis rechazar y qué hipótesis no rechazar.
Tanto en el modelo y desde luego en la tabla del AdeV, aparece el término bloques (porque en el modelo por construcción se incluye el término bloques). Cuando por las características de la investigación no se exige el uso de bloques, ello quiere decir que el investigador está usando casi con seguridad un diseño CaA.
En el presente ejemplo, como todos los factores son aleatorios, todos ellos quedan, no desaparecen. Las pruebas de significancia para los FV que pueden hacerse o no, se determinan con una adecuada relación de ECM.
Prueba de significancia para el factor de variación αi:
H0:σ2i=0VSH1:σ2i0
Fc=(ECM)α+(ECM)αβγ(ECM)αβ+(ECM)αγ=σ2ε+rbcσ2i+rcσ2ij+  rbσ2ik+rσ2ijk+σ2ε+  rσ2ijkσ2ε+rcσ2ij+rσ2ijk+σ2ε+rbσ2ik+rσ2ijk=rbσ2ε
Fc=(ECM)α+(ECM)αβγ(ECM)αβ+(ECM)αγ=σ2ε+rbcσ2i+rcσ2ij+  rbσ2ik+rσ2ijk+σ2ε+  rσ2ijkσ2ε+rcσ2ij+rbσ2ik+σ2ijk+σ2ε+rσ2ijk=rbσ2ε
Fc=(ECM)α+(ECM)αβγ(ECM)αβ+(ECM)αγ=σ2ε+30cσ2i+15σ2ij+  6σ2ik+3σ2ijk+σ2ε+  3σ2ijkσ2ε+15σ2ij+6σ2ik+σ2ijk+σ2ε+3σ2ijk=30σ2i
Con lo anterior, se hizo (didácticamente), lo siguiente:
  • En la primera prueba de significancia, se colocaron simbólicamente, en numerador y denominador los coeficientes de los CV.
  • En la segunda, se reacomodan los CV, de tal manera que se correspondan: cada uno de los CV del numerador con cada uno de los CV del denominador, quedando solo o aislado, el término a probar: 30 σ i 2 = 30 σ i 2
  • En la tercera se han substituido los coeficientes por sus valores reales, quedando solo o aislado el término a probar: 30 σ i 2 La simplificación es precisamente, 30 σ i 2 . El valor Fc, se obtiene con el producto de 30 por el valor de la varianza σ i 2 .
Por otra parte: F ~ F 3 + 12 , 3 + 12 y α = F 15 , 15 , 0.5 = 2.41
Finalmente se compara el valor F de tablas (2.41), con el valor de Fc ( 30 σ i 2 ) .
Prueba de significancia para el factor de variación γk :
H 0 : σ γ 2 = 0 VS H 1 : σ γ 2 0
F c = E C M γ + E C M α β γ E C M α γ + E C M β γ = σ ε 2 + r b σ ε 2 + r b σ i k 2 +     r b σ j k 2 + r σ i j k 2 + σ ε 2 +     r σ i j k 2 σ ε 2 + r b σ i k 2 + r σ i j k 2 + σ ε 2 + r a σ j k 2 + r σ i j k 2 = 24 σ k 2
Como en el caso anterior: F c . ~ F t a b l a s ( 4 + 12 , 12 + 4 , α = F 16 , 16 , 0.05 = 2.33
Finalmente se compara el valor F de tablas (2.33), con el valor Fc
Segundo ejemplo: Suponer (como en el ejemplo 1, el siguiente modelo trifactorial: αi, βj, γk con 4, 2 y 5 niveles respectivamente, en un diseño BaA, con 3 bloques; pero ahora, con un factor fijo αi y dos aleatorios βj y γk.
  • i= 1, 2…a = 4 niveles del factor αi: (fijo)
  • j = 1, 2…b = 2 niveles del factor βj: (aleatorio)
  • k = 1, 2....c = 5 niveles del factor γk: (aleatorio)
  • l = 1, 2….r = 3 repeticiones. ρi: (aleatorio)
  • i, j, k, l: subíndices simbólicos.
  • a, b, c, r: subíndices reales
La prueba de hipótesis para el CV σ i 2 , factor de variación αi se expresa así:
H 0 : σ i 2 = 0 VS H 1 : σ i 2 0
F c = ( E C M ) α + ( E C M ) α β γ ( E C M ) α β + ( E C M ) α γ = 30 σ i 2
Semejante al caso anterior, puede comprobarlo.
Prueba de hipótesis para el factor γk, se expresa así:
F c = ( E C M ) γ ( E C M ) β γ = σ ε + r a b σ k 2 + r a σ j k 2 2 σ ε 2 + r a σ j k 2 = r a b σ k 2
F c = ( E C M ) γ ( E C M ) β γ = σ ε + 24 σ k 2 + 12 σ j k 2 2 σ ε 2 + 12 σ j k 2 = 24 σ k 2
σ k 2 ~ F 4 , 4 , 0.05 = 6.39
La prueba aproximada se ejecuta comparando Fc, con el valor f de tablas (6.39)
Tercer ejemplo: Con un modelo tetrafactorial mixto (aleatorio). Tres factores cruzados: αi, βj, δl y un cuarto:γk: jerárquico (anidado en αi, βj), con 3 bloques. De los cuatro factores vamos a suponer fijos (F): αi, δl y aleatorios (A): βj y γk.
  • i = 1, 2… a ⇒ αi: Fijo y cruzado con βj y δl
  • j = 1, 2… b ⇒ βj: Aleatorio y cruzado con αi y δl
  • k = 1, 2.... c ⇒ γk(ij): Aleatorio y anidado en αi, βj
  • l = 1, 2 …d ⇒ δl: Fijo y cruzado con αi, βj , γk(ij)
  • m = 1, 2... r ⇒ ρm : Repeticiones
  • i, j, k, l, m: subíndices simbólicos.
  • a, b, c, r: subíndices reales
En el modelo 7 y tabla del AdeV debía haberse incluido un EdeR, después del término bloques. No se hizo con el fin de prestarle mayor atención a la construcción de los Valores Esperados (VE), en la columna ECM. El lector interesado lo puede hacer como un ejercicio para verificar que la prueba de hipótesis sobre bloques no es posible hacerla, además de que no es de interés científico.
En el modelo (7), algunas interacciones no fueron incluidas y desde luego en la tabla del AdeV, por ejemplo: (αγ)k(ij) , porque γ es un factor anidado en αi al igual que el término ⑥: γk(ij) y además, porque las combinaciones de suscritos de estos términos, ya existen en dicho término. Por lo mismo, no se incluyen las interacciones: (βγ)jk , (αβγ)k(ij) , (αγδ)k(ij)l, (βγδ)k(ij)l, (αβγ)k(ij)l, lo que se ve más claro en la gráfica. Líneas adelante se explica el procedimiento para determinar qué CV se quedan (de acuerdo a la regla 4), en particular para los términos anidados.
Hasta el momento se ha hecho referencia a factores fijos, aleatorios y mixtos y a los diseños y modelos completos balanceados. En el modelo (7), Tabla 17 y en general en muchos modelos que se presentan en la vida real de acuerdo al fenómeno que se está estudiando, para estimar CV, se presentan otros dos casos muy interesantes:
  • Caso 1: Factores anidados (llamados también jerárquicos)
  • Caso 2: Factores cruzados.
Factores anidados: Como por ejemplo γk(ij). Quiere decir que los niveles k, están anidados dentro de i, j. Cada uno de los niveles de k, se combina con un solo nivel de i y con un solo nivel de j. En los Modelos anidados balanceados, todos los niveles del factor anidado se corresponden con los niveles del factor en que se encuentra anidado.
Los factores tipo anidado se expresan mediante un paréntesis. Los subíndices que están fuera del paréntesis son los que están anidados en los subíndices que están dentro del paréntesis. Por ejemplo:
  • En el modelo del diseño completamente al azar, el error aleatorio εj(i) , está anidado en el factor tratamientos.
  • En un modelo con dos factores de estudio sin interacción, el error aleatorio está anidado en ambos téminos.
  • En el modelo con dos factores de estudio o de variación, uno de los cuales (cualquiera), está anidado en el otro se escribe así: βj(i) y el error aleatorio está anidado en ambos: εk(ij)
Y así sucesivamente. Sin embargo, en la práctica, los errores se escriben usualmente así; εij, εijk, con lo cual no se está indicando que los errores están anidados. Con los factores anidados no hay interacción.
Por otro lado, los factores cruzados, ocurre en combinación con cada nivel de otro factor, esto es, cuando cada nivel de un factor se prueba en cada nivel de otro factor. Tiene la característica de cruzamiento de un factor con niveles de otro factor; a diferencia de los anidados, los niveles de todos los factores se cruzan entre sí. Recordemos que los factores son variables independientes.
Todo investigador debe tener presente que los Factores cruzados son aquellos en que cada uno de los suscritos de un factor, se combina con cada uno de los suscritos del otro factor (todos con todos). En los modelos cruzados, el número de repeticiones debe ser igual para cada una de las combinaciones de niveles (los tratamientos).
Discusión
Los modelos estadísticos son un conjunto de procedimientos que permiten aprender de los datos cuantitativos, de manera fiable y concluir acerca de ellos de manera razonable o dudosa. Es una relación matemática entre variables aleatorias y no aleatorias.
Además, es importante identificar que en los modelos completos todas las unidades de investigación (unidades experimentales), (investigaciones vía experimento), se conserva el mismo número hasta el final de la investigación. Y, que los modelos balanceados son aquellos en que todos los tratamientos o combinación de tratamientos se repiten el mismo número de veces.
Se hace énfasis, en que, sí por circunstancias fortuitas, el modelo en cuestión no fuese completo y balanceado, se está ante un modelo incompleto desbalanceado. Para evitar esta situación, el investigador tiene que extremar sus cuidados en la planeación y manejo o conducción del proyecto de investigación.
Los modelos incompletos y desbalanceados se presentan con frecuencia en los estudios o proyectos observacionales. Modelos de este tipo pueden ocurrir consecuentemente en ciencias sociales como en sociología, psicología, antropología, economía, y también en medicina, principalmente en estudios o proyectos de investigación retrospectivos.
Los modelos observacionales no tienen sustento experimental y se pueden manejar con modelos de regresión. Al diseño estadístico experimental le corresponde un modelo lineal que contiene efectos y un error aleatorio anidado dentro del resto de los efectos.
Más que un artículo de investigación es un texto didáctico para la mejora del uso y aplicación de la ECM, que poco se escribe al respecto. Como bien lo dice Restrepo (2007), “Al efectuar un análisis de varianza se debe tener presente el tipo de factor o factores involucrados en el diseño de clasificación experimental, a fin de poder generar la ECM adecuada, ý así llegar a conclusiones coherentes en el análisis de la información” (p. 201).
A manera de conclusión
Algunas recomendaciones y reglas para obtener la ECM, con relación a la regla 4, que determina los CV, que se quedan y los que no se quedan en la hilera correspondiente, con relación a los factores anidados, se hace énfasis que es importante partir del modelo, manipulando los suscritos o subíndices simbólicos y reales correspondientes. Así mismo, es conveniente enumerar los términos del modelo. Para cada Fuente de Variación, seleccionar los CV que contengan cuando menos un suscrito igual a dicho factor; determinar manipulando suscritos, los coeficientes de cada CV seleccionado, uno de los cuales siempre es r, excepto para σ ε 2 y determinar los suscritos que quedan y los que desaparecen ¿cómo? De dos o más suscritos se ignora el suscrito(s) igual(es) al del factor en cuestión. De los suscritos que quedan si son fijos el CV desaparece. Si son aleatorios el CV, se queda, no desaparece. Además, por la regla alternativa, el CV, cuyos suscritos coincidan exactamente con los del FV, se queda en la hilera (sea fijo o aleatorio).
Si algún factor está anidado en uno o más factores (Ejemplo 4), se procede a suponer en tabla 17 del AdeV, modelo 7, que se está en el Factor de Variación γk(ij), y que estamos analizando el término 11 del modelo: (γδ)k(ij)l, cuyo CV, es σ k i j l 2 para ver si se queda o no se queda. Se procede ignorando los suscritos ij (dentro del paréntesis) se considera como σ k l 2 por ser γk un factor anidado se dice lo siguiente: como estamos en la hilera k, de los suscritos kl, ignoro k y nos queda 1. Como 1 es fijo el CV 11 desaparece de la hilera considerada.
También es importante suponer en la tabla del AdeV, que estamos en el FV: (γδ)k(ij)l y que estamos analizando el término 11 del modelo (γδ)k(ij)l, para ver si su CV, σ k i j l 2 , se queda o no se queda. Se considera nuevamente, como σ k l 2 ; es decir, se ignoran los suscritos i, j (dentro del paréntesis), y decimos lo siguiente: como estamos en la hilera l (ele), de los suscritos kl, ignoro 1 y nos queda k. Como k es aleatorio el CV 11: σ k i j l 2 se queda no desaparece. Además, por regla alternativa, por coincidir los suscritos, considerados, el CV σ k i j l 2 , no desaparece (sea fijo o aleatorio).
Para el FV (αδ)il (el término ⑧ del modelo), cuyo CV es σ i l 2 , por coincidir suscritos (por la regla alternativa) dicho CV se queda. Los términos ⊃ y 11 se quedan porque j y k, son aleatorios. Los términos ⑨ y ⑩ del modelo: (βδ)jl y (αβδ)ijl respectivamente, es el mismo caso del FV (αδ)il (término ∩ del modelo) y así sucesivamente.
Futuras líneas de investigación
Utilizar diseño experimental elegido por el investigador conlleva a la obtención de la ECM, que además es necesaria en el análisis de la varianza. La ECM es un tema que puede ser aprendido en cursos de estadística o de investigación cuantitativa, pero hay que señalar que existe poca literatura al respecto, sobre todo en español; por tanto, escribir y socializar sobre el tema representa una oportunidad para potencializar y facilitar su uso en apoyo a los investigadores experimentales que buscan conocer la ECM para determinar pruebas estadísticas y lograr decidir si se acepta o se rechaza la hipótesis de interés
Resumen
Introducción
Conceptos metodológicos fundamentales
Reglas para calcular la ECM: Valores Esperados (VE), Componentes de Varianza (CV)
Modelos más complicados. Cálculo de las ECM
Discusión
A manera de conclusión
Futuras líneas de investigación
Regresar