elocation-id: e3861
Las series de experimentos en tiempo, en espacio o combinando ambos ambientes en arreglo de parcelas divididas o subdivididas en cuadro latino no han sido utilizadas frecuentemente. En esta investigación se construye un modelo estadístico y las fórmulas para obtener grados de libertad y suma de cuadrados usando formas cuadráticas o matriciales y mínimos cuadrados, cuando las componentes de tiempo y espacio están confundidas en ambientes, como un prerrequisito para extender su análisis con submuestreo balanceado. Con relación a la parcela principal se parte de la suposición de ausencia de interacción entre hileras, columnas y niveles del factor A y de hileras y columnas con los ambientes, esta restricción también aplica entre hileras y columnas o ambos, con los factores A, B y su interacción, pero también se indica cómo llegar a los mismos resultados introduciendo el principio de cruzamiento y anidamiento, particularmente si será aplicado algún paquete estadístico, adicionalmente se hace énfasis en las fórmulas para calcular directamente grados de libertad y suma de cuadrados para los errores a y b, así como para los correspondientes a parcelas principales y subparcelas.
años y localidades confundidos en ambientes, modelo estadístico, matrices.
El análisis y la discusión de las series de experimentos en las ciencias agropecuarias y forestales, entre otras disciplinas, han sido abordadas frecuentemente desde la construcción de sus modelos estadístico-genético, la obtención de un análisis de varianza y la aplicación de una metodología para la comparación de medias entre niveles de dos o más factores (Sahagún, 1993, 1994, 2007).
El procesamiento estadístico de datos provenientes de arreglos en parcelas divididas (PD) o subdivididas (PSD) se puede realizar de manera fácil y confiable utilizando InfoStat y InfoGen (Balzarini et al., 2008; Di Rienzo et al., 2008; Balzarini y Di Rienzo, 2016) y SAS, así como el correspondiente a las series de experimentos a través de años, localidades o ambos (González et al., 2019; Pérez et al., 2022; González et al., 2024b). Los diseños experimentales que más se han utilizado son completamente al azar (DCA) y bloques completos al azar (DBCA) (Martínez, 1988; Gomez y Gomez, 1984; Little y Hills, 2008; Montgomery, 2009), pero Ledolter (2010) analizó y discutió los arreglos en PD para ensayos factoriales y para factoriales fraccionados, con énfasis en los diseños experimentales DCA y DBCA.
La serie de experimentos para un DCL, en PD o PSD podría ser fundamental para ayudar a detectar diferencias importantes entre años, entre localidades o entre ambos cuando se elijan diversos paquetes tecnológicos o diferentes manejos agronómicos, orientados a la generación, validación, aplicación o transferencia de tecnología a terrenos de agricultores, con el propósito de incrementar la productividad en los cultivos y para mejorar la calidad de la materia prima que se deriva de ellos y que será utilizada en la agroindustria mexicana.
El mejoramiento genético, la producción de semillas o la hibridación intra e interespecífica también podría documentarse mejor con base en estas metodologías estadísticas (González et al., 2019; Pérez et al., 2022; González et al., 2024a, 2024b). Los terrenos de agricultores que son muy heterogéneos también presentan este tipo de variabilidad aleatoria que es indeseable para establecer un experimento adecuado, dicha heterogeneidad ambiental podría controlarse más eficientemente utilizado un PD o un PSD en DCL (González et al., 2019; Pérez et al., 2022; Rodríguez et al., 2025).
También se han encontrado pocos reportes sobre modelos estadísticos, análisis de varianza y comparación de medias para el DCL en experimentos factoriales (Tirado y Tirado, 2017; González et al., 2019), particularmente cuando se utiliza un arreglo en PD o PSD con submuestreo balanceado y con la aplicación de algún paquete estadístico como Proc Anova: Latin Square Split Plot :: SAS/STAT(R) 9.22 User's Guide. (Gomez y Gomez, 1984; Martínez, 1994; Montgomery, 2009).
En el contexto previo, en esta investigación se construyó un modelo estadístico y se generaron las fórmulas para calcular GL y SC con dos metodologías, como un prerrequisito para su validación con algún software, como InfoStat, InfoGen o SAS, entre otros.
En esta investigación se utilizará la misma terminología que emplearon Mendenhall (1987); Sahagún (2007a); Montgomery (2009); Pérez et al. (2022); González et al. (2023, 2024a, 2024b). Los cinco factores de clasificación que ahora serán considerados son ambientes, hileras, columnas, A, B, que en lo sucesivo serán identificados como E, H, C, A y B, respectivamente; los subíndices y sus niveles también corresponderán a: m= 1, 2, 3 … , e; i= 1, 2, 3…,h; j= 1, 2, 3…,c; k=1, 2, 3…,t; l= 1, 2, 3…,b.
El modelo estadístico y las fórmulas para calcular grados de libertad y suma de cuadrados en un DCL en PD para un solo ensayo fue propuesto por Rodríguez et al. (2025) y en la situación más práctica, su serie de experimentos se puede construir suponiendo ausencia de interacción entre hileras (H) y columnas (C), entre cada uno de éstas o de ambas con los factores E, A, B, y de H y C con las interacciones que se pueden generar con estos tres últimos.
Con cinco factores de clasificación E, H, C, A y B, habrá un total de 32 interacciones posibles, que se pueden obtener aplicando combinaciones de cinco factores tomados de cero, uno, dos, tres, cuatro y cinco veces a la vez
pero de éstas no son viables las dos primeras debido a que es imposible formar combinaciones entre ninguno de ellos o entre las correspondientes a un solo factor. Por lo tanto, sólo son posibles:
Interacciones, pero este número es más fácil calcularlo cómo: 32 - 1 - 6 = 26 (interacciones de primero, segundo, tercero y cuarto orden).
Con este antecedente es más fácil construir el modelo de referencia, particularmente si es aplicada correctamente la guía publicada por Sahagún (1998), quien, antes de introducir el principio de anidamiento, sugiere construir un modelo preliminar suponiendo que dichos factores solo tienen relaciones de cruzamiento. Así, el modelo propuesto es: Yijklm = µ + Em + Hi + Cj + Ak + (EA)mk + (EHA)i(mk) + Bl + (EB)ml + (AB)kl + (EAB)mkl + εijklm.
Donde: Y es la variable que será analizada; µ es la media aritmética general; Em, Hi, Cj, Ak, Bl, son los efectos principales causados por los factores identificados como ambientes, hileras, columnas, A, B, respectivamente, (EHA)i(mk) es el error a, (AB)kl, (EA)mk, (EB)ml, (EAB)mkl son interacciones de primer y segundo orden originadas por la combinación de dos o tres de los factores previamente descritos, εijklm es el error b o residual del modelo.
Para conformar una serie de experimentos en PD en DCL, con años y localidades confundidos en ambientes, para cada ensayo los niveles del factor A son distribuidos en las parcelas principales con base en un diseño en cuadro latino, como lo sugirieron Smith (1951); Martínez (1994); Tirado y Tirado (2017) y los niveles del Factor B se aleatorizarán al azar de manera independiente en cada subparcela.
Para obtener un plan de aleatorización para cada experimento en este tipo de diseño experimental se puede utilizar el paquete estadístico Statistical Tools for Agricultural Research (Star), del instituto internacional de investigación en arroz (IRRI), con sede en los Baños, Filipinas (Digital Tools |International Rice Research Institute (irri.org).
También se puede emplear SAS (Statistical Analysis System; SAS OnDemand for Academics | SAS) u otros paquetes estadísticos que dispongan de este tipo de herramientas para generarlos. Para realizar cálculos manuales con formas cuadráticas o matriciales podría utilizarse la calculadora científica disponible gratuitamente en https://matrixcalc.org/es/. Para analizar datos podrían utilizarse los paquetes estadísticos referenciados previamente u otros como InfoGen y InfoStat (Balzarini et al., 2008; Di Rienzo et al., 2008; Balzarini y Di Rienzo, 2016).
En parcelas principales, el número de niveles para Hileras (H), columnas (C) y factor A es igual (h= c =t); la combinación ht o ct es equivalente a t2. Para un DBCA en PD, H o C, pero no ambos, podría considerarse como r, que sería el número de repeticiones por cada combinación AB elegido para el experimento. La serie de experimentos se genera agregando E, el número de ambientes por evaluar. Los resultados que a continuación se presentan son una extensión del caso propuesto por Rodríguez et al. (2025).
GL total= et2b -1; GL E= e - 1; GL H = h-1= t-1; GL C=c-1=t-1; GL A=t-1; GL ExA= (e-1)(t-1); GL error a= t [e(t-1)- 2] +2; GL parcelas principales (PP)= GL E+GL H+GL C+GL A+GL ExA+GL error a. Para verificación: GL PP= et2 -1; GL B=b-1; GL AxB= (t-1)(b-1); GL ExB= (e-1)(b-1); GL ExAxB= (e-1)(t-1)(b-1); GL Error b= et(t-1)(b-1); GL subparcelas (SUB)= GL total-GL E-GL H-GL C-GL A-GL ExA-GL error a-GL B-GL AxB-GL ExB-GL ExAxB-GL error b. También: GL SUB= GL B+GL AxB+GL ExB+GL ExAxB+GL error b. Para verificación GL SUB= et2 (b-1); GL PP+GL SUB= (et2 -1) + et2(b-1)= et2 (b -1)= GL total.
En el denominador de las siguientes fórmulas, h o c es nulo; E, H, C, A, B estarán relacionados con los subíndices m, i, j, k, l, respectivamente. Las formas cuadráticas o matriciales se escribirán como lo hicieron González et al. (2023); González et al. (2024a, 2024b) en éstas, antes de su aplicación, se utilizarán sumas o totales realizadas sobre el o los subíndices que no se muestran en su numerador, la matriz J es cuadrada y sólo está formada por unos y tiene et2b hileras y columnas.
SC TRAT1= SC E + SC A + SC ExA. Así: SC ExA = SC TRAT1 - SC E - SC A. Adicionalmente:
SC parcelas principales (PP)=
SC error a=
También:
Para calcular SC AxB, deberá obtenerse primero SC TRAT2 como: SC TRAT2= SC A+SC B+SC AxB; entonces: SC AxB= SC TRAT2-SC A-SC B. Donde:
Como SC TRAT3= SC E+SC B+SC ExB; SC ExB= SC TRAT3-SC E-SC B; pero,
SC TRAT4 = SC E+SC A+SC B+SC ExA+SC ExB+SC AxB+SC ExAxB. Así: SC ExAxB= SC TRAT4-SC E-SC A-SC B-SC ExA-SC ExB-SC AxB.
Para cálculo directo puede utilizarse la siguiente formula:
Finalmente: SC error b= SC total-SC E-SC H-SC C-SC A-SC ExA-SC error a-SC B-SC AxB-SC ExB-SC ExAxB.
También es válida:
SC subparcelas (SUB)= SC total-SC parcelas principales (PP);
Cuando se diseña y analiza un experimento o una serie de ensayos a través de años (A) localidades (L) o en combinaciones de éstos (AxL), están implícitas al menos tres etapas fundamentales: a) la construcción o elección de un modelo estadístico; b) la generación de un análisis de varianza; y c) la aplicación de una prueba de comparación de medias aritméticas de dos niveles diferentes, en uno, dos o más factores bajo consideración (Sahagún, 1993, 1998, 2007).
Con relación a esta estrategia también es recomendable la aplicación de uno o más paquetes estadísticos para ahorrar tiempo durante el análisis estadístico de los datos. En el contexto previo, la elección del software adecuado es también de gran relevancia para generar las salidas requeridas de manera fácil y confiable (González et al., 2023; González et al., 2024a, 2024b).
Las series de experimentos que han sido más frecuentemente abordadas en la investigación agronómica son las que corresponden a los diseños completamente al azar (DCA) y bloques completos al azar (DBCA), para los arreglos combinatorio, en parcelas divididas (PD), parcelas subdivididas (PSD) o bloques o franjas divididas (FD) (Sahagún, 1993, 1994, 2007; Gomez y Gomez, 1984; Ledolter, 2010; Tirado y Tirado, 2017), pero el DCL en PD, PSD o FD no está bien documentado.
En la literatura publicada se ha encontrado poca evidencia con relación al modelo estadístico de referencia, así como para un análisis de varianza (Anava) y una comparación de medias (Ledolter, 2010; Tirado y Tirado, 2017; https://biometrics.ilri.org/Publication/Full%20Text/chapter20.pdf), especialmente para submuestreo (Gomez y Gomez, 1984; Martínez, 1988) Proc Anova: Latin Square Split Plot :: SAS/STAT(R) 9.22 User's Guide.
Investigaciones como las de Martínez (1994) sólo presentó una tabla con las fuentes de variación (FV) y los grados de libertad (GL) que podrían calcularse sin submuestreo. Gomez y Gomez (1984) mostraron dos tablas con las FV y los GL para un DBCA y para un arreglo en PD con submuestreo balanceado, pero para un solo ensayo, adicionalmente, ellos describieron los procedimientos para obtener un Anava en ambas situaciones, con énfasis en la estimación de los errores muestral (EM) y experimental (EE), que en el presente estudio conforman al error conjunto (EC).
En el sistema para análisis estadístico Statistical Analysis System (SAS) sólo se presentaron los datos proporcionados por Smith (1951; Proc Anova: Latin Square Split Plot :: SAS/STAT(R) 9.22 User’s Guide) pero sin submuestreo, así como un código para obtener un Anava con tres tipos de errores; con relación a la presente investigación y para un solo ensayo, CxHxA es igual al error a y la suma de HxB y del residual del modelo originan al error b. Tirado y Tirado (2017) presentaron el modelo estadístico para un PD en DCL sin submuestreo, así como un ejemplo para generar su Anava; ellos también generalizaron este tipo de análisis para un arreglo en parcelas subdivididas en DCL sin submuestreo.
En estudios previos, Sahagún (1993; 1994; 2007) abordó varias situaciones en las cuales analizó las series de ensayos para los diseños experimentales DCA y DBCA y de este último en arreglo en PD, este autor analizó sus modelos, las esperanzas de los cuadrados medios para realizar las pruebas de hipótesis pertinentes en un análisis de varianza, así como su eficiencia, con y sin restricción en dichos modelos. Adicionalmente, consideró dos casos: a) cuando hay cruzamiento entre años, localidades y genotipos; y b) cuando los años están anidados dentro de las localidades, por lo que los genotipos pueden o no estar anidados en la interacción AxL.
Los hallazgos de Rodríguez et al. (2025) consideraron el modelo estadístico y las fórmulas para calcular grados de libertad y suma de cuadrados aplicando dos metodologías al caso específico de un ensayo conducido en un diseño experimental en cuadro latino en arreglo de parcelas divididas, como un prerrequisito para extender su análisis a serie de experimentos con la aplicación de software, cuando años y localidades están confundidos dentro de ambientes contrastantes.
Por lo que la presente investigación es una extensión de su trabajo, como un prerrequisito para analizar datos provenientes de este tipo de experimentos cuando aplica el submuestreo balanceado dentro de las unidades experimentales que conforman a cada ensayo. Sin embargo, aún quedará pendiente el análisis y discusión de este tipo de ensayos cuando, como Sahagún (1993; 1994; 2007) lo sugirió, los años y las localidades sean consideradas como factores cruzados o cuando los años sean anidados dentro de localidades, particularmente para el caso de un PD, PSD y FD en DCL.
Una situación complementaria a lo considerado previamente fue abordada por González et al. (2024b), quienes fraccionaron cada una de las repeticiones en arreglo de ‘g’ grupos de bloques completos balanceados para un DBCA, confundiendo años y localidades en ambientes diferentes, ellos extendieron el caso presentado por Gomez y Gomez (1984), para un solo ensayo, para el análisis de 45 cultivares de arroz (Oriza sativa L.) clasificados en tres grupos, con 15 cultivares dentro de cada uno de éstos.
Ellos también consideraron la posibilidad de agrupar el material genético con base en dos criterios: a) que los grupos fueran tan heterogéneos como sea posible; y b) que dentro de cada grupo existieran diferencias tan pequeñas en la madurez fisiológica en la fracción de material que está siendo considerada, si no hubiera diferencias significativas entre grupos de cultivares el análisis estadístico de los datos puede realizarse simplemente como un DBCA o como una serie de ensayos en este tipo de diseño experimental.
En la serie de experimentos que está siendo discutida en el presente estudio, para un arreglo en PD en DCL sin submuestreo, se asume que el modelo estadístico fue construido considerando que años y localidades están confundidos en ambientes contrastantes (E) y éstos últimos no presentan interacción con Hileras (H), columnas (C) o con ambos, pero E está cruzado con los factores A y B. Adicionalmente, H, C o ambos tampoco presentan interacción con A, B o AB. Finalmente, cuando se aplique InfoStat el Error a estará representado por las interacciones ExHxA o ExCxA, debido a la restricción impuesta en las parcelas principales (h= c =t), relacionada con el doble bloqueo que se aplica a las unidades experimentales cuando se aleaterizan los niveles del factor A.
Para una serie de experimentos en DBCA, Sahagún (1993) consideró tres situaciones con relación a las repeticiones: a) éstas anidadas dentro de localidades; b) éstas anidadas dentro de años y localidades; y c) éstas anidadas dentro de un Factor C, correspondiente a las combinaciones entre A y L. En los tres casos se recomendó considerar a repeticiones como factor aleatorio, al igual que A, L o C. Con relación a genotipos, con propósitos de selección, él sugirió considerarlos como factor de efectos fijos, pero si el propósito es estimar componentes de varianza, éste deberá definirse como factor aleatorio.
En el contexto previo, aplicando la guía propuesta por Sahagún (1998) se construirá el mismo modelo si se establecen las siguientes condiciones: a) hileras (H) anidado dentro de columnas (C) o viceversa; H, C o ambos anidados dentro de ambientes (E); b) E, A y B o sus interacciones, están cruzados; c) H, C o ambos están anidados dentro de B o AB; d) E es factor aleatorio, pero A y B pueden ser factores fijos y e) el residual del modelo está anidado en todas las componentes del modelo. Además de lo anterior, deberá considerarse si hay o no restricción en las componentes de dicho modelo (Sahagún, 1993).
Para propósitos complementarios se sugiere considerar las publicaciones de Sahagún (1994 y 2007a, 2007b), quien propone probar las hipótesis estadísticas correctas relacionadas con las componentes de los modelos estadísticos que el analizó y discutió, utilizando los cuadrados medios apropiados. Esta última situación también es un punto crítico en el tema que está siendo considerado en la presente investigación o en otras que ahora están siendo utilizadas para generar, validar, aplicar o transferir tecnología, debido a que cuando se emplea un paquete estadístico podrían generarse análisis de varianza con valores de F incorrectos, así como para alguna prueba de comparación de medias para efectos principales o interacciones que podrían no ser válidas también, como lo sugirieron Sahagún (1993; 1994 a, b; 1998; 2007), Gomez y Gomez (1984); Montgomery (2009).
Las metodologías presentadas en esta investigación permitirán homologar fórmulas para calcular grados de libertad y suma de cuadrados de manera fácil y confiable, como lo han mostrado para otros estudios González et al. (2023); González et al. (2024a, 2024b), con su simbología y la descrita en Mendenhall (1987); Sahagún (2007 a); Montgomery (2009), se generarán de manera fácil y confiable las formas cuadráticas o matriciales que alimentarán más frecuentemente a las calculadoras de matrices o a SAS, Agrobase, Spss, StatGraphics, Star, PB Tools.
En el modelo estadístico que se propone se asumió que años y localidades están confundidos en ambientes contrastantes (E) y que éstos últimos no presentan interacción con hileras, columnas o con ambos, pero E está cruzado con los factores A y B. Adicionalmente, se consideró que H, C o ambos tampoco presentan interacción con A, B o AB. Finalmente, el error a estará representado por las interacciones ExHxA o ExCxA. Para verificar grados de libertad y suma de cuadrados en ambos modelos pueden aplicarse las fórmulas alternativas que fueron construidas para los errores a y b, así como las correspondientes a parcelas principales y subparcelas, para cada una o para ambas metodologías.
Balzarini, M. G. y Di-Rienzo, J. A. 2016. InfoGen Versión 2016. FCA. Universidad Nacional de Córdoba, Argentina. http://www.info-Gen.com.ar.
Di Rienzo, J. A.; Casanoves, F.; Balzarini, M. G.; González, L.; Tablada, M. y Robledo, C. W. 2008. InfoStat, versión 2008. Grupo InfoStat, FCA. Universidad Nacional de Córdoba, Argentina.336 p.https://www.infostat.com.ar.
González, H. A.; Pérez, L. D. J.; Balbuena, M. A.; Franco, M. J. R.; Gutiérrez, R. F. y Rodríguez, G. J. A. 2023. Submuestreo balanceado en experimentos monofactoriales usando InfoStat y InfoGen: validación con SAS. Revista Mexicana de Ciencias Agrícolas. 14(2):235-249. Doi: https://doi.org/10.29312/remexca. v14i2.3418.
González, H. A.; Pérez, L. D. J.; Hernández, A. J.; Franco, M. J. R. P.; Rubí, A. M. y Balbuena, M. A. 2024a. Tratamientos anidados dentro de un arreglo en grupos de bloques completos balanceados. Revista Mexicana de Ciencias Agrícolas. 15(2):e3634. Doi: https://doi.org/10.29312/remexca.v15i2.3634.
Ledolter, J. 2010. Split-plot design: discussion and examples. International Journal of Quality Engineering and Technology. 1(4):441-457. Doi:https://doi.org/10.1504/IJQET.2010.035588).
Pérez, L. D.; Jasso, B. G.; Saavedra, G. C.; Franco, M. J. R. P.; Ramírez, D. J. F.; González, H. A. 2022. Uso de artificios en Opstat para analizar series de experimentos en dialélico parcial. Revista Mexicana de Ciencias Agrícolas. 13(2):273-287. Doi: https://doi.org/10.29312/remexca.v13i2.3130.
Rodríguez, G. J. A.; Pérez, L. D. J.; Hernández, A. J.; Balbuena, M. A.; Franco, M. J. R. P. y González, H. A. 2025. Parcelas divididas en cuadro latino: modelos estadísticos y fórmulas, sin y con submuestreo. Revista Mexicana de Ciencias. 16(2):1-11. Doi: https://doi.org/10.29312/remexca.v16i2.3926.
Smith, W. G. 1951. Dissertation notes on Canadian sugar factories Ltd, Taber, Alberta, Canada 7 p. https://searcharchives.vancouver.ca/fire-insurance-plans-for-bc-sugar-canadian-sugar-factories-and-manitoba-sugar-co.