Revista Mexicana de Ciencias Agrícolas volumen 11 número 4 16 de mayo - 29 de junio, 2020
DOI: https://doi.org/10.29312/remexca.v11i4.2249
Artículo
Código de SAS para analizar un dialelico completo y heterosis. Un ambiente
Delfina de Jesús Pérez López
Claudia Saavedra Guevara
Martín Rubí Arriaga
J. Ramón Pascual Franco Martínez
Francisco Gutiérrez Rodríguez
Andrés González Huerta§
Centro de Investigación y Estudios Avanzados en Fitomeroramiento-Facultad de Ciencias Agrícolas-Universidad Autónoma del Estado de México-Campus Universitario ‘El Cerrillo’. El Cerrillo Piedras Blancas, Toluca, Estado de México, México. AP. 435. Tel. 722 2965531, ext. 148. (djperezl@uaemex.mx; csg1003@yahoo.com; m-rubi65@yahoo.com.mx; jrfrancom@uaemex.mx; fgrfca@hotmail.com.
§Autor para correspondencia: agonzalezh@uaemex.mx.
Resumen
La elaboración de programas para sistema para análisis estadístico (SAS) y su validación con softwares disponibles gratuitamente es indispensable cuando no existen recursos económicos para adquirir la licencia de un paquete estadístico apropiado. En este estudio se presenta un código para SAS y se realiza su validación con el programa propuesto por Zhang y Kang (1997), modificado por Saavedra (2019). El código genera un análisis de varianza con partición de los efectos de tratamientos en progenitores (P), cruzas directas (CD), cruzas recíprocas (CR), P vs cruzas, y CD vs CR. Además de generar la comparación de medias de tratamientos con la prueba de Tukey, se estiman los efectos genéticos para progenitores o para sus cruzas (Gi, Sij, Rij, Mi); así como, los de heterosis con la media de ambos padres o con el mejor de ellos. Debido a que ambos códigos sólo coinciden en el cálculo de los efectos genéticos previamente indicados, se sugiere su aplicación simultánea para realizar un análisis completo del método 1 de Griffing (1956a, b). El código que ha sido propuesto será de gran utilidad para fitomejoradores y genetistas y especialmente, para estudiantes en ciencias biológicas y agropecuarias de nivel licenciatura y de postgrado con poco entrenamiento en el lenguaje de programación en SAS.
Palabras clave: bloques completos al azar, método 1 de Griffing, modelo 1, prueba de Tukey.
Recibido: febrero de 2020
Aceptado: abril de 2020
Introducción
Las cruzas dialélicas fueron diseñadas antes de los 50’s, pero pronto se convirtieron en una poderosa herramienta para mejoradores de plantas y animales, quienes para reconocer el mérito de varios progenitores evaluaron sus progenies a través de los efectos y varianzas de aptitud combinatoria general (ACG) y específica (ACE) (Sprague y Tatum, 1942; Griffing, 1956a, b; González et al., 2007a, b). Con éstas se definen nuevos patrones heteróticos o una población segregante a partir de la cual es posible aislar nuevamente plantas sobresalientes, predecir la respuesta a la selección o el comportamiento de híbridos o sintéticos formados con nuevas líneas (Hallauer y Miranda, 1988; Christie y Shattuck, 1992; González et al., 2007a, b).
El análisis de un experimento de cruzas dialélicas completo sin una computadora personal (PC) es laborioso y para ahorrar tiempo, existen varios paquetes estadísticos como SAS (https://www.sas.com/store/index.ep), Excel (Microsoft Office), Indostat (https://www.indostat.org), AGD-R (https://data.cimmyt.org/dataset.xhtml?persistentld= hdl:11529/ 10202), Agrobase II, generación (http://www.agronomix.com), PB Tools (https://pbtools.software.informer.com/2.0/), TNAUSTAT (https:// sites. google.com/site/tnaustat) y GSCA (https://bioseqdata.com/gsca/gsca.htm), entro otros; de éstos sólo Agrobase II generación e Indostat deben adquirirse con licencia con un costo superior a $1 000.0 USD, debido a que se requieren al menos tres módulos para operar adecuadamente ambos softwares. Aunque SAS es el mejor paquete estadístico, es común que los mejoradores y genetistas utilicen varios softwares para analizar los datos de experimentos diseñados en las ciencias agropecuarias y biológicas (Padilla et al., 2019a; Padilla et al., 2019b; Saavedra, 2019).
También, para muchos usuarios es difícil descargar software gratuito debido a que hay problema de incompatibilidad entre éste y sus PC’s, existen problemas técnicos durante las descargas, no se obtiene el permiso necesario, los investigadores no responden las solicitudes o el programa no funciona en versiones antiguas o recientes de Windows. En este contexto, sería deseable elaborar y validar algunos códigos para SAS, para versiones 6.01 o superiores (SAS, 1989), que permitan complementar el análisis genético-estadístico para experimentos de cruzas dialélicas completas.
Materiales y métodos
Dialélico completo
En la metodología 1, descrita en Saavedra (2019), el análisis de varianza (ANOVA) para un solo ambiente contiene repeticiones (R), tratamientos (Trat) y error experimental, su modelo estadístico corresponde a un diseño de bloques completos al azar. En el ANOVA, los efectos de Trat se dividen en progenitores (P), cruzas directas (CD), cruzas recíprocas (CR), P vs cruzas y CD vs CR, como lo sugirió González et al. (2007b), ambos contrastes estiman heterosis promedio y efectos maternos y no maternos.
El programa calcula las diferencias entre Trat con la prueba de Tukey (SAS, 1989). Este código puede modificarse fácilmente si el usuario requiere de otras pruebas de comparación de medias, o de diversos análisis de regresión y correlación, estos análisis pueden extenderse a series de experimentos en tiempo y espacio (Saavedra, 2019).
En la metodología 2, que corresponde al método 1 de Griffing (1956a, b), el ANOVA para un solo ensayo tiene repeticiones (R), aptitud combinatoria general (ACG), aptitud combinatoria específica (ACE), efectos maternos (EM) y efectos recíprocos (ER); en las series de experimentos podrían estimarse las interacciones de éstos con sólo dos ambientes.
También, en ambos casos, serían estimables los efectos de gi para cada progenitor o de sij para cada cruza, los efectos recíprocos y maternos (Zhang y Kang, 1997). Los componentes de varianza y heredabilidades, y la predicción de híbridos y sintéticos podrían estimarse con otros programas para SAS (Martínez, 1983; González et al., 2007a, b; Montesinos et al., 2007).
Definición de variables en el código
En la base de datos denominada ‘dialelo’ se define female, male, YH, YP, YM, X, Y, A, B, C, D y M, en las variables female y male se indican las combinaciones de cada hembra con cada macho, YH, YP y YM corresponden a las medias de cruza, hembra y macho, respectivamente. En X, Y se capturan los totales para cada pareja de CD y CR. Después de realizado la suma sobre repeticiones en A, B, C, D, cada línea de la CD o de CR aparece dos veces, como hembra y como macho (Yi. ó Y.i.; Yj.. o Y.j.)M es la gran media aritmética, GI, SIJ, RIJ y MI son los mismos efectos genéticos que se estiman con las fórmulas propuestas en el método 1 de Griffing (1956a, b).
Valores usados en el código
En este estudio fueron utilizados 96 datos, correspondientes a cuatro progenitores, sus seis cruzas directas y sus seis cruzas recíprocas, registrados en seis repeticiones (Saavedra, 2019).
Resultados y discusión
Desde su creación en 1972, los programas para SAS para el análisis de experimentos de cruzas dialélicas han sido implementados en computadoras personales PC’s por varios investigadores. Los grandes logros que se han obtenido para PC’s se atribuyen a Schaffer y Usanis (1989); Burow y Coors (1994); Magari y Kang (1994); Zhang y Kang (1997); Martínez (1983, 1991), entre otros. Más recientemente, Mastache y Martínez (1998a, 1998b, 1999a, 1999b), perfeccionaron sus algoritmos para obtener los mejores predictores lineales e insesgados (MPLI) empíricos de los efectos de los progenitores, para ayudar a los usuarios con poco entrenamiento en programación, cuando se utilizan diseños completamente al azar (DCA) y bloques completos al azar (BCA).
También, Mastache y Martínez (2003) obtuvieron un algoritmo integrado para su análisis simultáneo en experimentos balanceados para modelos de efectos fijos o aleatorios. Estos y otros programas podrían emplearse también para validar y para complementar las salidas que se obtuvieron con el código que se propone en el presente estudio (Zhang et al., 2005; Montesinos et al., 2007).
Zhang et al. (2005) modificaron los códigos de Zhang y Kang (1997); en Diallel-SAS05, ellos discutieron un programa más eficiente para el análisis genético-estadístico de los cuatro métodos de Griffing (1956a, b), incluyendo los correspondientes a los diseños II y III de Gardner y Eberhart (1966). Este programa es más amigable y es más fácil de modificar que Diallel-SAS, cuando los progenitores varían de 4 a 12, cuando no hay restricción en el número de ambientes, y cuando se estiman los efectos y varianzas de ACG y ACE para progenitores y cruzas, así como de sus interacciones con ambientes. Al igual que con otros paquetes estadísticos, hay problemas para implementarse en computadoras personales con versiones recientes de Windows (Padilla et al., 2019a, b).
Con el programa 1a se calcula el ANOVA y la comparación de medias (Tukey, p= 0.01). Como Trat y sus componentes se consideran como efectos fijos, las pruebas de F se prueban con el cuadrado medio del error experimental o residual del modelo. En su código, se utiliza Data, SET, IF-THEN, ANOVA y GLM para definir subconjuntos de datos. El usuario será cuidadoso en respetar el orden correcto en la base de datos: P, CD y CR, los signos y los coeficientes de los contrastes, al igual que para otros paquetes estadísticos, deben capturarse dentro del programa. Si hay alguna duda para diseñar este tipo de contrastes se sugiere consultar a Padilla et al. (2019a).
En la salida del SAS, si R= 6 y Trat= 4, el ANOVA corresponde a progenitores; su prueba de hipótesis no es correcta, debido a que se construyó como un subconjunto y su cuadrado medio del residual es una fracción de los 96 datos. En este contexto deberá consultarse una tabla de F en esta etapa no hay restricciones con relación al número de variables por analizar. El código puede modificarse para incluir las pruebas de la diferencia mínima significativa (DMS o LSD), Dunnett, o contrastes mutuamente ortogonales, entre otras. Con dos o más variables, es posible modificar el programa para realizar regresión y correlación, estimar estadísticos simples y aplicar metodologías multivariadas, entre otros.
El código correspondiente al programa 1a se presenta a continuación:
Data maiz; Input rep trat PVG;Cards;
1 01 758
1 02 761
6 15 768
6 16 758;
DATA PADRES;SET MAIZ;IF TRAT>4 THEN DELETE;*sólo progenitores;
DATA CD;SET MAIZ;IF TRAT<5 OR TRAT>10 THEN DELETE;*sólo cruzas directas;
DATA CR; SET MAIZ; IF TRAT<11 THEN DELETE; *sólo cruzas recíprocas;
PROC ANOVA DATA=MAIZ; CLASS REP TRAT; MODEL PVG=REP TRAT; MEANS TRAT/TUKEY LINES ALPHA=0.01;*Análisis con los 96 datos;
PROC GLM DATA=MAIZ; CLASS REP TRAT; MODEL PVG=REP TRAT;
CONTRAST "P VS CRUZAS"TRAT 12 12 12 12 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4;
CONTRAST "CD VS CR" TRAT 0 0 0 0 1 1 1 1 1 1 -1 -1 -1 -1 -1 -1;
PROC ANOVA DATA=PADRES; CLASS REP TRAT; MODEL PVG=REP TRAT;*Análisis de varianza para progenitores;
PROC ANOVA DATA=CD; CLASS REP TRAT; MODEL PVG=REP TRAT;*Análisis de varianza para cruzas directas;
PROC ANOVA DATA=CR; CLASS REP TRAT; MODEL PVG=REP TRAT;*Análisis de varianza para cruzas recíprocas; RUN;
Con el programa 1b se obtienen las estimaciones de los efectos genéticos (Gi, Sij, Rij, MI) y la heterosis (%). La definición de variables antes de CARDS debe indicarse correctamente utilizando los datos de los Cuadros 1 y 2 (Saavedra, 2019), pero deben corregirse los valores del denominador de las fórmulas de GI, SIJ, RIJ y MI, si cambia R, P o ambos. En esta etapa es fundamental recurrir a los artificios que Martínez (1983) utilizó estableciendo una forma lógica de relacionar las fórmulas de Griffing (1956a, b) con el lenguaje de programación en SAS (SAS Institute, 1989).
Cuadro 1. Peso volumétrico del grano (g L-1) de 16 cruzas formadas con cuatro líneas.
Cruza | R1 | R2 | R3 | R4 | R5 | R6 | Total | Media |
1) 1x1 | 758 | 734 | 750 | 790 | 758 | 765 | 4 555 | 759.1 |
2) 2x2 | 761 | 762 | 737 | 779 | 763 | 773 | 4 575 | 762.5 |
3) 3x3 | 802 | 812 | 802 | 838 | 793 | 782 | 4 829 | 804.8 |
4) 4x4 | 790 | 768 | 780 | 772 | 783 | 775 | 4 668 | 778 |
5) 1x2 | 814 | 792 | 770 | 781 | 775 | 755 | 4 687 | 781.1 |
6) 1x3 | 805 | 803 | 806 | 832 | 813 | 824 | 4 883 | 813.8 |
7) 1x4 | 791 | 775 | 777 | 791 | 795 | 780 | 4 709 | 784.8 |
8) 2x3 | 819 | 816 | 793 | 814 | 818 | 786 | 4 846 | 807.6 |
9) 2x4 | 779 | 778 | 758 | 798 | 783 | 755 | 4 651 | 775.1 |
10) 3x4 | 830 | 830 | 850 | 853 | 828 | 806 | 4 997 | 832.8 |
11) 2x1 | 774 | 772 | 786 | 750 | 794 | 769 | 4 645 | 774.16 |
12) 3x1 | 789 | 808 | 816 | 808 | 824 | 806 | 4 851 | 808.5 |
13) 4x1 | 787 | 815 | 815 | 825 | 802 | 796 | 4 840 | 806.6 |
14) 3x2 | 817 | 832 | 808 | 775 | 790 | 797 | 4 819 | 803.1 |
15) 4x2 | 756 | 768 | 756 | 754 | 753 | 768 | 4 555 | 759.1 |
16) 4x3 | 850 | 820 | 840 | 850 | 805 | 758 | 4 923 | 820.5 |
Total | 12 722 | 12 865 | 12 644 | 12 810 | 12 677 | 12 495 | 76 033 | 792.01 |
Cuadro 2. Valores usados para estimar efectos genéticos y heterosis.
| 1 | 2 | 3 | 4 | Total |
1 | 4 555 | 4 687 | 4 883 | 4 709 | 18 834 |
2 | 4 645 | 4 575 | 4 846 | 4 651 | 18 717 |
3 | 4 851 | 4 819 | 4 829 | 4 997 | 19 496 |
4 | 4 840 | 4 555 | 4 923 | 4 668 | 18 986 |
Total | 18 891 | 18 636 | 19 481 | 19 025 | 76 033 |
Nota: se sumó sobre repeticiones y los totales de hilera o de columna son la contribución de cada línea hembra o macho, respectivamente.
En algunas columnas como la gran media aritmética (M), que es una constante para los 12 apareamientos, hay valores duplicados, pero es fácil establecer a que progenitor o cruza corresponden porque los datos se muestran descendentes (González et al., 2007a, b; Saavedra, 2019).
El código correspondiente al programa 1b se presenta a continuación:
DATA HETERO; INPUT FEMALE MALE YH YP YM X Y A B C D M;
MP= YP+YM)/2;*para calcular la media de los padres (MP);
BP= MAX (YP,YM);*para elegir al mejor progenitor (BP);
DMP= YH-MP;*para estimar el numerador de la fórmula de heterosis con MP;
HMP= (DMP/MP)*100;*para estimar heterosis con la media de los padres, en %;
DBP= YH-BP;*calcula el numerador de la fórmula de heterosis con BP;
HBP= (DBP/BP)*100;*calcula heterosis con el mejor padre, en %;
GI= (A+B)/48 - M;*estima los efectos de gi;
SIJ= (X+Y)/12 -(A+B+C+D)/48 + M;*calcula los efectos de Sij;
RIJ= (X-Y)/12;*determina los efectos de rij;
MI= (A-B)/48;*calcula los efectos mi;
CARDS;
1 2 781.1 759.1 762.5 4687 4645 18834 18891 18717 18636 792.01
1 3 813.8 759.1 804.8 4883 4851 18834 18891 19496 19481 792.01
1 4 784.8 759.1 778.0 4709 4840 18834 18891 18986 19025 792.01
2 3 807.6 762.5 804.8 4846 4819 18717 18636 19496 19481 792.01
2 4 775.1 762.5 778.0 4651 4555 18717 18636 18986 19025 792.01
3 4 832.8 804.8 778.0 4997 4923 19496 19481 18986 19025 792.01
2 1 774.1 762.5 759.1 4645 4687 18636 18717 18891 18834 792.01
3 1 808.5 804.8 759.1 4851 4883 19481 19496 18891 18834 792.01
4 1 806.6 778.0 759.1 4840 4709 19025 18986 18891 18834 792.01
3 2 803.1 804.8 762.5 4819 4846 19481 19496 18636 18717 792.01
4 2 759.1 778.0 762.5 4555 4651 19025 18986 18636 18717 792.01
4 3 820.5 778.0 804.8 4923 4997 19025 18986 19481 19496 792.01
TITLE ‘Efectos de gi, sij, rij, mi y heterosis para el dialélico general’;
DATA DOS; SET HETERO; PROC PRINT; RUN;
Procedimiento ANOVA
Variable dependiente: PVG
Suma de Cuadrado de
Fuente DF cuadrados la media F-Valor Pr > F
Modelo 20 51191.16667 2559.55833 9.69 <.0001
Error 75 19801.82292 264.02431
Total correcto 95 70992.98958
R-cuadrado Coef Var Raiz MSE PVG Media
0.721074 2.051592 16.24882 792.0104
Cuadrado de
Fuente DF ANOVA SS la media F-Valor Pr > F
rep 5 3365.67708 673.13542 2.55 0.0347
trat 15 47825.48958 3188.36597 12.08 <.0001
Prueba del rango estudentizado de Tukey (HSD) para PVG
NOTA: este test controla el índice de error experimentwise de tipo I, pero normalmente tiene un índice de error de tipo II más elevado que REGWQ.
Alfa 0.01
Error de grados de libertad 75
Error de cuadrado medio 264.0243
Valor crítico del rango estudentizado 5.76634
Diferencia significativa mínima 38.251
Medias con la misma letra no son significativamente diferentes.
Tukey Agrupamiento Media N trat
A 832.833 6 10
B A 820.500 6 16
B A C 813.833 6 6
B D A C 808.500 6 12
B D A C 807.667 6 8
B D A C 806.667 6 13
B D A C 804.833 6 3
B D A C 803.167 6 14
B D E C 784.833 6 7
D E C 781.167 6 5
D E C 778.000 6 4
D E 775.167 6 9
D E 774.167 6 11
E 762.500 6 2
E 759.167 6 1
E 759.167 6 15
Cuadrado de
Contraste DF Contraste SS la media F-Valor Pr > F
P VS CRUZAS 1 8075.086806 8075.086806 30.58 <.0001
CD VS CR 1 272.222222 272.222222 1.03 0.3132
Variable dependiente: PVG
Cuadrado de
Fuente DF ANOVA SS la media F-Valor Pr > F
rep 5 1952.875000 390.575000 2.00 0.1376
trat 3 7805.458333 2601.819444 13.30 0.0002
Cuadrado de
Fuente DF ANOVA SS la media F-Valor Pr > F
rep 5 2869.25000 573.85000 3.57 0.0143
trat 5 15157.25000 3031.45000 18.84 <.0001
Cuadrado de
Fuente DF ANOVA SS la media F-Valor Pr > F
rep 5 1741.80556 348.36111 0.90 0.4948
trat 5 16515.47222 3303.09444 8.56 <.000
Efectos de Gi, Sij, Rij, Mi y heterosis para la metodología 1
Obs FEMALE MALE YH YP YM X Y A B C D M MP
1 1 2 781.1 759.1 762.5 4687 4645 18834 18891 18717 18636 792.01 760.80
2 1 3 813.8 759.1 804.8 4883 4851 18834 18891 19496 19481 792.01 781.95
3 1 4 784.8 759.1 778.0 4709 4840 18834 18891 18986 19025 792.01 768.55
4 2 3 807.6 762.5 804.8 4846 4819 18717 18636 19496 19481 792.01 783.65
5 2 4 775.1 762.5 778.0 4651 4555 18717 18636 18986 19025 792.01 770.25
6 3 4 832.8 804.8 778.0 4997 4923 19496 19481 18986 19025 792.01 791.40
7 2 1 774.1 762.5 759.1 4645 4687 18636 18717 18891 18834 792.01 760.80
8 3 1 808.5 804.8 759.1 4851 4883 19481 19496 18891 18834 792.01 781.95
9 4 1 806.6 778.0 759.1 4840 4709 19025 18986 18891 18834 792.01 768.55
10 3 2 803.1 804.8 762.5 4819 4846 19481 19496 18636 18717 792.01 783.65
11 4 2 759.1 778.0 762.5 4555 4651 19025 18986 18636 18717 792.01 770.25
12 4 3 820.5 778.0 804.8 4923 4997 19025 18986 19481 19496 792.01 791.40
Obs BP DMP HMP DBP HBP GI SIJ RIJ MI
1 762.5 20.30 2.66824 18.6 2.43934 -6.0725 5.5517 3.5000 -1.1875
2 804.8 31.85 4.07315 9.0 1.11829 -6.0725 5.2183 2.6667 -1.1875
3 778.0 16.25 2.11437 6.8 0.87404 -6.0725 9.9267 -10.9167 -1.1875
4 804.8 23.95 3.05621 2.8 0.34791 -13.8225 7.2183 2.2500 1.6875
5 778.0 4.85 0.62967 -2.9 -0.37275 -13.8225 -10.9067 8.0000 1.6875
6 804.8 41.40 5.23124 28.0 3.47913 20.0108 14.7600 6.1667 0.3125
7 762.5 13.30 1.74816 11.6 1.52131 -13.8225 5.5517 -3.5000 1.6875
8 804.8 26.55 3.39536 3.7 0.45974 20.0108 5.2183 -2.6667 0.3125
9 778.0 38.05 4.95088 28.6 3.67609 -0.1142 9.9267 10.9167 -0.8125
10 804.8 19.45 2.48198 -1.7 -0.21123 20.0108 7.2183 -2.2500 0.3125
11 778.0 -11.15 -1.44758 -18.9 -2.42931 -0.1142 -10.9067 -8.0000 -0.8125
12 804.8 29.10 3.67703 15.7 1.95080 -0.1142 14.7600 -6.1667 -0.8125
Los resultados anteriores fueron validados con el programa elaborado por Zhang y Kang (1997). En el ANOVA el código permite la partición de los efectos de cruzas posibles en ACG, ACE, ER y EM, cuando se implementaron SORT, BY, GLM, IF-THEN, DROP, ARRAY, ELSE, GLM, CONTRAST, ESTIMATE y algunas MACROS. En Martínez (1991) se presentan éstas y otras componentes para elaborar el código de referencia.
El programa de Zhang y Kang (1997) aplica a los cuatro métodos de Griffing (1956a, b), para el método 1 se analizan m variables en dos ambientes. En el presente estudio, éste se amoldó a un solo ambiente implementando la restricción IF ENV> 1 THEN DELETE o IF ENV< 2 THEN DELETE, capturado antes de DROP y después del INPUT. Su modificación es más laboriosa para los usuarios con poco entrenamiento en programación y, especialmente cuando el análisis se extiende a series de experimentos (Singh, 1973; Mastache y Martínez, 2003; Zhang et al., 2005).
TNAUSTAT software, además de calcular los efectos genéticos relacionados con progenitores y con sus cruzas en el método 1 de Griffing (1956a, b) también, simultáneamente, permite el cálculo del vigor híbrido con la media de ambos padres, con el mejor de ellos y adicionalmente, con base a heterosis comercial. Éste tiene la ventaja adicional de estimar los parámetros genéticos correspondientes al diseño de apareamiento I, propuesto por Hayman (1954). Sin embargo, este software fue diseñado para funcionar adecuadamente en una plataforma con MS Dos, por lo que anticipadamente debe descargarse del internet DOSBox software.
El programa de Zhang y Kang (1997), modificado por Saavedra (2019), se presenta a continuación:
OPTIONS PS=56 LS=78; TITLE 'METHOD 1'; DATA METHOD1;
INPUT I J REP HYBRID YIELD ENV; IF ENV>1 THEN DELETE;DROP N NI NJ P;
P=4;*NUMBER OF PARENTAL LINES? ; ARRAY GCA (N) G1 G2 G3;DO N=1 TO (P-1);
GCA= ((I=N)-(I=P)) + ((J=N)-(J=P)); END;ARRAY SCA(N) S11 S12 S13 S22 S23 S33;
N=0; DO NI=1 TO (P-1); DO NJ=NI TO (P-1); N+1; IF NI=NJ THEN DO;
SCA=(I=NI)*((J=NJ)-(J=P))+(I=P)*((J=P)-(J=NI));END;ELSE DO;
SCA=(I=NI)*(J=NJ)-(J=P)*((I=NI)+(I=NJ)-(I=P)*2)+(I=NJ)*(J=NI)
-(I=P)*((J=NI)+(J=NJ));END;END;END;
ARRAY REC (N) R12 R13 R14 R23 R24 R34; N=0; DO NI=1 TO (P-1);
DO NJ= (NI+1) TO P; N+1; REC= (I=NI)*(J=NJ)-(j=NI)*(I=NJ); END;END;
ARRAY MAT (N) M1 M2 M3; DO N=1 TO (P-1); MAT= (I=N) + (J=P)-(J=N)-(I=P);
END;ARRAY NONM (N) N12 N13 N23;N=0;DO NI=1 TO (P-2);DO NJ=(NI+1) TO (P-1);N+1;NONM=((I=NI)*(J=NJ))-(I=NJ)*(J=NI)-((I=NI)*(J=P))+(I=NJ)*(J=P)
+ ((I=P)*((J=NI)-(J=NJ))); END;END;CARDS;
1 1 1 01 758 1
1 2 1 02 814 1
1 3 1 03 805 1
4 3 6 15 758 1
4 4 6 16 775 1;
PROC SORT; BY REP ENV I J; PROC GLM; CLASS REP ENV HYBRID; MODEL YIELD=ENV REP(ENV) HYBRID HYBRID*ENV; TEST H=HYBRID E=HYBRID*ENV;LSMEANS HYBRID;
RUN; TITLE 'DIALLEL-SAS 1'; PROC GLM; CLASS REP ENV HYBRID;
MODEL YIELD= ENV REP (ENV) G1 G2 G3 S11 S12 S13 S22 S23 S33 R12 R13 R14 R23 R24 R34 G1*ENV G2*ENV G3*ENV S11*ENV S12*ENV S13*ENV S22*ENV S23*ENV S33*ENV R12*ENV R13*ENV R14*ENV R23*ENV R24*ENV R34*ENV;
%MACRO GCASCA; CONTRAST 'GCA' G1 1, G2 1, G3 1;
CONTRAST 'SCA' S11 1, S12 1, S13 1, S22 1, S23 1, S33 1;
ESTIMATE 'G1' G1 1; ESTIMATE 'G2' G2 1; ESTIMATE 'G3' G3 1;
Estimate 'G4' G1 -1 G2 -1 G3 -1;
ESTIMATE 'S11' S11 1; ESTIMATE 'S12' S12 1; ESTIMATE 'S13' S13 1;
ESTIMATE 'S22' S22 1; ESTIMATE 'S23' S23 1; ESTIMATE 'S33' S33 1;
Estimate 'S14' S11 -1 S12 -1 S13 -1;
Estimate 'S24' S12 -1 S22 -1 S23 -1;
Estimate 'S34' S13 -1 S23 -1 S33 -1;
Estimate 'S44' S11 1 S12 2 S13 2 S22 1 S23 2 S33 1;
%MEND GCASCA; %GCASCA %MACRO INTERACT;
CONTRAST 'GCA*ENV' G1*ENV 1 -1, G2*ENV 1 -1, G3*ENV 1 -1;
CONTRAST 'SCA*ENV' S11*ENV 1 -1, S12*ENV 1 -1, S13*ENV 1 -1, S22*ENV 1 -1, S23*ENV 1 -1, S33*ENV 1 -1; %MEND INTERACT; %INTERACT
CONTRAST 'REC' R12 1, R13 1, R14 1, R23 1, R24 1, R34 1;
ESTIMATE 'R12' R12 1; ESTIMATE 'R13' R13 1; ESTIMATE 'R14' R14 1;
ESTIMATE 'R23' R23 1; Estimate 'R24' R24 1; ESTIMATE 'R34' R34 1;
CONTRAST 'REC*ENV' R12*ENV 1 -1,R13*ENV 1 -1,R14*ENV 1 -1,R23*ENV 1 -1,R24*ENV 1 -1,R34*ENV 1 -1;
CONTRAST 'MAT SS' R12 1 R13 1 R14 1, R12 -1 R23 1 R24 1, R13 -1 R23 -1 R34 1, R14 -1 R24 -1 R34 -1; ESTIMATE 'MAT1' R12 1 R13 1 R14 1/DIVISOR=3;
ESTIMATE 'MAT2' R12 -1 R23 1 R24 1/DIVISOR=3;
ESTIMATE 'MAT3' R13 -1 R23 -1 R34 1/DIVISOR=3;
ESTIMATE 'MAT4' R14 -1 R24 -1 R34 -1/DIVISOR=3; RUN;
TITLE 'DIALLEL-SAS 2'; PROC GLM; CLASS REP ENV HYBRID;
MODEL YIELD= ENV REP (ENV) G1 G2 G3 S11 S12 S13 S22 S23 S33
M1 M2 M3 N12 N13 N23 G1*ENV G2*ENV G3*ENV
S11*ENV S12*ENV S13*ENV S22*ENV S23*ENV S33*ENV
M1*ENV M2*ENV M3*ENV N12*ENV N13*ENV N23*ENV;
%GCASCA %INTERACT
CONTRAST 'MAT SS' M1 1, M2 1, M3 1;
CONTRAST 'NONM SS' N12 1, N13 1, N23 1;
CONTRAST 'MAT*ENV' M1*ENV 1 -1, M2*ENV 1 -1, M3*ENV 1 -1;
CONTRAST 'NONM*ENV' N12*ENV 1 -1, N13*ENV 1 -1, N23*ENV 1- 1;
ESTIMATE 'M1' M1 1; ESTIMATE 'M2' M2 1; ESTIMATE 'M3' M3 1;
Estimate 'M4' M1 -1 M2 -1 M3 -1;
ESTIMATE 'N12' N12 1; ESTIMATE 'N13' N13 1; ESTIMATE 'N23' N23 1;
Estimate 'N14' N12 -1 N13 -1;
Estimate 'N24' N12 1 N23 -1;
Estimate 'N34' N13 1 N23 1; RUN;
Para validar el código que se presenta en el programa 1a, se muestran algunos resultados que genera el programa de Zhang y Kang (1997).
Procedimiento GLM
Variable dependiente: YIELD
Suma de Cuadrado de
Fuente DF cuadrados la media F-Valor Pr > F
Modelo 20 51191.16667 2559.55833 9.69 <.0001
Error 75 19801.82292 264.02431
Total correcto 95 70992.98958
R-cuadrado Coef Var Raiz MSE YIELD Media
0.721074 2.051592 16.24882 792.0104
Cuadrado de
Fuente DF Tipo I SS la media F-Valor Pr > F
ENV 0 0.00000 . . .
REP(ENV) 5 3365.67708 673.13542 2.55 0.0347
HYBRID 15 47825.48958 3188.36597 12.08 <.0001
ENV*HYBRID 0 0.00000 . . .
Cuadrado de
Contraste DF Contraste SS la media F-Valor Pr > F
GCA 3 30162.39583 10054.13194 38.08 <.0001
SCA 6 14715.59375 2452.59896 9.29 <.0001
REC 6 2947.50000 491.25000 1.86 0.0988
(MAT SS) (3) (240.75000) 80.25000 0.30 0.8224
(NONM SS) (3) (2706.75000) 902.25000 3.42 0.0216
Error
Parámetro Estimación estándar Valor t Pr > |t|
G1 -6.0729167 2.03110309 -2.99 0.0038
G2 -13.8229167 2.03110309 -6.81 <.0001
G3 20.0104167 2.03110309 9.85 <.0001
G4 -0.1145833 2.03110309 -0.06 0.9552
S12 5.5520833 3.70826994 1.50 0.1385
S13 5.2187500 3.70826994 1.41 0.1635
S23 7.2187500 3.70826994 1.95 0.0553
S14 9.9270833 3.70826994 2.68 0.0091
S24 -10.9062500 3.70826994 -2.94 0.0043
S34 14.7604167 3.70826994 3.98 0.0002
M1 -1.1875000 2.03110309 -0.58 0.5605
M2 1.6875000 2.03110309 0.83 0.4087
M3 0.3125000 2.03110309 0.15 0.8781
M4 -0.8125000 2.03110309 -0.40 0.6903
R12 3.5000000 4.69063167 0.75 0.4579
R13 2.6666667 4.69063167 0.57 0.5714
R14 -10.9166667 4.69063167 -2.33 0.0226
R23 2.2500000 4.69063167 0.48 0.6329
R24 8.0000000 4.69063167 1.71 0.0922
R34 6.1666667 4.69063167 1.31 0.1926
Conclusiones
Los programas ‘1a’ y ‘1b’ son fáciles de utilizar y modificar para realizar un análisis de varianza en un solo ambiente, con la subdivisión de los efectos de los tratamientos en progenitores (P), cruzas directas (CD), cruzas recíprocas (CR), P versus cruzas y CD versus CR. También es útil para realizar la comparación de medias de tratamientos (Tukey, p= 0.01) y para estimar heterosis con la media de los padres y con el mejor de éstos cuando se analiza una variable.
El programa de Zhang y Kang (1997) fue diseñado para analizar ‘m’ variables, pero es más difícil de manipular cuando progenitores y ambientes es diferente de 5 y 2, respectivamente. Por esta restricción, fue necesario modificar el código con P= 4. El código propuesto por Zhang y Kang estima aptitud combinatoria general y específica, efectos recíprocos y maternos, pero no incluye la prueba de Tukey ni la estimación de heterosis.
Los tres códigos para SAS corren en versiones de más de 10 años de su liberación comercial y en las académicas de prueba más recientes. El programa de Zhang y Kang (1997) permitió la validación confiable del código propuesto en el presente estudio cuando se estimaron los efectos genéticos, pero los tres códigos deben utilizarse para realizar un análisis dialélico más completo.
Literatura citada
Burow, M. D. and Coors, J. G. 1994. DIALLEL: a microcomputer program for the simulation and analysis of diallel crosses. Agron. J. 86(1):154-158.
Christie, B. R. and Shattuck, V. I. 1992. The diallel cross: design, analysis and use for plant breeders. Plant Breeding Reviews. 9(1):9-36.
Gardner, C. O. and Eberhart, S. A. 1966. Analysis and interpretation of the variety cross diallel and related populations. Biometrics. 22(3): 439-452.
González, H. A.; Sahagún, C. J. y Pérez, L. D. J. 2007a. Estudio de ocho líneas de maíz en un experimento dialélico incompleto. Ciencias Agrícolas Informa. 16(1):3-9.
González, H. A.; Pérez, L. D.; Sahagún, C. J.; Norman, M. T. H.; Balbuena, M. A. and Gutiérrez, R. F. 2007b. Análisis de una cruza dialélica completa de líneas endogámicas de maíz. Ciencias Agrícolas Informa. 16(1):10-17.
Griffing, B. 1956a. A generalized treatment of the use of diallel crosses in quantitative inheritance. Heredity. 10(1):31-50.
Griffing, B. 1956b. Concept of general and specific combining ability in relation to diallel crossing systems. Austr. J. Biol. Sci. 9(4):463-491.
Hallauer, A. R.; Miranda, F. O. J. B.1988. Quantitative Genetics in Maize Breeding. Iowa State University Press, Ames. Second Edition. USA. 468 p.
Hayman, B. I. 1954. The theory and analysis of the diallel crosses. Genetics. 39(1):798-809.
Magari, R. and Kang, M. S. 1994. Interactive BASIC program for Griffing’s diallel analysis. Journal of Heredity. 85(4):336.
Martínez, G. A. 1983. Diseño y análisis de los experimentos de cruzas dialélicas. Centro de Estadística y Cálculo. Colegio de Postgraduados. Chapingo, Estado de México. 252 p.
Martínez, G. A. 1991. Análisis de los experimentos dialélicos a través del procedimiento IML del SAS. Comunicaciones en Estadística y Cómputo. 10(2):1-36.
Mastache, L. A. A.; Martínez, G. A.; Castillo, M. A. y González, C. F. V. 1998a. Los mejores predictores lineales e insesgados (MPLI) en experimentos dialélicos parciales sin efectos maternos. Revista Fitotecnia Mexicana. 21(1):49-60.
Mastache, L. A. A.; Martínez, G. A. y Castillo, M. A. 1998b. Los mejores predictores lineales e insesgados (MPLI) en experimentos dialélicos parciales con efectos maternos. Revista Fitotecnia Mexicana. 21(2):171-184.
Mastache, L. A. A.; Martínez, G. A. y Castillo, M. A. 1999a. Los mejores predictores lineales e insesgados (MPLI) en los diseños dos y cuatro de Griffing. Agrociencia. 33(1):81-90.
Mastache, L. A. A.; Martínez, G. A. y Castillo, M. A. 1999b. Los mejores predictores lineales e insesgados (MPLI) en los diseños uno y tres de Griffing. Agrociencia. 33(3):349-359.
Mastache, L. A. A. y Martínez, G. A. 2003. Un algoritmo para el análisis, estimación y predicción en experimentos dialélicos balanceados. Revista Fitotecnia Mexicana. 26(3):191-200.
Montesinos, L. O. A.; Mastache, L. A. A.; Luna, E. I. y Hidalgo, C. J. V. 2007. Mejor predictor lineal e insesgado combinado para aptitud combinatoria general y análisis combinado de los diseños uno y tres de Griffing. Técnica Pecuaria en México. 45(2):131-146.
Padilla, L. A.; González, H. A.; Pérez, L. D. J.; Rubí, A. M.; Gutiérrez, R. F. y Franco, M. J. R. P. 2019a. InfoStat, InfoGen y SAS para contrastes mutuamente ortogonales en experimentos en bloques completos al azar en parcelas subdivididas. Rev. Mex. Cienc. Agríc. 10(6):1417-1431.
Padilla, L. A.; González, H. A.; Pérez, L. D. J.; Rubí, A. M.; Gutiérrez, R. F.; Ramírez, D. J. F.; Franco, M. J. R. P. y Serrato, C. R. 2019b. Programas para SAS e InfoStat para analizar una serie de experimentos en parcelas subdivididas. En: temas selectos en la innovación de las ciencias agropecuarias. Alfaomega Grupo Editor SA. de CV. Primera edición (Salgado y otros, eds.). México, DF. 724 p. ISBN: 9786075384115.
SAS Institute, Inc. 1989. SAS/IML software: Usage and reference. Version 6. First edition. Cary, N. C.
Saavedra, G. C. 2019. Estimación de parámetros genéticos en maíz con dos metodologías usando datos de una cruza dialélica completa. I. Un ambiente. Tesis de Maestro en Fitomejoramiento. Facultad de Ciencias Agrícolas, Universidad Autónoma del Estado de México. Toluca, Estado de México. 96 p.
Singh, D. 1973. Diallel analysis for combining ability over several environments-II. Indian Journal of Genetics and Plant Breeding. 33(1):469-481.
Schaffer, H. E. y Usanis, R. A. 1989. General least squares analysis of diallel experiments: A computer program. Genetics Dep. Res. Rep. 1. North Carolina State University, Raleigh. 61 p.
Sprague, G. F. and Tatum, L. A. 1942. General vs specific combining ability in single crosses of corn. J. Amer. Soc. Agron. 34(1):923-932.
Zhang, Y. and Kang, M. S. 1997. DIALLEL-SAS: A SAS program for Griffing’s Diallel Analyses. Agronomy Journal. 89(2):176-182.
Zhang, Y.; Kang, M. S. and Lamkey, K. R. 2005. DIALLEL-SAS05: A comprehensive program for Griffing’s and Gardner-Eberhart analysis. Agron. J. 97(4):1097-1106.