dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/cortes_basilio_gregorio.pdf · la...

74
DIVISION DE CIENCIAS FORESTALES ·e. ....... t: }IlpJot a..: iDn. d"" kt. N", 1.0. +-t""",l·"'-!- L1CEI\ICIATURA EN ESTADfsTICA IMPACTO DE LAS EVALUACIONES GENETICAS NACIONALES EN EL MEJORAMIENTO GENETICO DE BOVINOS JERSEY EN MEXICO TESIS COMO REQUISITO PARCIAL I PARA OBTENER EL TITULO DE: Licenciado en Estadistica PRESENTA: Gregorio Cortes Basilio " - . .::.. ..... --# Baja la supervision de: Rodalfo Ramirez Valverde, Ph.D. ,. ABRIL DE 2018 Chapingo, Estado de Mexico

Upload: others

Post on 16-Mar-2020

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

DIVISION DE CIENCIAS FORESTALES ·e........ ~"\ ,.lA t:}IlpJot a..: iDn. d"" kt.

't' i .:-_~lo N", 1.0. d~ 1 +-t""",l·"'-!­

L1CEI\ICIATURA EN ESTADfsTICA

IMPACTO DE LAS EVALUACIONES GENETICAS NACIONALES EN EL MEJORAMIENTO GENETICO DE BOVINOS JERSEY EN MEXICO

TESIS

COMO REQUISITO PARCIAL

I

PARA OBTENER EL TITULO DE:

Licenciado en Estadistica

PRESENTA:

Gregorio Cortes Basilio

~-: ~-" - .~

.::....... --#~

Baja la supervision de: Rodalfo Ramirez Valverde, Ph.D.

,.

ABRIL DE 2018

Chapingo, Estado de Mexico

Page 2: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

La tesis titulada "Impacto de las evaluaciones geneticas nacionales en el mejoramiento

oeneuco de bovinos Jersey en Mexico", fue realizada por Grego rio Cortes Basilio, bajo la

direcci6n del Dr. Rodolfo Rami rez Valverde . Fue revisada y aprobada por el siguiente

cornite revisor y jurado examinador, para obtener el tit ulo de Licenciado en Estadistica.

Lieeneiado en Estadistiea

DIRECTOR

Dr. Rodolfo Ramirez Valve rde

SECRETARIO

Dr. Anton io Villanu eva Morales

VOCAL

Lie. Margarito Soriano Montero

SUPLE NTE

Dr. Rafael Nunez Domingu ez

SUPLENTE

Dr. Agustin Ruiz Flores

Chapingo, Texcoco, Edo. de Mexico, abril de 2018 .

ii

Page 3: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

iii

DEDICATORIAS

“Cada palabra escrita en este texto será partida a la mitad, una parte será para mi viejo

y la otra para mi negrita hermosa, que con sus regaños merecidos y consejos ahora me

encuentro en una etapa importante de mi vida.”

Gregorio Cortes Basilio

Page 4: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

iv

AGRADECIMIENTOS

A mi Alma Mater, la Universidad Autónoma Chapingo por la oportunidad brindada de

pertenecer a su comunidad.

Al Ph. D. Rodolfo Ramírez Valverde, por su ayuda en la dirección de este proyecto,

también por ser un buen amigo y por sus valiosos consejos que me han permitido crecer

como persona.

A mi comité, por sus valiosos aportes en este proyecto, y por el tiempo dedicado.

Page 5: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

v

Contenido

Lista de Cuadros ................................................................................................................... vi

Lista de Figuras ................................................................................................................... vii

Lista de Apéndices .............................................................................................................. viii

RESUMEN ............................................................................................................................. 1

ABSTRACT ............................................................................................................................ 2

1. Introducción........................................................................................................................ 3

2. Objetivos ............................................................................................................................ 5

3. Revisión de literatura ......................................................................................................... 6

3.1. Generalidades del mejoramiento genético en animales .............................................. 6 3.2. Mejoramiento genético en bovinos lecheros ................................................................ 7 3.3. Conceptos elementales de genética ............................................................................. 8 3.4. Evaluaciones genéticas.................................................................................................. 9 3.4.1. Valor genético ............................................................................................................ 11 3.4.2. Interpretación de las HTP ......................................................................................... 14 3.4.3. Predicción del valor genético .................................................................................... 14 3.4.4. Grupos contemporáneos .......................................................................................... 15 3.4.5. Tendencias genéticas ............................................................................................... 16 3.5. Modelación en evaluaciones genéticas (genética cuantitativa)................................. 17 3.5.1. Modelos mixtos .......................................................................................................... 18 3.5.2. Ecuaciones normales de Henderson introduciendo A − 1 ...................................... 24

3.5.3. Propiedades del BLUP .............................................................................................. 25 3.6. Regresión lineal múltiple .............................................................................................. 26 3.6.1. Estimadores de los parámetros ................................................................................ 27 3.6.2. Análisis de varianza .................................................................................................. 28 3.6.3. Prueba F para la significancia del modelo de regresión ......................................... 29

3.6.4. Inferencias acerca de los parámetros de regresión ................................................ 30 3.6.5. Modelo de regresión lineal con variables continuas e indicadoras ........................ 31

4. Materiales y métodos ...................................................................................................... 41

4.1. Origen de la información .............................................................................................. 41 4.2. Análisis estadísticos para la predicción de valores genéticos ................................... 41 4.2.1. Tendencias genéticas ............................................................................................... 43 4.2.2. Comparación de HTP antes y después del inicio de las evaluaciones genéticas 44

5. Resultados y discusión.................................................................................................... 45

6. Conclusiones ................................................................................................................... 53

7. Literatura citada ............................................................................................................... 54

Page 6: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

vi

Lista de Cuadros

Cuadro 1. Ejemplos de estimaciones de heredabilidad para la característica producción

de leche por lactancia en bovinos lecheros. ............................................................... 10

Cuadro 2. Valores genéticos aditivos estimados para cada gameto. .............................. 13

Cuadro 3. Tabla de análisis de varianza para el modelo de regresión. .......................... 29

Cuadro 4. Efecto intervención en término de periodos. ................................................... 44

Cuadro 5. Estadística descriptiva para el comportamiento en la producción de leche por

vaca por lactancia ajustada a 305 d y equivalente maduro (PL), y para las habilidades

de predicción predichas (HTP) de bovinos Jersey en México. ................................. 45

Cuadro 6. Ejemplo de las HTP obtenidas para producción de leche de 10 animales del

pedigrí de la población Jersey en México................................................................... 50

Cuadro 7. Estadísticos descriptivos para las habilidades de predicción predichas (HTP,

kg) para producción de leche por vaca por lactancia ajustada a 305 d y equivalente

maduro de bovinos Jersey en México, en animales antes y después de las

evaluaciones genéticas (EG). ...................................................................................... 51

Page 7: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

vii

Lista de Figuras

Figura 1. Genotipo de un animal con sus respectivos valores aditivos de los alelos ..... 11

Figura 2. Gametos que puede producir el genotipo del animal ejemplificado. ............... 13

Figura 3. Tendencias genéticas en producción de leche a 305 días para vacas Holstein

y Jersey en Costa Rica (Fuente: Vargas y Gamboa, 2008). ..................................... 16

Figura 4. Distribución por año de nacimiento de la producción de leche (kg/lactancia) por

vaca por lactancia ajustada a 305 d y equivalente maduro (PL), de bovinos Jersey

en México...................................................................................................................... 46

Figura 5. Tendencia genética de las habilidades de transmisión predicha (HTP) para

producción de leche (kg/lactancia) por vaca por lactancia ajustada a 305 d y

equivalente maduro (PL).............................................................................................. 47

Figura 6. Habilidades de transmisión predichas (HTP) ajustadas en la regresión por

periodos. ....................................................................................................................... 49

Page 8: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

viii

Lista de Apéndices

Apéndice 1. Ilustración en un ejemplo hipotético del uso del modelo animal simple para

predecir valores genéticos de los animales y su programación en el paquete

estadístico SAS. ........................................................................................................... 59

Apéndice 2. Ejemplo de valores de HTP para PL de animales Jersey (únicamente se

presentan las HTP de 30 animales). ........................................................................... 63

Apéndice 3. Número de observaciones utilizadas para estimar las tendencias genéticas,

mediante análisis de regresión y la salida de su correspondiente análisis de varianza.

....................................................................................................................................... 64

Apéndice 4. Verificación de los supuestos para el ajuste del modelo para estimar las

tendencias genéticas. .................................................................................................. 65

Apéndice 5. Histograma de las HTP de los animales nacidos antes y después de las

evaluaciones genéticas, respectivamente. ................................................................. 66

Page 9: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

1

IMPACTO DE LAS EVALUACIONES GENÉTICAS NACIONALES EN EL

MEJORAMIENTO GENÉTICO DE BOVINOS JERSEY EN MÉXICO

Gregorio Cortes Basilio

RESUMEN

En México se realizan evaluaciones genéticas nacionales de bovinos Jersey desde 2004; sin embargo, se desconoce su posible impacto en el mejoramiento genético de la población. El propósito de este estudio fue evaluar el impacto de los resultados de las evaluaciones genéticas en la producción de leche de bovinos Jersey en México; mediante la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el área de genética cuantitativa en animales. La información analizada provino de las bases de datos de la Asociación Mexicana de Criadores de Ganado Jersey de Registro. La característica de análisis fue producción de leche por lactancia (PL). La información utilizada para realizar las predicciones de los valores genéticos de los animales consistió de un pedigrí de 22,480 animales (nacidos de 1944 a 2014), y 9,555 registros de PL provenientes de 5,505 vacas. Para predecir los valores genéticos se utilizó un modelo mixto (programa MTDFREML), que incluyó los efectos aleatorios genéticos aditivos directos y de ambiente permanente, y el efecto fijo de grupos contemporáneos. Se estimaron las tendencias genéticas, mediante la regresión de los valores genéticos de los animales a través del tiempo. Adicionalmente, se compararon los valores genéticos de animales nacidos antes y después del inicio de las evaluaciones genéticas. El promedio de los valores genéticos en los animales nacidos posterior al inicio de las evaluaciones genéticas (198 kg) fue mayor que el de los animales nacidos antes del inicio de las evaluaciones genéticas (-37 kg). Sin embargo, la pendiente estimada para PL en todo el periodo implicó un progreso genético positivo pequeño (10.2 kg por año; P>0.05), lo que representó un cambio genético anual de 0.14%. Cuando los análisis fueron realizados por periodos, los cambios genéticos fueron pequeños y negativos para, moderados y positivos, y pequeños y negativos para 1974-1993, 1994-2004, y 2005-2014 respectivamente. En general, los resultados sugieren poco impacto de las evaluaciones genéticas en el mejoramiento genético de los bovinos Jersey de México y posiblemente que los criadores no utilizan apropiadamente los resultados de las evaluaciones genéticas para la selección de animales reproductores de las próximas generaciones.

Palabras clave: habilidad de transmisión predicha, valor genético, tendencias genéticas.

Page 10: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

2

IMPACT OF NATIONAL GENETIC EVALUATIONS ON THE GENETIC

IMPROVEMENT OF JERSEY CATTLE IN MEXICO

Gregorio Cortes Basilio

ABSTRACT

National genetic evaluations of Jersey cattle have been performed in Mexico since 2004; however, their impact in the genetic improvement of the population is unknown. The purpose of this study was to evaluate the impact of the results of genetic evaluations on milk production of Jersey cattle in Mexico; by applying a practical, using statistical bases and their relationship with quantitative genetics in animals. Dataset analyzed came from the Asociación Mexicana de Criadores de Ganado Jersey de Registro. The trait analyzed was milk production by lactation (PL). Dataset used to make predict the genetic values (BV) of the animals had 22,480 animals (born from 1944 to 2014) in the pedigree, and 9,555 records of PL, from 5,505 cows. A mixed model was used to predict breeding values (MTDFREML program), that included the random genetic direct and permanent environment effects, and the fixed contemporary group effect. Genetic trends were estimated, using regression of breeding values over time. In addition, BVs of animals born before and after the start of genetic evaluations were compared. The average of BVs in the animals born after the start of the genetic evaluations (198 kg) was higher than that of the animals born before the start of the genetic evaluations (-37 kg). However, the estimated slope of the PL throughout the period implied a positive but small genetic progress (10.2 kg year-1; P>0.05), which represents a genetic change of 0.14% year-1.

When the analyzes were performed by periods, the genetic changes were small and negative, moderate and positive, and small and negative for 1974-1993, 1994-2004, and 2005-2014, respectively. In general, the results suggest little impact of genetic evaluations on the genetic improvement of Mexican Jersey cattle and possibly that breeders are not using the results of genetic evaluations for the selection of the animals to produce next generations.

Key words: predicted transmitted ability, breeding value, genetic trends.

Page 11: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

3

1. Introducción

La estructura del mejoramiento genético de la ganadería bovina lechera está conformada

por los productores de ganado de registro y los comerciales. Los criadores de ganado de

registro tienen como propósito comercializar y diseminar reproductores con mérito

genético conocido (animales, semen y embriones), por lo que son la punta de la pirámide

en la producción animal y su principal herramienta para mejoramiento genético es la

selección de reproductores (Gasque, 2008)

Si los criadores disponen de criterios de selección que maximicen la probabilidad de que

los machos y hembras seleccionadas como remplazos posean genes de mejor calidad

para la característica de interés, el mejoramiento genético del ganado Jersey se realizará

con mayor éxito. Uno de estos criterios es la obtención de los mejores predictores lineales

insesgados (BLUP) de los valores genéticos (VG) de los animales, los cuales toman en

cuenta la información de cada animal y de todos sus parientes, a través de la matriz de

relaciones genéticas aditivas entre ellos, y mediante el uso del modelo animal. Estos VG

se publican como habilidades de transmisión predicha (HTP). Con la utilización adecuada

de los resultados de las evaluaciones genéticas, los criadores de ganado Jersey tienen

la oportunidad de identificar los vientres y sementales de mejor calidad genética, para

una mejor definición de apareamientos; así como para ubicar a los animales más jóvenes

prospectos a futuros reproductores para una selección acertada de los remplazos (Núñez

et al., 2013). Las ventajas de aplicar metodologías modernas para realizar evaluaciones

genéticas de los animales, han sido verificadas en varios países. Como consecuencia del

uso de las evaluaciones genéticas, por ejemplo, Powell y Norman (2006) reportaron que

la media de mérito genético para producción de leche de bovinos Holstein en EE. UU.

aumentó 113 kg/año de 1988 a 1998, y la tendencia fenotípica total fue 221 kg/año.

En México, el Gobierno Federal estableció en 1998 el Programa Nacional de Recursos

Genéticos Pecuarios, en 1998, con el propósito de evaluar y utilizar racionalmente las

diversas razas disponibles en los sistemas de producción. Asimismo, en 1999 se

constituyó el Consejo Nacional de los Recursos Genéticos Pecuarios, A. C.

(CONARGEN), que agrupa a productores de pie de cría, técnicos especialistas de

instituciones de enseñanza e investigación, y al Gobierno Federal como área normativa.

Page 12: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

4

Una de las líneas principales de acción fue iniciar la realización y publicación de

evaluaciones genéticas periódicas de los animales de cada raza, utilizando sus

respectivas bases de datos genealógicos y productivos (CONARGEN, 2000). En 1999 se

realizó la primera evaluación genética nacional en México (Holstein) y posteriormente se

implementaron evaluaciones genéticas periódicas para Jersey, Suizo Americano, Angus,

Simmental y Brangus, entre otras. Aunque se tienen avances en investigaciones

relacionadas con dichas evaluaciones genéticas (Ramírez-Valverde et al., 2010; Larios-

Sarabia et al., 2011; Ramírez-Valverde et al., 2016) y su aplicación con un posible

impacto a nivel nacional, se requiere verificar los resultados de su posible aplicación en

la práctica.

En México se realizan evaluaciones genéticas nacionales de bovinos Jersey desde 2004,

utilizando información del comportamiento de los animales para hatos que varían en

términos de clima, manejo y niveles de producción (Ramírez-Valverde et al., 2014). A

partir de esa fecha se han venido realizando evaluaciones genéticas nacionales en

ganado Jersey (Núñez et al., 2004; 2005; 2008; 2010; 2013; 2016; 2017); sin embargo,

se desconoce su posible impacto en el mejoramiento genético de la población.

Page 13: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

5

2. Objetivos

El propósito de este estudio fue evaluar el impacto de los resultados de las evaluaciones

genéticas en la producción de leche de bovinos Jersey en México; mediante la aplicación

de un ejemplo práctico, utilizando bases de estadística y su relación con el área de

genética cuantitativa en animales.

Page 14: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

6

3. Revisión de literatura

3.1. Generalidades del mejoramiento genético en animales

El mejoramiento genético consiste en aplicar principios biológicos, económicos y

matemáticos, para encontrar estrategias óptimas para aprovechar la variación genética

existente en una especie de animales en particular para maximizar su mérito. El

mejoramiento genético involucra procesos de evaluación genética y difusión del material

genético seleccionado; pudiendo usar tecnologías reproductivas artificiales como la

inseminación artificial, ovulación múltiple y transferencia de embriones (Montaldo et al.,

1998)

La mejora genética de las poblaciones persigue como principal objetivo obtener avances

en características económicamente importantes, es decir, obtener beneficios económicos

que se expresan mediante aumento de la rentabilidad de cada animal durante su vida

productiva. Cada programa de mejoramiento genético tiene un objetivo específico

diferente, esto es debido a que la mejora genética depende de la orientación que les den

los ganaderos a sus programas. El mejoramiento genético se logra generación tras

generación a través del aumento de la frecuencia de genes favorables para una

característica dada. Este aumento de la frecuencia génica es posible valiéndose del uso

continuo de reproductores superiores, cuyo germoplasma, aplicado al animal comercial,

es clave para que éste mejore a través de las generaciones (Gasque, 2008).

Según Montaldo et al. (1998) y Gasque (2008), las herramientas primordiales del

mejoramiento genético son: a) la selección de reproductores (determinar cuáles

individuos van a dejar descendencia), y b) el diseño de los apareamientos (determinar

cómo los individuos seleccionados se aparean).

En el mejoramiento genético animal debe considerarse la selección, es decir, tomar en

cuenta los individuos élite, que son los animales que tienen buena capacidad productiva

(para el carácter seleccionado) y contar con muy buen antecedente genético

representado en su pedigrí. Además, es importante establecer los caracteres sobre los

Page 15: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

7

cuales selecciona, esto debido a que existen fenotipos correlacionados con algunos

caracteres genéticos (Mathur et al., 2002)

Un programa de mejoramiento genético pretende que las nuevas generaciones

produzcan de manera más eficiente que la actual. Este programa genera una serie de

información que es la herramienta de los ganaderos y de los responsables de los centros

de inseminación artificial para seleccionar animales que sean rentables económicamente.

3.2. Mejoramiento genético en bovinos lecheros

Según Ochoa (1997), uno de los pioneros del mejoramiento animal fue el inglés Robert

Backwell, durante el periodo 1760-1795, en el cual inició la aplicación de la selección

artificial con base en la producción individual, pruebas de progenie y el uso de

consanguinidad. Como resultado, se formaron muchas nuevas razas de ganado,

estableciéndose el tipo ideal para cada una de ellas. En la producción de leche, se logró

un importante progreso genético, por el desarrollo de dos hechos. Primero la formación

en Dinamarca en 1885 de una nueva asociación para llevar acabo el control de

producción en hatos lecheros, estas asociaciones pronto se diseminaron en diferentes

países. El segundo fue el redescubrimiento del trabajo de Mendel en 1900, el cuál es el

fundamento de la genética. La mayor parte de las características de importancia

económica en el ganado lechero son cuantitativas, las cuales se caracterizan porque

están determinadas por muchos pares de genes, y además la expresión fenotípica de la

característica se ve afectada de manera importante por el ambiente; estos dos efectos se

combinan para causar que el fenotipo de estas características presente una variación

continua, en casos como la producción y la composición de la leche. Algunas de las

características comúnmente incluidas en los objetivos del mejoramiento genético para

producción de leche son: salud, fertilidad, facilidad del parto, peso corporal, velocidad de

ordeña, temperamento. Cuando se busca un cambio genético, lo importante no es qué

tanta ventaja ambiental ha tenido un animal, ya que esto no se transmite, lo que importa

es escoger animales con combinaciones genéticas que beneficien a su progenie.

De acuerdo con Powell y Norman (2006), algunos de los aspectos más relevantes de los

años recientes en la evolución de la modelación para realizar evaluaciones genéticas de

Page 16: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

8

animales son: el modelo animal (MA), que en 1989 remplazó al modelo de comparación

de contemporáneos modificado (MCC), este último es un modelo de semental. Canadá

adoptó el modelo animal en 1989, y en el informe de 1992 de la International Bull

Evaluation Service (INTERBULL, 2009), se considera a este modelo el método estándar

en el sistema nacional de evaluaciones. En 1984 se introdujo en Australia un modelo

animal conocido como Día de Prueba (Test Day), este modelo considera la variación

ambiental en cada una de las observaciones de prueba en lugar de los datos completos

de la lactancia. El muestreo de la producción de leche del día se ha realizado en los

Estados Unidos desde 1905 y ha contribuido a las evaluaciones genéticas desde 1936,

sin embargo, fue hasta 1993 cuando se implementó el análisis con un modelo estadístico

específico, posteriormente, se empezó a utilizar en Canadá, Bélgica, Estonia, Finlandia,

Alemania, Italia (Holstein), los países bajos, Suiza y Sudáfrica (Guernsey y Jersey). En

agosto de 1995, el modelo para evaluaciones de características múltiples entre países

(MACE), sistema desarrollado por L. R Schaeffer, fue implementado cuando las

correlaciones genéticas entre países eran menores que uno.

3.3. Conceptos elementales de genética

Para comprender mejor esta investigación por lectores no especializados, a continuación,

se presentan algunos conceptos elementales de genética (interpretaciones y notas de

cursos por el autor de esta tesis).

Valor Genético. También se le conoce como valor genético aditivo y representa el valor

sumado de los efectos de los genes que recibió el animal de ambos padres. Al cruzarse

un animal solo puede segregar la mitad de sus genes y, por tanto, la mitad de su valor

genético (aditivo), esa mitad es la que pasa a su descendencia.

Pedigrí. Genealogía de todos los animales usados en la población como reproductores o

con datos disponibles. El pedigrí se forma con las identificaciones del animal, y de sus

progenitores.

Selección. Es la reproducción diferencial entre individuos, y esta puede ser natural (opera

sin la intervención del hombre en toda la población) o artificial (su finalidad está

Page 17: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

9

determinada por el humano). La selección natural y artificial se rigen con los mismos

principios genéticos, sin embargo, la artificial es más rápida que la natural, motivo por el

cual la selección artificial es la clave para el mejoramiento genético. En general, la

selección es una fuerza lenta para cambiar las frecuencias génicas, pero es permanente

y acumulativa.

Aditividad. Se refiere a los efectos individuales de los genes, por tanto, los efectos en

conjunto de grupos de genes pueden sumarse. En la aditividad, el valor genético del

heterocigoto se encuentra en el punto medio entre los genotipos homocigotos.

Dominancia. Son los efectos debidos a la interacción entre alelos en un locus (interacción

intralocus). Cuando se encuentran dos alelos diferentes (por ejemplo, A y a), producen

una respuesta extra a la esperada con base en aditividad, dicha respuesta es específica

para cada par de alelos. Existen tres tipos de dominancia: completa, parcial y

sobredominancia.

Epistasis. Son los efectos debidos a la interacción entre genes no alélicos (interacción

interloci).

Heredabilidad. Representa la fracción de la variación fenotípica total que es debida a la

variación de los efectos genéticos aditivos. La heredabilidad, h2, de los caracteres

cuantitativos, al ser medible, representa un parámetro genético aplicable a la población

total. En términos estadísticos, h2 también se puede definir como el coeficiente de

regresión del valor genético sobre el valor fenotípico del animal, en términos simples es

la confiabilidad del fenotipo como el predictor de valor genético. En el Cuadro 1, como

ejemplo, se presentan estimaciones de h2 para algunas investigaciones con bovinos

lecheros.

3.4. Evaluaciones genéticas

El propósito principal de las evaluaciones genéticas es predecir el VG de los animales, a

partir de un conjunto de registros propios y de sus parientes, ajustando los efectos no

genéticos particulares de cada animal a evaluar (efectos ambientales). La utilización de

modelos estadísticos permite remover parte de los efectos ambientales particulares de

Page 18: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

10

los animales y predecir con mayor precisión su VG. La disponibilidad de una mayor

cantidad de registros de comportamiento propios y de sus parientes, permite lograr mayor

precisión en la predicción del valor genético de los animales (Ravagnolo et al., 2002).

Cuadro 1. Ejemplos de estimaciones de heredabilidad para la característica producción de leche por lactancia en bovinos lecheros.

Heredabilidad Investigación Raza

0.23

Resumen de evaluaciones

genéticas para ganado Jersey

(Núñez et al., 2013)

Jersey

0.20

Estimación de tendencias genéticas

en interacción genotipo ambiente en

ganado lechero de Costa Rica

(Vargas y Gamboa, 2008)

Jersey

0.19

Estimación de tendencias genéticas

en interacción genotipo ambiente en

ganado lechero de Costa Rica

(Vargas y Gamboa, 2008)

Holstein

0.14

Heredabilidad y tendencia genética

de la producción de leche y grasa

en vacas Siboney en Cuba

(González-Peña et al., 2008)

Siboney

De acuerdo con Montaldo et al. (1998), una evaluación genética es una metodología que

podría considerarse como un nuevo método de selección, ya que permite conocer la

calidad genética de un animal, entonces esto brinda información para señalar con mayor

certeza que animal seleccionar como reproductor. En las evaluaciones genéticas se

reportan las habilidades de transmisión predicha (HTP) de cada animal. Las HTP

representan el VG promedio de los gametos producidos por el animal; y cuantifican el

comportamiento (producción de leche, ganancia de peso, etc.) que se espera que el

Page 19: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

11

progenitor transmita a su progenie, en comparación con otros progenitores evaluados en

el mismo análisis, cuando estos se aparean con animales de calidad genética similar y

su progenie se desarrolla en ambientes semejantes.

Algunas de las características de las HTP son las siguientes (Núñez et al., 2005):

Pueden ser negativas o positivas.

Las HTP son propias para animales de una población de una raza y tiempo

determinado, es decir, no se pueden comparar entre diferentes razas ni entre dos

evaluaciones genéticas realizadas en tiempos diferentes.

Pueden hacerse comparaciones directas de HTP de animales de diferentes hatos,

siempre y cuando algún(os) semental(es) tenga(n) progenie en varios hatos.

En ganado productor de carne se reporta la Diferencia Esperada en la Progenie (DEP).

La DEP de un animal, es la diferencia esperada entre los promedios de producción de su

progenie y la de los hijos de otro animal con una DEP igual a cero. Por ejemplo, si un

animal A tiene una DEP para peso vivo al destete de 5.3%, y se aparea con un número

suficientes de hembras, producirá crías 5.6% más pesadas en promedio que aquellas de

un animal B con una DEP de -0.3% (INIA, 2011).

3.4.1. Valor genético

Suponga hipotéticamente que se tiene un animal con el siguiente genotipo (Notas de

cursos de Genética en el Departamento de Zootecnia de la UACh):

𝑨𝟐𝑨𝟐𝑩𝟏𝑩𝟐𝑪𝟏𝑪𝟐𝑫𝟐𝑫𝟐=4

Figura 1. Genotipo de un animal con sus respectivos valores aditivos de los alelos

Page 20: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

12

Asuma que el toro presenta:

El valor de aditividad es:

A2 + A2 + B1 + B2 + C1 + C2 + D2 + D2 = 8 + 8 + 4 + (-4) + 9 + (-9) + 6 + 6

Si el valor genético es la suma de valores genéticos aditivos de los genes que el animal

posee, entonces:

Los valores de dominancia y epistasis no se consideran, ya que son expresiones de

resultados de interacción intraloci e interloci respectivamente, entonces estos no se

pasarán directamente a la progenie.

Una vez que ya se tiene claro el concepto de valor genético, no está por demás calcular

el valor del HTP del animal, y la fórmula para calcularlo es:

HTP =1

2 (VG)

Entonces el valor del HTP para este individuo es:

HTP =1

2 (28) =14

A pesar de que anteriormente se calculó el valor HTP aún no se ha estudiado el concepto

de éste, en la revisión de literatura hay un apartado especial para HTP. Los gametos

probables a producir en el ejemplo se muestran en la Figura 2.

Page 21: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

13

A continuación, se indica en el Cuadro 2 los respectivos valores genéticos para cada

gameto.

Cuadro 2. Valores genéticos aditivos estimados para cada gameto.

Gameto VG

𝑨𝟐𝑩𝟏𝑪𝟏𝑫𝟐 27

𝑨𝟐𝑩𝟐𝑪𝟏𝑫𝟐 19

𝑨𝟐𝑩𝟏𝑪𝟐𝑫𝟐 9

𝑨𝟐𝑩𝟐𝑪𝟐𝑫𝟐 1

Retomando la definición de HTP, entonces el valor del HTP es:

𝐻𝑇𝑃 =27 + 19 + 9 + 1

4= 14

El caso anterior es para un individuo, ahora se ilustrará para el caso de un apareamiento,

es decir, gametos femeninos y masculinos. A continuación, se presentan dos animales,

los cuales son nuestros especímenes para ilustrar el concepto de valor genético y HTP

para la progenie.

𝑨𝟐𝑨𝟐𝑩𝟏𝑩𝟐𝑪𝟏𝑪𝟐𝑫𝟐𝑫𝟐

Gametos

𝑨𝟐𝑩𝟏𝑪𝟏𝑫𝟐

𝑨𝟐𝑩𝟐𝑪𝟏𝑫𝟐

𝑨𝟐𝑩𝟏𝑪𝟐𝑫𝟐

𝑨𝟐𝑩𝟐𝑪𝟐𝑫𝟐

Figura 2. Gametos que puede producir el genotipo del animal ejemplificado.

Page 22: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

14

Observando la figura anterior, se puede calcular el VG de la progenie.

VG = 14 + 0 = 14

El descendiente superior, se obtiene con los gametos 𝐆𝟏27 y 𝐆𝟒13, masculino y femenino

respectivamente, y la probabilidad de hacer esa combinación es 1

48.Como podemos ver

nunca podremos saber de manera exacta el VG del individuo, únicamente se puede

calcular el promedio de VGs en los gametos.

3.4.2. Interpretación de las HTP

Para el caso de producción de leche, considere que la HTP del toro 1 es +400 kg y la del

toro 2 es -100 kg. Lo anterior significa que se espera que las hijas del toro 1 produzcan

500 kg de leche más que las hijas del toro 2, suponiendo que ambos toros se aparean

con vacas de la misma calidad genética y su progenie se desarrolla en ambientes

similares (Núñez et al., 2005).

3.4.3. Predicción del valor genético

La predicción del VG aditivo, forma parte de la mayoría de los programas de

mejoramiento genético; para la predicción precisa de VGs es importante la disponibilidad

de registros detallados. En las fases iniciales, la predicción del valor genético podrá estar

basada en registros individuales y el pedigrí (Núñez et al., 2010).

Page 23: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

15

Las predicciones del VG se realizan mediante la aplicación del modelo animal simple

(interés en los efectos genéticos directos de los animales), este último no es más que una

ecuación matemática estocástica que describe la producción o dato productivo de un hato

considerando el efecto propio del animal, así como la circunstancia que ha afectado al

animal en la producción. Con el modelo animal se predice el valor genético aditivo de los

reproductores superiores a partir del fenotipo, el cual generación tras generación

incrementa su VG. En el caso del ganado lechero, las valoraciones de los caracteres de

producción se refieren comúnmente a la producción láctea obtenida en 305 días (Ramírez

et al., 2016).

3.4.4. Grupos contemporáneos

En las evaluaciones genéticas, los grupos contemporáneos (GC) se utilizan para reducir

sesgos debidos a diferencias en el manejo y condiciones ambientales de los animales.

Se esperaría que una mejor definición de los GC aumente la exactitud de las HTP e

incremente el progreso genético. El GC como efecto fijo o aleatorio tiene implicaciones

en la evaluación genética de los animales; es decir, si el GC se considera efecto fijo, los

resultados de las evaluaciones genéticas no varían y se reduce el sesgo en las

comparaciones genéticas debido a asociaciones entre GC y sementales. Pero si el GC

se considera como efecto aleatorio, la varianza del error de predicción se reduce, ya que

se utiliza mayor información para obtener el valor genético. En la actualidad no hay un

acuerdo en la literatura publicada acerca de la mejor forma de análisis. En evaluaciones

genéticas de bovinos, generalmente se considera al GC como efecto fijo; sin embargo,

algunos estudios han mostrado que en ciertas circunstancias podría ser mejor alternativa

considerarlo como efecto aleatorio; por ejemplo, cuando los GC son pequeños (3, 4 o 5

GC), cuando se dispone de poca información para evaluar a los animales o cuando no

existe asociación entre los GC y los sementales. En la práctica la mejor decisión depende

de parámetros desconocidos de la población específica y de la estructura de los datos

(Ramírez-Valverde et al., 2008)

Page 24: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

16

3.4.5. Tendencias genéticas

Las tendencias genéticas representan los cambios promedio en el VG que han ocurrido

en el ganado de alguna raza a través de los años. Estas tendencias se calculan con base

en el promedio de las HTP de los animales nacidos en cada año, incluyendo machos y

hembras (Parra-Bracamonte et al., 2007). Un ejemplo de la representación de las

tendencias genéticas se muestra en la Figura 3.

En la Figura 3 es posible notar que los valores genéticos tienen momentos de bajadas y

subidas, es decir, para ciertos años la calidad sube y para otros años esta tiende a bajar;

sin embargo, a pesar de ese comportamiento puede notarse que, en general, los VGs

tienen una tendencia a aumentar en forma positiva y lineal a través de los años.

Las tendencias genéticas indican en qué dirección y a qué velocidad se está

desarrollando el programa de selección para las características evaluadas, permitiendo

así mantener el rumbo de éste o corregir la dirección del mismo cuando se aleja del

objetivo deseado (INIA, 2011).

Figura 3. Tendencias genéticas en producción de leche a 305 días para

vacas Holstein y Jersey en Costa Rica (Fuente: Vargas y Gamboa, 2008).

Page 25: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

17

3.5. Modelación en evaluaciones genéticas (genética cuantitativa)

En la mejora genética con orientación productiva, el punto clave son los caracteres

cuantitativos (Gasque, 2008). Los caracteres cuantitativos son aquellos normalmente

influenciados por los efectos de muchos genes y el medio ambiente, y tienen una

distribución normal de los valores de la población, herencia poligénica (Falconer y

MacKay, 1996).

Modelo básico de genética cuantitativa

𝐶𝑜𝑚𝑝𝑜𝑟𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = 𝐻𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 + 𝑂𝑝𝑜𝑟𝑡𝑢𝑛𝑖𝑑𝑎𝑑……………………………….................. (1)

𝐹𝑒𝑛𝑜𝑡𝑖𝑝𝑜 = 𝐺𝑒𝑛𝑜𝑡𝑖𝑝𝑜 + 𝐴𝑚𝑏𝑖𝑒𝑛𝑡𝑒…..….....…………………………………….…….…….(2)

En las ecuaciones (1 y 2) fundamentales de genética cuantitativa, el interés recae en la

variabilidad de los componentes con la expresión siguiente:

𝑉(𝐹) = 𝑉(𝐺) + 𝑉(𝐸)…………………….…………..…………………………………………(3)

donde:

𝑉(𝐹): 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑓𝑒𝑛𝑜𝑡í𝑝𝑖𝑐𝑎

𝑉(𝐺): 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑔𝑒𝑛𝑜𝑡í𝑝𝑖𝑐𝑎

𝑉(𝐸): 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑎𝑚𝑏𝑖𝑒𝑛𝑡𝑎𝑙

La varianza genotípica está compuesta por:

𝑉(𝐺) = 𝑉(𝐴) + 𝑉(𝐷) + 𝑉(𝐼)………………………...…………….…………………………. (4)

Donde

𝐴:𝑎𝑑𝑖𝑡𝑖𝑣𝑖𝑑𝑎𝑑, 𝐷: 𝑑𝑜𝑚𝑖𝑛𝑎𝑛𝑐𝑖𝑎, 𝑒 𝐼: 𝑒𝑝𝑖𝑠𝑡𝑎𝑠𝑖𝑠

Page 26: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

18

Dado que el interés es separar la varianza genética aditiva del resto de los componentes,

el modelo (Ecuación 3) puede representarse como:

𝑉(𝐹) = 𝑉(𝐴) + 𝑉(𝐸)∗……………………………………………...……….……………….... (5)

donde:

𝑉(𝐸)∗ = 𝑉(𝐸) + 𝑉(𝐷) + 𝑉(𝐼)

3.5.1. Modelos mixtos

De acuerdo con Henderson (1988), cuando se consideran animales de una misma raza

en un proceso de evaluación genética, un modelo animal de efectos aditivos directos se

puede expresar de manera matricial de la siguiente manera.

𝑦 = 𝑋𝛽 + 𝑍𝑢 + 𝑒………………………………………………………………………………. (6)

Donde:

𝑦: 𝑒𝑠 𝑒𝑙 𝑣𝑒𝑐𝑡𝑜𝑟 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑓𝑒𝑛𝑜𝑡í𝑝𝑖𝑐𝑎𝑠

𝛽: 𝑒𝑠 𝑢𝑛 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑓𝑖𝑗𝑜𝑠

𝑢: 𝑒𝑠 𝑢𝑛 𝑣𝑒𝑐𝑡𝑜𝑟 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑔𝑒𝑛é𝑡𝑖𝑐𝑜𝑠 𝑎𝑑𝑖𝑡𝑖𝑣𝑜𝑠

𝑒: 𝑒𝑠 𝑢𝑛 𝑣𝑒𝑐𝑡𝑜𝑟 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙𝑒𝑠

𝑋 𝑦 𝑍 𝑠𝑜𝑛 𝑚𝑎𝑡𝑟𝑖𝑐𝑒𝑠 𝑑𝑒 𝑜𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑞𝑢𝑒 𝑠𝑒 𝑟𝑎𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑛 𝑐𝑜𝑛 𝛽 𝑦 𝜇, 𝑟𝑒𝑝𝑒𝑐𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒

Los modelos mixtos fueron ampliamente estudiados por Fisher desde 1918, quien los

denominó modelos de componentes de varianza. Estos modelos fueron de gran utilidad

en los estudios de genética cuantitativa y mejoramiento animal; sin embargo, su

aplicación en diferentes campos de la investigación científica se ha venido generalizando

en las décadas recientes, en las cuales se han implementado nuevos desarrollos

metodológicos que han contribuido a su estudio y aplicación.

El modelo animal es un modelo lineal mixto, que permite estimar efectos fijos y predecir

efectos aleatorios.

Page 27: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

19

Efectos fijos o aleatorios

Los modelos para la evaluación genética generalmente contienen efectos fijos y

aleatorios, por lo cual reciben el nombre de modelos mixtos. Un modelo de efectos fijos

se establece cuando los niveles de un factor son seleccionados específicamente, ya que

el interés se centra en conocer los efectos en la respuesta de esos niveles particulares

(Searle, 1997). Los modelos que únicamente contienen efectos fijos se denominan

modelos de efectos fijos. En algunas situaciones se tiene interés en un factor con un

número elevado de posibles niveles y para realizar su estudio es necesario seleccionar

aleatoriamente una muestra de ellos (Searle, 1997). En este caso, el modelo se considera

de efectos aleatorios y en el modelo matemático del diseño, los factores son variables

aleatorias idénticamente distribuidas, según la distribución de la población de niveles de

la cual fueron muestreadas. Los modelos con factores de efectos aleatorios se

denominan modelos de efectos aleatorios. En estos modelos el interés radica en estimar

la variabilidad existente en la totalidad de los efectos de la población de niveles (Abraira

y Pérez, 1996).

De acuerdo con Searle (1997), algunas preguntas generales deben contestarse para

clasificar los efectos como fijos o aleatorios: ¿cuántos niveles del factor están en el

modelo? Si son pocos, entonces quizá ese es un factor fijo; si son muchos, entonces

probablemente sea un factor aleatorio. ¿El número de los niveles en la población es

suficientemente grande para ser considerado infinito? Si es así, podría ser un factor

aleatorio. ¿Los mismos niveles serían utilizados otra vez si se repitiera el experimento?

Si es así, tal vez sea un factor fijo. ¿Las inferencias se harán incluso sobre niveles no

incluidos en el experimento? Si es así, entonces es factible que ese factor sea aleatorio.

¿Los niveles de un factor fueron determinados de una manera no aleatoria? Si es así,

entonces quizá ese factor es fijo.

Actualmente, la mayoría de las evaluaciones genéticas se realizan usando el modelo

animal. Los efectos que se incluyen en el modelo animal, pueden dividirse en: fijos y

aleatorios, y dentro de aleatorios en genéticos y no genéticos.

Page 28: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

20

Según Hartley y Rao (1967) el modelo mixto puede ser escrito matricialmente, en forma

general como:

𝑦 = 𝑋1𝛽1 + 𝑋2𝛽2+⋯+ 𝑋𝑏𝛽𝑏 +𝑍1𝑢1 + 𝑍2𝑢2 +⋯+ 𝑍𝑐𝑢𝑐 + 𝑒……....................................... (7)

donde:

𝑦: 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑑𝑖𝑚𝑒𝑛𝑠𝑖ó𝑛 𝑛𝑥1

𝑋𝑖: 𝑚𝑎𝑡𝑟𝑖𝑧 𝑑𝑒 𝑖𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑓𝑖𝑗𝑜𝑠 𝑑𝑒 𝑑𝑖𝑚𝑒𝑛𝑠𝑖ó𝑛 𝑛𝑥𝑝

𝛽𝑖: 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑓𝑖𝑗𝑜𝑠 𝑝𝑥1

𝑍𝑖:𝑚𝑎𝑡𝑟𝑖𝑧 𝑑𝑒 𝑖𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜𝑠 𝑑𝑒 𝑑𝑖𝑚𝑒𝑛𝑠𝑖ó𝑛 𝑛𝑥𝑞𝑖 , 𝑐𝑜𝑛 𝑖 = 1,2,… , 𝑐

𝑢𝑖: 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜𝑠 𝑑𝑒 𝑑𝑖𝑚𝑒𝑛𝑠𝑖ó𝑛 𝑞𝑖𝑥1, 𝑐𝑜𝑛 𝑖 = 1,2,… , 𝑐

𝑒: 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎𝑠 𝑑𝑒 𝑑𝑖𝑚𝑒𝑛𝑠𝑖ó𝑛 𝑛𝑥1

Propiedades de los modelos mixtos

El modelo de la Ecuación (7) se puede representar de la siguiente manera:

𝑦 = 𝑋𝛽 + 𝑍𝑢 + 𝑒………………………………………………………………………………. (8)

donde:

𝑋 = (𝑋1, 𝑋2, … , 𝑋𝑐)

𝛽 = (𝛽1𝑡 , 𝛽2

𝑡 ,𝛽3𝑡 , … , 𝛽𝑐

𝑡)𝑡

𝑍 = (𝑍1 , 𝑍2, … , 𝑍𝑐)

𝑢 = (𝑢1𝑡 , 𝑢2

𝑡 , 𝑢3𝑡 , … , 𝑢𝑐

𝑡)𝑡

Para el modelo de la Ecuación (8) se tienen las siguientes propiedades (McCulloch y

Searle, 2001):

1). 𝑢𝑖~𝑁(0, 𝜎2𝑖); 𝑒𝑖~𝑁(0,𝑅𝜎

20)

2). 𝐸(𝑢𝑖) = 𝐸(𝑒𝑖) = 0

Page 29: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

21

3). 𝐶𝑜𝑣(𝑢𝑖, 𝑢𝑗) = {𝜎2𝑖𝐼𝑞𝑖 , 𝑠𝑖 𝑖 = 𝑗

0 𝑠𝑖 𝑖 ≠ 𝑗𝑝𝑎𝑟𝑎 𝑖, 𝑗 = 1,2,… , 𝑡

4). 𝑉𝑎𝑟(𝑦) = 𝑉𝑎𝑟(𝑋𝛽 + 𝑍𝑢 + 𝑒) = 𝑍𝑉𝑎𝑟(𝑢)𝑍𝑡 + 𝑉𝑎𝑟(𝑒) + 𝑍𝐶𝑜𝑣(𝑢, 𝑒) = 𝑍𝐺𝑍𝑡 + 𝑅

Donde:

𝐺 = 𝐼𝜎𝑎2

𝑅 = 𝐼𝜎02

5). 𝐶𝑜𝑣(𝑦, 𝑢) = 𝐸 [(𝑦 − 𝐸(𝑦))(𝑢 − 𝐸(𝑢))𝑡] = 𝑍𝐷

Obtención del mejor predictor lineal insesgado

Para obtener el predictor de �̂� y el estimador de 𝛽,̂ Henderson utilizó la estimación por

máxima verosimilitud, en la cual se define una función de distribución conjunta de manera

matricial donde:

y~NMV{Xβ,ZGZt+R}

Sigue una distribución normal multivariada; para la obtención de �̂� 𝑦 �̂�, Henderson

condicionó solamente sobre u, por lo que la función conjunta es:

f(y,u)=f(y|u)f(u)

y sigue la distribución siguiente:

y|u~NMV {𝑋𝛽 + 𝑍𝑢, 𝑅} 𝑦 u~NMV{0, G}

Por tanto, la función de máxima verosimilitud (𝐿) queda de la siguiente manera

𝐿 = 𝑓(𝑦|𝑢)𝑓(𝑢)

= (2𝜋)−𝑛/2|𝑅|−1/2𝑒{−1/2((𝑦−𝑋𝛽−𝑍𝑢)′𝑅−1(𝑦−𝑋𝛽−𝑍𝑢)}(2𝜋)−𝑗/2|𝐺|−1/2𝑒{−1/2(𝑢−0)

′𝐺−1(𝑢−0)}

= (2𝜋)−1/2(𝑛+𝑗)(|𝑅||𝐺|)−1/2𝑒{−1/2((𝑦−𝑋𝛽−𝑍𝑢)′𝑅−1(𝑦−𝑋𝛽−𝑍𝑢)+𝑢′𝐺−1𝑢)}

Page 30: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

22

Ahora obteniendo 𝑙𝑜𝑔 (𝐿)

log (L)=log [(2π)-1/2(n+j)(|R||G|)-1/2e{-1/2((y-Xβ-Zu)'R-1(y-Xβ-Zu)+u'G-1u)}]

−1/2(𝑛 + 𝑗)log (2𝜋) − 1/2((log(|𝑅|) + log (|𝐺|)) − 1/2((𝑦 − 𝑋𝛽 − 𝑍𝑢)′𝑅−1(𝑦 − 𝑋𝛽 − 𝑍𝑢)

+𝑢′𝐺−1𝑢).

Ahora se define 𝐶 = −1/2(𝑛 + 𝑗)log (2𝜋) − 1/2(log(|𝑅|)+ log (|𝐺|)), ya que para el

interés del desarrollo, 𝐶 es una constante, por tanto se obtiene:

log(𝐿) = 𝐶 − 1/2((𝑦 − 𝑋𝛽 − 𝑍𝑢)′𝑅−1(𝑦 − 𝑋𝛽 − 𝑍𝑢) + 𝑢′𝐺−1𝑢)

= −1/2(𝑦′𝑅−1𝑦 − 𝑦′𝑅−1𝑋𝛽 − 𝑦′𝑅−1𝑍𝑢 − (𝑋𝛽)′𝑅−1𝑦 + (𝑋𝛽)′𝑅−1𝑋𝛽 + (𝑋𝛽)′𝑅−1𝑍𝑢

−(𝑍𝑢)′𝑅−1𝑦 + (𝑍𝑢)′𝑅−1𝑋𝛽 + (𝑍𝑢)′𝑅−1 + 𝑢′𝐺−1𝑢.

= 𝐶 −1

2(𝑦′𝑅−1𝑦 − 2𝑦′𝑅−1𝑋𝛽 − 2𝑦′𝑅−1𝑍𝑢 + (𝑋𝛽)′𝑅−1𝑋𝛽 + 2(𝑋𝛽)′𝑅−1𝑍𝑢 + (𝑍𝑢)′𝑅−1𝑍𝑢

+ 𝑢′𝐺−1𝑢

Ahora utilizando diferenciación matricial, se deriva la función respecto a 𝛽 𝑦 𝑢.

𝛿 𝑙𝑜𝑔(𝐿)

𝛿𝛽=𝛿

𝛿𝛽(𝐶 − 1/2(𝑦′𝑅−1𝑦 − 2𝑦′𝑅−1𝑋𝛽 − 2𝑦′𝑅−1𝑍𝑢 + (𝑋𝛽)′𝑅−1𝑋𝛽 + 2(𝑋𝛽)′𝑅−1𝑍𝑢

+(𝑍𝑢)′𝑅−1𝑍𝑢 + 𝑢′𝐺−1𝑢)).

= −1/2(−2𝑋′𝑅−1𝑦 + 2𝑋′𝑅−1𝑋𝛽 + 2𝑋′𝑅−1𝑍𝑢)

→ 𝑋′𝑅−1𝑋𝛽 + 𝑋′𝑅−1𝑍𝑢 = 𝑋′𝑅−1𝑦……………………..…………………...…………….…..(9)

Page 31: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

23

𝛿 𝑙𝑜𝑔(𝐿)

𝛿𝑢=𝛿

𝛿𝑢(𝐶 − 1/2(𝑦′𝑅−1𝑦 − 2𝑦′𝑅−1𝑋𝛽 − 2𝑦′𝑅−1𝑍𝑢 + (𝑋𝛽)′𝑅−1𝑋𝛽 + 2(𝑋𝛽)′𝑅−1𝑍𝑢

+(𝑍𝑢)′𝑅−1𝑍𝑢 + 𝑢′𝐺−1𝑢))

= −1/2(−𝑍′𝑅−1𝑦 + 2𝑍′𝑅−1𝑋𝛽 + 2𝑍′𝑅−1𝑍𝑢 + 2𝐺−1𝑢)

→ 𝑍′𝑅−1𝑋𝛽 + 𝑍′𝑅−1𝑍𝑢 +𝐺−1𝑢 = 𝑍′𝑅−1𝑦……………………………..…………………... (10)

Los predictores y estimadores de �̂� y �̂� se obtienen a partir de la solución del sistema de

ecuaciones siguiente:

[𝑋′𝑅−1𝑋 𝑋′𝑅−1𝑍

𝑍′𝑅−1𝑋 𝑍′𝑅−1𝑍 + 𝐺−1] [�̂��̂�] = [

𝑋′𝑅−1𝑦

𝑍′𝑅−1𝑦]

Este sistema de ecuaciones es conocido como las ecuaciones normales de Henderson

(Searle, 1987; McCulloch y Searle, 2001). Estas ecuaciones proveen los mejores

predictores lineales insesgados (BLUP). A continuación se encuentran las soluciones

explícitas para �̂� y �̂�. Desarrollando la ecuación (10) se tiene:

(𝑍′𝑅−1𝑋)�̂� + (𝑍′𝑅−1𝑍 + 𝐺−1) �̂�=𝑍′𝑅−1𝑦

(𝑍′𝑅−1𝑍 + 𝐺−1)�̂� = 𝑍′𝑅−1𝑦 − (𝑍′𝑅−1𝑋)�̂�

�̂� = (𝑍′𝑅−1𝑍 + 𝐺−1) −1[𝑍′𝑅−1𝑦 − (𝑍′𝑅−1𝑋)�̂�]

�̂� = (𝑍′𝑅−1𝑍 + 𝐺−1) −1𝑍′𝑅−1(𝑦 − 𝑋�̂�)

Reemplazando este resultado en la ecuación (9) de Henderson.

(𝑋′𝑅−1𝑋)�̂� + 𝑋′𝑅−1𝑍 [(𝑍′𝑅−1𝑍 + 𝐺−1)−1 (𝑍′𝑅−1(𝑦 − 𝑋�̂�))] = 𝑋′𝑅−1𝑦

Reagrupando términos en la ecuación anterior, se tiene:

𝑋′𝐵𝑋�̂� = 𝑋′𝐵𝑦

Page 32: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

24

donde:

𝐵 = 𝑅−1 − 𝑅−1𝑍[𝑍′𝑅−1𝑍 + 𝐺−1]−1𝑍′𝑅−1

Se tiene que:

𝐵 = 𝑉−1

Por tanto

𝑋′𝑉−1𝑋�̂� = 𝑋′𝑉−1𝑦

Que es la ecuación de cuadrados mínimos generalizados para 𝛽.

Po otro lado, �̂� es el 𝐵𝐿𝑈𝑃(𝑢) y usando la identidad:

[𝐺−1 + 𝑍′𝑅−1𝑍]−1𝑍′𝑅−1 = 𝐺𝑍′𝑉−1

Entonces,

�̂� = 𝐺𝑍′𝑉−1(𝑦 − 𝑋�̂�)

Con

�̂� = [𝑋′𝑉−1𝑋]−𝑋′𝑉−1𝑦

3.5.2. Ecuaciones normales de Henderson introduciendo 𝑨−𝟏

Las ecuaciones normales para el modelo mixto (Mrode y Thompson, 2005) son:

[𝑋′𝑅−1𝑋 𝑋′𝑅−1𝑍

𝑍′𝑅−1𝑋 𝑍′𝑅−1𝑍 + 𝐺−1] [�̂��̂�] = [

𝑋′𝑅−1𝑦

𝑍′𝑅−1𝑦]

Las soluciones para �̂� y �̂� requieren de 𝑉−1, sin embargo, en la mayoría de los casos es

difícil calcular esta última. Henderson, en 1955, facilitó la manera estimar y predecir, 𝛽 y

u, respectivamente.

Page 33: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

25

Donde: 𝑅−1 = 𝐼1

𝜎2𝑒 ; 𝐺−1 = 𝐴−1

1

𝜎2𝑢 ; y 𝐴: matriz de relaciones genéticas aditivas entre

los animales considerados en el pedigrí.

Las ecuaciones anteriores pueden simplificarse a:

[𝑋′𝑋 𝑋′𝑍 𝑍′𝑋 𝑍′𝑍 + 𝐴−1𝜆

] [�̂��̂�] = [

𝑋′𝑦

𝑍′𝑦]

donde: 𝜆 =𝜎2𝑒

𝜎2𝑢

En el Apéndice 1 se ilustra con un ejemplo, utilizando datos hipotéticos, la aplicación

práctica de modelos mixtos, usando un modelo animal simple, la notación matricial y su

programación en el paquete estadístico SAS.

3.5.3. Propiedades del BLUP

Las propiedades más sobresalientes del BLUP-Modelo Animal (Ducrocq, 1994) son:

Propiedades prácticas

Los valores genéticos esperados (EBVs) son generalmente aditivos.

Corrige los efectos fijos para todos los animales incluidos en el análisis.

Permite calcular tendencias genéticas, es decir, permite comparar la media de

los VGs esperados en animales nacidos y medidos en diferentes años.

Utiliza toda la información disponible tanto productiva como genealógica, así

coma la h2 de la característica estudiada.

Los cambios de varianza genética como consecuencia de la selección y/o

consanguinidad son tenidos en cuenta a través de la matriz de varianzas y

covarianzas genéticas.

Determina la precisión y el error estándar de los VGs predichos (EBVs).

Permite el análisis de características afectadas por efectos maternos.

Las evaluaciones genéticas de los animales son ajustadas por el valor genético

de sus progenitores.

Page 34: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

26

Propiedades estadísticas

Maximiza la exactitud de las predicciones 𝑟𝑢,𝑢.

Minimiza la varianza del error de predicción, PEV=𝑉𝑎𝑟(𝑢 − �̂�).

Predictores son funciones lineales de las observaciones (y)

𝐸[𝑈] = 𝑈 𝑦 𝐸[�̂�] = 𝛽

3.6. Regresión lineal múltiple

El modelo de regresión lineal con 𝑝 − 1 variables regresoras (variables independientes),

una variable respuesta, 𝑝 − 1 parámetros y errores (residuales) con distribución normal,

se describe a continuación:

𝑌𝑖 = 𝛽0 + 𝛽1𝑋1𝑖 +𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 +⋯+𝛽𝑝−1𝑋(𝑝−1)𝑖 + 𝑒𝑖

donde:

𝑋𝑗𝑖 𝑑𝑒𝑛𝑜𝑡𝑎 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑜𝑟𝑎 𝑗 𝑑𝑒 𝑙𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 𝑖

𝛽𝑗 𝑑𝑒𝑛𝑜𝑡𝑎 𝑒𝑙 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑗. 𝑗 = 1, 2, 3,… , 𝑝 − 1

𝑐𝑜𝑛 𝑝 = 𝑘 + 1 𝑑𝑜𝑛𝑑𝑒 𝑘 𝑑𝑒𝑛𝑜𝑡𝑎 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑟𝑒𝑔𝑟𝑒𝑠𝑜𝑟𝑎𝑠.

𝑒𝑖~𝑖𝑖𝑑 𝑁(0, 𝜎2) 𝑐𝑜𝑛 𝑖 = 1, 2, 3,… , 𝑛.

𝑌𝑖 = 𝛽0 +∑ 𝛽𝑗𝑋1𝑗𝑝−1𝑗=1 +𝑒𝑖

La cual podemos expresar de forma matricial para n observaciones de la siguiente

manera:

[

𝑌1𝑌2⋮𝑌𝑛

] =

[ 11⋮1

𝑋11𝑋12⋮𝑋1𝑛

𝑋21𝑋22⋮𝑋2𝑛

𝑋31𝑋32⋮𝑋3𝑛

… 𝑋(𝑝−1),1… 𝑋(𝑝−1),2

⋮… 𝑋(𝑝−1),𝑛]

[

𝛽0𝛽1⋮

𝛽𝑝−1

] + [

𝑒1𝑒2⋮𝑒𝑛

]

Lo anterior queda:

𝑌𝑛×1 = 𝑋𝑛×𝑝𝛽𝑝 + 𝑒𝑛×1

Page 35: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

27

donde:

𝑌𝑛×1 𝑑𝑒𝑛𝑜𝑡𝑎 𝑒𝑙 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎𝑠

𝑋𝑛×𝑝 𝑑𝑒𝑛𝑜𝑡𝑎 𝑙𝑎 𝑚𝑎𝑡𝑟𝑖𝑧 𝑑𝑒 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒𝑠

𝛽𝑝 𝑑𝑒𝑛𝑜𝑡𝑎 𝑒𝑙 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠

𝑒𝑛×1 𝑑𝑒𝑛𝑜𝑡𝑎 𝑢𝑛 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙 𝑐𝑜𝑛

𝐸(𝑒𝑛×1) = 0𝑛×1

𝑣𝑎𝑟(𝑒𝑛×1) = [

𝜎2

0⋮0

0𝜎2

⋮0

……

00⋮𝜎2

] = 𝜎2I𝑛

Por consecuencia, el vector 𝑌𝑛×1 tiene esperanza:

𝐸(𝑌𝑛×1) = 𝑋𝑛×𝑝𝛽𝑝

y la matriz de varianzas y covarianzas: 𝜎2I𝑛

3.6.1. Estimadores de los parámetros

𝑆(𝛽𝑝×1) =∑𝑒2𝑖

𝑛

𝑖=1

= (𝑒𝑛×1)′(𝑒𝑛×1) = (𝑌𝑛×1 − 𝑋𝑛×𝑝𝛽𝑝)′(𝑌𝑛×1 − 𝑋𝑛×𝑝𝛽𝑝)

= 𝑌′𝑛×1𝑌𝑛×1 − 𝑌′𝑛×1𝑋𝑛×𝑝𝛽𝑝 − (𝛽𝑝)

′(𝑋𝑛×𝑝)

′𝑌𝑛×1 − (𝛽𝑝)

′(𝑋𝑛×𝑝)

′𝑋𝑛×𝑝𝛽𝑝

=𝑌′𝑛×1𝑌𝑛×1 − 2(𝛽𝑝)′(𝑋𝑛×𝑝)

′𝑌𝑛×1 + (𝛽𝑝)

′(𝑋𝑛×𝑝)

′𝑋𝑛×𝑝𝛽𝑝

𝜕𝑆(𝛽𝑝×1)

𝜕𝛽= −(𝑋𝑛×𝑝)

′𝑌𝑛×1 +2(𝑋𝑛×𝑝)

′𝑋𝑛×𝑝𝛽𝑝 = 0

�̂�𝑝×1 = [(𝑋𝑛×𝑝)′𝑋𝑛×𝑝]

−1

(𝑋𝑛×𝑝)′𝑌𝑛×1

Page 36: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

28

El estimador de cuadrados mínimos existirá siempre y cuando la inversa de (𝑋𝑛×𝑝)′𝑋𝑛×𝑝

exista. Por tanto:

�̂�𝑛×1 = 𝑋𝑛×𝑝�̂�𝑝 = 𝑿𝒏×𝒑 [(𝑿𝒏×𝒑)′𝑿𝒏×𝒑]

−𝟏

(𝑿𝒏×𝒑)′𝑌𝑛×1

donde:

𝐇𝑛×𝑛 = 𝑿𝒏×𝒑 [(𝑿𝒏×𝒑)′𝑿𝒏×𝒑]

−𝟏

(𝑿𝒏×𝒑)′

Entonces:

�̂�𝑛×1 = 𝐇𝑛×𝑛𝑌𝑛×1

𝐇𝑛×𝑛 cuenta con la propiedad de que es una matriz simétrica e idempotente. También

𝐈 − 𝐇 es una matriz idempotente y simétrica.

�̂�𝑛×1 = (𝑌𝑛×1 − �̂�𝑛×1) = (𝑌𝑛×1 − 𝐇𝑛×𝑛𝑌𝑛×1) = (𝐈 −𝐇)𝑌𝑛×1

𝑣𝑎𝑟(𝑒𝑛×1) = 𝜎2(𝐈 − 𝐇)

Entonces se tiene que:

𝑣𝑎𝑟(�̂�𝑛×1) = 𝑀𝑆𝐸(𝐈 − 𝐇)

3.6.2. Análisis de varianza

La suma de cuadrados para el análisis de varianza (Cuadro 3) en términos de matrices

es:

𝑆𝑆𝑇𝑂 = 𝑌′𝑛×1𝑌𝑛×1 −1

𝑛𝑌′𝑛×1𝐉𝑌𝑛×1 = 𝑌′𝑛×1[𝐈 −

𝟏

𝒏𝐉]𝑌𝑛×1

𝑆𝑆𝐸 = (𝑌𝑛×1 − 𝑋𝑛×𝑝�̂�𝑝)′(𝑌𝑛×1 − 𝑋𝑛×𝑝�̂�𝑝) = 𝑌′𝑛×1𝑌𝑛×1 − (�̂�𝑝)

′(𝑋𝑛×𝑝)

′𝑌𝑛×1

= 𝑌′𝑛×1(𝐈 −𝐇)𝑌𝑛×1

𝑆𝑆𝑅 = (�̂�𝑝)′(𝑋𝑛×𝑝)

′𝑌𝑛×1 −

1

𝑛𝑌′𝑛×1𝐉𝑌𝑛×1 = 𝑌′𝑛×1[𝐇 −

1

𝑛𝐉]𝑌𝑛×1

Page 37: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

29

Donde: 𝐉𝑛×𝑛 = [

11⋮1

11⋮1

… 1… 1⋱…

⋮1

]

Otros resultados importantes son:

𝐸(𝑀𝑆𝐸) = 𝜎2 y 𝑀𝑆𝐸 =𝑆𝑆𝐸

𝑛−𝑝

𝐸(𝑀𝑆𝑅) > 𝜎2

Si la hipótesis nula no se rechaza, entonces 𝐸(𝑀𝑆𝑅) = 𝜎2

donde: 𝑀𝑆𝑅 =𝑆𝑆𝑅

𝑝−1

Cuadro 3. Tabla de análisis de varianza para el modelo de regresión.

Fuentes de

variación

Suma de

cuadrados Grados de libertad

Cuadrados

medios

Regresión 𝑌′𝑛×1[𝐇 −1

𝑛𝐉]𝑌𝑛×1 𝑝 − 1

𝑆𝑆𝑅

𝑝 − 1

Error 𝑌′𝑛×1(𝐈 − 𝐇)𝑌𝑛×1 𝑛 − 𝑝 𝑆𝑆𝐸

𝑛 − 𝑝

Total 𝑌′𝑛×1[𝐈 −𝟏

𝒏𝐉]𝑌𝑛×1 𝑛 − 1

𝑆𝑆𝑇𝑂

𝑛 − 1

3.6.3. Prueba 𝑭 para la significancia del modelo de regresión

Para probar la significancia del modelo, es decir, si hay relación entre la variable

respuesta 𝑌 y el conjunto de variables predictoras 𝑋1, 𝑋2, 𝑋3, … , 𝑋𝑝−1, se tiene la hipótesis

de contraste siguiente:

H0: 𝛽1 = 𝛽2 = 𝛽3 = ⋯ = 𝛽𝑝−1 = 0

H1: 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝛽𝑘 (𝑘 = 1,… , 𝑝 − 1) 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑒𝑟𝑜.

Page 38: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

30

Se usa el estadístico F =𝑀𝑆𝑅

𝑀𝑆𝐸 y la regla de decisión con un nivel de significancia 𝛼 es:

Si F ≤ F(1 − 𝛼;𝑝 − 1, 𝑛 − 𝑝), se rechaza H0.

Si F > F(1 − 𝛼;𝑝 − 1, 𝑛 − 𝑝), se acepta H1.

3.6.4. Inferencias acerca de los parámetros de regresión

La estimación de 𝛽𝑝×1 por cuadrados mínimos es insesgada:

E[�̂�𝑝×1] = 𝛽𝑝×1

La matriz de varianzas y covarianzas de �̂�𝑝×1 es:

𝑣𝑎𝑟(�̂�𝑝×1) =

[ 𝑣𝑎𝑟(�̂�0)

𝑐𝑜𝑣(�̂�1, �̂�0)⋮

𝑐𝑜𝑣(�̂�𝑝−1, �̂�0)

𝑐𝑜𝑣(�̂�0, �̂�1)

𝑣𝑎𝑟(�̂�1)⋮

𝑐𝑜𝑣(�̂�𝑝−1 , �̂�1)

……⋱…

𝑐𝑜𝑣(�̂�0, �̂�𝑝−1)

𝑐𝑜𝑣(�̂�1, �̂�𝑝−1)

⋮𝑣𝑎𝑟(�̂�𝑝−1) ]

Está dada por:

𝑣𝑎𝑟(�̂�𝑝×1)𝑝×𝑝= 𝜎2(𝑋′𝑛×𝑝𝑋𝑛×𝑝)

−1

La matriz de varianzas y covarianzas estimadas es:

𝑣𝑎�̂�(�̂�𝑝×1) =

[ 𝑣𝑎�̂�(�̂�0)

𝑐𝑜�̂�(�̂�1, �̂�0)⋮

𝑐𝑜�̂�(�̂�𝑝−1, �̂�0)

𝑐𝑜�̂�(�̂�0, �̂�1)

𝑣𝑎�̂�(�̂�1)⋮

𝑐𝑜�̂�(�̂�𝑝−1 , �̂�1)

……⋱…

𝑐𝑜�̂�(�̂�0, �̂�𝑝−1)

𝑐𝑜�̂�(�̂�1, �̂�𝑝−1)

⋮𝑣𝑎�̂�(�̂�𝑝−1) ]

Está dada por:

𝑣𝑎�̂�(�̂�𝑝×1)𝑝×𝑝= 𝑀𝑆𝐸(𝑋′𝑛×𝑝𝑋𝑛×𝑝)

−1

Page 39: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

31

3.6.5. Modelo de regresión lineal con variables continuas e indicadoras

Las variables que se utilizan en el análisis de regresión suelen llamarse variables

cuantitativas, lo que significa que estas variables tienen una escala bien definida.

Ejemplos de estas variables son: temperatura, velocidad, altura, peso, etc. En algunas

ocasiones es necesario agregar al modelo de regresión, variables categóricas

(cualitativas) como variables predictoras. Una variable categórica no tiene escala natural,

a esta se le debe asignar un conjunto de niveles para tener en cuenta el efecto que pueda

tener la variable sobre la respuesta, esto mediante el uso de variables indicadoras.

Algunos ejemplos son: sexo de una persona (masculino y femenino), convicción política

(demócrata y republicano), complexión de una persona (gordo, delgado y flaco), etc.

(Montgomery et al., 2006).

Definición. Sea 𝑋𝑗 se la j-ésima variable de un modelo de regresión lineal, esta será una

variable indicadora, siempre que cumpla las dos condiciones siguientes (Kutner et al.,

2004):

𝑋𝑗 es una variable categórica nominal (el orden no importa).

𝑋𝑖𝑗 = 𝑘 para 𝑘 = 0 𝑦 1, y 𝑗 = 1, 2, 3,… , 𝑛.

Suponga un modelo de regresión con las siguientes variables:

𝑌𝑖 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎 𝑒𝑛 𝑙𝑎 𝑖 − é𝑠𝑖𝑚𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛; 𝑖 = 1, 2, … , 𝑛.

𝑋1𝑖 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑜𝑟𝑎 𝑐𝑢𝑎𝑛𝑡𝑖𝑡𝑎𝑡𝑖𝑣𝑎 𝑒𝑛 𝑙𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 𝑖 − é𝑠𝑖𝑚𝑎.

𝑋2𝑖 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑖𝑐𝑎𝑑𝑜𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑖 − é𝑠𝑖𝑚𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛.

Donde:

𝑋2𝑖 = {0 𝑐𝑢𝑎𝑛𝑑𝑜 𝑖 = 𝑚 𝑝𝑟𝑖𝑚𝑒𝑟𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑋1𝑖 1 𝑐𝑢𝑎𝑛𝑑𝑜 𝑖 = 𝑛 −𝑚 ú𝑙𝑡𝑖𝑚𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑋1𝑖

El modelo de regresión es:

𝑦𝑖 = 𝛽0 + 𝛽1𝑋1𝑖 + 𝛽2𝑋2𝑖 + 𝑒𝑖…………………………………………………...…………… (11)

Page 40: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

32

De manera matricial es:

La representación matricial es:

[ 𝑌1𝑌2𝑌3⋮𝑌𝑚𝑌𝑛−𝑚⋮

𝑌𝑛−2𝑌𝑛−1𝑌𝑛 ]

=

[ 111⋮11⋮111

𝑋11𝑋12𝑋13⋮𝑋1𝑚

𝑋1(𝑛−𝑚)⋮

𝑋1(𝑛−2)𝑋1(𝑛−1)𝑋1(𝑛)

𝑋21𝑋22𝑋23⋮

𝑋2𝑚𝑋2(𝑛−𝑚)

⋮𝑋2(𝑛−2)𝑋2(𝑛−1)𝑋2(𝑛) ]

[

𝛽0𝛽1𝛽2

] +

[ 𝑒1𝑒2⋮𝑒𝑚𝑒𝑛−𝑚⋮

𝑒𝑛−2𝑒𝑛−1𝑒𝑛 ]

Dando valores a la variable indicadora queda:

[ 𝑌1𝑌2𝑌3⋮𝑌𝑚𝑌𝑛−𝑚⋮

𝑌𝑛−2𝑌𝑛−1𝑌𝑛 ]

=

[ 111⋮11⋮111

𝑋11𝑋12𝑋13⋮

𝑋1𝑚𝑋1(𝑛−𝑚)

⋮𝑋1(𝑛−2)𝑋1(𝑛−1)𝑋1(𝑛)

000⋮01⋮111]

[

𝛽0𝛽1𝛽2

] +

[ 𝑒1𝑒2⋮𝑒𝑚𝑒𝑛−𝑚⋮

𝑒𝑛−2𝑒𝑛−1𝑒𝑛 ]

Los parámetros se estiman como en el caso de un modelo de regresión múltiple, por lo

tanto, los estimadores son:

�̂� = (𝑋′𝑋)−1𝑋′𝑦

Page 41: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

33

donde:

�̂� = [

�̂�0�̂�1�̂�2

]; y 𝑋 =

[ 111⋮11⋮111

𝑋11𝑋12𝑋13⋮𝑋1𝑚

𝑋1(𝑛−𝑚)⋮

𝑋1(𝑛−2)𝑋1(𝑛−1)𝑋1(𝑛)

000⋮01⋮111]

Lo más importante en este apartado es la interpretación del modelo de regresión,

enseguida se muestra la interpretación del modelo de la Ecuación (11).

El modelo de regresión ajustado para la Ecuación (11) es:

�̂� = �̂�0 + �̂�1𝑋1𝑖 + �̂�2𝑋2𝑖………………………………………………………….................. (12)

El modelo de la Ecuación (12) describe a un fenómeno que tienen la misma pendiente

pero diferente ordenada al origen, esto es, son dos líneas paralelas, una más arriba de

la otra.

𝑦 = {𝛽0 + 𝛽1𝑋1𝑖 + 𝛽2(0) 𝑝𝑎𝑟𝑎 𝑙𝑎𝑠 𝑚 𝑝𝑟𝑖𝑚𝑒𝑟𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠

𝛽0 + 𝛽1𝑋1𝑖 + 𝛽2(1) 𝑃𝑎𝑟𝑎 𝑙𝑎𝑠 ú𝑙𝑡𝑖𝑚𝑎𝑠 𝑛 −𝑚 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠

Lo anterior describe las primeras 𝑚 observaciones, que tienen la ecuación:

𝑦 = �̂�0 + �̂�1𝑋1𝑖

Mientras que las últimas 𝑛 − 𝑚 observaciones tienen por ecuación:

𝑦 = (�̂�0 + �̂�2) + �̂�1𝑋1𝑖 =𝛽′̂0 + �̂�1𝑥1𝑖

donde: 𝛽′̂0 = (�̂�0 + �̂�2)

Note que la variable indicadora tiene dos niveles; esta variable genera dos clases en el

modelo.

Page 42: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

34

Sin embargo, no todos los modelos de regresión con una variable indicadora tendrán la

misma pendiente y misma ordenada al origen, la solución para considerar esta situación

es agregar al modelo una iteración entre la variable cuantitativa y la variable indicadora.

El modelo es:

𝑦𝑖 = 𝛽0 +𝛽1𝑋1𝑖 + 𝛽2𝑋2𝑖 + 𝛽3𝑋1𝑖𝑋2𝑖 + 𝑒𝑖

Retomando las condiciones del modelo de regresión en la Ecuación (11), se tiene:

[ 𝑌1𝑌2𝑌3⋮𝑌𝑚𝑌𝑛−𝑚⋮

𝑌𝑛−2𝑌𝑛−1𝑌𝑛 ]

=

[ 111⋮11⋮111

𝑋11𝑋12𝑋13⋮𝑋1𝑚

𝑋1(𝑛−𝑚)⋮

𝑋1(𝑛−2)𝑋1(𝑛−1)𝑋1(𝑛)

𝑋21𝑋22𝑋23⋮

𝑋2𝑚𝑋2(𝑛−𝑚)

⋮𝑋2(𝑛−2)𝑋2(𝑛−1)𝑋2(𝑛)

𝑋11𝑋21𝑋12𝑋22𝑋13𝑋23⋮

𝑋1𝑚𝑋2𝑚𝑋1(𝑛−𝑚)𝑋2(𝑛−𝑚)

⋮𝑋1(𝑛−2)𝑋2(𝑛−2)𝑋1(𝑛−1)𝑋2(𝑛−1)𝑋1(𝑛)𝑋2(𝑛) ]

[

𝛽0𝛽1𝛽2𝛽3

] +

[ 𝑒1𝑒2⋮𝑒𝑚𝑒𝑛−𝑚⋮

𝑒𝑛−2𝑒𝑛−1𝑒𝑛 ]

𝑦 = {𝛽0 + 𝛽1𝑋1𝑖 +𝛽2(0) + 𝛽3𝑋1𝑖(0) + 𝑒𝑖 𝑝𝑎𝑟𝑎 𝑙𝑜𝑠 𝑚 𝑝𝑟𝑖𝑚𝑒𝑟𝑎𝑠 𝑜𝑏𝑠

𝛽0 + 𝛽1𝑋1𝑖 +𝛽2(1) + 𝛽3𝑋1𝑖(1) + 𝑒𝑖 𝑃𝑎𝑟𝑎 𝑙𝑜𝑠 ú𝑙𝑡𝑖𝑚𝑎𝑠 𝑛 − 𝑚 𝑜𝑏𝑠

Lo anterior describe que los primeros (𝑚 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠) individuos tienen por ecuación:

𝑦 = �̂�0 + �̂�1𝑋1𝑖

Mientras que los últimos (𝑛 − 𝑚 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠) tienen por ecuación:

𝑦 = (�̂�0 + �̂�2) + (�̂�1 + �̂�3)𝑋1𝑖=𝛽′̂0 + 𝛽′̂1𝑋1𝑖

Donde: 𝛽′̂0 = (�̂�0 + �̂�2); y 𝛽′̂1 = (�̂�1 + �̂�3).

Note que la variable indicadora tiene dos niveles; esta variable genera dos clases en el

modelo.

Page 43: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

35

Suponga un modelo de regresión con las variables siguientes:

𝑌𝑖 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎 𝑒𝑛 𝑙𝑎 𝑖 − é𝑠𝑖𝑚𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛. 𝑖 = 1, 2,… , 𝑛

𝑋1𝑖 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑜𝑟𝑎 𝑥1 𝑒𝑛 𝑙𝑎 𝑖 − é𝑠𝑖𝑚𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 .

𝑋2𝑖 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑖𝑐𝑎𝑑𝑜𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑖 − é𝑠𝑖𝑚𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛.

𝑋3𝑖 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑖𝑐𝑎𝑑𝑜𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑖 − é𝑠𝑖𝑚𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛

Donde:

𝑋2𝑖 = {

0 𝑐𝑢𝑎𝑛𝑑𝑜 𝑖 = 𝑚 𝑝𝑟𝑖𝑚𝑒𝑟𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑋1𝑖 1 𝑐𝑢𝑎𝑛𝑑𝑜 𝑖 = 𝑚 + 𝑘 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑟𝑖𝑚𝑒𝑟𝑜𝑠 𝑚 𝑜𝑏𝑠

0 𝑐𝑢𝑎𝑛𝑑𝑜 𝑖 = 𝑛 − (2𝑚 + 𝑘)ú𝑙𝑡𝑖𝑚𝑜𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑋1𝑖 𝑑𝑒 𝑋1𝑖

Donde:

𝑋3𝑖 = {

0 𝑐𝑢𝑎𝑛𝑑𝑜 𝑖 = 𝑚 𝑝𝑟𝑖𝑚𝑒𝑟𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑋1𝑖 0 𝑐𝑢𝑎𝑛𝑑𝑜 𝑖 = 𝑚 + 𝑘 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑟𝑖𝑚𝑒𝑟𝑜𝑠 𝑚 𝑜𝑏𝑠 𝑑𝑒 𝑋1𝑖

1 𝑐𝑢𝑎𝑛𝑑𝑜 𝑖 = 𝑛 − (2𝑚 + 𝑘)ú𝑙𝑡𝑖𝑚𝑜𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑋1𝑖

El modelo de regresión es:

𝑦𝑖 = 𝛽0 + 𝛽1𝑋1𝑖 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 +𝛽4𝑋1𝑖𝑋2𝑖 + 𝛽5𝑋1𝑖𝑋3𝑖 + 𝑒𝑖………………..................... (13)

𝑦𝑛×1 = 𝑋𝑛×6𝛽6×1 + 𝑒𝑛×1

Donde:

𝑦𝑛×1 =

[

𝑌1𝑌2𝑌3⋮𝑌𝑚𝑌𝑚+1𝑌𝑚+2⋮

𝑌𝑚+𝑘𝑌𝑛−(2𝑚+𝑘)

𝑌𝑛−3𝑌𝑛−2𝑌𝑛−1𝑌𝑛 ]

𝛽6×1 =

[ 𝛽0

𝛽1

𝛽2

𝛽3

𝛽4

𝛽5]

𝑒𝑛×1 =

[

𝑒1𝑒2𝑒3⋮𝑒𝑚𝑒𝑚+1𝑒𝑚+2⋮

𝑒𝑚+𝑘𝑒𝑛−(2𝑚+𝑘)

𝑒𝑛−3𝑒𝑛−2𝑒𝑛−1𝑒𝑛 ]

Page 44: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

36

La matriz 𝑋𝑛×6 es:

𝑋𝑛×6 =

[ 1

11⋮

11

1⋮

1

1⋮111

1

𝑋11𝑋12𝑋13⋮

𝑋1𝑚𝑋1𝑚+1𝑋1𝑚+2⋮

𝑋1𝑚+𝑘𝑋1,𝑛−(2𝑚+𝑘)

𝑋1(𝑛−3)𝑋1(𝑛−2)𝑋1(𝑛−1)𝑋1(𝑛)

𝑋21𝑋22𝑋23⋮

𝑋2𝑚𝑋2(𝑚+1)𝑋2(𝑚+2)

𝑋2(𝑚+𝑘)𝑋2,𝑛−(2𝑚+𝑘)

𝑋2(𝑛−3)𝑋2(𝑛−2)𝑋2(𝑛−1)𝑋2(𝑛)

𝑋31𝑋32𝑋33⋮

𝑋3𝑚𝑋3(𝑚+1)𝑋3(𝑚+2)

𝑋3(𝑚+𝑘)𝑋3,𝑛−(2𝑚+𝑘)

𝑋3(𝑛−3)𝑋3(𝑛−2)𝑋3(𝑛−1)𝑋3(𝑛)

𝑋11𝑋21𝑋12𝑋22𝑋13𝑋23⋮

𝑋1(𝑚)𝑋2(𝑚)𝑋1(𝑚+1)𝑋2(𝑚+1)𝑋1(𝑚+2)𝑋2(𝑚+2)

𝑋1(𝑚+𝑘)𝑋2(𝑚+𝑘)𝑋1,𝑛−(2𝑚+𝑘)𝑋2,𝑛−(2𝑚+𝑘)

𝑋1(𝑛−3)𝑋2(𝑛−3)𝑋1(𝑛−2)𝑋2(𝑛−2)𝑋1(𝑛−1)𝑋2(𝑛−1)

𝑋1(𝑛)𝑋2(𝑛)

𝑋11𝑋31𝑋12𝑋32𝑋13𝑋33⋮

𝑋1(𝑚)𝑋3(𝑚)𝑋1(𝑚+1)𝑋3(𝑚+1)𝑋1(𝑚+2)𝑋3(𝑚+2)

𝑋1(𝑚+𝑘)𝑋3(𝑚+𝑘)𝑥1,𝑛−(2𝑚+𝑘)𝑥3,𝑛−(2𝑚+𝑘)

𝑥1(𝑛−3)𝑥3(𝑛−3)𝑥1(𝑛−2)𝑥3(𝑛−2)𝑥1(𝑛−1)𝑥3(𝑛−1)𝑥1(𝑛)𝑥3(𝑛) ]

El modelo de arriba (Ecuación 13) describe a un fenómeno que tiene diferente pendiente

y diferente ordenada al origen, pero ahora el modelo de regresión está dividido por las

variables indicadoras 𝑥2𝑖 y 𝑥3𝑖, en tres clases

𝑦 =

{

𝛽0 + 𝛽1𝑋1𝑖 + 𝛽2(0) + 𝛽3(0) + 𝛽4𝑋1𝑖(0) + 𝛽5𝑋1𝑖(0) + 𝑒𝑖 𝑖 𝑠𝑜𝑛 𝑙𝑎𝑠 𝑚 𝑝𝑟𝑖𝑚𝑒𝑟𝑎𝑠 𝑜𝑏𝑠

𝛽0 + 𝛽1𝑋1𝑖 + 𝛽2(1) + 𝛽3𝑋3𝑖 + 𝛽4𝑋1𝑖(1) + 𝛽5𝑋1𝑖(0) + 𝑒𝑖 𝑖 𝑠𝑜𝑛 𝑙𝑜𝑠 𝑚 + 𝑘 𝑜𝑏𝑠

𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑟𝑖𝑚𝑒𝑟𝑎𝑠 𝑚 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠

𝛽0 + 𝛽1𝑋1𝑖 + 𝛽2(0) + 𝛽3(1) + 𝛽4𝑋1𝑖(0) + 𝛽5𝑋1𝑖(1) + 𝑒𝑖 𝑖 𝑠𝑜𝑛 𝑙𝑎𝑠 ú𝑙𝑡𝑖𝑚𝑜𝑠 𝑛 − (2𝑚 + 𝑘)

ú𝑙𝑡𝑖𝑚𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠

Lo anterior describe que los primeros (𝑚 𝑝𝑟𝑖𝑚𝑒𝑟𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠) tienen por ecuación:

�̂� = �̂�0 + �̂�1𝑋1𝑖

Los siguientes 𝑚+ 𝑘 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑟𝑖𝑚𝑒𝑟𝑎𝑠 𝑚 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 tienen por

ecuación:

�̂� = (�̂�0 + �̂�2) + (�̂�1 + �̂�4)𝑋1𝑖

Page 45: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

37

Mientras que 𝑛 − (2𝑚 + 𝑘) ú𝑙𝑡𝑖𝑚𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 tienen por ecuación:

�̂� = (�̂�0 + �̂�3) + (�̂�1 + �̂�5)𝑋1𝑖

Note que cada variable indicadora tiene tres niveles y estas generan tres clases en el

modelo que son:

En el primer ejemplo donde se empleó únicamente una variable indicadora se formaron

dos clases, mientras que el segundo ejemplo donde se emplearon dos variables

indicadoras se formaron tres clases. Entonces a partir de esta reflexión se tiene la

siguiente proposición:

Proposición. Si se quiere dividir en 𝐾 clases un modelo de regresión, se requieren 𝑘 − 1

variables indicadoras, cada una de estas con 𝐾 niveles.

Prueba de medias: antes de realizar la prueba de dos medias, se tiene que verificar si

𝜎12 = 𝜎2

2, ya que esto depende del estadístico 𝑡 a utilizar.

Prueba de igualdad de varianzas. Se tienen dos poblaciones de tamaño 𝑛1 𝑦 𝑛2 de las

poblaciones 1 y 2, respectivamente.

El contraste de hipótesis es:

{𝐻0: 𝜎1

2 = 𝜎22

𝐻1: 𝜎12 ≠ 𝜎2

2

Donde: 𝜎12 es la varianza de la población 1 y 𝜎2

2 es la varianza de la población 2.

El estadístico se obtiene a partir de:

𝐹0 =𝑆12

𝑆22

Page 46: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

38

Por lo tanto 𝐻0 se rechazará si

𝐹0 > 𝐹𝛼2,𝑛1−1,𝑛2−1

o

𝐹0 < 𝐹1−𝛼2,𝑛1−1,𝑛2−1

𝐹1−𝛼2,𝑛1−1,𝑛2−1

=1

𝐹𝛼2,𝑛1−1,𝑛2−1

Comparación de dos medias. Cuando se desean comparar dos medias para verificar si

estas son significativamente diferentes, se realiza el siguiente contraste de hipótesis.

{𝐻0: 𝜇1 = 𝜇2𝐻1: 𝜇1 ≠ 𝜇2

Donde 𝜇1 es la media de la muestra 1 y 𝜇2 es la media de la muestra 2.

Entonces el estadístico de prueba que se utiliza para comparar las medias de dos

tratamientos es:

con 𝜎12 = 𝜎2

2:

𝑡0 =�̅�1 − �̅�2

𝑆𝑝√1𝑛1+1𝑛2

La cual sigue una distribución t-student.

Page 47: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

39

donde:

�̅�1 𝑦 �̅�2 son las medias muestrales.

𝑛1 𝑦 𝑛2 son los tamaños de las muestras.

𝑆2𝑝 es una estimación de la varianza común 𝜎12 = 𝜎2

2 = 𝜎2, y se calcula:

𝑆𝑝2 =

(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆1

2

𝑛1 + 𝑛2 − 2

donde 𝑆12 𝑦 𝑆2

2 son las varianzas individuales muestrales.

El cálculo de este estadístico puede realizarse mediante el software R.

Por lo tanto, 𝐻0 se rechaza con un nivel de significancia 𝛼 = 5%, y se concluye que hay

diferencias en las medias de los tratamientos si:

|𝑡0| > 𝑡𝑐,𝑛1+𝑛2−2

con 𝜎12 ≠ 𝜎2

2:

𝑡0 =�̅�1 − �̅�2

√𝑆12

𝑛1+𝑆22

𝑛2

Page 48: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

40

Este estadístico no se distribuye como t. No obstante, es una buena aproximación de la

distribución, utilizando como grados de libertad:

𝑣 =(𝑆12

𝑛1+𝑆12

𝑛2 )2

(𝑆12

𝑛1)2

𝑛1+(𝑆22

𝑛2)2

𝑛2

Por lo tanto, 𝐻0 se rechaza con un nivel de significancia 𝛼 = 5%, y se concluye que hay

diferencias en las medias de los tratamientos si:

|𝑡0| > 𝑡𝑐,𝑛1+𝑛2−2

Page 49: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

41

4. Materiales y métodos

4.1. Origen de la información

La información analizada provino de las bases de datos de la Asociación Mexicana de

Criadores de Ganado Jersey de Registro. La característica de análisis fue producción de

leche por lactancia (PL) ajustada a 305 días y equivalente maduro. La información

utilizada para realizar las predicciones de los VGs de los animales consistió de un pedigrí

de 25,376 animales, de éstos se 9,555 tuvieron registros de PL. El pedigrí tuvo animales

nacidos de 1944 a 2014, mientras que los registros de producción fueron observaciones

realizadas de 1992 a 2014. De los 25,376 animales totales, se presentan los resultados

para 22,480 animales; el restante de animales no se utilizaron por no estar genéticamente

conectados directa o indirectamente con animales que tenían registros de

comportamiento.

4.2. Análisis estadísticos para la predicción de valores genéticos

Los análisis estadísticos para la predicción de los valores genéticos se realizaron

mediante el programa de máxima verosimilitud restringida, sin el uso de derivadas y

multivariado (MTDFREML), desarrollado en la Universidad de Nebraska-Lincoln, EE. UU.

(Boldman et al., 1995). El programa contiene un conjunto de subprogramas para la

estimación de componentes de varianzas y covarianzas de los efectos aleatorios, a través

de máxima verosimilitud restringida (REML) sin el uso de derivadas; y posterior a la

estimación de componentes de (co)varianza, permite obtener soluciones a las

ecuaciones de modelos mixtos de Henderson, con propiedades de mejores predictores

lineales insesgados (BLUP) de los efectos aleatorios y de mejores estimadores lineales

insesgados de los efectos fijos (BLUE). El criterio de convergencia del modelo fue

considerado en 1× 10−6, con 300 iteraciones, se realizaron cinco reinicios en el análisis

hasta que el cambio en logaritmo de la función verosimilitud fue menor a 1× 10−4, para

asegurar convergencia global.

Page 50: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

42

Se utilizó un modelo mixto (modelo animal de repetibilidad) que incluyó los efectos

aleatorios genéticos directos (valores genéticos) y los de ambiente permanente en las

vacas, y el efecto fijo de grupo contemporáneo. El efecto fijo de grupo contemporáneo

consideró animales con registros de comportamiento del mismo año, hato y estación

(número de grupos contemporáneos utilizados = 175). Un ejemplo de la presentación de

las HTP predichas empleando el modelo mixto descrito se presenta en el Apéndice 2.

El modelo lineal mixto utilizado se puede representar matricialmente como:

y = Xβ + Zu + WPE + e……………………………………………………………………… (14)

donde:

𝑦: 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑟𝑒𝑔𝑖𝑠𝑡𝑟𝑜𝑠 𝑑𝑒 𝑝𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑒𝑐ℎ𝑒 𝑑𝑒 𝑙𝑎𝑠 𝑣𝑎𝑐𝑎𝑠 (9,555𝑥1),

𝑋: 𝑚𝑎𝑡𝑟𝑖𝑧 𝑞𝑢𝑒 𝑎𝑠𝑜𝑐𝑖𝑎 𝑙𝑜𝑠 𝑟𝑒𝑔𝑖𝑠𝑡𝑟𝑜𝑠 𝑐𝑜𝑛 𝑙𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠 𝑐𝑜𝑛𝑡𝑒𝑚𝑝𝑜𝑟á𝑛𝑒𝑜𝑠 (9,555𝑥175),

𝛽: 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑓𝑖𝑗𝑜𝑠 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠 𝑐𝑜𝑛𝑡𝑒𝑚𝑝𝑜𝑟á𝑛𝑒𝑜𝑠 (175𝑥1),

𝑍: 𝑚𝑎𝑡𝑟𝑖𝑧 𝑞𝑢𝑒 𝑎𝑠𝑜𝑐𝑖𝑎 𝑙𝑜𝑠 𝑟𝑒𝑔𝑖𝑠𝑡𝑟𝑜𝑠 𝑐𝑜𝑛 𝑙𝑜𝑠 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑔𝑒𝑛é𝑡𝑖𝑐𝑜𝑠 𝑑𝑖𝑟𝑒𝑐𝑡𝑜𝑠 (9,555𝑥22,480),

𝑢: 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑔𝑒𝑛é𝑡𝑖𝑐𝑜𝑠 𝑑𝑖𝑟𝑒𝑐𝑡𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑎𝑛𝑖𝑚𝑎𝑙𝑒𝑠 (22,480𝑥1),

𝑊: 𝑚𝑎𝑡𝑟𝑖𝑧 𝑞𝑢𝑒 𝑎𝑠𝑜𝑐𝑖𝑎 𝑙𝑜𝑠 𝑟𝑒𝑔𝑖𝑠𝑡𝑟𝑜𝑠 𝑐𝑜𝑛 𝑙𝑜𝑠 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑝𝑒𝑟𝑚𝑎𝑛𝑒𝑛𝑡𝑒𝑠 (9,555𝑥5,505),

𝑝𝑒: 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑝𝑒𝑟𝑚𝑎𝑛𝑒𝑛𝑡𝑒𝑠 (5,505𝑥1),

𝑒𝑖𝑗 : 𝑣𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑒𝑓𝑒𝑐𝑡𝑜𝑠 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙𝑒𝑠 (9,555𝑥1).

Los VGs predichos por este modelo (Ecuación 14), se dividieron entre dos para generar

las HTP de todos los animales del pedigrí.

Page 51: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

43

4.2.1. Tendencias genéticas

La tendencia genética se calculó promediando las HTP de los animales que nacieron en

un año específico, y mediante una regresión de las medias anuales sobre cada uno de

los periodos de tiempo (año), se realizó una prueba de significancia para la pendiente,

con el fin de obtener la significancia del cambio anual de las HTP. Para la estimación de

la tendencia genética se tomaron las HTP de los individuos con año de nacimiento donde

hubiera un número de individuos mayor o igual que 30. Posteriormente, para el análisis

por periodos se estableció un modelo de regresión con una variable cuantitativa 𝑥1 (años)

y dos variables indicadoras 𝑥2 𝑦 𝑥3, esto con el objetivo de incorporar al modelo los

cambios de pendiente que las HTP presentan en ciertos periodos, estos periodos

representan un efecto denominado intervención. Los periodos considerados fueron tres:

de [1974 a 1993], de [1994 a 2004] y de [2005 a 2014]. El modelo es:

𝑦𝑖 = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + 𝛽3𝑥3𝑖 +𝛽4𝑥1𝑖𝑥2𝑖 + 𝛽5𝑥1𝑖𝑥3𝑖 + 𝑒𝑖………………………………. (15).

Donde:

𝑦𝑖 ∶ 𝑑𝑒𝑛𝑜𝑡𝑎 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝐻𝑇𝑃 𝑑𝑒 𝑙𝑎 𝑖 − é𝑠𝑖𝑚𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛

𝑥1𝑖: 𝑑𝑒𝑛𝑜𝑡𝑎 𝑒𝑙 𝑎ñ𝑜 𝑒𝑛 𝑙𝑎 𝑖 − é𝑠𝑖𝑚𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛

𝑥2𝑖 = {

0 𝑠𝑖 𝒊 [1974,1993]

1 𝑠𝑖 𝒊 [1994,2004]0 𝑠𝑖 𝒊 [2005,2014]

y 𝑥3𝑖 = {

0 𝑠𝑖 𝒊 [1974,1993]

0 𝑠𝑖 𝒊 [1994,2004]1 𝑠𝑖 𝒊 [12005,2012]

Page 52: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

44

En el Cuadro 4 se presenta el efecto intervención en término de periodos.

Cuadro 4. Efecto intervención en término de periodos.

Valor de 𝑥2 Valor de 𝑥3 Periodo efecto

0 0 Periodo [1974,1993]

Inte

rven

ció

n

1 0 Periodo [1994,2004]

0 1 Periodo [2005,2014]

Para el análisis de varianza con el fin de estimar los parámetros y probar la significancia

de la regresión se utilizó el paquete estadístico R, llevando a cabo la función lm.

4.2.2. Comparación de HTP antes y después del inicio de las evaluaciones

genéticas

Se utilizaron las HTP de los animales obtenidos con la Ecuación 14 y se realizó una

prueba de medias (prueba de t-student) de los animales nacidos después de tener

resultados de evaluaciones genéticas y los animales nacidos antes de empezar las

evaluaciones genéticas. La prueba se realizó utilizando el paquete R.

{𝐻0: 𝜇1 = 𝜇2𝐻1: 𝜇1 ≠ 𝜇2

donde:

𝜇1: 𝑚𝑒𝑑𝑖𝑎 𝑎𝑛𝑖𝑚𝑎𝑙𝑒𝑠 𝑛𝑎𝑐𝑖𝑑𝑜𝑠 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 2005.

𝜇2: 𝑚𝑒𝑑𝑖𝑎 𝑎𝑛𝑖𝑚𝑎𝑙𝑒𝑠 𝑛𝑎𝑐𝑖𝑑𝑜𝑠 𝑒𝑛 𝑦 𝑑𝑒𝑠𝑝𝑢é𝑠 𝑑𝑒 2005

Page 53: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

45

5. Resultados y discusión

En el Cuadro 5 se muestra información general descriptiva del comportamiento fenotípico

de la PL de las vacas Jersey del estudio y del comportamiento genético de los animales

(expresados como HTP). Esta información muestra la variabilidad fenotípica y genética

en la característica evaluada en este estudio para esta población.

Cuadro 5. Estadística descriptiva para el comportamiento en la producción de leche por vaca por lactancia ajustada a 305 d y equivalente maduro (PL), y para las habilidades de predicción predichas (HTP) de bovinos Jersey en México.

En la Figura 4 se muestra la distribución fenotípica a través del tiempo, de la PL de vacas

Jersey nacidas de 1992 a 2014. En general, el patrón fenotípico de PL es aumentos y

disminuciones moderadas a través de los años. Lo anterior podría sugerir la no

efectividad en el uso de las evaluaciones genéticas; sin embargo, dadas las

incorporaciones y deserciones de hatos estabulados y en pastoreo pudieran explicar lo

errático en los cambios fenotípicos. Larios-Sarabia et al. (2011) realizaron una

caracterización de los hatos Jersey usados en este estudio, reportando que en ese tiempo

56% de los hatos estuvieron estabulados, 26% en semiestabulados y 19% en pastoreo.

Para estos tres sistemas, la producción de leche en línea por vaca por día fue (estimados

con base en encuestas) 21.6, 16.8 y 13.6 L, respectivamente. Por lo anterior, la

evaluación fenotípica con hatos de diferentes sistemas en diferentes años dificulta la

evaluación del patrón de cambios en PL a través de los años de nacimiento de las vacas.

Usando la misma base de datos, pero con animales nacidos hasta 2008, Larios (2009)

mencionó que los patrones de cambios en la PL a partir de 2004, pudieron deberse a la

salida de la AMCGJR de un socio con gran cantidad de ganado (en sistema estabulado),

Variable Promedio Mínimo Máximo Desviación estándar

PL (kg) 7118.19 1045 14578 2504.31

HTP de PL (kg) 34.72 -1631.96 2009.86 345.02

Page 54: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

46

del cual muchos de sus animales se han ubicado como los mejores en las evaluaciones

genéticas.

Para medir el impacto de las evaluaciones genéticas en el mejoramiento genético de la

población Jersey de México, a continuación, se presentan y discuten los resultados a

través de dos criterios: 1) análisis de la tendencia genética a través de varios periodos, y

2) comparación de medias de las HTP de animales nacidos cuando no se tenían

evaluaciones genéticas y animales nacidos después de implementar las evaluaciones

genéticas.

Criterio 1. Tendencia genética

En la Figura 5 se muestra los valores de las HTP promedio por año de nacimiento de las

vacas. La recta de regresión para las HTP fue:

Figura 4. Distribución por año de nacimiento de la producción de leche (kg/lactancia) por vaca por lactancia ajustada a 305 d y equivalente maduro (PL), de bovinos Jersey en México.

Page 55: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

47

𝐴𝑗𝑢𝑠(𝑯𝑻𝑷) = −20314+ 10.172 ∗ 𝒂ñ𝒐……………………………………………………. (16)

La pendiente estimada de la PL en todo el periodo implicó un progreso genético positivo

aunque pequeño (10.2 kg por año, 1974-2014), lo que representa un cambio genético de

0.14% anual. El ajuste para la Ecuación (16) indica que la pendiente no es

estadísticamente diferente de cero, ya que mediante una prueba conjunta se acepta la

hipótesis nula (𝐻𝑜: 𝛽0 = 𝛽1 = 0) con un valor del P-valor = 7.08e-07. Esto implica que los

parámetros resultaron no ser significativos.

Las tendencias genéticas observadas en la población Jersey de México para producción

de leche, fueron similares a las obtenidas una población Jersey de Costa Rica, aunque

menores que las estimadas en poblaciones Jersey de los EE. UU. y Canadá. En Costa

Rica, Vargas y Solano (1995), y Vargas y Gamboa (2008) estimaron cambios genéticos

Figura 5. Tendencia genética de las habilidades de transmisión predicha (HTP) para producción de leche (kg/lactancia) por vaca por lactancia ajustada a 305 d y equivalente maduro (PL).

1980 1990 2000 2010

-20

0-1

00

01

00

20

03

00

año

HT

P's

P

rom

ed

io

Page 56: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

48

anuales en producción de leche de 12.1 y 7.9 kg, respectivamente (0.28 y 0.17% de las

respectivas medias fenotípicas). En Canadá (CDN, 2009) y los EE. UU. (Blanchard et al.,

1983; Nizamani y Berger, 1996; AIPL, 2009) los cambios genéticos anuales en

producción de leche fluctuaron entre 42 y 77 kg, y como porcentajes de las respectivas

medias fenotípicas 0.57% en Canadá (CDN, 2009) y 0.66% en los EE. UU (AIPL, 2009).

El siguiente modelo es con variables indicadoras que considera los periodos de

intervención:

�̂�𝑖 = �̂�0 + �̂�1𝑥1𝑖 + �̂�2𝑥2𝑖 + �̂�3𝑥3𝑖 + �̂�4𝑥1𝑖𝑥2𝑖 + �̂�5𝑥1𝑖𝑥3𝑖……………………….…………… (17)

Donde:

�̂�𝑖: 𝑑𝑒𝑛𝑜𝑡𝑎 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝐻𝑇𝑃 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑖 − é𝑠𝑖𝑚𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛

𝑥1𝑖: 𝑑𝑒𝑛𝑜𝑡𝑎 𝑒𝑙 𝑎ñ𝑜 𝑝𝑎𝑟𝑎 𝑒𝑙 𝑖 − é𝑠𝑖𝑚𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛

𝑥2𝑖 𝑦 𝑥3𝑖 𝑠𝑜𝑛 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑖𝑛𝑑𝑖𝑐𝑎𝑑𝑜𝑟𝑎𝑠

�̂�𝑖 = 13630− 6.945𝑥1𝑖 − 140400𝑥2𝑖 + 20450𝑥3𝑖 + 70.38𝑥1𝑥𝟐𝒊 − 9.929𝑥1𝑥3𝑖…………... (18)

En la prueba de significancia conjunta de la Ecuación (17), se rechazó la hipótesis nula

(𝐻0: 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 0) con un valor del p-valor=2.2e-16;y a un nivel de

significancia 𝛼 = 0.05 para la Ecuación (18), cinco parámetros individuales resultaron no

significativos. En el Apéndice 3 se muestra el número de observaciones utilizadas para

la regresión (tendencia genética) y los análisis de varianza correspondientes. También

se realizó prueba de normalidad y análisis de residuales, cuyos resultados se muestran

en el Apéndice 4.

El modelo de regresión (Ecuación 18) se describe de manera más explícita (con relación

a sus periodos), por lo que el modelo queda:

𝐴𝑗𝑢𝑠(𝑯𝑻𝑷) = {13630.0 − 6.945 ∗ 𝒂ñ𝒐 𝑃𝑎𝑟𝑎 𝒂ñ𝒐 ∈ [1974,1993] −126770+ 63.435 ∗ 𝒂ñ𝒐 𝑃𝑎𝑟𝑎 𝒂ñ𝒐 ∈ [1994,2004]34080.0− 16.874 ∗ 𝒂ñ𝒐 𝑃𝑎𝑟𝑎 𝒂ñ𝒐 ∈ [2005, 2014]

Page 57: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

49

En la Figura 6 se muestran las HTP estimadas y su ajuste con el modelo de regresión

con la Ecuación (18). Para el primer periodo [1974-1993], la estimación del cambio

genético directo fue −6.945 kg/año. El cambio genético fue pequeño y negativo, esto es,

los valores de las HTP no aumentaron, al contrario, tendieron a disminuir aunque sólo en

forma marginal, posiblemente por falta de una estrategia de selección conjunta de los

criadores. Para el segundo periodo [1994-2004], el estimador del cambio genético directo

fue 63.435 kg/año. El cambio genético fue de magnitud moderada y positivo, esto es, los

valores de las HTP tuvieron un cambio mayor al periodo anterior, posiblemente producto

de importaciones de semovientes (Larios, 2009). Para el tercer periodo [2005-2014], el

estimador del cambio genético directo fue -16.874 Kg/año. El cambio genético fue

negativo (-16.87 kg/año), esto es, los valores de las HTP disminuyeron. Este periodo

coincide con los años en que se ha realizado evaluaciones genéticas, lo que sugiere el

no uso de los resultados de las evaluaciones genéticas en la selección de animales

reproductores.

-300

-200

-100

0

100

200

300

400

19

74

19

76

19

78

19

80

19

82

19

84

19

86

19

88

19

90

19

92

19

94

19

96

19

98

20

00

20

02

20

04

20

06

20

08

20

10

20

12

20

14H

TP p

rom

edio

AñoHTPs promedios Curva de ajuste

Figura 6. Habilidades de transmisión predichas (HTP) ajustadas en la regresión por periodos.

Page 58: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

50

Criterio 2. Comparación de medias para HTP de animales nacidos antes de iniciar y

posterior a las evaluaciones genéticas

Para ilustrar la forma de presentación de los resultados obtenidos en las evaluaciones

genéticas realizadas, en el Cuadro 6 se muestran las HTP de 10 animales. Los primeros

cuatro números de la identificación de los animales representa su año de nacimiento, por

lo que en este ejemplo, los animales nacieron entre 1944 y 1947.

Cuadro 6. Ejemplo de las HTP obtenidas para producción de leche de 10 animales del pedigrí de la población Jersey en México.

En el Cuadro 7 se presentan estadísticos descriptivos de los valores genéticos (HTP), de

las dos clases consideradas (animales nacidos antes y después de realizar las

evaluaciones genéticas).

Animal Clase ID. animal HTP (kg)

1 1 194400001 -117.434

2 1 194400002 -127.339

3 1 194500001 -127.339

4 1 194500002 -127.339

5 1 194600001 -117.434

6 1 194600002 -120.93

7 1 194600003 -127.339

8 1 194700001 6.579

9 1 194700002 6.579

10 1 194700003 -36.594

Page 59: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

51

Cuadro 7. Estadísticos descriptivos para las habilidades de predicción predichas (HTP, kg) para producción de leche por vaca por lactancia ajustada a 305 d y equivalente maduro de bovinos Jersey en México, en animales antes y después de las evaluaciones genéticas (EG).

La prueba de diferencias de medias se realizó mediante la hipótesis:

{𝐻0: 𝜇1 = 𝜇2𝐻1: 𝜇1 ≠ 𝜇2

donde:

𝜇1 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎𝑠 𝐻𝑇𝑃 𝑝𝑎𝑟𝑎 𝑎𝑛𝑖𝑚𝑎𝑙𝑒𝑠 𝑛𝑎𝑐𝑖𝑑𝑜𝑠 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑒𝑣𝑎𝑙𝑢𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑔𝑒𝑛é𝑡𝑖𝑐𝑎𝑠, 𝑦

𝜇2 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎𝑠 𝐻𝑇𝑃 𝑝𝑎𝑟𝑎 𝑎𝑛𝑖𝑚𝑎𝑙𝑒𝑠 𝑛𝑎𝑐𝑖𝑑𝑜𝑠 𝑑𝑒𝑠𝑝𝑢é𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑒𝑣𝑎𝑙𝑢𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑔𝑒𝑛é𝑡𝑖𝑐𝑎𝑠.

Primeramente, en una prueba de igualdad de varianzas el valor estimado de 𝐹 = 1.9677,

lo cual es mayor que 𝐹.052,15586,6892

= 1.03, por lo que se rechaza la hipótesis de nula, y

se concluye que las varianzas son diferentes.

Teniendo en cuenta lo anterior, el estadístico 𝑡 que se utilizó para prueba de medias fue:

𝑡 =(�̅�1 − �̅�2)

√�̂�12

𝑛1+�̂�22

𝑛2

Clases n Media Mínimo Máximo Desviación

estándar

Antes de las EG 15587 -37.34 -1631.96 2009.9 355.5

Después de las EG 6893 197.69 -880.00 1808.9 197.7

Page 60: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

52

Su valor calculado fue 𝑡 = |−56.309|; este es mayor a 𝑡.05,18059 = 1.6449; por lo tanto, se

rechazó la hipótesis nula, lo que equivale a decir que la media de los animales nacidos

antes de las evaluaciones genéticas y la media de animales nacidos después de

iniciadas, resultaron ser estadísticamente diferentes y superiores en estos últimos (-37 vs

198 kg). En el Apéndice 5 se muestra un histograma con el que se verifica la normalidad

de los datos y una visualización de las varianzas así como las medias.

La ventaja en valores genéticos de los animales nacidos posterior al inicio de las

evaluaciones genéticas no permite establecer con precisión el uso e impacto de los

resultados de las evaluaciones, ya que el periodo sin evaluaciones genéticas comprende

un periodo demasiado largo y es de esperarse este resultado. Se sugiere realizar análisis

más detallados que permitan determinar con precisión el uso de las evaluaciones

genéticas.

Page 61: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

53

6. Conclusiones

El comportamiento fenotípico promedio de la producción de leche por lactancia de las

vacas Jersey de México no muestra incremento importante a través de 1974-2014.

El promedio de los valores genéticos en los animales nacidos posterior al inicio de las

evaluaciones genéticas fue mayor que el de los animales nacidos antes del inicio de las

evaluaciones genéticas. Sin embargo, los valores genéticos del ganado Jersey estimados

para animales nacidos durante el periodo 1974-2014, muestran una tendencia genética

positiva pero pequeña, prácticamente de cero. Cuando los análisis fueron realizados por

periodos se muestran cambios genéticos pequeños y negativos para 1974-1993,

moderados y positivos para 1994-2004, y pequeños y negativos para 2005-2014.

En general, los resultados sugieren poco impacto de las evaluaciones genéticas en el

mejoramiento genético de los bovinos Jersey de México, posiblemente porque los

criadores no están usando los resultados de las evaluaciones genéticas para la selección

de animales reproductores.

Page 62: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

54

7. Literatura citada

Abraira, V., y Pérez, A. (1996). Métodos Multivariantes en Bioestadística. Centro de

Estudios Ramón Areces. España.

AIPL (Animal Improvement Programs Laboratory). (2009). Genetic evaluations available

from AIPL. Disponible en: http://aipl.arsusda.gov/eval.htm#summary. Consultada

el 28 de agosto de 2016.

Blanchard, P. J., Everett R. W., and Searle, S. R. (1983). Estimation of genetic trends and

correlations for Jersey cattle. Journal of Dairy Science 66: 1947-1954.

Boldman, K. G., Kriese, L. A., Van Vleck, L. D., Van Tasell, C. P., and Kachman, S. D.

(1995). A manual for use of MTDFREML. A set of programs to obtain estimates of

variances and covariances (Draft). USDA-ARS.

CDN (Canadian Dairy Network). 2009. General articles / reports & lists - Aug 2009.

Disponible en: http://www.cdn.ca/files_ge_articles.php. Consultada el 28 de agosto

de 2016.

CONARGEN (Consejo Nacional de Recursos Genéticos Pecuarios A. C.). (2000). Plan

de Acción. Boletín Técnico. Cd. Victoria, Tamps. 127 p.

Ducrocq, V. (1994). Statistical analysis of length of productive life for dairy cows of the

Normande breed. Journal of Dairy Science 77(3): 855-866.

Falconer, D. S., and Mackay, T. F. C. (1996). Introduction to Quantitative Genetics.

Longman Group Ltd. 4th Edition. Edimburgh, England, UK.

Gasque, R. (2008). Enciclopedia Bovina. Universidad Nacional Autónoma de México

Ciudad Universitaria, México D. F.

González-Peña, D., Guerra, D., Évora, J. C., González, S., y Ortiz, J. (2008). Análisis uni

y multicarácter para las 4 primeras lactancias de vacas Siboney de Cuba. Ciencia

y Tecnología Ganadera 2(3):141-146.

Page 63: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

55

Hartley, H. O., and Rao, J. N. K (1967). Maximum-likelihood estimation for the mixed

analysis of variance model. Biometrika 54: 93-108.

INIA (Instituto Nacional de Investigación Agropecuaria, Uruguay). (2011). Evaluaciones

Genéticas Ovinas. http://www.geneticaovina.com.uy/tendencias.php. Consultado

el 10 de junio de 2016.

INTERBULL (International Bull Evaluation Service). (2009). Description of National

Genetic Evaluation Systems for dairy cattle traits as applied in different Interbull

member countries. Disponible en: http://www-interbull.slu.se/national_

ges_info2/framesida-ges.htm. Consultada el 28 de agosto de 2016.

Kutner, M., Natchtsheim, C., Neter, J., and Li. W. (2004). Applied Linear Statistical

Models. McGraw-Hill Irwin. México, D. F.

Larios S., N. (2009). Caracterización del hato bovino Jersey de registro en México. Tesis

de Maestría en Ciencias. Universidad Autónoma Chapingo. Chapingo, Méx. 125

p.

Larios-Sarabia, N., Ramírez-Valverde, R., Núñez-Domínguez, R., García-Muñiz, J. G.,

and Ruíz-Flores, A. 2011. Technical, social and economic characterization of

companies in the registered Jersey cattle herd in Mexico. Agricultura, Sociedad y

Desarrollo 8: 229-247.

Mathur, P. K., Sullivan, B, and Chesnais, J. (2002). Measuring connectedness: Concept

and application to a large industry breeding program. Proc. 7th World Congr.

Genet. Appl. Livest. Prod., August 19-23. Montpellier, France, p. 13.

McCulloch, C., and Searle, S. (2001). Generalized Linear and Mixed Models. John Wiley

and Sons Inc. New York, NY, USA.

Page 64: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

56

Montaldo, H., Barría, H, y Nelson P. Mejoramiento Genético de Animales. Ciencia al Día

[online]. (1998). Disponible en:

http://ciencia.cl/CienciaAlDia/volumen1/numero2/articulos/cad-2-3.pdf.

Consultado el 26 de agosto de 2016.

Nizamani, A. H., and Berger, P. J. (1996). Estimates of genetic trend for yield traits of the

registered Jersey population. Journal of Dairy Science 79: 487-494.

Ochoa G., P. (1997). Estructura genética de la ganadería. Papel de los criadores de

ganado bovino de registro en el mejoramiento genético. In: Memorias del Primer

Foro de Análisis de los Recursos Genéticos de la Ganadería Bovina. 17-19 de

noviembre. México, D. F. Pp: 9-11.

Mrode, R. A., and Thompson, R. (2005). Linear Models for the Prediction of Animal

Breeding Values. CABI Publishing. USA.

Montgomery, D., Peck, E., y Vining, G. (2006). Introducción al Análisis de Regresión

Lineal. Editorial Continental. México, D. F.

Núñez D., R., Ramírez V., R., Ruiz F., A., y Domínguez V., J. (2004). Resumen de

Evaluaciones Genéticas para Ganado Jersey 2004. Boletín Técnico.

Departamento de Zootecnia. Universidad Autónoma Chapingo. Chapingo, México.

Núñez D., R., Ramírez V., R., Ruiz F., A., Domínguez V., J., y Chin C., R. (2005).

Resumen de Evaluaciones Genéticas para Ganado Jersey 2005. Boletín Técnico.

Departamento de Zootecnia. Universidad Autónoma Chapingo. Chapingo, México.

Núñez D., R., Ramírez V., R., Ruiz F, A., y Gallegos R, R. (2008). Resumen de

Evaluaciones Genéticas para Ganado Jersey 2008. Boletín Técnico.

Departamento de Zootecnia. Universidad Autónoma Chapingo. Chapingo, México.

Núñez D., R., Ramírez V., R., Ruiz F, A., y Gallegos R, R. Resumen de Evaluaciones

Genéticas para Ganado Jersey 2010. Boletín Técnico. Departamento de

Zootecnia. Universidad Autónoma Chapingo. Chapingo, México.

Page 65: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

57

Núñez D., R., Ramírez V., R., Saavedra J., L. A., y Zepeda B., J. L. (2013). Resumen de

Evaluaciones Genéticas para Ganado Jersey 2013. Boletín Técnico.

Departamento de Zootecnia. Universidad Autónoma Chapingo. Chapingo, México.

Núñez D., R., Ramírez V., R., Ruíz F., A., Hidalgo M., J. Á. (2016). Resumen de

Evaluaciones Genéticas para Sementales Jersey 2014. Boletín Técnico.

Departamento de Zootecnia. Universidad Autónoma Chapingo. Chapingo, México.

Núñez D., R., Ramírez V., R., Ruíz F., A., Hidalgo M., J. Á. (2017). Resumen de

Evaluaciones Genéticas para sementales Jersey 2016. Boletín Técnico.

Departamento de Zootecnia. Universidad Autónoma Chapingo. Chapingo, México.

Parra-Bracamonte, G. M., Martínez-González, J. C., García-Esquivel, F. J., González, A.,

Briones, F., Cienfuegos-Rivas, E. G. (2007). Tendencias genéticas y fenotípicas

de características de crecimiento en el ganado Brahman de registro de México.

Revista Científica, FCV-LUZ 17(3): 262–267.

Powell, L., and Norman, D. (2006). Major Advances in genetic evaluation techniques.

Journal of Dairy Science 89: 1337-1346.

Ramírez, J., Gualdrón, J. L., Corrales, J. D., y Buitrago, S. M. (2016). Evaluación Genética

Bovinos Jersey de Colombia. Programa Nacional de Mejoramiento Genético.

Colombia. pp. 10-13.

Ramírez-Valverde, R., Núñez-Domínguez, R., Ruíz-Flores, A., García-Muñiz J. G., y

Magaña-Valencia, F. (2008). Comparison of contemporary group definitions for

genetic evaluations of Braunvieh cattle. Técnica Pecuaria en México 46(4): 359-

370.

Ramírez-Valverde, R., Peralta-Aban, J. A., Núñez-Domínguez, R., Ruíz-Flores, A.,

García-Muñiz, J. G., and T. B. García-Peniche. (2010). Genotype by feeding

system interaction in the genetic evaluation of Jersey cattle for milk yield. Animal

4: 1971-1975.

Page 66: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

58

Ramírez-Valverde, R., Núñez-Domínguez, R., Palacios-Jiménez, A. L., and Jiménez-

Carrasco, S. (2014). Characterization of dairy cattle germplasm used in Mexico

with national genetic evaluations in importing and exporting countries. Livestock

Science 167: 51-57.

Ramírez-Valverde, R., Ramírez-Valverde, G., Núñez-Domínguez, R., Delgadillo-Zapata,

R. A., and Hernández-León, M. (2016). Association between genetic evaluation

and judgment in the show-ring of dairy and beef cattle. Revista Colombiana de

Ciencias Pecuarias 29: 25-32.

Ravangolo, O., Rovere, G., Aguilar, I., Gimeno, D., y La Buonora, D. (2002). Evaluación

Genética Nacional Raza Holando. Boletín Técnico. Instituto Nacional para el

Mejoramiento Lechero. Facultad de Agronomía. Instituto Nacional de

Investigaciones. Montevideo, Uruguay. 59 p.

Searle, S. R. (1997). Linear Models. John Wiley & Sons. New York, USA. 532 p.

Vargas L., B., y Solano P. C. (1995). Tendencias genéticas en producción de leche en

vacas lecheras de Costa Rica. Archivos Latinoamericanos en Producción Animal

3(2): 165-176.

Vargas, B., y Gamboa, G. (2008). Estimación de tendencias genéticas e interacción

genotipo ambiente en ganado lechero de Costa Rica. Técnica Pecuaria en México

4: 378-380.

Page 67: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

59

Apéndices

Apéndice 1. Ilustración en un ejemplo hipotético del uso del modelo animal simple para

predecir valores genéticos de los animales y su programación en el paquete estadístico

SAS.

Ejemplo: se desea predecir los valores genéticos de los siguientes animales.

Suponiendo: 𝜎𝑢2 = 20 𝑦 𝜎𝑒

2 = 40 .

Utilizando un modelo animal simple.

𝑦8 = 𝑋8×2𝛽2 + 𝑍8×8𝑈8 + 𝑒8

donde:

𝑦𝑖𝑗 𝑑𝑒𝑛𝑜𝑡𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑑𝑎 𝑝𝑒𝑠𝑜 𝑑𝑒𝑙 𝑎𝑛𝑖𝑚𝑎𝑙 𝑖 − é𝑠𝑖𝑚𝑜 𝑑𝑒 𝑠𝑒𝑥𝑜 𝑗 − é𝑠𝑖𝑚𝑜.

𝛽𝑗 𝑑𝑒𝑛𝑜𝑡𝑎 𝑢𝑛 𝑒𝑓𝑒𝑐𝑡𝑜 𝑓𝑖𝑗𝑜 ( 𝑠𝑒𝑥𝑜 𝑑𝑒𝑙 𝑎𝑛𝑖𝑚𝑎𝑙). 𝑗 = 1 𝑦 2.

𝑢𝑖 𝑑𝑒𝑛𝑜𝑡𝑎 𝑒𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜 (𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑖𝑟𝑒𝑐𝑡𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑎𝑛𝑖𝑚𝑎𝑙). 𝑖 = 1, 2,… , 8.

𝑒 𝑑𝑒𝑛𝑜𝑡𝑎 𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 𝑎𝑙𝑒𝑡𝑜𝑟𝑖𝑜

Suposiciones:

𝐸 (𝑦𝑢𝑒) = (

𝑋𝛽00) Y 𝑉 (

𝑦𝑢𝑒) = (

𝑉 𝑍𝐺 𝑅𝐺𝑍𝑡 𝐺 0𝑅 0 𝑅

) donde:

ID Animal Sexo Padre Madre GDP (kg)

4 Macho 1 - 4.5

5 Hembra 3 2 2.9

6 Hembra 1 2 3.9

7 Macho 4 5 3.5

8 Macho 3 6 5.0

1 Macho . . .

2 Hembra . . .

3 macho . . .

GDP = ganancia de peso. Fuente: Mrode y Thompson (2005).

𝐺 = 𝐴𝜎𝑢2

𝑉 = 𝑍𝐺𝑍𝑡 + 𝑅

𝑅 = 𝐼𝜎𝑒2

Page 68: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

60

Donde de acuerdo con lo revisado, se puede establecer:

[𝑋′𝑋 𝑋′𝑍 𝑍′𝑋 𝑍′𝑍 + 𝐴−1𝜆

] [�̂�

𝑈] = [

𝑋′𝑦

𝑍′𝑦]

Estas matrices son:

Haciendo las operaciones matriciales correspondientes se obtiene el vector de

soluciones:

(

�̂�1�̂�2

�̃�1�̃�2�̃�3�̃�4�̃�5�̃�6�̃�7�̃�8)

=

(

4.35853.4044

0.0985−0.018−.0411−0.041−0.086−0.1850.1769−0.24940.1826 )

Page 69: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

61

A continuación, se presentan los resultados y el programa en SAS para resolver las

ecuaciones de modelos mixtos:

Programa en SAS:

Se Ingresa el pedigrí en donde la primer columna pertenece al animal, la segunda a el

macho y la tercera a la hembra, los puntos representan información no disponible.

data pedg;

input ANIMAL PADRE MADRE;

CARDS;

1 . .

2 . .

3 . .

4 1 .

5 3 2

6 1 2

7 4 5

8 3 6

;

proc print;

run;

Con el siguiente procedimiento se obtiene la matriz A.

proc inbreed data=pedg covar outcov=amatrix;

var animal padre madre;

proc print;

run;

Solución para efectos fijos

Efecto Sexo Estimador Error

Estándar Valor t

Macho 1 4.3585 4.7016 0.93

Hembra 2 3.4044 5.3803 0.61

Predicción de valores genéticos

Observación Efecto Animal Predicción

1 Animal 4 -.0861

2 Animal 5 -.1852

3 Animal 6 0.1769

4 Animal 7 -0.2494

5 Animal 8 0.1826

Page 70: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

62

Enseguida se introduce el registro de los animales, en este caso GDP (kg)

data carg;

input animal sexo y;

CARDS;

1 . .

2 . .

3 . .

4 1 4.5

5 2 2.9

6 2 3.9

7 1 3.5

8 1 5.0

;

proc print;

run;

Con las siguientes indicaciones se obtendrá la matriz “A” de endogamia, para posteriormente utilizarla en PROC MIXED.

data L2DATA;

set amatrix;

parm = 1;

row = _n_;

proc print;

run;

Para obtener los estimadores de los efectos fijos y los componentes de varianza.

proc mixed data=carg noprofile;

class sexo animal;

model y = sexo /solution noint covb;

random animal /type=lin(1) LDATA=L2data solution;

parms (20) (40) /noiter;

ods listing exclude solutionr;

ods output solutionr = solutionr;

proc print;

run;

data solutionr;

set solutionr;

accuracy = (40-StderrPred**2)/40;

proc print;

run;

title 'predicciones valores geneticos';

proc print data=solutionr (obs=30);

run;

Page 71: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

63

Apéndice 2. Ejemplo de valores de HTP para PL de animales Jersey (únicamente se

presentan las HTP de 30 animales).

Animal Año de nacimiento HTP (kg)

194400002 1944 -127.339328

194500001 1945 -127.339328

194500002 1945 -127.339328

194600001 1946 -117.433871

194600002 1946 -120.930244

194600003 1946 -127.339328

194700001 1947 6.5791085

194700002 1947 6.5791085

194700003 1947 -36.59355

194800001 1948 -153.517046

194800002 1948 -1.1935295

194800003 1948 -31.3086275

194800004 1948 -32.502157

194800005 1948 -3.511932

194900001 1949 -234.867741

194900002 1949 -3.511932

194900003 1949 8.3397325

194900004 1949 8.3397325

194900005 1949 -254.678656

194900006 1949 -45.2258075

194900007 1949 -45.2258075

194900009 1949 -254.678656

194900010 1949 -432.849674

194900011 1949 24.6224025

194900012 1949 24.6224025

195000001 1950 32.4353525

195000002 1950 -18.1273355

195000003 1950 -10.691757

195000004 1950 -50.562688

195000005 1950 13.1582175

195000006 1950 -241.860489

Page 72: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

64

Apéndice 3. Número de observaciones utilizadas para estimar las tendencias genéticas,

mediante análisis de regresión y la salida de su correspondiente análisis de varianza.

Año n Promedio de

HTP´s (PL en kg)

1994 552 -230.53

1995 712 -203.86

1996 887 -206.83

1997 770 -197.02

1998 938 -164.14

1999 969 -120.90

2000 1136 -16.45

2001 1020 161.18

2002 1023 249.05

2003 1215 284.71

2004 1312 327.79

2005 1160 255.72

2006 951 210.20

2007 916 195.02

2008 1276 219.17

2009 541 231.16

2010 623 166.87

2011 515 150.85

2012 555 113.40

2013 308 108.38

2014 48 100.82

Año n Promedio de

HTP´s (PL en kg)

1974 34 -62.42

1975 42 -103.72

1976 48 -104.55

1977 36 -71.70

1978 56 -84.99

1979 68 -130.59

1980 96 -145.00

1981 98 -133.44

1982 109 -159.93

1983 149 -151.75

1984 162 -169.75

1985 252 -175.78

1986 230 -153.62

1987 306 -127.61

1988 358 -167.48

1989 458 -163.16

1990 502 -196.56

1991 550 -195.45

1992 550 -207.54

1993 645 -233.39

Parámetros Estimadores Error estándar P-valor individual

𝛽0 1.363e+04 3.243e+03 0.000173

𝛽1 -6.945e+00 1.635 0.000153

𝛽2 -1.404e+05 8.667e+03 2e-16

𝛽3 2.045e+04 9.877e+03 0.045795

𝛽4 7.038e+01 4.340 2e-16

𝛽5 -9.929 4.922 0.051390

Page 73: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

65

Apéndice 4. Verificación de los supuestos para el ajuste del modelo para estimar las

tendencias genéticas.

Page 74: dicifo.chapingo.mxdicifo.chapingo.mx/pdf/tesislic/2018/Cortes_Basilio_Gregorio.pdf · la aplicación de un ejemplo práctico, utilizando bases de estadística y su relación con el

66

Apéndice 5. Histograma de las HTP de los animales nacidos antes y después de las

evaluaciones genéticas, respectivamente.