capítulo 2 probabilidad - agro.uba.ar · por ejemplo, los eventos a y b son mutuamente excluyentes...

22
30 Capítulo 2 PROBABILIDAD Una característica de la agricultura extensiva es que homogeneiza el paisaje. Esto se vincula con el uso eficiente de los equipos e insumos, con la simplificación de las operaciones de cultivo, cosecha y transporte y con la fuerte demanda de algunos productos en el mercado internacional. Bajo estas condiciones, la homogeneidad el paisaje agrícola tiene notables ventajas económicas. Sin embargo, también trae aparejados aumentos en el riesgo económico y el riesgo ambiental asociados con la destrucción del hábitat de muchos organismos, con la contaminación, las plagas y adversidades climáticas y con las fluctuaciones del mercado. En el marco de una investigación sobre los cambios en la estructura del paisaje rural en el partido de Tiacalín, un equipo de ingenieros agrónomos y licenciados en ciencias ambientales se propone estimar las proporciones (frecuencias relativas) de establecimientos con modalidades de explotación ganadera, agrícola-ganadera, agrícola y otra en el partido. Para realizar esta inferencia estadística, sortearán 100 establecimientos rurales entre los 2719 del partido y registrarán cuál de las cuatro modalidades de explotación se lleva a cabo en cada uno. Luego, usarán la distribución de frecuencias relativas de diferentes modalidades observada entre los 100 establecimientos como estimaciones de la correspondiente distribución entre los 2719 establecimientos del partido. Como la selección de cada establecimiento se hará por sorteo, el registro de su modalidad de explotación podrá dar uno cualquiera de los cuatro resultados

Upload: others

Post on 14-Oct-2019

32 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

30

Capítulo 2

PROBABILIDAD

Una característica de la agricultura extensiva es que homogeneiza el paisaje. Esto se vincula con el uso eficiente de los equipos e insumos, con la simplificación de las operaciones de cultivo, cosecha y transporte y con la fuerte demanda de algunos productos en el mercado internacional. Bajo estas condiciones, la homogeneidad el paisaje agrícola tiene notables ventajas económicas. Sin embargo, también trae aparejados aumentos en el riesgo económico y el riesgo ambiental asociados con la destrucción del hábitat de muchos organismos, con la contaminación, las plagas y adversidades climáticas y con las fluctuaciones del mercado.

En el marco de una investigación sobre los cambios en la estructura del paisaje rural en el partido de Tiacalín, un equipo de ingenieros agrónomos y licenciados en ciencias ambientales se propone estimar las proporciones (frecuencias relativas) de establecimientos con modalidades de explotación ganadera, agrícola-ganadera, agrícola y otra en el partido. Para realizar esta inferencia estadística, sortearán 100 establecimientos rurales entre los 2719 del partido y registrarán cuál de las cuatro modalidades de explotación se lleva a cabo en cada uno. Luego, usarán la distribución de frecuencias relativas de diferentes modalidades observada entre los 100 establecimientos como estimaciones de la correspondiente distribución entre los 2719 establecimientos del partido.

Como la selección de cada establecimiento se hará por sorteo, el registro de su modalidad de explotación podrá dar uno cualquiera de los cuatro resultados

Page 2: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

31

diferentes (ganadera, agrícola-ganadera, agrícola u otra). Por eso este procedimiento es lo que se llama un experimento aleatorio. Este experimento aleatorio tiene mayor probabilidad de dar como resultado el registro de una modalidad muy frecuente que el de una poco frecuente entre los establecimientos del partido. En consecuencia, es razonable esperar que las frecuencias relativas de diferentes modalidades entre los 100 establecimientos se aproximen a las frecuencias relativas entre los 2719 del partido y eso justifica usarlas como estimación. Sin embargo, según cuáles establecimientos resulten sorteados, la estimación cometerá mayor o menor error.

Los procedimientos de inferencia estadística están diseñados de modo tal que la probabilidad de cometer un error que se considere grave es estipulada de antemano. Por eso, antes de estudiar estos procedimientos, debemos examinar en profundidad la noción de probabilidad y revisar los métodos para su cálculo.

Experimento aleatorio Un experimento aleatorio puede producir diferentes resultados en diferentes oportunidades en que se lo lleve a cabo.

Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos

qué cara queda hacia arriba obtendremos uno de seis resultados posibles. Si repetimos

esta acción, puede ocurrir que obtengamos un resultado diferente del primero. En ese

caso, no podremos explicar la diferencia como el efecto de aplicar procedimientos

distintos porque en ambas oportunidades habremos hecho lo mismo. El procedimiento

que consiste en agitar el dado dentro de un cubilete, arrojarlo sobre la mesa y registrar

qué cara queda hacia arriba es un experimento aleatorio, un procedimiento que puede

producir diferentes resultados cada vez que se lo ejecuta. El procedimiento que consiste

en sortear un establecimiento rural del partido de Tiacalín (p.ej. con un bolillero) y

registrar su modalidad de explotación es también un experimento aleatorio, dado que

produce diferentes resultados según cuál establecimiento resulte elegido en el sorteo.

Definiciones:

Un experimento es una acción o procedimiento preestablecido que produce un

resultado que se registra.

Un experimento aleatorio es aquel que no necesariamente produce el mismo

resultado cada vez que se lo lleva a cabo.

No todo experimento es aleatorio. Por ejemplo, el experimento que consiste en

calentar agua pura en un ambiente con presión controlada de exactamente 1 atm y

registrar su temperatura cuando comienza a hervir puede producir sólo un resultado

(100ºC). Por eso, este procedimiento no es un experimento aleatorio.

Todo experimento aleatorio tiene su base en procesos físicos que ocurren en

algún sistema material o dispositivo experimental. En el experimento del dado, el

dispositivo experimental está formado por un cubilete, un dado y una mesa y el proceso

físico necesario es generado deliberadamente cuando agitamos el cubilete. En otros

experimentos, los procesos físicos aleatorios ocurren naturalmente. Por ejemplo, si

dejamos que una planta heterocigota para un gen que controla el color de las flores se

autofecunde, cultivamos las semillas que produce y registramos la distribución de

frecuencias de diferentes colores de flores entre las plantas hijas, obtendremos uno de

muchos resultados posibles. Esto se debe a que los granos de polen se dispersan y

alcanzan los estigmas de las flores como resultado de procesos similares a la agitación

de un dado dentro del cubilete.

Page 3: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

32

Azar

El azar es una característica del comportamiento de objetos materiales.

Cuando un experimento es aleatorio, existe la posibilidad de que produzca diferentes

resultados sin que haya diferencias en el procedimiento. Este tipo de variabilidad se llama

azar. Su existencia en los sistemas macroscópicos se explica por los accidentes o

casualidades, esto es, por encuentros entre procesos con causas independientes. Una

multitud de accidentes como los que ocurren cuando se agita un dado o cuando el polen se

dispersa hacia los estigmas provoca la variabilidad azarosa en los resultados de muchos

experimentos aleatorios. El azar es esencial en la inferencia estadística porque se usa para

obtener muestras aleatorias.

Azar e incertidumbre

El azar provoca incertidumbre pero no toda incertidumbre nace del azar.

Como un experimento aleatorio puede dar diferentes resultados, tenemos incertidumbre

acerca de qué resultado producirá. Sin embargo, lo que distingue a un experimento

aleatorio no es el carácter incierto sino el carácter azaroso de sus resultados. Mientras el

azar es una propiedad objetiva del comportamiento de un sistema material, la

incertidumbre es el estado de conciencia que alguien experimenta en relación con algo

que ignora total o parcialmente, se trate o no del resultado que dará un experimento

aleatorio. La incertidumbre varía entre personas que tienen diferente información o

diferente capacidad para interpretarla.

El azar provoca incertidumbre pero la incertidumbre no es privativa del azar. En

la investigación de la estructura del paisaje rural del partido de Tiacalín, los profesionales

registrarán las frecuencias relativas de diferentes modalidades de explotación entre 100

establecimientos a elegir por sorteo. Luego, utilizarán los registros que obtengan como

estimaciones de las verdaderas frecuencias relativas de cada modalidad entre todos los

establecimientos del partido. Las frecuencias a registrar ente los 100 establecimientos

son inciertas porque dependen del azar de los sorteos a realizar. En cambio, las

correspondientes frecuencias relativas entre todos los establecimientos del partido

resultan inciertas para estos profesionales solamente por falta de suficiente información.

Eventos y espacio muestral

Los resultados que puede producir un experimento aleatorio se llaman eventos y el conjunto de todos ellos se llama espacio muestral.

El conjunto de todos los resultados que puede producir un experimento aleatorio se

denomina espacio muestral. Por ejemplo, en el experimento del dado, el espacio

muestral es el conjunto S = {1, 2, 3, 4, 5 ,6}. Cada uno de los seis resultados elementales

contenidos en el espacio muestral es un evento simple. Los eventos simples pueden ser

agrupados en eventos compuestos como por ejemplo los eventos A = {1, 3, 5}, “que

salga un número impar”, B = {2, 4, 6}, “que salga un número par”, o C = {1, 2, 3},

“que salga número menor que 4”1.

1 La condición de evento simple no es absoluta sino que depende del detalle con que se registre

el resultado del experimento aleatorio. En el experimento del dado, los elementos de S son

eventos simples porque sólo se registra qué cara queda hacia arriba sin distinguir entre los

diferentes ángulos posibles de rotación horizontal de esa cara.

Page 4: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

33

Figura 2.1. Representación en forma de

diagrama de Venn del espacio muestral del

experimento aleatorio que consiste en agitar un

dado en un cubilete, arrojarlo sobre una mesa y

registrar qué cara queda hacia arriba. El espacio

muestral S incluye los eventos simples 1, 2, 3,

4, 5 y 6. Dentro de dicho espacio muestral

podemos definir, por ejemplo, los eventos

compuestos A, número impar, B, número par y

C, número menor que 4. Los eventos A y B son

mutuamente excluyentes y complementarios.

Los eventos A y C no son mutuamente

excluyentes, tampoco lo son los eventos B y C.

Unión e intersección entre eventos

La unión de eventos 𝐵 ∪ 𝐶 significa 𝐵 𝒐 𝐶 y la intersección entre eventos 𝐵 ∩ 𝐶 significa 𝐵 𝒚 𝐶.

Todo evento compuesto constituye la unión de otros eventos. Por ejemplo, el evento

“que no salga el 5” es {1, 2, 3, 4, 6} = 𝐵 ∪ 𝐶, la unión del evento B con el evento C

(Figura 2.1). El evento 𝐵 ∪ 𝐶 ocurre si ocurre el evento B o el evento C.

Algunos eventos constituyen la intersección de otros eventos. El evento “que

salga el 2” es {2} = 𝐵 ∩ 𝐶, la intersección entre los eventos B y C (Figura 2.1). El

evento 𝐵 ∩ 𝐶 ocurre sólo si ocurren conjuntamente los eventos B y C.

Eventos mutuamente excluyentes y eventos complementarios Dos o más eventos son mutuamente excluyentes (o incompatibles) si no pueden ocurrir

como resultado de una misma ejecución del experimento aleatorio. Por ejemplo, los

eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita

y tira un dado una vez no puede salir un número que sea impar y también par, pero sí

puede salir un número que sea par y también menor que cuatro (el 2). En particular, todos

los eventos simples son mutuamente excluyentes. Por ejemplo, si se agita y tira el dado

una vez es imposible que salga el 1 y también el 3. La intersección entre eventos

mutuamente excluyentes es siempre el conjunto vacío, por ejemplo A ∩ B= ∅ (Figura

2.1).

Dos eventos son complementarios si son mutuamente excluyentes y además su

unión abarca todo el espacio muestral (son exhaustivos). Por ejemplo, los eventos A y B

son complementarios porque A ∩ B= ∅ y A ∪ B= S (Figura 2.1). Dado un evento

cualquiera E, denotaremos a su evento complementario como Ec, por ejemplo B = Ac.

Experimento aleatorio y realización

Cuando un experimento aleatorio ha sido ejecutado su resultado es irrevocable.

Como vimos, un experimento aleatorio es un procedimiento que puede producir

diferentes resultados. Sin embargo, esta posibilidad sólo existe mientras el experimento

no ha sido ejecutado. Una vez que el experimento ha sido ejecutado, el resultado que se

obtiene queda fijo y no cabe la posibilidad de que sea otro. Un resultado producido por

una ejecución del experimento aleatorio se denomina una realización de dicho

experimento.

Page 5: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

34

Un triste ejemplo de la diferencia entre un experimento aleatorio y su realización

es el que me tocó vivir luego de un sorteo del Gordo de Navidad. Poco antes había

comprado un billete con el número 16.354, decididamente uno de los posibles resultados

del sorteo. Mi número era un evento que integraba el espacio muestral del experimento

aleatorio que se realizaría y yo me ilusionaba con ganar el Gordo. Cuando salió el

66.190, debí abandonar mi ilusión definitivamente. Podía tirar mi billete a la basura. El

66.190 es la realización de ese experimento y como tal es fija e irrevocable.

Muestreo aleatorio: un experimento aleatorio básico para la inferencia estadística

La inferencia estadística utiliza experimentos aleatorios para obtener información parcial sobre poblaciones de interés.

Los profesionales que investigan la estructura del paisaje rural en el partido de Tiacalín

utilizarán un método de sorteo (p. ej. un bolillero) para elegir 100 de los 2719

establecimientos rurales del partido. En cada establecimiento seleccionado registrarán si

la modalidad de explotación es ganadera, agrícola-ganadera, agrícola u otra.

En el procedimiento descripto, el conjunto de los 2719 establecimientos rurales

del partido de Tiacalín constituye la población de referencia, cada uno de los

establecimientos es una unidad muestral, el subconjunto de la población formado por

los 100 establecimientos elegidos al azar es una muestra aleatoria y la modalidad de

explotación es la variable de interés. Como los establecimientos serán elegidos por

sorteo y no todos los establecimientos del partido tienen igual modalidad de explotación,

será posible registrar diferentes modalidades en cada selección. Es decir que la obtención

de la información correspondiente a cada unidad muestral es un experimento aleatorio.

En este caso, el espacio muestral del experimento aleatorio es S = {exclusivamente

ganadera, agrícola-ganadera, exclusivamente agrícola, otra}. A su vez, la serie de 100

selecciones aleatorias necesaria para completar la muestra aleatoria constituye un

experimento aleatorio en sí mismo ya que puede dar diferentes resultados que son las

diferentes secuencias de modalidades de explotación que pueden registrarse cuando se

ejecute.

Población y espacio muestral

La obtención de una muestra aleatoria involucra dos conjuntos de índole muy diferente que no

debemos confundir, la población de referencia y el espacio muestral. La población es una

colección de objetos materiales (p.ej. establecimientos) del cual la muestra es un subconjunto.

Como cada objeto de la muestra se elige por sorteo y en él se registra una característica que

es variable en la población, cada registro a obtener es un evento aleatorio. El espacio muestral

es el conjunto de los eventos posibles; se trata de un conjunto formal y no material porque no

reúne cosas sino características de las cosas (p.ej. modalidades de explotación).

Probabilidad La probabilidad de un evento es el potencial o disposición que un sistema

material tiene para producirlo.

Como vimos, todo experimento aleatorio ocurre en algún dispositivo experimental, un

sistema material que, cada vez que se acciona, produce alguno de los eventos contenidos

en el espacio muestral. Ese dispositivo tiene cierto potencial o disposición para producir

Page 6: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

35

cada uno de los eventos. Llamaremos probabilidad de un evento particular al potencial

o disposición que el dispositivo experimental tiene para producirlo. Esta es la acepción

realista de la palabra probabilidad; alude a una propiedad física real de un sistema

material. Por ejemplo, si decimos que la probabilidad de que salga un número menor que

cuatro en el experimento del dado es mayor que la probabilidad de que salga uno mayor

que cuatro, afirmamos que el dispositivo experimental formado por el cubilete, el dado

y la mesa tiene mayor potencial para producir el evento C = {1, 2, 3} que el evento

D = {5, 6}. Esta afirmación podrá ser cierta o falsa según a qué cubilete, dado y mesa se

refiera. En el contexto de la inferencia estadística, cada vez que usemos la palabra

probabilidad nos referiremos estrictamente a su acepción realista2.

Probabilidad en el lenguaje vulgar y probabilidad en inferencia estadística

Es importante distinguir el estrecho significado que la palabra probabilidad tiene para la

inferencia estadística de su laxo significado en el lenguaje vulgar. En el lenguaje vulgar la

palabra probabilidad se asocia con incertidumbre, provenga ésta del azar o simplemente de

nuestra falta de información o comprensión. Por ejemplo, cuando decimos que probablemente

llueva, nos referimos al comportamiento azaroso de la atmósfera, pero cuando decimos que

probablemente haya llovido, manifestamos nuestra falta de información acerca de si cayó lluvia

o no. Esta doble acepción de la palabra probabilidad es admisible en el lenguaje vulgar porque

resulta comprensible, pero no es válida en el contexto de la inferencia estadística, en del cual

sólo es válida la acepción realista que asocia la palabra probabilidad únicamente con azar.

La probabilidad de un evento se manifiesta como la frecuencia relativa con que ocurre.

Según la acepción realista de la palabra, la probabilidad del evento C designa una

propiedad física real del dispositivo experimental formado por el cubilete, el dado y la

mesa; se trata de un potencial que este dispositivo experimental tiene aun cuando no es

accionado. Cuando el dispositivo experimental es accionado muchas veces ese potencial

se manifiesta como la frecuencia relativa con que ocurre en evento C. Si un evento C es

más probable que un evento D, el evento C debe ocurrir más frecuentemente que el

evento D en una serie suficientemente larga de repeticiones del experimento aleatorio.

Por eso, la medida de la probabilidad de un evento debe cumplir reglas consistentes con

las propiedades de las frecuencias relativas. Estas reglas son estipuladas por la definición

axiomática de probabilidad.

Definición axiomática de probabilidad

Formalmente, la probabilidad es una función P que vincula cada evento de un espacio muestral S con un valor en el intervalo [0, 1].

Consideremos el conjunto S, denominado espacio muestral, que contiene todos los

eventos que puede producir un experimento aleatorio. Definimos la probabilidad como

2 La palabra probabilidad ha sido usada con acepciones contrastantes en la literatura científica y

filosófica. Esto ha provocado numerosos malentendidos y fuertes controversias. La acepción de

probabilidad que utilizamos aquí, denominada realista siguiendo a Mario Bunge, se vincula con

el azar y sólo permite atribuir valores de probabilidad a eventos aleatorios. Una acepción

alternativa vincula la palabra probabilidad con la incertidumbre y justifica la atribución de

probabilidades a cualquier hecho desconocido. Esta última acepción no se aplica a la probabilidad

(riesgo) de error que se preestablece en los procedimientos de inferencia estadística.

Page 7: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

36

una función P que asocia un número real a cada subconjunto del espacio muestral S

(incluido el conjunto vacío ∅) y que satisface los siguientes axiomas o proposiciones que

damos por ciertas sin demostración:

Axioma I Para cualquier evento A contenido en S,

𝑃[𝐴] ≥ 0 (2.1)

Axioma II Si A, B , C , … son eventos mutuamente excluyentes contenidos en S, entonces la

probabilidad de que ocurra alguno de ellos, esto es la probabilidad de su unión, es,

𝑃[𝐴 ∪ 𝐵 ∪ 𝐶 ∪ … ] = 𝑃[𝐴] + 𝑃[𝐵] + 𝑃[𝐶] + ⋯ (2.2)

Axioma III La probabilidad de que ocurra el evento S es,

𝑃[𝑆] = 1 (2.3)

Teoremas derivados de los axiomas de probabilidad

Teorema I

Si A es un evento contenido en S, la probabilidad de su evento complemento Ac es,

𝑃[𝐴𝑐] = 1 − 𝑃[𝐴] (2.4)

Consecuencia de la definición de evento complementario y los Axiomas II y III. Ver figura 2.1.

Teorema II

La probabilidad de un evento que constituye el conjunto vacío es 0.

𝑃[∅] = 0 (2.5)

Consecuencia de Axioma III y Teorema I.

Teorema III Si A y C son dos eventos cualesquiera contenidos en S, la probabilidad de que ocurra uno o el otro, es decir la probabilidad de su unión, es,

𝑃[𝐴 ∪ 𝐶] = 𝑃[𝐴] + 𝑃[𝐶] − 𝑃[𝐴 ∩ 𝐶] (2.6)

Consecuencia del Axioma II. Ver figura 2.1.

Asignación de valores de probabilidad

Dado que la probabilidad de un evento se manifiesta como la frecuencia relativa con que

éste ocurre cuando el experimento aleatorio que puede producirlo se repite muchas

veces, el valor que asignamos a su probabilidad es el de dicha frecuencia relativa.

Dependiendo de las características del experimento aleatorio en cuestión, se pueden usar

dos criterios para asignar los valores a las probabilidades de diferentes eventos.

Page 8: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

37

Si los eventos simples tienen igual probabilidad…

Si a cada evento simple se asigna igual probabilidad, el valor de probabilidad de un evento compuesto es el cociente entre el número de eventos simples que abarca y el total de eventos simples del espacio muestral.

Existen experimentos aleatorios para los cuales asignar igual probabilidad a todos los

eventos simples constituye un criterio razonable. Por ejemplo, en el experimento del

dado, si se agita bien el cubilete y el dado está balanceado, es razonable asignar igual

probabilidad a los seis resultados elementales posibles. En ese caso, asignaremos

probabilidad de 1/6 a cada uno de los eventos simples (por Axiomas II y III).

Si el espacio muestral S de un experimento aleatorio incluye un número finito k de

eventos simples de modo que S = {E1, E2, …, Ek} y los k eventos simples son

igualmente probables entonces el valor que asignamos a la probabilidad de cada

evento simple Ei es,

𝑃[𝐸𝑖] =1

𝑘 , para todo 𝑖 = 1, … , 𝑘 (2.7)

En consecuencia, cuando es razonable asignar igual probabilidad a todos los

eventos simples de un espacio muestral S, la probabilidad de un evento compuesto A

contenido en S se calcula como el cociente entre h, el número de eventos simples en A,

y k, el total de eventos simples en S (por Axioma II).

𝑃[𝐴] =ℎ

𝑘 (2.8)

Por ejemplo, en el experimento del dado balanceado, es razonable asignar al

evento D = {5, 6}, “que salga un número mayor que 4”, la probabilidad,

𝑃[𝐷] =2

6

Este criterio para asignar probabilidades es muy importante para la inferencia

estadística porque se vincula con el muestreo aleatorio. Por ejemplo, para obtener la

muestra aleatoria de 100 establecimientos rurales del partido de Tiacalín, se utiliza un

dispositivo (p.ej. un bolillero bien construido) que razonablemente justifica asignar igual

probabilidad a que cualquiera de los 2719 establecimientos de la población de referencia

resulte sorteado. Por esa razón, si definimos al evento compuesto G como la selección

de un establecimiento que realiza ganadería, se justifica asignar a P[G] el valor de la

frecuencia relativa de establecimientos que realizan ganadería, es decir de aquellos con

modalidad exclusivamente ganadera o agrícola-ganadera en el partido de Tiacalín.

Si los eventos simples pueden tener diferente probabilidad…

El valor que asignamos a la probabilidad de un evento es aquel en el cual su frecuencia relativa se estabiliza razonablemente en una secuencia suficientemente larga de repeticiones del experimento aleatorio.

A diferencia del dado bien balanceado y del bolillero bien construido, existen

dispositivos experimentales que evidentemente tienen diferente potencial para producir

los distintos eventos simples. Por ejemplo, si dejamos caer una tostada untada con

mermelada y registramos qué cara queda hacia el piso realizamos un experimento

aleatorio cuyo espacio muestral tiene dos eventos simples cuyas probabilidades son muy

diferentes… como muchos hemos lamentado alguna vez.

Page 9: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

38

Dado que la probabilidad de un evento cualquiera debe manifestarse como su

frecuencia relativa en muchas repeticiones del experimento aleatorio, la aproximación

realista a la medida de la probabilidad de un evento E es el valor en el cual se estabiliza

la frecuencia relativa de E cuando el experimento aleatorio se repite un número

suficiente de veces.

Si el evento E es un subconjunto del espacio muestral S de un experimento aleatorio,

el valor que asignamos a la probabilidad de E es,

𝑃[𝐸] =𝑚

𝑛 (2.9)

donde m es la frecuencia absoluta de E en n repeticiones del experimento, y n es

suficiente como para que el cociente m / n se estabilice razonablemente.

Este criterio es válido para asignar valores de probabilidad a los resultados de

cualquier experimento aleatorio, inclusive aquellos que producen eventos simples

igualmente probables. Además, este criterio tiene precedencia sobre la ecuación 2.8. Por

ejemplo, si la frecuencia relativa con que sale el 2 en muchas repeticiones del

experimento del dado se aparta notablemente de 1/6, concluimos que el dado no está

balanceado y por eso no corresponde usar la fórmula 2.8. El valor que asignamos

entonces a la probabilidad del evento {2} no es 1/6 sino el de la frecuencia relativa

observada, como estipula la fórmula 2.9.

Además, este criterio es el que da significado a cualquier afirmación particular

sobre la probabilidad de un evento aleatorio. Por ejemplo, si se dice que la probabilidad

de que el Glifosato mate una planta de una maleza es 0,97, es correcto interpretar que se

afirma que el Glifosato tiene un potencial para matar las plantas de esa maleza que se

manifestará como una frecuencia relativa de plantas muertas cercana a 0,97 cuando se

aplique a muchas plantas. De modo similar, si se afirma que la probabilidad de que la

aplicación de Glifosato en un lote agrícola contribuya a la contaminación del curso de

agua de una cuenca es de 0,66, es correcto interpretar que se afirma que si se aplica

Glifosato en un número suficiente de lotes de la cuenca, la frecuencia relativa de

aplicaciones que contribuirán a la contaminación del curso de agua se aproximará a 0,66.

En particular, esta interpretación es la que corresponde a las probabilidades de

error que se preestablecen en la inferencia estadística. Por ejemplo, supongamos que

para investigar la estructura del paisaje rural del partido de Tiacalín se usará un

procedimiento de inferencia estadística que preestablece que la probabilidad de cometer

un error que supere ± 0,1 en la estimación de la proporción de establecimientos

ganaderos es menor que 0,05. En ese caso, es correcto interpretar que, si ese

procedimiento se repite un número suficiente de veces, la frecuencia relativa de

estimaciones que difieran en más que 0,1 de la verdadera proporción de establecimientos

ganaderos entre los 2719 establecimientos del partido será menor que 0,05 (5%).

Distribución de probabilidad

Dado que los valores de probabilidad corresponden a frecuencias relativas, la distribución de

dichas frecuencias se extiende a las probabilidades. Los valores de probabilidad de todos los

eventos contenidos en el espacio muestral de un experimento aleatorio constituyen una

distribución de probabilidad. En el próximo capítulo examinaremos diferentes modelos de

distribución de probabilidad que, como una distribución de frecuencias, se pueden describir

con tablas y gráficos y resumir con medidas de posición y de dispersión.

Page 10: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

39

Probabilidad conjunta y probabilidad marginal

Probabilidad conjunta es la probabilidad de la intersección entre dos o más eventos y probabilidad marginal es una suma especial de probabilidades conjuntas.

Los profesionales que investigan la estructura del paisaje rural en el partido de Tiacalín

elegirán establecimientos al azar (por sorteo) y registrarán su modalidad de explotación.

En cada establecimiento elegido, deberán obtener dos piezas separadas de información:

¿se realiza ganadería? y ¿se realiza agricultura? Con las respuestas a estas dos preguntas,

clasificarán cada establecimiento en una de las cuatro modalidades que constituyen los

eventos simples del espacio muestral S = {exclusivamente ganadera, agrícola-

ganadera, exclusivamente agrícola, otra}. En este espacio muestral, cada respuesta

posible a una de las preguntas determina un evento compuesto y cada evento simple es

la intersección (ocurrencia conjunta) de dos eventos compuestos. Por ejemplo, el evento

“agrícola-ganadera” es la intersección de los eventos A “se realiza agricultura” y G “se

realiza ganadería” (Figura 2.2).

Figura 2.2. Espacio muestral del

experimento aleatorio que consiste en

elegir al azar un establecimiento rural

del partido de Tiacalín y registrar su

modalidad de explotación. S, espacio

muestral; G, evento compuesto “se

realiza ganadería”; A, evento

compuesto “se realiza agricultura”,

Gc y Ac son los correspondientes

complementos.

En casos como éste, resulta práctico describir el espacio muestral mediante una

tabla denominada tabla de contingencias (Figura 2.3). En la tabla, los eventos

compuestos aparecen en las celdas de los márgenes y los eventos simples aparecen en

las celdas interiores ubicadas en las intersecciones de la fila y la columna

correspondientes a los eventos compuestos que ocurren conjuntamente en cada uno.

Agricultura

Sí No

Ganadería

Sí agrícola-

ganadera

exclusivamente

ganadera

G = se realiza

ganadería

No exclusivamente

agrícola otra

Gc =no se realiza

ganadería

A = se realiza

agricultura

Ac = no se realiza

agricultura S

Figura 2.3. Tabla de contingencias que describe el espacio muestral del experimento

aleatorio que consiste en elegir al azar un establecimiento rural del partido de Tiacalín y registrar su modalidad de explotación.

La probabilidad de la intersección entre dos (o más) eventos se llama

probabilidad conjunta porque constituye la probabilidad de que dichos eventos ocurran

Page 11: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

40

conjuntamente en una realización del experimento aleatorio. Por ejemplo, la

probabilidad de cada evento simple representado en la tabla de contingencias de la

Figura 2.3 es una probabilidad conjunta.

Definición:

Sean los eventos A, B, C,… pertenecientes al espacio muestral S, llamamos

probabilidad conjunta de A, B, C,… a la probabilidad del evento definido como su

intersección.

𝑃[𝐴 ∩ 𝐵 ∩ 𝐶 ∩ … ] (2.10)

La probabilidad de cada evento compuesto representado en los márgenes de la

tabla de contingencias es una probabilidad marginal. Cada probabilidad marginal es

igual a la suma de las probabilidades conjuntas correspondientes a los eventos que

componen el evento compuesto en cuestión (por Axioma II).

Definición:

Sean el evento compuesto A perteneciente al espacio muestral S y sean n eventos

compuestos mutuamente excluyentes E1, E2,…, En, cuya unión abarca todo el

espacio muestral S, la probabilidad marginal de A es la siguiente suma de

probabilidades conjuntas,

𝑃[𝐴] = 𝑃[𝐸1 ∩ 𝐴] + 𝑃[𝐸2 ∩ 𝐴] + ⋯ + 𝑃[𝐸𝑛 ∩ 𝐴] (2.11)

La tabla de contingencias se puede usar para presentar la distribución de

frecuencias observadas así como la distribución de probabilidad entre los diferentes

eventos. Por ejemplo, la distribución de probabilidad ente los diferentes eventos que

pueden resultar de sortear un establecimiento rural del partido de Tiacalín y registrar su

modalidad de explotación podría ser la que se muestra en la Figura 2.4.

Agricultura

Sí No

Ganadería Sí 0,24 0,33 0,57

No 0,42 0,01 0,43

0,66 0,34 1,00

Figura 2.4. Tabla de contingencias con la distribución de probabilidad en el

espacio muestral del experimento aleatorio que consiste en elegir al azar un

establecimiento rural del partido de Tiacalín y registrar su modalidad de

explotación.

En la tabla de contingencias leemos que la probabilidad conjunta de los

eventos A, “se realiza agricultura” y G, “se realiza ganadería”, el evento simple

“agrícola-ganadera” es 0,24 (Figura 2.4). Usando la fórmula 2.10 escribimos,

𝑃[𝐴 ∩ 𝐺] = 0,24

También leemos que la probabilidad marginal del evento “se realiza

ganadería” (se realice o no agricultura) es 0,57. Usando la fórmula 2.11 escribimos,

𝑃[𝐺] = 𝑃[𝐴 ∩ 𝐺] + 𝑃[𝐴𝑐 ∩ 𝐺]

= 0,24 + 0,33

= 0,57

Notemos que la suma de todas las probabilidades conjuntas es 𝑃[𝑆] = 1.

Page 12: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

41

Probabilidad condicional

La probabilidad condicional se calcula como el cociente entre la probabilidad conjunta y la probabilidad marginal del evento impuesto como condición.

El potencial de un dispositivo experimental para producir un evento aleatorio B puede

variar según el experimento produzca o no un evento aleatorio A. Por ejemplo, si el

dispositivo experimental está formado por un árbol y su entorno, la probabilidad de que

una semilla de dicho árbol llegue a germinar puede variar según ésta caiga cerca o lejos

del árbol. En ese caso, diríamos que la probabilidad de que una semilla germine (evento

B) bajo la condición de que caiga cerca del árbol (evento A) es diferente de la

probabilidad de que germine bajo la condición de que caiga lejos del árbol (evento Ac).

Cada una de estas probabilidades es una probabilidad condicional. Para denotar la

probabilidad del evento aleatorio B condicional a la ocurrencia del evento aleatorio A,

escribiremos 𝑃[𝐵|𝐴] y lo leeremos “probabilidad de B dado A” o “probabilidad de B si

ocurre A”.

La probabilidad de B dado A es un potencial del dispositivo experimental que se

manifiesta como la frecuencia relativa con que ocurre el evento B entre muchas

repeticiones del experimento aleatorio en las que ocurre el evento A. Esta frecuencia

relativa se puede calcular como el cociente entre las frecuencias relativas del evento

A ∩ B y del evento A, es decir como el valor que asignamos a la probabilidad conjunta

de A y B dividido por el valor que asignamos a la probabilidad marginal de A. Por eso,

Si A y B son dos eventos aleatorios pertenecientes al espacio muestral S y P[A] > 0,

entonces la probabilidad de B dado A se calcula como,

𝑃[𝐵|𝐴] =𝑃[𝐴 ∩ 𝐵]

𝑃[𝐴] (2.12)

Es decir que la probabilidad condicional se calcula como el cociente entre la

probabilidad conjunta de los dos eventos y la probabilidad marginal del evento

impuesto como condición3.

La fórmula 2.12 implica que la probabilidad conjunta de dos eventos aleatorios A y

B se puede escribir como,

𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴]. 𝑃[𝐵|𝐴] (2.13)

En la investigación sobre la estructura del paisaje rural del partido de Tiacalín,

una pregunta importante que los profesionales se formulan de antemano es cuánto vale

la probabilidad condicional de sortear un establecimiento que realiza ganadería dado que

realiza agricultura. A partir de las probabilidades (conjuntas y marginales) que figuran

en la tabla de contingencias de la Figura 2.4, calculamos el valor de esta probabilidad

condicional como,

𝑃[𝐺|𝐴] =𝑃[𝐴 ∩ 𝐺]

𝑃[𝐴]=

0,24

0,66= 0,36

3 Si en lugar 𝑃[𝐵|𝐴] nos interesa 𝑃[𝐴|𝐵], debemos calcular,

𝑃[𝐴|𝐵] =𝑃[𝐴 ∩ 𝐵]

𝑃[𝐵]

Notemos que la diferencia entre 𝑃[𝐵|𝐴] y 𝑃[𝐴|𝐵] está en el denominador del cociente que, en

cada caso, es la probabilidad marginal del evento impuesto como condición.

Page 13: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

42

Como el sorteo se realizará con un dispositivo que asegura igual probabilidad

de seleccionar cualquier establecimiento del partido, los profesionales entienden que el

valor de esta probabilidad condicional coincide con el de la frecuencia relativa de

establecimientos que realizan ganadería entre aquellos que realizan agricultura dentro

del partido de Tiacalín. Notemos que, en este caso, la probabilidad condicional

𝑃[𝐺|𝐴] = 0,36

es menor que la probabilidad marginal

P[𝐺] = 0,57.

Es decir que, en este caso, la probabilidad de sortear un establecimiento que

realiza ganadería dado que también realiza agricultura es menor que la probabilidad de

sortear un establecimiento que realiza ganadería, realice o no agricultura. Esta diferencia

cobrará especial significado en la próxima sección referida a la independencia

estadística.

Ley de probabilidad total y teorema de Bayes

La noción de probabilidad condicional es la base de dos reglas conocidas que tienen

cierta utilidad para el cálculo de probabilidades.

Dados los eventos aleatorios A y B pertenecientes al espacio muestral S de un

experimento aleatorio, se cumple que:

𝑃[𝐵] = 𝑃[𝐴]. 𝑃[𝐵|𝐴] + 𝑃[𝐴𝑐]. 𝑃[𝐵|𝐴𝑐] (2.14)

Esta igualdad, consecuencia de Axioma II y la ecuación 2.13, se conoce con el nombre de Ley de probabilidad total. Además,

𝑃[𝐴|𝐵] =𝑃[𝐴]. 𝑃[𝐵|𝐴]

𝑃[𝐵] (2.15)

Esta igualdad, consecuencia de las ecuaciones 2.12 y 2.13, se conoce como teorema de Bayes.

Independencia estadística Dos eventos A y B son estadísticamente independientes si la probabilidad condicional de B dado A es igual a la probabilidad condicional de B dado AC.

Si el valor de la probabilidad de que una semilla germine difiere según ésta caiga cerca

o lejos del árbol progenitor, se hace evidente cierta forma de dependencia entre el evento

B, “que la semilla germine” y el evento A, “que caiga cerca del árbol”. En ese caso,

diremos que, por alguna razón, la probabilidad de que una semilla germine depende de

dónde ésta caiga4. Si en cambio la probabilidad de que una semilla germine (evento B)

tiene igual valor caiga ésta cerca (evento A) o lejos (evento Ac) del árbol progenitor

decimos que los eventos B y A son estadísticamente independientes.

4 Más adelante veremos que esta forma de dependencia puede ocurrir sin que un evento sea causa

del otro.

Page 14: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

43

Definición:

Los eventos aleatorios A y B pertenecientes al espacio muestral S son

estadísticamente independientes si se cumple que,

𝑃[𝐵|𝐴] = 𝑃[𝐵|𝐴𝑐] (2.16)

Es decir que los eventos A y B son estadísticamente independientes si la probabilidad

de B dado A es igual a la probabilidad de B dado el evento complementario de A.

Si A y B son eventos estadísticamente independientes: • la probabilidad de B dado A es igual a la probabilidad marginal de B y • la probabilidad conjunta de A y B es igual al producto de sus

probabilidades marginales.

La independencia estadística entre dos eventos aleatorios tiene dos consecuencias que

permiten reconocerla. La primera es que si dos eventos A y B son estadísticamente

independientes, entonces la probabilidad condicional del evento B dado A tiene igual

valor que la probabilidad marginal de B,

𝑃[𝐵|𝐴] = 𝑃[𝐵] (2.17)

La segunda consecuencia es que, si dos eventos A y B son estadísticamente

independientes, entonces la probabilidad de que ocurran conjuntamente tiene igual valor

que el producto de sus probabilidades marginales,

𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴]. 𝑃[𝐵] (2.18)

Demostración:

Demostraremos las ecuaciones 2.17 y 2.18, consecuencias de la independencia

estadística entre dos eventos aleatorios.

La Ley de Probabilidad Total (ecuación 2.14) establece que,

𝑃[𝐵] = 𝑃[𝐴]. 𝑃[𝐵|𝐴] + 𝑃[𝐴𝑐]. 𝑃[𝐵|𝐴𝑐]

Si A y B son eventos independientes, la definición 2.16 implica que podemos reemplazar 𝑃[𝐵|𝐴𝑐] por 𝑃[𝐵|𝐴], sacar factor común y escribir,

𝑃[𝐵] = 𝑃[𝐵|𝐴]. (𝑃[𝐴] + 𝑃[𝐴𝑐])

Pero el Teorema I (ecuación 2.4) implica que 𝑃[𝐴] + 𝑃[𝐴𝑐] = 1. Por eso

𝑃[𝐵] = 𝑃[𝐵|𝐴]

Como establece la ecuación 2.17.

Este resultado nos permite reemplazar la probabilidad condicional 𝑃[𝐵|𝐴] por la

probabilidad marginal 𝑃[𝐵] en la ecuación 2.13 para obtener la ecuación 2.18,

𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴]. 𝑃[𝐵]

Queda demostrado que si A y B son eventos estadísticamente independientes, la probabilidad condicional de B dado A tiene igual valor que la probabilidad marginal de B y la probabilidad conjunta de A y B tiene igual valor que el producto de sus probabilidades marginales.

Page 15: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

44

Las probabilidades que aparecen en la tabla de contingencias de la Figura 2.4

implican que en el partido de Tiacalín el valor de la probabilidad condicional de sortear

un establecimiento que realiza ganadería dado que realiza agricultura es, como ya vimos,

𝑃[𝐺|𝐴] =𝑃[𝐴 ∩ 𝐺]

𝑃[𝐴]=

0,24

0,66= 0,36

mientras el valor de la probabilidad condicional de sortear un establecimiento que realiza

ganadería dado que no realiza agricultura es mucho mayor.

𝑃[𝐺|𝐴𝑐] =𝑃[𝐴𝑐 ∩ 𝐺]

𝑃[𝐴𝑐]=

0,33

0,34= 0,97

Es decir que, según la definición 2.16, los eventos G, “realiza ganadería”, y A, “realiza

agricultura” no son estadísticamente independientes en este caso.

La dependencia estadística entre estos eventos se pone también en evidencia

cuando se comprueba que el valor de 𝑃[𝐺|𝐴] no es igual que el de 𝑃[𝐺], la probabilidad

marginal de sortear un establecimiento que realiza ganadería realice o no agricultura

(ecuación 2.17). Como ya calculamos,

𝑃[𝐺|𝐴] = 0,36 ≠ 0,57 = 𝑃[𝐺]

La tercera manera de establecer que G y A no son estadísticamente

independientes es comparar su probabilidad conjunta con el producto de sus

probabilidades marginales (ecuación 2.18),

𝑃[𝐴 ∩ 𝐺] = 0,24

𝑃[𝐴]. 𝑃[𝐺] = 0,66 . 0.57 = 0,38

y comprobar que 𝑃[𝐴 ∩ 𝐺] ≠ 𝑃[𝐴]. 𝑃[𝐺]. En el capítulo 7 veremos que esta

comparación es la que se usa en inferencia estadística para producir generalizaciones

acerca de la posible falta de independencia entre dos eventos.

Reconocemos que n eventos aleatorios son estadísticamente independientes si su probabilidad conjunta es igual al producto de todas sus probabilidades marginales.

La ecuación 2.18 es muy importante porque permite ampliar de modo sencillo la noción

de independencia estadística a cualquier número de eventos aleatorios.

Definición:

Sean n eventos aleatorios E1, E2,… En pertenecientes al espacio muestral S. Los

eventos E1, E2,… En son estadísticamente independientes si se cumple que,

𝑃[𝐸1 ∩ 𝐸2 ∩ … ∩ 𝐸𝑛] = 𝑃[𝐸1]. 𝑃[𝐸2] … 𝑃[𝐸𝑛] (2.19)

Es decir que los eventos E1, E2,… En son estadísticamente independientes si su

probabilidad conjunta es igual a la productoria de sus probabilidades marginales.

Dependencia estadística y causalidad

La falta de independencia estadística entre dos eventos puede reflejar una conexión causal entre ellos pero no demuestra la existencia de tal conexión.

En el partido de Tiacalín, la probabilidad de sortear un establecimiento rural donde se

realice ganadería es mucho mayor bajo la condición de que no realice agricultura que

Page 16: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

45

bajo la condición de que realice agricultura. Esto podría deberse a que la introducción

de la agricultura en muchos establecimientos causara la exclusión de la ganadería. Sin

embargo, la falta de independencia estadística no alcanza para demostrar tal conexión

causal porque admite otras explicaciones razonables. Por ejemplo, si en el partido de

Tiacalín hubiera establecimientos con tierras aptas para la ganadería pero no para la

agricultura, la frecuencia relativa de establecimientos que realizan ganadería sería mayor

entre los que no realizan agricultura que entre los que realizan agricultura. Esto se

reflejaría en una mayor probabilidad condicional de sortear un establecimiento que

realiza ganadería bajo la condición de que no realice agricultura que bajo la condición

de que sí realice agricultura.

En diversos ecosistemas se ha comprobado que, para muchas especies de

árboles, la probabilidad de que una semilla germine es mayor si cae lejos que si cae cerca

del árbol progenitor. En ocasiones, esta falta de independencia estadística puede deberse

a que las semillas que caen cerca del árbol progenitor están más expuestas a hongos

patógenos que las que caen lejos. En este caso, existe una conexión causal entre el evento

“que la semilla caiga cerca del árbol” y el evento “que la semilla no germine”. Sin

embargo, la misma diferencia entre probabilidades condicionales podría deberse a que

las semillas con mayor capacidad para germinar (p. ej. más grandes) fueran también las

más atractivas para los animales que las transportan lejos del árbol progenitor. Estos

ejemplos demuestran que la sola observación de falta de independencia estadística entre

dos eventos no alcanza para demostrar que exista entre ellos una conexión causal.

Cuestionario 1. ¿Qué es un experimento aleatorio? ¿Cuál es su característica distintiva?

2. ¿A qué nos referimos cuando decimos azar?

3. ¿Qué es la incertidumbre y qué relación guarda con el azar?

4. ¿A qué se llama evento y a qué se llama espacio muestral?

5. ¿Qué es un evento simple y qué es un evento compuesto?

6. ¿Qué son eventos mutuamente excluyentes? ¿Cuál es la intersección entre dos eventos mutuamente excluyentes?

7. ¿Qué son eventos complementarios? ¿Cuál es la intersección y cuál es la unión entre dos eventos complementarios?

8. ¿A qué llamamos realización de un experimento aleatorio? ¿Qué propiedad tiene?

9. ¿Qué experimento aleatorio está involucrado en la obtención de una muestra aleatoria? ¿Qué diferencia hay entre población de referencia y espacio muestral de ese experimento?

10. ¿Cuál es la acepción realista de la palabra probabilidad que se aplica en la inferencia estadística?

11. ¿Qué diferencia existe entre la acepción realista de la palabra probabilidad y su significado en el lenguaje vulgar?

12. ¿Qué relación guarda la probabilidad con la frecuencia relativa?

13. ¿Cuál es la definición axiomática de la probabilidad? ¿Cuáles son los tres axiomas que incluye?

14. ¿Cuánto vale la probabilidad del evento complementario de cualquier evento A?

15. ¿Cuánto vale la probabilidad del conjunto vacío?

16. ¿Cuánto vale la probabilidad de la unión de dos eventos cualesquiera?

17. ¿Qué alternativas existen para asignar valores de probabilidad? ¿Cuál tiene precedencia?

Page 17: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

46

18. ¿Qué aplicación tiene en inferencia estadística la asignación de valores de probabilidad sobre la base de eventos simples con igual probabilidad? ¿Cómo se asegura que sea correcto aplicar esta aproximación?

19. ¿Qué papel cumple en inferencia estadística la asignación de valores de probabilidad a partir de frecuencias relativas en un número suficiente de repeticiones del experimento aleatorio?

20. ¿A qué se denomina probabilidad conjunta y a qué probabilidad marginal?

21. ¿Qué es una tabla de contingencias?

22. ¿A qué se denomina probabilidad condicional? ¿Cómo se denota? ¿Cómo se calcula?

23. ¿Qué establecen la Ley de Probabilidad Total y el Teorema de Bayes?

24. ¿Cómo definimos la independencia estadística entre dos eventos aleatorios?

25. ¿Cómo se puede reconocer la independencia estadística a partir de las probabilidades conjuntas y marginales?

26. ¿Cómo definimos la independencia estadística entre un número arbitrario de eventos aleatorios?

27. ¿Cómo es la relación entre falta de independencia estadística y conexión causal?

Ejercicios

2.1 Las monedas de 25 centavos tienen de un lado la imagen del cabildo de Buenos Aires (“cara”) y del otro el número que indica su valor (“ceca”). Todas son de igual tamaño y peso pero algunas son doradas y otras plateadas. Imaginemos el procedimiento que consiste en arrojar dos monedas de 25 centavos, una dorada y otra plateada, y registrar si cada una queda con “cara” o con “ceca” hacia arriba al caer.

a. ¿Por qué el procedimiento descripto es un experimento aleatorio? ¿Cuál es el dispositivo experimental y cómo se lo acciona?

b. ¿Qué eventos simples componen el espacio muestral de este experimento aleatorio? Representar este espacio muestral con un diagrama de Venn.

c. Sobre el diagrama de Venn, señalar un evento compuesto, indicar a qué unión de eventos simples corresponde y cuál es su evento complementario.

d. Señalar el evento “que la moneda dorada quede con “cara” hacia arriba”. ¿Se trata de un evento simple o compuesto? ¿Por qué?

e. Señalar el evento “no quedan las dos monedas con “cara” hacia arriba”. ¿Se trata de un evento simple o compuesto? ¿Por qué?

f. Señalar el evento “una de las monedas queda con “cara” hacia arriba y la otra no”. ¿Se trata de un evento simple o compuesto? ¿Por qué?

g. Señalar dos eventos no mutuamente excluyentes y el evento que constituye su intersección.

2.2 Consideremos nuevamente el experimento aleatorio que consiste en arrojar hacia arriba dos monedas de 25 centavos, una dorada y otra plateada, y registrar si cada una queda con “cara” o con “ceca” hacia arriba. Aceptemos que este experimento se realiza bajo condiciones que permiten asignar igual valor de probabilidad a todos los eventos simples que puede producir.

a. Construir una tabla de contingencias con los valores de las probabilidades conjuntas y marginales de los eventos del espacio muestral de este experimento.

b. ¿Cuánto vale la probabilidad conjunta de que las dos monedas queden con “cara” hacia arriba?

c. ¿Cuánto vale la probabilidad marginal de que la moneda dorada quede con “cara” hacia arriba?

Page 18: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

47

d. ¿Cuánto vale la probabilidad condicional de que la moneda dorada quede con “cara” hacia arriba si la moneda plateada también queda con “cara” hacia arriba?

e. Comparar los valores de las probabilidades calculadas en los puntos c y d. ¿Qué indica la comparación?

f. ¿Cuánto vale la probabilidad de que una de las monedas quede con “cara” y la otra con “ceca” hacia arriba?

2.3 En una investigación sobre la diversificación de la producción agrícola en el partido de Tiacalín, un estudiante graduado de la Facultad de Agronomía decide obtener una muestra aleatoria de 50 establecimientos rurales con superficies entre 25 y 500 has y registrar qué cultivos realizaron en el último verano. Para ello, numerará los 2198 establecimientos del partido cuya superficie está en el rango estipulado y elegirá por sorteo 50 para incluir en la muestra. Luego, pedirá a cada productor que complete una encuesta en la que deberá consignar cuáles de las siguientes especies fueron cultivadas en su establecimiento en el último verano: soja, girasol, maíz, sorgo, otro.

a. ¿Cuál es la población de referencia, cuáles son las unidades muestrales y cuál es la muestra?

b. ¿Por qué el procedimiento que consiste en elegir al azar un establecimiento de la población de referencia y registrar cuáles cultivos de la lista fueron realizados allí en el último verano es un experimento aleatorio?

c. Detallar las 32 listas de cultivos estivales que se pueden consignar en cada establecimiento. Se trata de los eventos simples que componen el espacio muestral del experimento aleatorio.

d. ¿Qué eventos simples componen los siguientes eventos compuestos?

“en el establecimiento se cultivó soja”

“en el establecimiento se cultivó maíz y girasol”

“en el establecimiento se realizaron exactamente dos cultivos estivales diferentes”

“en el establecimiento se realizaron al menos dos cultivos estivales diferentes”

“en el establecimiento se realizaron más que dos cultivos estivales diferentes”

“en el establecimiento se realizaron menos que cuatro cultivos estivales diferentes”

e. ¿Cuál es el evento complementario del evento “en el establecimiento se realizó más que un cultivo estival”? ¿Qué eventos simples lo integran?

f. ¿Con qué propiedad de la población de referencia coincide el valor de la probabilidad de que un establecimiento a elegir al azar haya cultivado soja en el último verano?

g. ¿Con qué propiedad de la población de referencia coincide el valor de la probabilidad de que un establecimiento elegir al azar haya cultivado al menos dos cultivos estivales diferentes en el último verano?

2.4 Una vez obtenida la muestra aleatoria de 50 establecimientos agropecuarios con superficies entre 25 y 500 ha en el partido de Tiacalin, el estudiante graduado encontró que en todos ellos se había realizado al menos un cultivo estival, que en 38 de ellos se había cultivado soja y que en 16 la soja era el único cultivo estival. Además, en 8 de los 12 establecimientos donde no se había cultivado soja se habían cultivado dos o más especies estivales diferentes.

a. Construir una tabla de contingencias con las frecuencias absolutas de establecimientos de la muestra que habían o que no habían cultivado soja y que habían cultivado una especie estival o más de una especie estival.

b. A partir de la tabla construida en a, confeccionar otra que muestre las correspondientes frecuencias relativas en la muestra.

Page 19: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

48

Suponiendo que la información de la muestra reflejara fielmente las frecuencias relativas de establecimientos que han cultivado o no cultivado soja y que han realizado uno o más cultivos estivales en la población de referencia:

c. ¿Cuál sería la probabilidad de que un establecimiento a elegir al azar de la población de referencia haya cultivado soja en el último verano? ¿Se trata de una probabilidad conjunta, marginal o condicional?

d. ¿Cuál sería la probabilidad de que un establecimiento a elegir al azar de la población de referencia haya cultivado únicamente soja en el último verano? ¿Se trata de una probabilidad conjunta, marginal o condicional?

e. ¿Cuál sería la probabilidad de que un establecimiento a elegir al azar de la población de referencia haya realizado un sólo cultivo estival si ha cultivado soja? ¿Se trata de una probabilidad conjunta, marginal o condicional?

f. ¿Los eventos “se ha cultivado soja” y “se ha realizado un único cultivo” serían estadísticamente independientes? ¿Qué interpretaciones admite la respuesta a esa pregunta?

2.5 En una investigación sobre la regeneración de la palmera yatay (Butia yatay) en el Parque Nacional El Palmar se marcaron 200 plántulas de palmera elegidas al azar en un área de 4 ha de sabana de palmeras. Entre las plántulas marcadas, 120 estaban ubicadas bajo la copa de una palmera adulta (a menos de 4 metros de su base) y 80 estaban ubicadas a más de 4 m de la palmera adulta más cercana. Al cabo de un año, se comprobó que habían muerto 40 de las plántulas ubicadas bajo la copa de una palmera adulta y 20 de las restantes. Definamos ahora el experimento aleatorio que consiste en elegir por sorteo una de las 200 plántulas y registrar si estaba o no bajo la copa de una palmera adulta y si sobrevivió o no.

a. ¿Qué eventos simples componen el espacio muestral de este experimento aleatorio?

b. Señalar dos eventos mutuamente excluyentes en dicho espacio muestral. ¿Cuál es la probabilidad de cada uno? ¿Cuál es la probabilidad de que ocurra uno o el otro?

c. Señalar dos eventos no mutuamente excluyentes. ¿Cuál es la probabilidad de cada uno? ¿Cuál es su probabilidad conjunta?

d. ¿Cuál es la probabilidad de que la plántula a elegir al azar resulte ser una que estaba bajo la copa de una palmera adulta?

e. ¿Cuál es la probabilidad que la plántula a elegir al azar haya sobrevivido?

f. ¿Cuál es la probabilidad que la plántula a elegir al azar haya sobrevivido, si estaba a más de 4 m de distancia de la palmera adulta más cercana?

Suponiendo que las probabilidades calculadas a partir de estas 200 plántulas constituyen buenas aproximaciones a las probabilidades que tienen las plántulas de Butia yatay del Parque Nacional El Palmar de establecerse y de sobrevivir a diferentes distancias de las palmeras adultas

g. ¿La supervivencia de las plántulas de Butia yatay es estadísticamente independiente de su ubicación respecto de las palmeras adultas? Justificar la respuesta usando probabilidades condicionales y discutir su interpretación.

2.6 Se prepara un dispositivo experimental con dos bolilleros bien construidos y una cantidad de bolillas blancas o rojas, todas esféricas, de igual diámetro, peso y rugosidad. En el primer bolillero se colocan 96 bolillas blancas y 32 rojas y en el segundo 8 blancas y 56 rojas. Ambos bolilleros girarán cerrados durante 3 minutos para mezclar bien las bolillas y luego girarán una vez más para sacar una bolilla de cada uno. El dispositivo y el procedimiento descriptos permiten razonablemente asignar igual valor de probabilidad a todos los eventos simples que puede producir este experimento aleatorio. Llamaremos A al evento que ocurre cuando “del primer bolillero sale una bolilla roja” y B al que ocurre cuando “del segundo bolillero sale una bolilla roja”.

Page 20: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

49

a. ¿Cuál es el evento 𝐴𝑐? ¿Cuál es el valor de su probabilidad?

b. ¿Cuál es el evento 𝐴 ∩ 𝐴𝑐? ¿Cuál es su probabilidad?

c. ¿Cuál es el evento 𝐴 ∪ 𝐴𝑐? ¿Cuál es su probabilidad?

d. ¿A qué intersección corresponde el evento “de cada bolillero sale una bolilla roja”? ¿Cuál es su probabilidad?

e. ¿Cuál es el evento 𝐴𝑐 ∩ 𝐵? ¿Cuál es su probabilidad?

f. ¿A qué intersección corresponde el evento “del primer bolillero sale una bolilla roja y del segundo sale una bolilla blanca”? ¿Cuál es su probabilidad?

g. ¿A qué unión de eventos corresponde el evento “de un bolillero sale una bolilla blanca y del otro una bolilla roja? ¿Cuál es su probabilidad?

h. ¿Cuál es el evento (𝐴 ∪ 𝐵)𝑐? ¿Cuál es su probabilidad?

2.7 En un bosque subtropical, la probabilidad de que un árbol cualquiera sea derribado por una tormenta muy fuerte (velocidad del viento >150km /h) es de 0,75 si está colonizado por lianas que agregan peso y volumen a su copa y de 0,30 si está libre de lianas. Además, la probabilidad de que un árbol a tomar al azar de este bosque esté colonizado por lianas es de 0,40.

a. ¿Cuánto vale la probabilidad de que un árbol a tomar al azar de este bosque esté colonizado por lianas y además sea derribado por una tormenta fuerte? ¿Se trata de una probabilidad conjunta, marginal o condicional?

b. ¿Cuánto vale la probabilidad de que un árbol a tomar al azar de este bosque sea derribado por una tormenta fuerte? ¿Se trata de una probabilidad conjunta, marginal o condicional?

c. ¿Cómo se interpretan los valores calculados en los ítems a y b en términos del criterio presentado en la ecuación 2.9?

d. ¿La caída de un árbol de este bosque por acción una tormenta fuerte es estadísticamente independiente de la presencia de lianas en su copa? Justificar la respuesta con un cálculo apropiado y discutir su interpretación.

2.8 Consideremos un árbol cuyas semillas caen todas bajo su copa. Estas semillas tienen una probabilidad de morir por acción de organismos patógenos o depredadores igual a 0,6, una probabilidad de ser enterradas y germinar in situ igual a 0,1 y una probabilidad de ser transportadas por animales a sitios alejados del árbol igual a 0,3. Si llegan a los sitios alejados, las semillas tienen una probabilidad igual a 0,4 de ser enterradas y germinar.

a. ¿Cuánto vale la probabilidad de que una semilla de este árbol a tomar al azar no sea transportada a un sitio alejado del mismo?

b. ¿Cuánto vale la probabilidad de que una semilla de este árbol a tomar al azar germine en un sitio alejado del mismo? ¿y en un sitio ubicado bajo la copa del árbol?

c. ¿Cuánto vale la probabilidad de que una semilla de este árbol a tomar al azar llegue a germinar? ¿Cómo se interpreta este valor en términos del criterio presentado en la ecuación 2.9?

d. ¿Cuánto vale la probabilidad de que entre dos semillas de este árbol a tomar al azar ninguna llegue a germinar?

e. ¿Cuánto vale la probabilidad de que entre dos semillas de este árbol a tomar al azar la primera llegue a germinar y la segunda no?

f. ¿Cuánto vale la probabilidad de que entre dos semillas de este árbol a tomar al azar una cualquiera de las dos llegue a germinar y otra no?

Page 21: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

50

g. ¿Cuánto vale la probabilidad de que entre tres semillas de este árbol a tomar al azar una cualquiera llegue a germinar y dos no? ¿Cómo se interpreta este valor en términos del criterio presentado en la ecuación 2.9?

2.9 En un censo rural realizado en 2010 en el partido de Tiacalín se registró la superficie de tierra y la forma de gestión de cada establecimiento. Con esta información se clasificaron todos los establecimientos en tres categorías de superficie (<50 ha, 50 a 500 ha y >500 ha) y en tres modelos de gestión (explotación directa por el propietario, explotación mediante contratos anuales de siembra y arrendamiento por más de 3 años). Las frecuencias relativas encontradas de cada clase de establecimiento son las que se presentan en la siguiente tabla de contingencias.

Superficie

<50 ha 50 -500 ha ≥500 ha

Gestión

Propietario 0,04 0,29 0,07 0,40

Contrato anual 0,13 0,27 0,02 0,42

Arrendamiento 0,01 0,14 0,03 0,18

0,18 0,70 0,12 1,00

Frecuencias relativas de establecimientos rurales clasificados por superficie y modelo de gestión en el partido de Tiacalín (Censo rural 2010).

Con el propósito de evaluar los posibles cambios recientes en la distribución de los establecimientos del partido entre estas clases de superficie y modelo de gestión, un ingeniero agrónomo obtendrá una muestra aleatoria de establecimientos del partido y registrará la superficie de tierra y la forma de gestión de cada establecimiento a elegir al azar.

Si cuando el ingeniero obtenga la muestra las frecuencias relativas de establecimientos en diferentes clases de superficie y modelo de gestión son iguales a las registradas en 2010:

a. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar sea gestionado directamente por el propietario?

b. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie ≥500 ha y <50 ha?

c. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie <50 ha si es <500ha?

d. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie <50 ha y sea gestionado directamente por el propietario?

e. ¿El evento “el establecimiento tiene una superficie <50 ha” es estadísticamente independiente del evento “el establecimiento es gestionado directamente por el propietario? Justificar con un cálculo apropiado e interpretar en términos de las frecuencias relativas de diferentes clases de establecimiento en el partido.

f. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie ≥50 ha y sea gestionado mediante contratos anuales de siembra?

g. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar sea gestionado mediante contratos anuales de siembra si tiene una superficie ≥50 ha?

h. ¿El evento “el establecimiento tiene una superficie ≥50 ha” es estadísticamente independiente del evento “el establecimiento es gestionado mediante contratos anuales de siembra”? Justificar con un cálculo apropiado e interpretar en términos de las frecuencias relativas de diferentes clases de establecimiento en el partido.

2.10 Muchas malezas de los lotes agrícolas provienen de semillas enterradas en el suelo antes de la siembra del cultivo. En el suelo, las semillas vivas pueden encontrarse en dos estados fisiológicos, “despiertas”, si germinan cuando la temperatura y la humedad son apropiadas, o “dormidas” si no germinan a menos que reciban algún

Page 22: Capítulo 2 PROBABILIDAD - agro.uba.ar · Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir

51

estímulo específico como luz o frio. Para analizar la infestación con la maleza Commelina erecta L. en un lote agrícola del partido de Tiacalín, un investigador tomó una muestra aleatoria de 2000 semillas y las clasificó según su estado fisiológico y la profundidad a la que estaban enterradas. Llamaremos A al evento “una semilla de Commelina erecta L. tomada al azar de este lote está despierta” y B al evento “una semilla tomada al azar de Commelina erecta L. de este lote está a una profundidad <2cm”.

a. Identificar la población de referencia, las unidades muestrales y las variables de interés.

Entre las 2000 semillas de la muestra, el investigador encontró 1739 semillas a menos de 2 cm de profundidad, entre las cuales 1165 estaban despiertas. Además encontró 89 semillas despiertas enterradas a profundidad ≥ 2 cm. A partir de esta información:

b. ¿Qué valor corresponde asignar a la probabilidad de que una semilla de Commelina erecta L. a tomar al azar de este lote agrícola esté enterrada a menos de 2 cm de profundidad?

c. ¿Qué valor corresponde asignar a la probabilidad de que una semilla de Commelina erecta L. a tomar al azar de este lote agrícola esté despierta?

d. ¿Qué valor corresponde asignar a la probabilidad condicional de que una semilla de Commelina erecta L. a tomar al azar de este lote agrícola esté despierta si está enterrada a una profundidad ≥2cm?

e. A partir de los resultados obtenidos en b, c y d, utilizar el Teorema de Bayes para asignar el valor a la probabilidad condicional de que una semilla de Commelina erecta L. a tomar al azar de este lote agrícola esté enterrada a una profundidad ≥2cm si está despierta. Comprobar que el valor obtenido coincide con el cociente

𝑃[𝐴 ∩ 𝐵𝑐]

𝑃[𝐴]

f. ¿Qué valor corresponde asignar a 𝑃[𝐴𝑐 ∪ 𝐵𝑐]?

g. ¿Cuál es el evento 𝐴𝑐 ∪ 𝐵𝑐?

h. Si el estado fisiológico y la profundidad en el suelo de una semilla de Commelina erecta L. a tomar al azar de este lote agrícola fuesen estadísticamente independientes, ¿cuál sería el valor de la probabilidad de que una semilla de Commelina erecta L. a tomar al azar de este lote esté enterrada a menos de 2 cm de profundidad y además esté despierta?

i. Comparar las respuestas a los ítems f y h. ¿Qué indica el resultado de esta comparación?