Clase 19: Probabilidad Condicional
Universidad Central de Venezuela- Escuela de Economía. 2025-1
2025-07-01
Tip
Todas las láminas que se muestran a continuación pertenecen al proyecto OpenIntroStats openintro.org/os, y se encuentra disponible en su formato original en el siguiente enlace
Investigadores asignaron aleatoriamente a 72 consumidores crónicos de cocaína en tres grupos: desipramina (antidepresivo), litio (tratamiento estándar para la cocaína) y un placebo. Los resultados del estudio se resumen a continuación.
La siguiente tabla:
| Tratamiento | Recaída | Sin Recaída | Total |
|---|---|---|---|
| desipramina | 10 | 14 | 24 |
| Litio | 18 | 6 | 24 |
| Placebo | 20 | 4 | 24 |
| Total | 48 | 24 | 72 |
| Tratamiento | Recaída | Sin Recaída | Total |
|---|---|---|---|
| desipramina | 10 | 14 | 24 |
| Litio | 18 | 6 | 24 |
| Placebo | 20 | 4 | 24 |
| Total | 48 | 24 | 72 |
| Tratamiento | Recaída | Sin Recaída | Total |
|---|---|---|---|
| desipramina | 10 | 14 | 24 |
| Litio | 18 | 6 | 24 |
| Placebo | 20 | 4 | 24 |
| Total | 48 |
24 | 72 |
\(P(\text{recaída}) = 48/72 \sim 0.67\)
La probabilidad marginal es la probabilidad de que ocurra un solo evento, sin tener en cuenta el resultado de otros eventos. Se obtiene a partir de una distribución de probabilidad conjunta sumando (o integrando, en el caso de variables continuas) sobre todos los posibles resultados de los otros eventos.
Definición: Es la probabilidad de un evento individual, calculada a partir de una tabla de probabilidad conjunta.
Fórmula: Dada una distribución de probabilidad conjunta para los eventos A y B, la probabilidad marginal de A, P(A), se calcula sumando las probabilidades conjuntas sobre todos los posibles resultados de B:
\(P(A) = \sum_{i} P(A, B_{i})\)
| Tratamiento | Recaída | Sin Recaída | Total |
|---|---|---|---|
| desipramina | 10 | 14 | 24 |
| Litio | 18 | 6 | 24 |
| Placebo | 20 | 4 | 24 |
| Total | 48 |
24 | 72 |
| Tratamiento | Recaída | Sin Recaída | Total |
|---|---|---|---|
| desipramina | 10 |
14 | 24 |
| Litio | 18 | 6 | 24 |
| Placebo | 20 | 4 | 24 |
| Total | 48 | 24 | 72 |
\(P(\text{recaída y desipramina}) = 10/72 \sim 0.14\)
Es la probabilidad de que dos o más eventos ocurran simultáneamente. Se denota como \(P(A∩B)\) o \(P(A,B)\) y se lee como “la probabilidad de A y B”.
Definición: Para dos eventos A y B, la probabilidad conjunta es la probabilidad de que ambos eventos sucedan al mismo tiempo.
Fórmula: Si los eventos son dependientes, la probabilidad conjunta se calcula utilizando la regla de la multiplicación:
\(P(A∩B)=P(A∣B)⋅P(B)\) o \(P(A∩B)=P(B∣A)⋅P(A)\)
Si los eventos son independientes, la fórmula se simplifica a:
\(P(A∩B)=P(A)⋅P(B)\)
La probabilidad condicional del resultado de interés A dada una condición B se calcula como:
\(P(A|B) = \frac{P(A \text{ y } B)}{P(B)}\)
La probabilidad condicional del resultado de interés A dada una condición B se calcula como: \(P(A|B) = \frac{P(A \text{ y } B)}{P(B)}\)
¿Cuál es la probabilidad de que un paciente reciba como tratamiento desipramina y tenga una recaida?
\(P(\text{recaída | desipramina}) = \\ \frac{P(\text{recaída y desipramina})}{P(\text{desipramina})}\)
\(\frac{P(\text{recaída y desipramina})}{P(\text{desipramina})}\)
| Tratamiento | Recaída | Sin Recaída | Total |
|---|---|---|---|
| desipramina | 10 |
14 | 24 |
| Litio | 18 | 6 | 24 |
| Placebo | 20 | 4 | 24 |
| Total | 48 | 24 | 72 |
La probabilidad condicional del resultado de interés A dada una condición B se calcula como:
\[P(A|B) = \frac{P(A \text{ y } B)}{P(B)}\]
\[P(\text{recaída | desipramina}) = \\ \\ \frac{P(\text{recaída y desipramina})}{P(\text{desipramina})} = \frac{10/72}{24/72} = \frac{10}{24} \approx 0.42 \]
| Tratamiento | Recaída | Sin Recaída | Total |
|---|---|---|---|
desipramina |
10 |
14 |
24 |
| Litio | 18 | 6 | 24 |
| Placebo | 20 | 4 | 24 |
| Total | 48 | 24 | 72 |
| Tratamiento | Recaída | Sin Recaída | Total |
|---|---|---|---|
desipramina |
10 |
14 | 24 |
| Litio | 18 | 6 | 24 |
| Placebo | 20 | 4 | 24 |
| Total | 48 | 24 | 72 |
\(P(\text{recaída | desipramina}) = 10/24 \sim 0.42\)
| Tratamiento | Recaída | Sin Recaída | Total |
|---|---|---|---|
| desipramina | 10 | 14 | 24 |
| Litio | 18 | 6 | 24 |
| Placebo | 20 | 4 | 24 |
| Total | 48 | 24 | 72 |
| Tratamiento | Recaída | Sin Recaída | Total |
|---|---|---|---|
| desipramina | 10 |
14 | 24 |
| Litio | 18 | 6 | 24 |
| Placebo | 20 | 4 | 24 |
| Total | 48 |
24 | 72 |
\(P(\text{desipramina | recaída}) = 10/48 \sim 0.21\)
La probabilidad condicional es la probabilidad de que ocurra un evento A, dado que ya ha ocurrido otro evento B. Se denota como \(P(A∣B)\) y se lee como “la probabilidad de A dado B”.
Definición: Mide la probabilidad de un evento, condicionada a la ocurrencia de otro evento. El conocimiento de que B ha ocurrido reduce el espacio muestral original a solo los resultados en los que B está presente.
Fórmula: \(P(A∣B)=P(B)P(A∩B)\)
Siempre que \(P(B)>0\)
Considere la siguiente distribución (hipotética) de género y especialidad de estudiantes en una clase de introducción a la estadística:
| Género | Ciencias Sociales | No Ciencias Sociales | Total |
|---|---|---|---|
| Femenino | 30 | 20 | 50 |
| Masculino | 30 | 20 | 50 |
| Total | 60 | 40 | 100 |
Considere la siguiente distribución (hipotética) de género y especialidad de estudiantes en una clase de introducción a la estadística:
| Género | Ciencias Sociales | No Ciencias Sociales | Total |
|---|---|---|---|
| Femenino | 30 | 20 | 50 |
| Masculino | 30 | 20 | 50 |
| Total | 60 | 40 | 100 |
Considere la siguiente distribución (hipotética) de género y especialidad de estudiantes en una clase de introducción a la estadística:
| Género | Ciencias Sociales | No Ciencias Sociales | Total |
|---|---|---|---|
| Femenino | 30 | 20 | 50 |
| Masculino | 30 | 20 | 50 |
| Total | 60 | 40 | 100 |
Genéricamente, si \(P(A|B) = P(A)\), entonces se dice que los eventos A y B son independientes.
\(P(A|B) = \frac{P(A \text{ y } B)}{P(B)} = \frac{P(A) \times P(B)}{P(B)} = P(A)\)
Dos eventos, A y B, son independientes si la ocurrencia de uno no afecta la probabilidad de ocurrencia del otro.
Definición: La independencia se puede definir formalmente utilizando la probabilidad condicional. Los eventos A y B son independientes si y solo si: \(P(A∣B)=P(A)yP(B∣A)=P(B)\)
Esto significa que saber que B ocurrió no cambia la probabilidad de A, y viceversa.
Relación Clave: Una consecuencia directa de la definición de independencia es la simplificación de la regla de la multiplicación para la probabilidad conjunta:
Si A y B son independientes, entonces: \(P(A∩B)=P(A)⋅P(B)\)
Esta es a menudo la prueba más fácil para determinar si dos eventos son independientes. Si esta igualdad se cumple, los eventos son independientes; de lo contrario, son dependientes.
Nota: Estos porcentajes son aproximados y muy difíciles de estimar.
Cuando una paciente se somete a una prueba de detección de cáncer de mama, hay dos afirmaciones contrapuestas: la paciente tiene cáncer y la paciente no tiene cáncer. Si una mamografía da un resultado positivo, ¿cuál es la probabilidad de que la paciente realmente tenga cáncer?
\(P(C|+) = \frac{P(\text{C y +})}{P(+)}\)
Nota: Los diagramas de árbol son útiles para invertir probabilidades: se nos da \(P(+|C)\) y se nos pide \(P(C|+)\).
\(P(C|+) = \frac{P(\text{C y +})}{P(+)}\)
\(P(C|+) = \frac{P(\text{C y +})}{P(+)} = \frac{0.0133}{0.0133 + 0.0983} = 0.12\)
Supongamos que una mujer que se hace la prueba una vez y obtiene un resultado positivo, quiere volver a hacerse la prueba. En la segunda prueba, ¿cuál deberíamos asumir que es la probabilidad de que esta mujer específica tenga cáncer?
0.017
0.12
0.0133
0.88
Resultado
¿Cuál es la probabilidad de que esta mujer tenga cáncer si esta segunda mamografía también arrojó un resultado positivo? \(P(C|+) = \frac{P(C \text{ y } +)}{P(+)}\)

Resultado
La fórmula de probabilidad condicional que hemos visto hasta ahora es un caso especial del Teorema de Bayes, que es aplicable incluso cuando los eventos tienen más de dos resultados.
La fórmula de probabilidad condicional que hemos visto hasta ahora es un caso especial del Teorema de Bayes, que es aplicable incluso cuando los eventos tienen más de dos resultados.
Teorema de Bayes
\[ P(\text{resultado } A_1 \text{ de variable 1 | resultado B de variable 2}) \]
\(=\frac{P(B|A_1)P(A_1)}{P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + \cdot\cdot\cdot + P(B|A_k)P(A_k)}\)
donde \(A_2, \cdot\cdot\cdot, A_k\) representan todos los demás resultados posibles de la variable 1.
Un modelo epidemiológico común para la propagación de enfermedades es el modelo SIR, donde la población se divide en tres grupos: Susceptibles, Infectados y Recuperados. Este es un modelo razonable para enfermedades como la varicela, donde una sola infección generalmente proporciona inmunidad a infecciones posteriores. A veces, estas enfermedades también pueden ser difíciles de detectar.
Imagina una población en medio de una epidemia donde el 60% de la población se considera susceptible, el 10% está infectada y el 30% está recuperada. La única prueba para la enfermedad es precisa el 95% de las veces para individuos susceptibles, el 99% para individuos infectados, pero solo el 65% para individuos recuperados. (Nota: En este caso, “precisa” significa que devuelve un resultado negativo para individuos susceptibles y recuperados, y un resultado positivo para individuos infectados).
Dibuja un árbol de probabilidad para reflejar la información dada anteriormente. Si un individuo ha dado positivo, ¿cuál es la probabilidad de que esté realmente infectado?
\(P(\text{inf}|+) = \frac{P(\text{inf y +})}{P(+)}\)
\(P(\text{inf}|+) = \frac{P(\text{inf y +})}{P(+)} = \frac{0.099}{0.03 + 0.099 + 0.105} \approx 0.423\)
Es un resultado fundamental en la teoría de la probabilidad que describe la probabilidad de un evento, basado en el conocimiento previo de condiciones que podrían estar relacionadas con el evento. Es una forma de actualizar nuestras creencias sobre una hipótesis a la luz de nueva evidencia.
Definición: El teorema relaciona la probabilidad condicional de dos eventos. Permite calcular la probabilidad de una causa (hipótesis) a partir del efecto observado (evidencia).
Fórmula: \(P(A∣B)=P(B)P(B∣A)⋅P(A)\)
Donde:
\(P(A∣B)\) es la probabilidad a posteriori.
\(P(B∣A)\) es la verosimilitud (likelihood).
\(P(A)\) es la probabilidad a priori.
\(P(B)\) es la evidencia marginal, que se puede calcular usando la ley de la probabilidad total:
\(P(B)=P(B∣A)P(A)+P(B∣A^c)P(A^c)\)
El Problema: Imaginemos que creamos un filtro para detectar correos SPAM. Si un correo tiene la palabra “oferta”, ¿qué tan probable es que sea SPAM?
Vamos a definir lo que sabemos sobre los correos que llegan:
Probabilidad de ser SPAM (A Priori):
El 20% de todos los correos que recibimos son SPAM.
\(P(\text SPAM)=0.20\)
Probabilidad de que un SPAM contenga “oferta”:
El 50% de los correos SPAM contienen la palabra “oferta”.
\(P(\text "oferta"∣\text SPAM)=0.50\)
Probabilidad de que un correo legítimo (NO SPAM) contenga “oferta”:
Solo el 1% de los correos legítimos contienen la palabra “oferta”.
\(P(\text "oferta"∣\text NO\ SPAM)=0.01\)
En notación de probabilidad, estamos buscando:
\[P(\text SPAM∣\text"oferta")=?\]
El numerador es la parte fácil, ya que tenemos esos datos directamente.
\(Numerador=P(\text "oferta"∣\text SPAM)⋅P(\text SPAM)\)
Sustituyendo nuestros valores:
\(Numerador=0.50×0.20=0.10\)
Este valor (10%) representa la probabilidad de que un correo sea SPAM y que contenga la palabra “oferta”.
El denominador, \(P(\text"oferta")\), es la probabilidad total de que cualquier correo contenga la palabra “oferta”. Un correo puede contener “oferta” de dos maneras:
Siendo SPAM y conteniendo “oferta”.
No siendo SPAM y conteniendo “oferta”.
Usamos la Ley de la Probabilidad Total:
\(P(B)=P(B∣A)P(A)+P(B∣A^c)P(A^c)\\P(\text "oferta")= [P(\text "oferta"∣\text SPAM)\text P(SPAM)]+[P(\text "oferta"∣\text NO\ SPAM)P(\text NO\ SPAM)]\)
Calculamos:
\(P(\text NO\ SPAM)=1−P(\text SPAM)=1−0.20=0.80\)
\(P(\text"oferta")=(0.50\times 0.20)+(0.01\times 0.80)\)
\(P(\text"oferta")=0.10+0.008=0.108\)
La probabilidad total de que un correo contenga la palabra “oferta” es del 10.8%.
Ahora dividimos el numerador (Paso 1) entre el denominador (Paso 2).
\(P(\text SPAM∣\text "oferta")= 0.10/0.108\\P(\text SPAM∣\text "oferta")≈0.926\)
Si recibes un correo que contiene la palabra “oferta”, hay una probabilidad del 92.6% de que sea SPAM.
El Teorema de Bayes nos permitió actualizar nuestra creencia inicial (la probabilidad de que un correo fuera SPAM era solo del 20%), al poder incorporar la nueva evidencia que viene dada por el uso de la palabra “oferta”.