🔍
Escribe al menos 2 caracteres...
AndalucíaAndalucía
MadridMadrid
CataluñaCataluña
GaliciaGalicia
MurciaMurcia
ValenciaValencia
En construcciónAñadimos comunidades, materias, años y soluciones de forma progresiva y constante.
Teorema de Bayes
Problema
2023 · Ordinaria · Titular
6
Examen
BLOQUE C - EJERCICIO 6

En una base de datos de correos electrónicos se ha observado que el 20%20\% de los correos recibidos son spam. Además, se ha observado que la palabra "lottery" ha aparecido en el 40%40\% de los correos que son spam y en el 0.6%0.6\% de los correos que no lo son.

a) Halle la probabilidad de que en un correo elegido al azar en el que aparezca la palabra "lottery" sea spam.b) Halle la probabilidad de que un correo elegido al azar en el que no aparezca la palabra "lottery" no sea spam.c) Si un correo se etiqueta como spam si aparece la palabra "lottery" y como no spam si esta palabra no aparece, calcule la probabilidad de que un correo se etiquete incorrectamente.
Probabilidad TotalBayesContexto digital

Definimos los siguientes sucesos:S: El correo es spam.S': El correo no es spam.L: La palabra "lottery" aparece en el correo.L': La palabra "lottery" no aparece en el correo.Según los datos del enunciado, tenemos las siguientes probabilidades:

P(S)=0.20P(S)=1P(S)=0.80P(S) = 0.20 \Rightarrow P(S') = 1 - P(S) = 0.80
P(LS)=0.40P(L|S) = 0.40
P(LS)=0.006P(L|S') = 0.006

A partir de estas probabilidades, podemos calcular:

P(LS)=1P(LS)=10.40=0.60P(L'|S) = 1 - P(L|S) = 1 - 0.40 = 0.60
P(LS)=1P(LS)=10.006=0.994P(L'|S') = 1 - P(L|S') = 1 - 0.006 = 0.994
a) Halle la probabilidad de que en un correo elegido al azar en el que aparezca la palabra "lottery" sea spam.

Se nos pide calcular P(SL)P(S|L). Para ello, necesitamos calcular P(L)P(L) usando el Teorema de la Probabilidad Total:

P(L)=P(LS)P(S)+P(LS)P(S)P(L) = P(L|S) \cdot P(S) + P(L|S') \cdot P(S')
P(L)=(0.40)(0.20)+(0.006)(0.80)P(L) = (0.40)(0.20) + (0.006)(0.80)
P(L)=0.08+0.0048=0.0848P(L) = 0.08 + 0.0048 = 0.0848

Ahora aplicamos el Teorema de Bayes para calcular P(SL)P(S|L):

P(SL)=P(LS)P(S)P(L)P(S|L) = \frac{P(L|S) \cdot P(S)}{P(L)}
P(SL)=(0.40)(0.20)0.0848=0.080.08480.9434P(S|L) = \frac{(0.40)(0.20)}{0.0848} = \frac{0.08}{0.0848} \approx 0.9434

La probabilidad de que un correo que contenga la palabra "lottery" sea spam es aproximadamente 0.94340.9434.

b) Halle la probabilidad de que un correo elegido al azar en el que no aparezca la palabra "lottery" no sea spam.

Se nos pide calcular P(SL)P(S'|L'). Primero calculamos P(L)P(L'):

P(L)=1P(L)=10.0848=0.9152P(L') = 1 - P(L) = 1 - 0.0848 = 0.9152

Ahora aplicamos el Teorema de Bayes para calcular P(SL)P(S'|L'):

P(SL)=P(LS)P(S)P(L)P(S'|L') = \frac{P(L'|S') \cdot P(S')}{P(L')}
P(SL)=(0.994)(0.80)0.9152=0.79520.91520.8689P(S'|L') = \frac{(0.994)(0.80)}{0.9152} = \frac{0.7952}{0.9152} \approx 0.8689

La probabilidad de que un correo en el que no aparece la palabra "lottery" no sea spam es aproximadamente 0.86890.8689.

c) Si un correo se etiqueta como spam si aparece la palabra "lottery" y como no spam si esta palabra no aparece, calcule la probabilidad de que un correo se etiquete incorrectamente.

Un correo se etiqueta incorrectamente si ocurre una de estas dos situaciones:1. El correo es spam, pero no aparece la palabra "lottery" (se etiqueta incorrectamente como no spam). Este suceso es SLS \cap L'.2. El correo no es spam, pero aparece la palabra "lottery" (se etiqueta incorrectamente como spam). Este suceso es SLS' \cap L.La probabilidad de etiquetado incorrecto es la suma de las probabilidades de estos dos sucesos, ya que son mutuamente excluyentes.

P(etiquetado incorrecto)=P(SL)+P(SL)P(\text{etiquetado incorrecto}) = P(S \cap L') + P(S' \cap L)

Calculamos P(SL)P(S \cap L'):

P(SL)=P(LS)P(S)=(0.60)(0.20)=0.12P(S \cap L') = P(L'|S) \cdot P(S) = (0.60)(0.20) = 0.12

Calculamos P(SL)P(S' \cap L):

P(SL)=P(LS)P(S)=(0.006)(0.80)=0.0048P(S' \cap L) = P(L|S') \cdot P(S') = (0.006)(0.80) = 0.0048

Sumamos estas probabilidades:

P(etiquetado incorrecto)=0.12+0.0048=0.1248P(\text{etiquetado incorrecto}) = 0.12 + 0.0048 = 0.1248

La probabilidad de que un correo se etiquete incorrectamente es 0.12480.1248.