En una base de datos de correos electrónicos se ha observado que el de los correos recibidos son spam. Además, se ha observado que la palabra "lottery" ha aparecido en el de los correos que son spam y en el de los correos que no lo son.
a) Halle la probabilidad de que en un correo elegido al azar en el que aparezca la palabra "lottery" sea spam.b) Halle la probabilidad de que un correo elegido al azar en el que no aparezca la palabra "lottery" no sea spam.c) Si un correo se etiqueta como spam si aparece la palabra "lottery" y como no spam si esta palabra no aparece, calcule la probabilidad de que un correo se etiquete incorrectamente.Definimos los siguientes sucesos:S: El correo es spam.S': El correo no es spam.L: La palabra "lottery" aparece en el correo.L': La palabra "lottery" no aparece en el correo.Según los datos del enunciado, tenemos las siguientes probabilidades:
A partir de estas probabilidades, podemos calcular:
Se nos pide calcular . Para ello, necesitamos calcular usando el Teorema de la Probabilidad Total:
Ahora aplicamos el Teorema de Bayes para calcular :
La probabilidad de que un correo que contenga la palabra "lottery" sea spam es aproximadamente .
b) Halle la probabilidad de que un correo elegido al azar en el que no aparezca la palabra "lottery" no sea spam.Se nos pide calcular . Primero calculamos :
Ahora aplicamos el Teorema de Bayes para calcular :
La probabilidad de que un correo en el que no aparece la palabra "lottery" no sea spam es aproximadamente .
c) Si un correo se etiqueta como spam si aparece la palabra "lottery" y como no spam si esta palabra no aparece, calcule la probabilidad de que un correo se etiquete incorrectamente.Un correo se etiqueta incorrectamente si ocurre una de estas dos situaciones:1. El correo es spam, pero no aparece la palabra "lottery" (se etiqueta incorrectamente como no spam). Este suceso es .2. El correo no es spam, pero aparece la palabra "lottery" (se etiqueta incorrectamente como spam). Este suceso es .La probabilidad de etiquetado incorrecto es la suma de las probabilidades de estos dos sucesos, ya que son mutuamente excluyentes.
Calculamos :
Calculamos :
Sumamos estas probabilidades:
La probabilidad de que un correo se etiquete incorrectamente es .





