Saltar al contenido principal
Página

Tema 2.1 - Tablas de probabilidad condicionada



Resumen

Para obtener los componentes necesarios para cada una de las fórmulas vistas en el capítulo anterior, es necesario construir una tabla de frecuencias que indíque el número de veces que el evento aparece en cada una de las situaciones. En nuestro ejemplo de spam, es necesario calcular el número de veces que la palabra Viagra ha aparecido en los mensajes de spam. Esta tabla de frecuencias se utiliza posteriormente para calcular las tablas de verosimilitud o de probabilidad condicionada. En el caso hipotético de que tuviéramos la siguiente distribución histórica de 100 mensajes para la palabra Viagra.



Obtendríamos la siguiente tabla de verosimilitud:




Con estos datos, podemos calcular la probabilidad de que un mensaje sea Spam dado que nos ha llegado la palabra Viagra, tendríamos que hacer el siguiente calculo: 


 P(Spam|Viagra) = [(4/20) * (20/100)] / (5/100) = 0.8 


Es decir, con los datos anteriores, la probabilidad de que un correo electrónico que contenga la palabra Viagra sea spam es del 0,8

Finalmente obtendriamos la siguiente tabla de verosimilitud:



Última modificación: viernes, 13 de enero de 2023, 13:58