Saltar al contenido principal
Página

Tema 3.1 - Independencia condicional en el clasificador Naive Bayes



Resumen

Dos eventos son independientes si el resultado del segundo evento no es afectado por el resultado del primer evento. Si A y B son eventos independientes, la probabilidad de que ambos eventos ocurran es el producto de las probabilidades de los eventos individuales. 

Los eventos dependientes son la base del modelado predictivo, puesto que permiten predecir la presencia de un evento en función de otro.

Por ejemplo:

1. La presencia de nubes suele ser un evento predictivo dependiente de un día lluvioso.

2. La presencia de la palabra Viagra en un correo electrónico suele ser un evento predictivo de spam


No obstante, al no poder asumir dependencia condicional por el alto coste computacional, el clasificador Naive Bayes asume independencia condicional entre los eventos condicionados al mismo valor de la clase. En nuestro ejemplo anterior, asumiendo independencia condicional de las palabras para obtener la probabilidad de spam, tendríamos la siguiente fórmula:




Por otro lado, para obtener la probabilidad de ham, tendríamos:




Como 0,012/0,002 = 6, se puede afirmar que es 6 veces más probable que el mensaje sea spam que ham.

Última modificación: viernes, 13 de enero de 2023, 14:01