Resumen
El clasificador Naive Bayes utiliza tablas de frecuencias para el cálculo de las probabilidades, cada una de las variables utilizada debe de ser categórica y no se pueden utilizar de forma directa variables numéricas. Una solución sencilla es discretizar las variables numéricas en N conjuntos, agrupamientos o bins.
Este método es ideal cuando hay grandes cantidades de datos. Una buena solución suele ser explorar los datos para observar los puntos de corte en la distribución de los datos. Por ejemplo, el siguiente histograma sugiere realizar una división en cuatro bins.
