Resumen
En los problemas de clasificación, el aprendizaje supervisado utiliza ejemplos conocidos para inferir la etiqueta (clasificar) de los vectores de entrada x eligiendo una de entre varias categorías o clases. (Vidales, 2019)
Estos algoritmos, al igual que en los problemas de regresión, utilizan ejemplos etiquetados previamente para «aprender» los patrones para llevar a cabo una clasificación.
En este tipo de problemas la variable respuesta y es una variable con dos o más categorías.
El objetivo es identificar a qué categoría pertenece una nueva observación, utilizando para ello una serie de observaciones y categorías conocidas previamente.
Ejemplos:
Asignar a un correo electrónico la categoría de spam o no spam en función de los correos recibidos previamente.
Realizar un diagnóstico a un paciente en función de sus características (sexo, presión sanguínea, colesterol, etc).
Los problemas de clasificación se dividen en dos grandes grupos:
Clasificación binaria: Buscan diferenciar las nuevas observaciones entre una de las dos clases posibles (ejemplo spam y no spam).
Clasificación multi-clase: Asignar una nueva observación a una de entre varias clases posibles (ejemplo: clasificador frutas: naranjas, manzanas o peras).