Típicamente los algoritmos se clasifican por el tipo de aprendizaje, hablando de:
- Aprendizaje supervisado
- Aprendizaje sin supervisión
- Aprendizaje semi-supervisado
Conforme esta clasificación:
Algoritmos de aprendizaje supervisado:
- En estos, los datos de entrada se llaman datos de entrenamiento y tienen una etiqueta o resultado conocido (como puede ser la temperatura media en un día, si un correo es spam o no,…)
- En estos se prepara un modelo a través de un proceso de entrenamiento, requerido para hacer predicciones y que se corrige (se reentrena cuando las predicciones son incorrectas).
- Problemas típicos son clasificaciones (de mails) y regresiones con algoritmos como la regresión logística o las redes neuronales
Algoritmos de aprendizaje sin supervisión:
- En estos los datos de entrada no se etiquetan y no tienen un resultado conocido.
- Es necesario preparar el modelo deduciendo estructuras presentes en los datos de entrada, bien sea extrayendo reglas o a través de un proceso automático.
- Problemas típicos con el clusering, reducción de dimensiones,… y algoritmo típicos el k-means y Apriori.
Algoritmos de aprendizaje semi-supervisado
- Los datos de entrada son una mezcla de ejemplos etiquetados y sin etiquetar
- Hay un problema de predicción pero el modelo debe aprender las estructuras para organizar los datos además de parar hacer predicciones.
- Problemas típicos son las clasificaciones y regresión y los algortimos son extensiones de los ya mencionados.