Típicamente los algoritmos se clasifican por el tipo de aprendizaje, hablando de:

  • Aprendizaje supervisado
  • Aprendizaje sin supervisión
  • Aprendizaje semi-supervisado

Conforme esta clasificación:

Algoritmos de aprendizaje supervisado:

  • En estos, los datos de entrada se llaman datos de entrenamiento y tienen una etiqueta o resultado conocido (como puede ser la temperatura media en un día, si un correo es spam o no,…)
  • En estos se prepara un modelo a través de un proceso de entrenamiento, requerido para hacer predicciones y que se corrige (se reentrena cuando las predicciones son incorrectas).
  • Problemas típicos son clasificaciones (de mails) y regresiones con algoritmos como la regresión logística o las redes neuronales

Algoritmos de aprendizaje sin supervisión:

  • En estos los datos de entrada no se etiquetan y no tienen un resultado conocido.
  • Es necesario preparar el modelo deduciendo estructuras presentes en los datos de entrada, bien sea extrayendo reglas o a través de un proceso automático.
  • Problemas típicos con el clusering, reducción de dimensiones,… y algoritmo típicos el k-means y Apriori.

Algoritmos de aprendizaje semi-supervisado

  • Los datos de entrada son una mezcla de ejemplos etiquetados y sin etiquetar
  • Hay un problema de predicción pero el modelo debe aprender las estructuras para organizar los datos además de parar hacer predicciones.
  • Problemas típicos son las clasificaciones y regresión y los algortimos son extensiones de los ya mencionados.