Gracias a la utilización del Machine learning, tenemos la posibilidad de llevar a cabo tareas de clasificación y regresión, pero ¿qué diferencias existen entre ambas?

El machine learning es una disciplina científica enmarcada en el ámbito de la inteligencia artificial con la que las máquinas pueden realizar análisis de los datos, prediciéndolos e identificándolos.

Así, los ordenadores y las máquinas llevan a cabo tareas concretas de forma independiente.

Existen distintos tipos de machine learning, entre los que encontramos el aprendizaje supervisado, el aprendizaje no supervisado y el aprendizaje reforzado y, dentro de ellos, podemos distinguir entre distintos tipos de algoritmos.

A la hora de aprender sobre machine learning, una de las primeras cosas que debemos tener en cuenta son las diferencias que existen entre algunos de sus algoritmos. En este artículo nos centraremos en los algoritmos de regresión y de clasificación. 

Tipos de machine learning

Dependiendo del tipo de proceso que vayamos a realizar, clasificaremos distintos tipos de machine learning.

  • Aprendizaje supervisado: Con este tipo de aprendizaje, el proceso de generación del conocimiento se realiza a través de ciertos ejemplos.
  • Aprendizaje no supervisado: Recopila información sin necesidad de conocer ninguna variable, ya que explora incluso los datos que aún no están etiquetados.
  • Aprendizaje reforzado: su objetivo es generar modelos que incrementen el rendimiento y utiliza como referencia la recompensa que se generará con cada interacción que se haya realizado.

Clasificación y regresión

En primer lugar, debemos saber que ambos tipos de problemas se encuentran enmarcados dentro del aprendizaje supervisado del machine learning. En este tipo de aprendizaje, se trabaja con datos etiquetados

Concretamente, la generación del conocimiento se genera mediante ejemplos que permiten predecir, de forma adecuada, el comportamiento de los datos.

A continuación, veremos algunas de las diferencias que existen entre ambas y, aunque algunas técnicas son específicas para cada tipo de algoritmo, otras funcionan para ambos.

Algoritmos de clasificación

Los algoritmos de clasificación se utilizan en casos en los que el resultado es un conjunto infinito de resultados.

El ejemplo más utilizado para entender los algoritmos de clasificación es el detector del spam o correo no deseado en el mail. Si buscamos saber si un correo es o no es spam, el algoritmo de clasificación decide a qué tipo pertenece.

A esta metodología también se la conoce por clasificación binaria.

Técnicas utilizadas

En la actualidad se usan distintas técnicas de aprendizaje automático para problemas de clasificación. Entre ellos encontramos:

  • La clasificación de Naïve Bayes
  • Los bosques aleatorios
  • La regresión logística
  • Los árboles de decisión
  • Máquinas de vectores de soporte
  • Redes neuronales y aprendizaje profundo

Algoritmos de regresión

En el caso de los algoritmos de regresión, podemos decir que se trata de un subcampo del aprendizaje automático supervisado que tiene el fin de crear una metodología para relacionar un cierto número de características y una variable objetivo-continua.

Algunos de los ejemplos más claros de los algoritmos de regresión son la estimación de cuánto tardará una persona en llegar a un destino, la predicción del tiempo que se mantendrá un empleado en una compañía…

Técnicas utilizadas

También existen distintas técnicas usadas en los algoritmos de regresión. Entre ellas, podemos encontrar:

  • Regresión lineal (utiliza datos continuos).
  • Regresión logística (utiliza datos discretos).
  • Árboles de decisión.
  • Deep Learning.