Modelos Naive Bayes: Precisión e independencia

[vc_row][vc_column][vc_column_text]El machine learning es toda una revolución y evolución en el ámbito de la inteligencia artificial y una de sus técnicas más utilizadas son los modelos Naive Bayes.

Para entender los modelos Naive Bayes del Machine learning, debemos comprender, en primer lugar, que esta disciplina ha supuesto todo un avance en el ámbito de la inteligencia artificial ya que, gracias a ella, se crean sistemas que aprenden de forma automática.

Un ejemplo de esto es, sin ir más lejos, los algoritmos que nos recomiendan una película o una serie cuando entramos a nuestra plataforma favorita de streaming. Y cada vez son más las empresas que utilizan esto para analizar el comportamiento de los usuarios o clientes.

En este sentido, el machine learning consigue que las máquinas aprendan un algoritmo que analiza, revisa y predice datos y comportamientos futuros.

¿Qué es machine learning?

Como te hemos adelantado, el machine learning es una disciplina científica, enmarcada en el ámbito de la inteligencia artificial. Gracias a ella, las máquinas tienen la capacidad de análisis predictivo y de identificación de datos.

Con el machine learning, las máquinas u ordenadores pueden realizar tareas concretas de forma independiente.

El término fue utilizado por primera vez a finales de los años 50. Sin embargo, ha evolucionado tanto y ha ganado tanta importancia gracias al aumento de la capacidad de computación y al boom de los datos, convirtiéndose en un pilar fundamental del Big Data.

¿Qué tipos de machine learning existen?

Existen diferentes tipos de machine learning, enfocados a procesos distintos. No obstante, están divididos, principalmente en:

Aprendizaje supervisado: con este tipo de aprendizaje, el proceso de generación del conocimiento se realiza a través de ciertos ejemplos. Así, permite realizar predicciones adecuadas del comportamiento de datos nuevos que aún no han sido procesados.
Aprendizaje no supervisado: este tipo busca recopilar información importante sin necesidad de conocer ninguna variable, ya que explora incluso los datos que aún no están etiquetados.
Aprendizaje reforzado: el aprendizaje reforzado se conoce también como aprendizaje profundo y busca crear modelos que aumenten el rendimiento, usando como referencia la recompensa que se generará con cada interacción que se haya realizado.

¿Cuáles son los algoritmos de machine learning?

Por otro lado, el machine learning también cuenta con un amplio y distinto número de algoritmos:

Algoritmos Bayesianos
Algoritmos de regresión
Algoritmos de árbol de decisión
Algoritmos de agrupación
Algoritmos de redes neuronales
Algoritmos de aprendizaje profundo

La técnica Naive Bayes

En este artículo nos centraremos en conocer qué son los algoritmos bayesianos. Es decir, cuando utilizamos los modelos Naive Bayes en el machine learning, también llamados modelos inocentes en español.

¿De dónde viene el nombre de los modelos Naive Bayes?

Por un lado, proviene de la palabra Naive porque asume que X característica y su existencia es independiente del resto de características.

Por otro lado, Bayes hace referencia al teorema Bayes, del que depende y que se usa para concretar la probabilidad de una hipótesis con conocimiento previo.

¿Qué hace un modelo Naive Bayes?

Los modelos Naive Bayes ofrecen una forma fácil de construir ciertos modelos con un comportamiento bueno, debido a lo sencillos que son, ya que se basan en que las variables predictoras no dependen unas de otras.

¿Cómo funciona?

Las técnicas Naive Bayes necesitan una forma de calcular la probabilidad ‘posterior’ de que prevenga un cierto evento A, dadas algunas probabilidades de eventos ‘anteriores’.

Así, lo hacen a través de esta fórmula:

Para utilizar el algoritmo Naive Bayes es necesario:

Convertir el todos los datos en tablas de frecuencia.
Crear una tabla de probabilidad buscando las probabilidades de características dadas.
Utilizar el teorema de Bayes para calcular la probabilidad posterior.

Ventajas y desventajas del modelo Naive Bayes

Entre las ventajas podemos destacar:

Naive Bayes es uno de los algoritmos de Machine Learning más rápidos y sencillos para predecir una clase de conjuntos de datos.
Se utiliza para clasificaciones binarias y de clases múltiples.
Funciona mejor que otros algoritmos cuando hablamos de predicciones multiclase.
Es la opción más popular para problemas de clasificación de texto.

La desventaja principal, por su parte, es que Naive Bayes asume que todas las características son independientes entre sí, de modo que nunca podrá aprender la relación existente entre ellas.

Además, a pesar de ser muy buenos clasificadores, los algoritmos Naive Bayes son conocidos por ser estimadores pobres.

Tipos de modelo Naive Bayes:

Existen tres tipos de modelo Naive Bayes:

Gaussiano: según este modelo, las características siguen una distribución normal. De modo que, en caso de que los predictores tomen valores continuos en lugar de discretos, el modelo asume que estos valores se muestrean a partir de la distribución gaussiana.
Multinomial: este modelo se usa cuando los datos cuentan con una distribución multinomial y se utilizan, principalmente, para resolver problemas de clasificación de documentos.
Bernoulli: el tipo Bernoulli tiene un funcionamiento parecido al multinomial, pero las variables predictoras son las variables booleanas independientes.

[/vc_column_text][/vc_column][/vc_row]

The Black Box Lab