Tipos de Aprendizaje en Inteligencia Artificial

Posiblemente hayas oído hablar en muchas ocasiones de inteligencia artificial y el entrenamiento de los modelos. En este post te explicamos qué tipos de entrenamiento existen para resolver problemas de IA.

Posiblemente hayas oído hablar en muchas ocasiones de inteligencia artificial y el entrenamiento de los modelos. En este post te explicamos qué tipos de entrenamiento existen y en qué sub problemas se puede dividir la inteligencia artificial teniendo en cuenta estas tipologías. Vamos a ello.

Los problemas de machine learning se suelen dividir en dos fases. La primera es una fase de entrenamiento, donde el algoritmo debe aprender y encontrar patrones, mientras que la segunda es la parte de test, que es donde le damos datos al algoritmo que nunca ha visto y le pedimos que haga la predicción. Generalmente la división suele ser de un 80-20 o de un 70-30. Es decir, alrededor del 70 o el 80% de los datos para entrenar y el 20 o 30% de los datos para test. 

Por ejemplo, si queremos predecir el fraude en un banco, lo primero que tendremos que hacer es dividir nuestro conjunto de datos en entrenamiento y test. En la fase de entrenamiento, le pasaremos los datos de entrenamiento para que aprenda a reconocer patrones de qué es fraude y que no, y luego, en la fase de test, le daremos los nuevos datos para que haga las predicciones.

Típicamente se suele generar otro subconjunto de datos que se llama de validación, ahora luego hablaremos sobre él. Pero antes, vamos a pasar a conocer más a fondo los tipos de aprendizaje más comunes.

Como decíamos en la introducción, existen varios tipos de aprendizaje. Es decir, las máquinas necesitan un período de aprender sobre los datos para poder reconocer luego esos patrones en base a la experiencia. En este módulo veremos tanto el aprendizaje supervisado como el aprendizaje no supervisado. Dentro de aprendizaje supervisado tendríamos dos tipos de problemas: regresión y clasificación y dentro del aprendizaje no supervisado, a grandes rasgos, tendríamos un tipo de problema, que es el clustering.

Vamos a verlos un poco más en detalle.

APRENDIZAJE SUPERVISADO

En primer lugar, el aprendizaje supervisado. Este es uno de los aprendizajes típicos en Machine Learning y básicamente su funcionamiento trata de que, durante el proceso de entrenamiento le damos tanto las características como el resultado o la clase que tenemos que etiquetar. Es decir, el algoritmo conoce tanto las características como el resultado de la clasificación. Pero únicamente en el proceso de aprendizaje.

Como comentábamos, dentro del aprendizaje supervisado encontramos dos tipos de problemas: regresión y clasificación.

PROBLEMAS DE CLASIFICACIÓN 

En el caso de la clasificación, el objetivo es asignar a cada registro de datos, de características, una clase determinada

Por ejemplo, en el caso de un problema para detectar spam en el correo, le daríamos un conjunto de datos de entrenamiento donde estarían tanto las características de los correos como si es spam o no. Así, el algoritmo debería aprender qué caracteriza a los casos etiquetados como spam y cuales son las características de los que se etiquetan como no spam.

PROBLEMAS DE REGRESIÓN  

En el caso de la regresión, el objetivo será asignar a cada registro de datos, un valor numérico contínuo.

Un ejemplo sería la predicción del precio de la vivienda, por ejemplo, donde tenemos una serie de características del alojamiento y queremos predecir cuánto va a costar. Es decir, aquí no buscamos una clase en especial, sino un valor.

APRENDIZAJE NO SUPERVISADO 

En segundo lugar está el aprendizaje no supervisado. En este tipo de aprendizaje no conocemos el grupo o la clase que queremos asignar ni en el entrenamiento ni en el test.

CLUSTERING

Típicamente en el aprendizaje no supervisado los problemas suelen ser de clustering. Es decir, lo que pretendemos es encontrar patrones en los datos que nos permitan agrupar los que tienen características comunes.

Por ejemplo, cuando queremos hacer una campaña de marketing, intentamos segmentar y generar distintos grupos de clientes que tengan características similares y, a partir de esa segmentación, poder impactar a cada grupo con un tipo de publicidad mucho más segmentada y personalizada.

Existen otras tipologías de entrenamiento algo distintas a estas, como puede ser el aprendizaje por transferencia, el aprendizaje por refuerzo o el aprendizaje activo (active learning), que trataremos con más detalle en otros post.

Imagen: https://www.pxfuel.com/en/free-photo-jrfwk

× ¡Cuéntanos sobre tu proyecto!