Introducción al Machine Learning #6 - Pasos para construir un modelo de Machine Learning

Índice

Introducción:

En artículos anteriores hemos visto los distintos tipos de aprendizaje, el  uso de los conjuntos de datos que se encuentran en el modulo Sklearn, y hemos visto un ejemplo sencillo de clasificación usando las Maquinas de vectores de soporte, esto fue un ejemplo sencillo de lo que se puede hacer con Machine Learning.


El Machine Learning es un tema complejo, y debemos admitirlo, no solo se trata de escoger un algoritmo y usar "fit()" y listo, tenemos el modelo perfecto. No, no solo se trata de eso.


A partir de aquí  quisiera entrar un poco más en la parte teórica del Machine Learning, explicar más a fondo las características que veremos.


Resultado de imagen para aprendizaje automatico modelo

Pasos para construir un modelo de Machine Learning:


Como sabes, el Aprendizaje Automático se trata sobre aprender. Se trata de crear un modelo capaz de aprender a partir de un conjunto de datos. Pero crear un modelo no solo se trata de elegir un modulo de python o elegir un algoritmo de aprendizaje. Se trata de un procedimiento que suele involucrar los siguientes pasos:

  1. Recolectar los datos: Se trata de una parte sumamente importante, por que sin datos ¿Que aprenderá el modelo?. Podemos extraer datos desde distintas fuentes, o utilizando diversas APIs. Podríamos utilizar métodos de web scraping y extraer información rápidamente de una pagina web. Utilizar bases de datos publicas. O elegir entre los miles de conjuntos de datos que se encuentran por Internet. La verdad es que existe una gran variedad de métodos que nos permiten recolectar datos, solo es cuestión de elegir.
  2. Preprocesar los datos: Una vez que tengamos los datos, debemos asegurarnos de que se encuentran en un formato correcto para nutrir a nuestro algoritmo.
  3. Explorar los datos: En esta etapa suelen ser de mucha utilidad las medidas estadísticas y los gráficos de 2 y 3 dimensiones para tener una idea visual de como se comportan nuestros datos. En este punto podemos detectar valores atípicos que debamos descartar, o encontrar las características que más influencia tienen para realizar una predicción. 
  4. Entrenar el algoritmo: En esta etapa es donde empezamos a utilizar los métodos del Aprendizaje Automático (Machine Learning). En este paso, nutrimos a nuestro algoritmo con los datos recolectados en los pasos anteriores. El algoritmo extraerá información útil de los datos que le hemos pasado para luego poder realizar las predicciones.
  5. Evaluar el algoritmo: En esta etapa probamos el conocimiento adquirido por el algoritmo en el paso anterior. Evaluamos que tan preciso es el algoritmo en sus predicciones, si no estamos conforme con el rendimiento del algoritmo, podemos regresar al paso anterior y cambiar algunos parámetros hasta lograr un rendimiento aceptable.
  6. Utilizar el modelo: En esta ultima etapa, ponemos a nuestro modelo a enfrentar el problema real (Clasificación, Regresión, Clustering, entre otros) . Aquí también podemos medir el rendimiento del modelo, lo que tal vez nos obligue a revisar los pasos anteriores.
Perfecto, debemos tener en cuenta estos pasos al momento de realizar nuestro modelo.
Es bueno tomarnos un tiempo y analizar estas 6 etapas.

Mi nombre es Luis, y les deseo un buen día :D.
  1. slash2x dice:

    Hola Luis, un buen libro que me recomiendes que desarrolle los pasos descritos? En Python y en R si fuese posible, te lo agradecería mucho 🙂

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir
White Monkey