¿Qué es el AutoML?

El AutoML o aprendizaje automático automatizado, hace que el aprendizaje automático (ML) sea accesible para usuarios no expertos, ya que les permite crear, validar, iterar y explorar modelos de ML a través de una experiencia automatizada.
El AutoML prepara y limpia datos automáticamente, crea y selecciona características, selecciona la familia de modelos correcta, optimiza hiperparámetros y analiza resultados. También ayuda con la visualización de datos, la generación de insights, la capacidad de explicación de modelos y la implementación de modelos.

¿Por qué es importante el AutoML?

Los modelos de ML proporcionan a las empresas insights valiosos, pero la responsabilidad de crear los modelos a menudo recae en aquellos que no cuentan con una amplia experiencia en ML. Si bien el AutoML no reemplaza a los científicos de datos, los hace más productivos y les permite (a ellos y a otros) automatizar los pasos que requieren una gran cantidad de código y centrarse en las pruebas y los insights del modelo. Los usuarios menos experimentados (también conocidos como ciudadanos científicos de datos) a menudo utilizan el AutoML para generar insights y como una forma rápida de aprender sobre la ciencia de datos.

Cómo funciona el AutoML

El AutoML generalmente incluye lo siguiente:

 

Preprocesamiento de evaluación de datos - AutoML
Evaluación y preprocesamiento de datos: los datos se preparan, limpian y transforman para crear un conjunto de datos útil para entrenar el modelo.

 

Ingeniería de características - AutoML
Ingeniería de características: se crean nuevas columnas de datos en los datos de entrenamiento del modelo existente, lo que puede representar mejor los factores de predicción en el fenómeno descrito por los datos o simplemente funcionar mejor con los algoritmos de ML.

 

Selección de características - AutoML
Selección de características: después de que se crean nuevas características, el AutoML toma solamente aquellas que son útiles para generar un modelo.

 

Selección de algoritmos - AutoML
Selección de algoritmo: se revisan los modelos candidatos competidores para seleccionar el que mejor se desempeñe en términos de la métrica deseada (por ejemplo, optimización de la precisión, recuperación, precisión equilibrada).

 

Ajuste de hiperparámetros - AutoML
Ajuste de hiperparámetros: se selecciona un conjunto de hiperparámetros óptimos para un algoritmo de aprendizaje.

Ejemplos de AutoML

El AutoML puede ayudar a resolver una gran cantidad de desafíos empresariales, entre los que se incluyen:

Personalización

Hablar con una base de consumidores ya no es suficiente. Para que una empresa tenga éxito, debe ser capaz de atender a cada cliente de forma individual. El AutoML hace que la personalización sea más escalable mediante el aprendizaje de las preferencias y los comportamientos individuales, lo que les permite a las empresas brindar recomendaciones y contenido personalizados. El resultado es una base de consumidores más comprometida y mejores ventas.

Limpieza de registros de clientes

Los errores ortográficos, las actualizaciones y la información inconsistente pueden generar registros duplicados en la base de datos de una empresa. El AutoML hace que sea fácil encontrar y corregir los valores atípicos para que los datos estén limpios, sean precisos y fáciles de usar.

Tasa de abandono de clientes

Atraer nuevos clientes es esencial para cualquier empresa, pero también lo es mantener a los que ya tienen. El AutoML puede encontrar patrones en la actividad de los clientes para predecir cuáles son los que probablemente se cambien a los competidores. Esta información permite llevar adelante iniciativas de retención clave que pueden aumentar las ganancias y el valor de la marca.

Detección de fraudes

El fraude le cuesta al gobierno de EE. UU. alrededor de $80 000 millones al año. Casi todas las agencias federales son el objetivo y no hay suficientes recursos para investigar cada reclamo. A medida que los delincuentes son más inteligentes, las soluciones también deben serlo. El AutoML se integra en los sistemas existentes y utiliza datos de casos de fraude anteriores para ayudar a encontrar señales de alerta y abordar los problemas rápidamente.

Primeros pasos con el AutoML

Alteryx ofrece una experiencia de AutoML accesible mediante un enfoque educativo y guiado que mantiene las capacidades técnicas potentes que utilizan los científicos de datos tradicionales. Con Alteryx Machine Learning, el AutoML está integrado en cada paso del proceso de análisis de datos, incluida la preparación, la combinación y el enriquecimiento.

En su nivel más básico, Alteryx Machine Learning puede realizar lo siguiente:

  • Automatizar los pasos de la ciencia de datos y el proceso de ML.
  • Entrenar una serie de modelos predictivos con esos datos.
  • Proporcionar métricas sobre el rendimiento de esos modelos (por ejemplo, características operativas del receptor, precisión, recuperación, exactitud, precisión equilibrada).

Además de esas funciones, Alteryx cuenta con:

  • Visualizaciones interactivas
  • Generación clara de informes para stakeholders de la empresa
  • Capacidad de implementar modelos en un sistema de funcionamiento
  • Lecciones y glosarios integrados
  • Evaluación de datos de entrenamiento automatizado
  • Sugerencias para mejorar los datos de entrenamiento o ajustar automáticamente dichos datos