Skip to main content

¿Cómo funciona el entrenamiento de modelos de IA?

Dan O'Keefe, Appian
January 24, 2024

El cerebro humano es una máquina predictiva: ve patrones y luego hace predicciones a partir de experiencias anteriores. Esta parte de la inteligencia humana ha sido fundamental para nuestra supervivencia. Por ejemplo, hace muchos años, un recolector podría haberse comido una baya en particular, haberse enfermado y, así, haber aprendido las señales que indican que una baya es venenosa. Esto sucedería de forma automática, ya que esa persona sentiría náuseas al volver a ver la baya, lo que la mantendría alejada de ella. En otras palabras, nuestro cerebro y sistema nervioso hacen una predicción que dicta nuestros resultados.

La inteligencia artificial funciona de la misma manera. Pasa por un proceso de entrenamiento, aprende mediante ensayo y error (aunque también puede utilizar otras técnicas de aprendizaje profundo) y luego predice los resultados. Así como nosotros aprendemos a evitar las bayas venenosas (o a dejar que el café se enfríe antes de quedarnos sin papilas gustativas durante medio día), el entrenamiento de modelos de IA enseña a un sistema de IA a responder a un conjunto de condiciones. Esto permite a las organizaciones dejar las tareas repetitivas en manos de la IA. Cuando se combina con otras herramientas de automatización, la IA puede reforzar una amplia gama de procesos comerciales, desde ofrecer una mejor atención al cliente hasta una comercialización más rápida de los productos.

Entrenar adecuadamente los modelos de IA puede hacer que la IA transforme su organización. Esta publicación cubre los pasos principales en el entrenamiento de modelos de IA y los diferentes enfoques para utilizar la inteligencia artificial empresarial.

[La revolución de la IA se debe a la proliferación de la IA generativa y los modelos de lenguaje de gran tamaño. Conozca la relación entre ambos: Inteligencia artificial generativa frente a modelos de lenguaje de gran tamaño (LLM): ¿Cuál es la diferencia?]

Cómo entrenar un modelo de IA

Los métodos de entrenamiento de modelos de IA dependen de varios factores, como el caso de uso y el alcance y tipo de datos involucrados. Pero si bien los detalles específicos varían, los aspectos generales de este tipo de entrenamiento siendo los mismos, tanto si es un aficionado que está creando un modelo personal como si es un profesional que trabaja en una profunda transformación digital de nivel empresarial impulsada por IA.

1. Recopilación de datos

Los datos son el alimento de la IA, por lo que contar con datos sólidos se traduce en modelos sólidos. Para crear un modelo de IA robusto, necesitemos empezar eligiendo los orígenes de datos y luego reunirlos en un solo lugar.

Veamos un ejemplo de servicios financieros: procesamiento de riesgos y préstamos. Las fuentes de datos podrían incluir:

  • Datos personales del solicitante (historial crediticio, direcciones o nivel de ingresos, por nombrar algunos).

  • Comportamiento financiero como transacciones bancarias, retiros de grandes cantidades de efectivo o ingresos extraordinarios.

  • Datos de mercado y factores económicos que podrían afectar la capacidad de una persona para pagar un préstamo.

  • Registros adicionales, como antecedentes judiciales, posesión de bienes, órdenes de desalojo o embargos de viviendas.

  • Bases de datos que incluyan nombres y apodos de delincuentes de guante blanco y perpetradores de fraude conocidos.

  • Datos corporativos sobre el historial de pagos de préstamos para ayudarle a descubrir sus propios marcadores de riesgo.

La incorporación de estos puntos de datos ayuda a entrenar el modelo para ponderar los marcadores de riesgo individuales y así hacer sugerencias y predicciones cuando alguien solicite un préstamo más adelante.

[La recopilación de datos de múltiples fuentes de datos puede complicarse rápidamente. Un data fabric puede ayudarle. Descubra cómo: La ventaja de Data Fabric: Integre y organice sus datos para lograr una rápida innovación.]

2. Preprocesamiento de datos

El siguiente paso consiste en preparar los datos para el entrenamiento. Si lo viéramos como si de una receta de cocina se tratara, entonces el primer paso es reunir los ingredientes y el segundo es cortarlos para prepararlos para su cocción. El preprocesamiento implica lo siguiente:

  • Revisar los datos para comprobar su adecuación e integridad.

  • Formatear los datos para el entrenamiento.

  • Limpiar los datos.

El preprocesamiento es esencial. Los modelos de IA requieren múltiples orígenes de datos, a menudo en formatos muy dispares. El preprocesamiento hace que estos elementos de datos sean más fáciles de acceder, procesar y usar para el entrenamiento de un sistema de inteligencia artificial.

Consejo profesional: Este es el momento perfecto para pensar en los sesgos. En este paso, elimine cualquier elemento que pueda hacer que el modelo haga predicciones inexactas o, peor aún, establezca discriminaciones. Por ejemplo, consulte los orígenes de datos en busca de información que pueda identificar a alguien por formar parte de un grupo demográfico protegido.

Lo último que quiere es un modelo de IA que tome malas decisiones basándose en este tipo de factores. Aunque el sesgo suele ser involuntario, las organizaciones pueden verse igualmente afectadas tanto por sanciones como por daños a su reputación. Evitar los sesgos es algo en lo que hay que trabajar continuamente, pero este paso sienta una base sólida.

3. Selección de modelos

Los detalles del entrenamiento del modelo de IA dependen de su caso de uso. La selección de modelos de entrenamiento de machine learning es un dominio del experto en ciencia de datos. Los tipos de modelos de entrenamiento de IA darían para un artículo aparte, pero aquí tiene un par de ejemplos.

Los modelos de aprendizaje por refuerzo ejecutan una serie de simulaciones en las que la IA intenta producir un resultado o alcanzar un objetivo mediante un método de ensayo y error. El modelo realiza acciones y luego recibe refuerzo positivo o negativo según si ha alcanzado o no el resultado deseado.

Los modelos de aprendizaje profundo utilizan redes neuronales para aprender de los datos. Se pueden alimentar con información y, con cada repetición, pueden empezar a clasificar esta información y establecer distinciones. Por ejemplo, puede alimentar un modelo de IA de aprendizaje profundo con imágenes, y este puede aprender con una primera repetición que en una imagen específica aparecen muebles. Luego, en un ciclo de aprendizaje posterior, el modelo puede empezar a establecer distinciones entre tipos de muebles, como aprender la diferencia entre una silla con cojines y una mesa.

Hay varios tipos diferentes de modelos de IA entre los que puede elegir. El modelo correcto para una tarea determinada dependerá de cuál sea su objetivo; en el ejemplo anterior, el aprendizaje por refuerzo puede tener más sentido en la previsión de objetivos empresariales, mientras que el aprendizaje profundo sería más idóneo para crear modelos que necesiten reconocer cosas como imágenes, documentos o texto. A menudo, una tarea puede implicar el uso de varios métodos.

4. Entrenamiento

Por último, entrenamos el modelo. Esto implica el uso de machine learning. Como es obvio, la forma de realizar el entrenamiento dependerá del modelo de machine learning que haya elegido en el paso anterior. Sin embargo, en general, la IA ejecuta una serie de pruebas o simulaciones, hace predicciones y luego las compara con un objetivo o resultado esperado. Y así el modelo se va ajustando mediante las múltiples rondas de entrenamiento. Con el tiempo, la diferencia entre la predicción y los resultados esperados debería reducirse, lo que lleva a predicciones más precisas.

5. Evaluación

Después del entrenamiento, ponga a prueba los resultados. Al igual que en cualquier otro ámbito de su empresa, deberá garantizar la calidad de la IA. Intente probar el modelo en un pequeño conjunto de tareas reales para asegurarse de que funciona bien. Si está satisfecho, puede desplegarlo en un entorno de mayor nivel; si no, vale la pena volver a entrenarlo.

Pero la evaluación de modelos no es un algo que se deba hacer una sola vez. Las organizaciones deben evaluar continuamente los modelos de IA para garantizar que producen los resultados adecuados. Por ejemplo, varias de las principales aseguradoras de salud de EE. UU. han sido muy criticadas y se están enfrentando a demandas legales por denegaciones excesivas de reclamaciones. Implementar supervisión humana para garantizar que estos modelos no tomen decisiones equivocadas es fundamental para evitar un mal rendimiento, daños a la reputación, una menor satisfacción del cliente o incluso sanciones por incumplimiento.

Entrenamiento de modelos de IA: enfoque público frente a enfoque privado

Hemos mencionado varias veces que para construir estos modelos se requiere experiencia. Las empresas tienen tres métodos para obtener los recursos para construir estos modelos.

Primer método: Crear todo de forma interna. Este enfoque ofrece numerosas ventajas, ya que obtiene un control total sobre sus modelos. Los modelos se entrenan con sus datos, lo que garantiza la precisión. Puede realizar ajustes en los modelos fácilmente si observa algún sesgo y, lo más importante: sus datos siguen siendo privados. Sin embargo, este método es costoso. Necesitará un equipo de ingenieros de datos, científicos de datos y desarrolladores de software, además del presupuesto necesario para su hardware, software e infraestructura. Esto hace que el método esté fuera del alcance de las organizaciones en las que la IA no es crítica para su misión.

Segundo método: Utilizar un gran proveedor de cloud pública (también conocidos como hiperescaladores). Estas empresas proporcionan modelos de IA preexistentes que puede utilizar para aplicar a sus tareas. Esto reduce el coste que supondría contar con un gran equipo especializado en datos, pero hay un problema: tiene poco control sobre sus datos. Esto significa que los modelos no se adaptarán a su organización y, peor aún, el proveedor podría utilizar sus datos para entrenar sus propios algoritmos. Esto pone en peligro la privacidad de sus datos.

Tercer método: Utilizar un proveedor que enfatice la IA privada. Se trata de grandes plataformas de hiperautomatización que adoptan un enfoque de IA privada. Puede crear sus propios modelos utilizando herramientas low-code o sin código e incorporarlos en un proceso integral más amplio que transforme su negocio. Por ejemplo, puede cargar un lote de correos electrónicos o documentos y luego hacer que la plataforma entrene un modelo por usted. Desde allí, puede revisar los resultados y desplegarlos en producción. Incluso puede ajustar los modelos de forma continua. Esto mantiene la privacidad de sus datos sin que tenga que contratar un equipo que resulte extremadamente costoso ni comprar una cantidad prohibitiva de hardware y sistemas para su mantenimiento.

¿Desea entender cómo funciona este enfoque de IA privada? Profundice en estos tres métodos para descubrir cuál es el adecuado para usted, y obtenga más información sobre cómo funcionan las plataformas de IA privada, leyendo Implementación de la Inteligencia Artificial Privada: Una Guía Práctica.