Técnicas de generación de imágenes sintéticas para el entrenamiento de modelos de aprendizaje automático

Uno de los problemas más comunes en Computer Vision es la falta de imágenes a la hora de entrenar los modelos. En deep learning se requiere un gran número de datos para que las redes neuronales aprendan las características relevantes de los inputs y después  puedan realizar el proceso de inferencia de forma correcta, ya que cuando los modelos se entrenan con ejemplos limitados no son capaces de generalizar a los datos no vistos. Incluso si se utilizan modelos pre-entrenados (transfer learning), muchas veces las imágenes para los casos particulares siguen siendo insuficientes y el modelo no se entrena correctamente.

En Keepler nos hemos encontrado con este reto sobre todo en proyectos de detección de objetos en imágenes, más concretamente en detección de anomalías. Ante este problema hemos visto la necesidad buscar métodos para generar imágenes sintéticas (data augmentation) con el objetivo de hacer viables proyectos con un dataset reducido de imágenes. En concreto hemos investigado dos técnicas.

  • Generación de imágenes mediante procedimientos clásicos de data augmentation: distorsiones, rotaciones, cambios de color etc. de las imágenes originales.
  • Generación de imágenes a partir de GANs (Generative Adversarial Networks); concretamente uso de Cycle GANs para realizar un cambio de contexto (style transfer) a las imágenes originales y así generar nuevas. 

La generación de imágenes o de cualquier tipo de dato está a la orden del día en un gran número de proyectos donde los datos son escasos. El aumento de la variabilidad de los datos de entrenamiento permite una mayor generalización de los modelos; además puede reducir el coste de la recogida y el etiquetado de datos. 

A lo largo del siguiente white paper que puedes descargar, veremos en detalle los métodos utilizados, algunos simples y otros más complejos, para producir imágenes sintéticas necesarias en el entrenamiento de modelos de computer vision.


Descarga gratis este white paper sobre Aumento de Datos 👇


Título: Cómo utilizar el aumento de datos cuando se tienen datos limitados
Autoras: Ángela García, Data Scientist en Keepler & Adriana A. Bogdan, Data Scientist en Keepler

[email-download download_id=»46747″ contact_form_id=»46761″]

+ posts

Data Scientist at Keepler. “Passionate about technology and science, I love solving problems and facing new challenges. In my spare time I like to read, currently studying a bachelor in humanities and philosophy.”

Data Scientist at Keepler. "I am a Data Scientist passionate about building models that fix problems and exploring data to draw meaningful conclusions. Being a part of new technologies and trying out innovative solutions is what motivates me the most. I love to learn about life through travelling, this way I can get to know different cultures, lifestyles and cuisines."

0 comentarios

Deja un comentario

You May Also Like

Google Gemini 3: un nuevo paradigma en la IA

Google Gemini 3: un nuevo paradigma en la IA

El panorama de la inteligencia artificial cambió de forma decisiva con el lanzamiento de Gemini 3 de Google DeepMind. Este documento técnico evalúa la arquitectura, las métricas de rendimiento y el posicionamiento estratégico de lo que es actualmente el modelo de IA...

leer más

Descubre más desde Keepler | The AI Enabler Partner

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo

Resumen de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.