{"id":2054,"date":"2022-10-11T08:53:43","date_gmt":"2022-10-11T07:53:43","guid":{"rendered":"https:\/\/keepler.io\/2022\/10\/11\/tecnicas-de-generacion-de-imagenes-sinteticas-para-el-entrenamiento-de-modelos-de-aprendizaje-automatico\/"},"modified":"2024-01-15T13:28:36","modified_gmt":"2024-01-15T12:28:36","slug":"tecnicas-de-generacion-de-imagenes-sinteticas-para-el-entrenamiento-de-modelos-de-aprendizaje-automatico","status":"publish","type":"post","link":"https:\/\/keepler.io\/es\/2022\/10\/11\/tecnicas-de-generacion-de-imagenes-sinteticas-para-el-entrenamiento-de-modelos-de-aprendizaje-automatico\/","title":{"rendered":"T\u00e9cnicas de generaci\u00f3n de im\u00e1genes sint\u00e9ticas para el entrenamiento de modelos de aprendizaje autom\u00e1tico"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">Uno de los problemas m\u00e1s comunes en <\/span><i><span style=\"font-weight: 400;\">Computer Vision<\/span><\/i><span style=\"font-weight: 400;\"> es la<\/span><b> falta de im\u00e1genes a la hora de entrenar los modelos<\/b><span style=\"font-weight: 400;\">. En <\/span><i><span style=\"font-weight: 400;\">deep learning se <\/span><\/i><span style=\"font-weight: 400;\">requiere un gran n\u00famero de datos para que las redes neuronales aprendan las caracter\u00edsticas relevantes de los <\/span><i><span style=\"font-weight: 400;\">inputs<\/span><\/i><span style=\"font-weight: 400;\"> y despu\u00e9s\u00a0 puedan realizar el proceso de inferencia de forma correcta, ya que <\/span><span style=\"font-weight: 400;\">cuando los modelos se entrenan con ejemplos limitados no son capaces de generalizar a los datos no vistos.<\/span><span style=\"font-weight: 400;\"> Incluso si se utilizan modelos pre-entrenados (<\/span><i><span style=\"font-weight: 400;\">transfer learning<\/span><\/i><span style=\"font-weight: 400;\">), muchas veces las im\u00e1genes para los casos particulares siguen siendo insuficientes y el modelo no se entrena correctamente.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">En Keepler nos hemos encontrado con este reto sobre todo en proyectos de detecci\u00f3n de objetos en im\u00e1genes, m\u00e1s concretamente en detecci\u00f3n de anomal\u00edas. Ante este problema hemos visto la necesidad buscar <\/span><b>m\u00e9todos para generar im\u00e1genes sint\u00e9ticas<\/b><span style=\"font-weight: 400;\"> (<\/span><i><span style=\"font-weight: 400;\">data augmentation<\/span><\/i><span style=\"font-weight: 400;\">) con el objetivo de hacer viables proyectos con un dataset reducido de im\u00e1genes. En concreto hemos investigado dos t\u00e9cnicas.<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Generaci\u00f3n de im\u00e1genes mediante procedimientos cl\u00e1sicos de <\/span><b><i>data augmentation<\/i><\/b><span style=\"font-weight: 400;\">: distorsiones, rotaciones, cambios de color etc. de las im\u00e1genes originales.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Generaci\u00f3n de im\u00e1genes a partir de <\/span><b><i>GANs<\/i><\/b><span style=\"font-weight: 400;\"> (Generative Adversarial Networks); concretamente uso de Cycle GANs para realizar un cambio de contexto (style transfer) a las im\u00e1genes originales y as\u00ed generar nuevas.\u00a0<\/span><\/li>\n<\/ul>\n<p><span style=\"font-weight: 400;\">La generaci\u00f3n de im\u00e1genes o de cualquier tipo de dato est\u00e1 a la orden del d\u00eda en un <\/span><b>gran n\u00famero de proyectos<\/b><span style=\"font-weight: 400;\"> donde los datos son escasos. El aumento de la variabilidad de los datos de entrenamiento permite una mayor <\/span><b>generalizaci\u00f3n<\/b><span style=\"font-weight: 400;\"> de los modelos; adem\u00e1s puede reducir el coste de la recogida y el etiquetado de datos.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">A lo largo del siguiente <em>white paper<\/em> que puedes descargar, veremos en detalle los <\/span><b>m\u00e9todos utilizados, <\/b><span style=\"font-weight: 400;\">algunos simples y otros m\u00e1s complejos, para producir im\u00e1genes sint\u00e9ticas necesarias en el entrenamiento de modelos de <\/span><i><span style=\"font-weight: 400;\">computer vision<\/span><\/i><span style=\"font-weight: 400;\">. <\/span><\/p>\n<hr \/>\n<div style=\"margin-top: 15px;\">\n<p><strong><em>Descarga gratis este white paper sobre Aumento de Datos \ud83d\udc47<\/em><\/strong><\/p>\n<\/div>\n<hr \/>\n<p><strong>T\u00edtulo: <\/strong>C\u00f3mo utilizar el aumento de datos cuando se tienen datos limitados<br \/>\n<strong>Autoras:<\/strong> \u00c1ngela Garc\u00eda, Data Scientist en Keepler &amp; Adriana A. Bogdan, Data Scientist en Keepler<\/p>\n<p>[email-download download_id=&#8221;46747&#8243; contact_form_id=&#8221;46761&#8243;]<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Uno de los problemas m\u00e1s comunes en Computer Vision es la falta de im\u00e1genes a la hora de entrenar los modelos. En deep learning se requiere un gran n\u00famero de datos para que las redes neuronales aprendan las caracter\u00edsticas relevantes de los inputs y despu\u00e9s\u00a0 puedan realizar el proceso de inferencia de forma correcta, ya [&hellip;]<\/p>\n","protected":false},"author":134360170,"featured_media":34811,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","_seopress_analysis_target_kw":"","_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_crdt_document":"","content-type":"","_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_feature_clip_id":0,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"_wpas_customize_per_network":false,"jetpack_post_was_ever_published":false},"categories":[222],"tags":[281,269,283],"class_list":["post-2054","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ia","tag-herramientas","tag-machine-learning-es","tag-tecnologia"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/keepler.io\/wp-content\/uploads\/2022\/10\/keepler-whitepaper-data-aumentation-1.jpg?fit=1280%2C452&ssl=1","jetpack_shortlink":"https:\/\/wp.me\/p9CeZw-x8","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/posts\/2054","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/users\/134360170"}],"replies":[{"embeddable":true,"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/comments?post=2054"}],"version-history":[{"count":3,"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/posts\/2054\/revisions"}],"predecessor-version":[{"id":39347,"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/posts\/2054\/revisions\/39347"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/media\/34811"}],"wp:attachment":[{"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/media?parent=2054"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/categories?post=2054"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/keepler.io\/es\/wp-json\/wp\/v2\/tags?post=2054"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}