La inteligencia artificial avanza a un ritmo vertiginoso, y parece predestinada a convertirse en una herramienta más que presente en nuestro día a día son las IA generadoras de imágenes. Sistemas capaces de crear imágenes realistas o ilustraciones a partir de descripciones escritas por sus usuarios.
Revista Digital – Información de Mercados – Noticia Diaria
.
El protagonismo que estos modelos están cobrando ha ido in crescendo y, lejos de detenerse, continúa aumentando. Así mismo, su complejidad y su capacidad de comprensión y ejecución también han evolucionado, pasando de unos sencillos prototipos iniciales a modelos con resultados más que precisos.
Estas inteligencias artificiales son capaces de lograr un entendimiento profundo del lenguaje escrito, generando imágenes que se ajusten a la descripción indicada. Toda una revolución que democratiza la creación de imágenes e ilustraciones, acercando el diseño a todo el mundo, independientemente de sus habilidades artísticas.
.
Cuáles son las mejores IA generadoras de imágenes
Si todavía no conoces estas herramientas o si solamente has oído hablar de unas pocas, te traemos un listado, de las IA generadoras de imágenes más sonadas actualmente:
.
Bluewillow
Abrimos nuestro listado con Bluewillow, una IA generadora de imágenes gratuita. Para poder hacer uso de esta solamente necesitas tener una cuenta en Discord y unirte al servidor de la herramienta. Una vez hecho esto, tan solo tendrás que seleccionar alguno de los canales situados en el menú lateral izquierdo, introducir el comando «/image promt» e introducir la descripción de la obra que quieras generar.
Desde logos hasta avatares, ilustraciones u obras fotorrealistas, con esta IA podrás generar todo tipo de imágenes con un acabado profesional y de calidad. Así mismo, si buscas generar imágenes muy precisas, la herramienta recomienda que incluyas detalles en la descripción, como instrucciones sobre el escenario en el que se plantea (si es de día o no, qué clima hay, si es un espacio interior, que elementos la componen…), así como sobre los colores o estilos pictóricos.
Tras describirle a Bluewillow la obra que quieres crear, te ofrecerá 4 imágenes y tendrás la posibilidad de descargar las que quieras, ya sea una, dos, tres o las cuatro. También tienes la opción de generar variaciones de las propuestas generadas.
.
Craiyon
Anteriormente conocido como Dalle-mini, Craiyon es un generador de código abierto de OpenAI que fue creado por Boris Dayma y Pedro Cuenca.
Esta herramienta es gratuita, pero más lenta que otras como Dreamstudio. No obstante, Craiyon te ofrece de forma automática varios resultados (9 concretamente), no es necesario establecer de forma concreta que quieres más de un resultado. Así mismo, funciona mejor al introducir frases sencillas, puesto que su sistema no es tan sofisticado como otros y todavía no cuenta con una inmensa capacidad de comprensión.
Sin embargo, llega a entender distintos idiomas, aunque con el que mejor funciona es el inglés. Por lo que, aunque pueda comprender ciertas palabras o frases en castellano, si buscas resultados más óptimos te recomendamos introducir tu descripción en inglés.
Actualmente, Craiyon se encuentra aumentando el número de servidores para poder ofrecer un mejor y más veloz servicio. Por otra parte, debido al alto coste que supone tener activos los ordenadores y sistemas para que funciona, así como su mantenimiento, este se financia incluyendo anuncios en la web de la herramienta.
.
Dalle-2
Se trata de la primera IA generadora de imágenes de la que hablamos en Marketing4eCommerce, allá por abril de 2022. Como su propio nombre indica, es la segunda versión del sistema desarrollado por la compañía de investigación y desarrollo de inteligencia artificial OpenAI, siendo la primera Dalle-1. Este primer modelo fue lanzando a principios de 2021, mientras que un mejorado Dalle-2 se presentó al público en enero de 2022.
Dalle-2 funciona como un «sistema neuronal» capaz de analizar en profundidad un texto. Estas neuronas pueden relacionar el sujeto (por ejemplo «teddy bears»), la acción («mixing sparkling chemicals as mad scientist») y el estilo artístico («as digital art»). Además, el sistema no genera una única propuesta, sino que es capaz de ofrecer múltiples opciones.
Así mismo, los cambios que integró este modelo con respecto a Dalle-1, fueron mejoras en la calidad y resolución de las imágenes, en la comprensión de los textos y dos nuevas funcionalidades: la edición y el versionado.
- Edición: brinda la posibilidad de incluir nuevos objetos o elementos en la composición, substituir otros y ampliar las imágenes añadiendo más contexto. Además, el programa tiene en cuenta luces, sombras, texturas y reflejos, otorgando una rica experiencia de edición.
- Versionado: permite crear nuevos diseños que reinterpreten otros ya existentes, pudiendo variar aspectos como los ángulos y perspectivas, entre otros.
Hasta hace nada si querías acceder a esta herramienta, debías rellenar un formulario en la web de OpenAI, tras lo que pasabas a entrar en una lista de espera. No obstante, ahora esto ya no es necesario, Dalle-2 ya se encuentra disponible para todo el mundo. ¿A qué esperas para comenzar a crear?
.
Dreamstudio
La cuarta herramienta de nuestro listado es la creada por Stability AI, una comunidad formada por más de 140.000 desarrolladores. Dreamstudio se basa en el modelo de generación de imágenes de código abierto nombrado como Stable Diffusion.
Lo que diferencia a Dreamstudio de otras IA generadoras de imágenes son dos puntos, principalmente. El primero es que todo el mundo puede acceder a ella comenzando por una primera prueba gratuita. Una vez agotadas las imágenes gratis, se debe pagar una recarga mínima de 10 libras para continuar usándola. Así mismo, las imágenes se generan bajo una licencia que permite su uso tanto comercial como no comercial. El segundo es que esta no se trata de un modelo cerrado, además desde Stability AI animan a los usuarios a realizar revisiones públicas y aportar mejoras que impulsen y potencien la herramienta.
Así mismo, Dreamstudio ofrece un amplio abanico de parámetros que puedes modificar para ajustar el resultado a tu gusto:
- Estilo artístico de la obra.
- Seleccionar el ancho y el alto de la imagen.
- Número de imágenes generadas.
- «Prompt strenght»: cuanto más alto sea el valor que indiques, mayor será el grado de similitud entre tu descripción y la imagen final.
- Número de pasos que se dedicarán a la creación.
- Modelo bajo el que trabajará la herramienta.
No obstante, dependiendo de la configuración que establezcas, esto consumirá más o menos créditos de imagen. Por lo que deberás estar atento para no agotar el límite de imágenes gratuitas.
Así mismo, desde hace no mucho esta IA también permite editar las obras que generes con ella o las imágenes que subas desde tu dispositivo. Desde Stability AI continúan trabajando en Dreamstudio, lanzando nuevos modelos (como el SDXL que actualmente se encuentra en fase beta), y realizando mejoras, con las que se pretende que la herramienta continúe aprendiendo y se disminuyan los posibles resultados adversos derivados de los malos significados, estigmas o connotaciones negativas ligados al lenguaje y cómo lo empleamos.
.
Firefly
La IA generadora de imágenes desarrollada por Adobe es la más reciente de nuestro listado. Tanto es así que todavía se encuentra en fase beta y para poder utilizarla deberás inscribirte en su lista de espera rellenando un formulario y aguardar a que tu solicitud sea aprobada. Además, dos requisitos a destacar son: tener más de 18 años y una cuenta en Adobe.
Esta herramienta ha sido entrenada con conjuntos de datos de licencia abierta y Adobe Stock, en colaboración con NVIDIA, empresa tecnológica estadounidense especializada en la creación de unidades de pensamiento gráfico. El que Firefly haya sido diseñada de este modo sería una garantía, en principio, para evitar problemas relativos a los derechos de autor.
Utilizar esta IA es sencillo y, a diferencia de otros modelos, no solo permite generar imágenes a partir de una descripción, sino también a partir de un boceto creado por el usuario. Además, permite seleccionar el estilo, color, iluminación y composición de la imagen a través de diversas opciones.
Otra característica relevante de Firefly es la variedad de posibilidades que presenta. No solo podrás crear obras de cero, sino que también tendrás la opción de añadir objetos o ampliar la imagen tomando en consideración el contexto inicial, de modo que todo quede armónico. También podrá emplearse en edición de vídeo, modificando la atmósfera de forma simplificada, en modelaje 3D y para crear vectores, efectos de texto, pinceles y texturas personalizadas.
Por ahora Firefly funciona a través de una aplicación web, pero próximamente Adobe la integrará en herramientas de su ecosistema como Adobe Creative Cloud, Adobe Express, Experience Cloud o Document Cloud.
.
Hotpot (AI Art Maker)
Hotpot reúne diversas soluciones y asistentes de IA y software para diseño gráfico, edición y escritura. Su premisa es ayudar a las personas a crear composiciones, diseños e imágenes a través de herramientas y plantillas atractivas y sencillas que faciliten la edición y creación. Pero, de todas las herramientas que ofrece, la que nos interesa para este ranking es AI Art Maker.
Esta IA generadora de imágenes funciona de manera similar a las anteriores. Lo principal es introducir un texto descriptivo que el programa procesará para convertirlo en una imagen. Además de esto, puedes ajustar criterios como el estilo pictórico, el tamaño de la imagen, si quieres diferentes resultados, etc.
Al igual que Craiyon, se toma más tiempo que otras opciones del listado a la hora de crear las imágenes y sus resultados también son algo más simples. El tiempo medio de espera es de 20 segundos a 2 minutos, pero la propia página advierte que, en caso de haber mucho tráfico en la web, las creaciones gratuitas pueden tardar 2 o 3 horas en crearse.
Si quieres que su velocidad de carga aumente, puedes comprar créditos, lo cual también te permitirá hacer un uso comercial de las imágenes que generes. Las opciones de compra ofrecen planes de pago de una sola vez, mensuales o anuales.
.
Midjourney
Midjourney es un pequeño laboratorio de investigación independiente que busca abrir nuevos caminos y expandir la creatividad humana. Actualmente cuenta con 11 miembros y un conjunto de asesores.
Para poder hacer uso de su IA generadora de imágenes puedes probar una demo o comenzar la experiencia completa. En ambos casos será necesario que accedas con una cuenta de Discord, y podrás acceder mediante Midjourney Bot o la plataforma web. Una vez que comiences a disfrutar de la herramienta, contarás con un límite de imágenes gratuitas (unas 25 aproximadamente). Cuando pases ese límite deberás escoger una de las tarifas que ofertan para poder continuar haciendo uso de Midjourney.
Cada vez que introduzcas un texto se generarán 4 opciones de imágenes, lo cual suele tardar un minuto, una media de tiempo más que razonable. Tras esto, aparecerán dos filas de botones, los cuales podrás usar para ampliar las imágenes y para editarlas a tu gusto.
.
Nightcafe
Nightcafe fue creada por Angus Russell en noviembre de 2019 en Sydney, y con el paso de los años ha ido perfeccionándose hasta llegar a más de 5 millones de usuarios. Su nombre deriva de la obra de Vincent Van Gogh «El café de noche».
Además de generar imágenes acordes a un texto descriptivo, esta herramienta ofrece la opción de imprimirlas como servicio adicional, de modo que puedas presumir de la obra que Nightcafe y tú habéis creado.
La plataforma te ofrece 5 créditos gratuitos, con cada imagen que generes gastarás un crédito. Una vez tengas tu diseño, podrás compartirlo para que otros usuarios puedan disfrutar de él e inspirarse.
.
StableDiffusion Web
Sí, en efecto, esta herramienta también se basa en el mismo modelo (Stable Diffusion) en que lo hace Dreamstudio. Pero, a diferencia de la anterior, es totalmente gratuita y no es necesario crearse una cuenta o registrarse para hacer uso de ella.
Esta plataforma no recopila tu información personal, ni tampoco guarda las imágenes que generas o los textos que introduces. Aunque, sí es posible guardar tus creaciones o compartirlas con la comunidad. Para esto último debes crear un perfil en Hugging Face.
En cuanto a su funcionamiento, esta web genera por defecto cuatro imágenes a partir del texto que introduzcas y, al igual que las herramientas anteriores, es muy rápida, creando imágenes en cuestión de segundos.
No obstante, como podemos apreciar, esta herramienta todavía no se encuentra al nivel de Dalle-2 o Dreamstudio, ya que sus creaciones no son tan precisas (le pedimos un estilo de dibujo animado Disney y nos devolvió imágenes realistas).
Así mismo, aunque bajo el panel de creación se encuentra un apartado de «opciones avanzadas», estas están inactivas por el momento.
.
Stable Diffusion XL
Al igual que el caso anterior, este modelo también ha sido creado por Stability AI y es de los lanzamientos más recientes de nuestro top. Se trata de una versión mejorada de Stable Diffusion 2.0 que, al igual que otros productos de la desarrolladora, es de código abierto.
Stable Diffusion XL se ha entrenado con 3 veces más parámetros que sus predecesores. Esto le otorga mayor capacidad de comprensión e interpretación, permitiéndole entender mucho mejor las instrucciones que se le dan. Entre las mejoras que introduce Stable Diffusion XL, podemos destacar las siguientes:
- Nuevas texturas, estilos y mejoras para crear manos y rostros más realistas y bien definidos.
- Incorporación de texto verdaderamente legible y entendible en las imágenes.
- Amplio rango de perspectivas.
- Colores con más saturación.
- Fusión de tonos para generar sombras, brillos y contrastes más realistas.
A diferencia de otros modelos del listado, este no cuenta con una web propia donde poder utilizarlo, sino que se ha integrado en Dreamstudio. También es posible probarlo en la web de Stability AI Clipdrop de forma gratuita o descargar la API e instalarlo en un ordenador. Así mismo, se ha anunciado su disponibilidad en SageMaker y Bedrock de Amazon Web Services.
Al utilizarlo en Clipdrop, se nos permite introducir algunos ajustes a la hora de crear nuestra imagen. En primer lugar, podemos seleccionar un estilo artístico de entre 14 posibles, o determinar que no queremos ninguno en concreto. También se nos permite determinar las dimensiones y proporciones de la obra, y el «prompt negativo» (una descripción de aspectos o elementos que queremos que la IA evite al generar la obra).
.
Stable Doodle
Y, para cerrar nuestro top, volvemos a toparnos con una IA desarrollada por Stability AI y basada en su modelo Stable Diffusion. No obstante, Stable Doodle ha sido creada a partir de una versión mejorada de este modelo combinada con T21-Adapter, una solución de control condicional.
El rasgo diferencial principal de Stable Doodle es que permite generar imágenes a partir de bocetos dibujados por el usuario. Además, es gratuita y puedes escoger entre registrarte en la herramienta o no. Eso sí, si no creas una cuenta tendrás una limitación diaria de unos 5 usos.
Esta tecnología es capaz de realizar un análisis del contorno del dibujo y crear una imagen con resultado profesional. Así mismo, el boceto se acompaña de una pequeña descripción o indicaciones escritas, que deberán ser introducidas en inglés. También es posible escoger entre 14 estilos artísticos para aplicarlos a tu obra y conseguir resultados más precisos.
Una vez cubiertos todos los campos necesarios, la IA generará tres imágenes y dará la posibilidad de descargarlas todas en alta definición. Los diseños que descargues presentarán una pequeña marca de agua en la esquina inferior derecha, para señalar que han sido creados con esta inteligencia artificial.
.
Fuente: marketing4ecommerce.net