Cómo crear imagenes artísticas fácilmente con una IA: VQGAN
Contents
En este artículo te mostraré cómo crear imagenes, con un tono artístico, como si fueran cuadros incluso, usando una inteligencia artificial. Es totalmente gratuito por lo que explicaré en breve. Además no se necesita saber programar para poder usarla, pero si sabes programar y en especial en Python, las posibilidades se multiplican.
Qué es VQGAN Y CLIP
VQGAN es una inteligencia artificila desarrollada con técnicas de machine learning, más concretamente usa transformers. Por primera vez se consigue crear imagenes de alta definición usando esta técnica, la cual anteriormente solo podía desarrollar imagenes de baja resolución debido al exponencial uso de recursos conforme aumentan el número de píxeles.
CLIP es otra inteligencia artificial que permite convertir textos en imagenes. Es decir, le decimos a CLIP con texto, qué queremos que cree, por ejemplo “a red car”, y esta lo crea usando VQGAN.
El resultado es simplemente asombroso. Además entenderá lo que queremos, por ejemplo, podremos acompañar con adjetivos lo que queramos crear, si decimos un “un coche rojo, estilo Van Gogh”, lo entenderá y lo hará.
Todo este código está publicada bajo licencia MIT, esto quiere decir, que podremos usar el programa como queramos: modificarlo, redistribuirlo, e incluso comercializarlo. La licencia MIT es la más libre que existe y da libertad absoluta de uso, por tanto podremos hacer lo que queramos con el código.
Cómo usar VQGAN Y CLIP en Google Collage
Usarlo es muy sencillo, como gasta bastantes recursos, conviene ejecutarlo en la nube o al menos en un pc potente. Ahora mismo lo podremos usar ejecutandolo en los servidores de Google, de manera gratuita. Usando el servicio de Google Colab.
Solo tendremos que acceder al enlace que dejaré a continuación, una cuenta en Google(imposible que no tengas una), y ya está.
Una vez estemos allí solo tienes que ejecutar todos los módulos en orden menos el último, pero no olvides antes dónde pone “A fantasy world”, lo que tú quieras escribir. Eso si, tiene muchas más opciones. De todas formas si te lias, dejo un video al final del artículo, al final del video explica con más detalles cómo usarla.
He aquí un ejemplo que he creado para yourgeekweb con el texto “sun and moon”:
Por la manera en la que trabaja, la herramienta va mostrando imagenes y cada vez va aumentando más los detalles y definiendo más los trazos. Las he puesto en orden cronológico.
Ir a Google Colab con VQGAN + CLIP.
Si alguna vez no está en Google
Si alguna vez Google deja de prestar este servicio gratuitamente podrás pagar 10$ al mes a Google Colab, o simplemente descargar el código y usarlo tú mismo en otro servicio de computación en la nube como Heroku, AWS, etc. O simplemente ejecutarlo en tu ordenador personal, siempre que este sea potente.
Por cierto, Google Colab, nos permitirá usarlo de manera limitada, a mi me ha dejado usarlo unas horas en un día, a partir de ahí solo me ha dejado ejecutarlo sin GPU, solo con el procesador, cosa que lo hace muchísimo más lento, tanto que no merece la pena. Eso si, al día siguiente me ha permitido seguir usandolo con GPU.
La teoría de VQGAN y CLIP
En este video se explica por DOT CSV la parte más teórica de esta tecnología, de manera estupenda como lo hace siempre. En los últimos minutos del video explica como usarlo, hasta entonces es solo la parte más teórica y por qué es otro pequeño hito esta herramienta en el mundo del machine learning.