1 minuto(s) de lectura

Microsoft, ha desarrollado una nueva herramienta llamada Visual ChatGPT. Esta herramienta es capaz de generar imágenes a partir de solicitudes de texto, lo que supone un gran avance en la creación de contenido visual por inteligencia artificial.

El equipo de investigación de Microsoft Research Asia ha presentado un paper que detalla la arquitectura y los avances de este software. La dinámica de introducción de órdenes será como la de ChatGPT, es decir, con lenguaje natural y mediante un diálogo entre el usuario y la inteligencia artificial. Además, Visual ChatGPT integrará modelos de Visual Foundation como Blip, Stable Difussion y Pix2Pix que la herramienta podrá usar a conveniencia.

Una de las características más interesantes de Visual ChatGPT es su capacidad para leer e interpretar imágenes. Esto significa que, además de generar imágenes, la herramienta también puede generar parámetros de las imágenes en forma de respuestas de texto. Esto supone una gran ventaja en la búsqueda de imágenes de Bing, ya que permitiría una búsqueda más precisa y específica.

Otro punto destacado de Visual ChatGPT es su capacidad para la edición sobre la marcha y la descripción parcial de las imágenes. Esto supone un cambio importante respecto a otros generadores de imágenes, que generan imágenes nuevas a partir de texto y solo usan los outputs anteriores como referencia.

¿Cómo probar Visual ChatGPT?

Visual ChatGPT, la herramienta de inteligencia artificial de Microsoft que genera imágenes a partir de solicitudes de texto, ya tiene disponible una versión preliminar en Github para que los usuarios puedan probarla. Sin embargo, la herramienta es exigente a nivel de hardware y requiere hasta 7 GB de VRAM para vídeo, por lo que se recomienda que el equipo disponga de una GPU dedicada para su uso. También es posible probar Visual ChatGPT, de forma online desde Hugging Face.

Deja un comentario