Observatorio Tecnológico de Hidalgo

Así es Stable Diffusion 2.0: la versión mejorada del modelo en el que se basan IA generadoras de texto como Dreamstudio

7 February, 2023

by OtechUAEH

Stability AI acaba de anunciar el lanzamiento de Stable Diffusion 2.0, la nueva y mejorada versión de su modelo de generación de imágenes de código abierto. La comunidad de desarrolladores de inteligencia artificial continúa trabajando en pos de un futuro que desborde creatividad y comunicación.

En concreto, son Robin Rombach y Katherine Crowson quienes están liderando este nuevo proyecto para impulsar las capacidades del modelo en el que se basan herramientas como Dreamstudio o Wepik.

Stable Diffusion 2.0, mejoras y nuevas características

Al igual que su anterior versión, Stable Diffusion 2.0 será de código abierto. Ya que desde Stability AI quieren promover el acceso a esta tecnología de última generación, permitiendo que las personas exploten y exploren su propio potencial y talento. Como ellos mismos han declarado «cuando millones de personas tiene en sus manos estos modelos, colectivamente crean algunas cosas realmente sorprendentes«.

Esta nueva versión integra nuevas funcionalidades como el depth2img, es capaz de generar imágenes con mayor calidad o mejorar su resolución, entre otras cosas.

Nuevos modelos de difusión de texto a imagen

Para entrenar esta nueva versión de Stable Diffusion, se ha utilizado un codificador de texto nuevo llamado OpenCLIP y desarrollado de forma conjunta por Satbility AI y LAION. Esta nueva tecnología ha servido para lograr una mayor calidad en las imágenes generadas por la herramienta. Ahora, con el modelo 2.0 se podrán generar imágenes con resoluciones predeterminadas de 512×512 píxeles y de 768×768 píxeles.

Superresolución

Otra de las novedades es la integración del modelo Upscaler Diffusion, el cual mejora la resolución de las imágenes. Ahora será posible crear imágenes con resoluciones mayores de 2048×2048 píxeles. Además, podrás, por ejemplo, convertir una imagen de baja resolución (128×128) en una de mayor resolución (512×512).

mayor resolucion stable diffusion

Profundidad a partir de una imagen base

Depth2img es el nombre bajo el que han bautizado al nuevo modelo de difusión guiado por profundidad. Este sirve para ampliar las características de una imagen ya existente, permitiendo crear nuevas obras a la vez que se mantiene parte de la información y sentido de esta fuente original.

stable diffusion profundidad

Modelo de pintura interior guiado por texto

Con esta funcionalidad se pueden modificar partes de una composición de manera ágil y veloz. De este modo podrás aprovechar una imagen para generar diferentes contextos o realizar las modificaciones que prefieras.

Desde Stability AI han anunciado que en los próximos días integrarán Stable Diffusion 2.0 en Dreamstudio y en su plataforma oficial. Mientras tanto, puedes disfrutarlo descargándolo e instalándolo en tu ordenador siguiendo unos sencillos pasos.

Fuente:

Irving, M. (2023, 6 febrero). Bizarre new form of ice might be «true glassy state» of water. New Atlas. https://newatlas.com/science/new-form-ice-true-glassy-state-water/