El venerable sitio de imágenes de archivo, Getty, cuenta con un catálogo de 80 millones de imágenes . Shutterstock, rival de Getty, ofrece 415 millones de imágenes . Tomó algunas décadas construir estas prodigiosas bibliotecas.
Ahora, parece que tendremos que redefinir lo prodigioso. En una publicación de blog la semana pasada, OpenAI dijo que su algoritmo de aprendizaje automático, DALL-E 2, está generando más de dos millones de imágenes al día. A ese ritmo, su producción igualaría a Getty y Shutterstock juntas en ocho meses. El algoritmo está produciendo casi tantas imágenes diarias como toda la colección del sitio de imágenes gratuitas Unsplash .
Y eso fue antes de que OpenAI abriera DALL-E 2 para todos. Hasta la semana pasada, el acceso estaba restringido y había una lista de espera de personas ansiosas por tener en sus manos el algoritmo. El propósito de la publicación de blog en la que apareció el número fue anunciar que DALL-E 2 ahora está abierto al público en general.
Mientras tanto, algoritmos similares ya están disponibles gratuitamente. El ritmo, entonces, probablemente se acelerará a partir de aquí.
Por supuesto, vale la pena señalar que esta es una comparación imperfecta. La calidad de su imagen promedio de Shutterstock o Getty es mayormente mayor desde el principio, y los sitios también ofrecen imágenes editoriales de eventos actuales. Mientras tanto, DALL-E 2 y otros algoritmos generan múltiples imágenes para cada mensaje, la calidad de la imagen varía ampliamente y el mejor trabajo requiere que lo perfeccione una mano experta.
Aún así, está claro que DALL-E y otras son máquinas de creación de imágenes sin precedentes.
Un lanzamiento por fases
DALL-E 2, lanzado a principios de este año, ha sido la comidilla del mundo de la tecnología.
A diferencia de su predecesor, que OpenAI presentó por primera vez en 2021 y produjo creaciones notablemente imperfectas, DALL-E 2 crea imágenes fotorrealistas con un mensaje de texto. Los usuarios pueden mezclar y combinar elementos, como solicitar un astronauta montando a caballo , y estilos, como una nutria marina al estilo de Girl With a Pearl Earring de Johannes Vermeer .
Para limitar el mal uso y filtrar mejor la salida del algoritmo, OpenAI buscó un lanzamiento por etapas. Entrenado en millones de imágenes y subtítulos en línea, DALL-E 2 y otros algoritmos similares son susceptibles a sesgos en sus conjuntos de datos, así como al uso indebido por parte de los usuarios. OpenAI publicó un artículo sobre DALL-E 2 en abril y presentó una vista previa del algoritmo para 200 artistas, investigadores y otros usuarios. Ampliaron la versión preliminar en 1000 usuarios a la semana el mes siguiente y luego ampliaron el acceso al algoritmo en versión beta, con precios, a un millón de personas.
“La escalabilidad responsable de un sistema tan poderoso y complejo como DALL-E, mientras se aprende sobre todas las formas creativas en las que se puede usar y maltratar, ha requerido un enfoque de implementación iterativo”, escribió la compañía en la publicación del blog.
Durante el lanzamiento, OpenAI tomó los comentarios de los usuarios y los tradujo en arreglos técnicos para reducir el sesgo y los filtros para evitar el contenido inapropiado. También están empleando un equipo de moderadores para controlar las cosas. Queda por ver qué tan bien escalará este enfoque, a medida que millones de imágenes se conviertan en decenas de millones y más, pero el equipo confiaba lo suficiente en el producto hasta ahora como para seguir adelante con un lanzamiento completo.
Arte de IA en ascenso
El resto del mundo de la IA no se quedó quieto mientras tanto. Los competidores siguieron rápidamente los pasos de DALL-E. Primero fue DALL-E Mini, ahora Craiyon, un generador de imágenes gratuito pero de menor calidad del que se apoderó Internet para fabricar memes. Los algoritmos de mayor calidad incluyen Midjourney y Stable Diffusion. Google incluso se metió en el juego con su algoritmo Imagen (aunque hasta ahora la compañía lo ha mantenido en secreto).
Agréguelos a la producción de DALL-E 2 y el volumen de arte de IA crecerá rápidamente.
A principios de este verano, Stable Diffusion dijo que su algoritmo ya estaba produciendo dos millones de imágenes por día durante las pruebas. Cuando la plataforma llegó a un millón de usuarios a mediados de septiembre, el fundador de Stable Diffusion, Emad Mostaque, tuiteó : “Deberíamos dividir mil millones de imágenes al día más temprano que tarde, imagino, especialmente una vez que activamos la animación, etc.”.
La rápida aparición del arte de la IA no ha estado exenta de controversia.
Una pieza de arte de IA generada en Midjourney por Jason Allen ganó recientemente la cinta azul para arte digital en la Feria Estatal de Colorado . No es difícil ver por qué. La pieza es hermosa y evocadora. Pero muchos artistas recurrieron a Twitter para expresar su descontento.
A algunos les preocupa que los algoritmos reduzcan la cantidad de trabajo disponible para los diseñadores gráficos. La combinación de calidad, velocidad y volumen con la habilidad especializada limitada requerida puede significar que las empresas elijan una creación algorítmica rápida en lugar de contratar a un diseñador.
Recientemente, Ars Technica informó que Shutterstock ya albergaba miles de imágenes de IA. No mucho después de que apareciera, el sitio estaba eliminando algunos. Mientras tanto, Getty prohibió por completo el arte de IA en su plataforma, citando preocupaciones de derechos de autor. El panorama legal aún es turbio y susceptible de cambiar.
“Por el momento, el contenido generado por IA no se revisará de manera diferente a cualquier otro tipo de presentación de ilustración digital”, dijo Shutterstock a Quartz la semana pasada . “Esto puede cambiar en cualquier momento a medida que aprendemos más sobre las imágenes sintéticas”.
A otros les preocupa que la capacidad de imitar de cerca el estilo de un artista en activo pueda afectar negativamente el valor y la visibilidad de su trabajo . Tampoco está claro qué se debe a los artistas cuyas creaciones ayudaron a entrenar los algoritmos. Los desarrolladores expresaron una preocupación similar el año pasado cuando OpenAI lanzó algoritmos de codificación entrenados en repositorios abiertos de código.
Pero no todos están de acuerdo en que el arte de la IA reemplazará tan fácilmente a los diseñadores y artistas hábiles una vez que la novedad desaparezca. Y la comunidad puede solucionar aún más los problemas, como decidir entrenar algoritmos solo en obras de dominio público o permitir que los artistas opten por no participar. (Ya existe una herramienta para que los artistas vean si sus creaciones están incluidas en los datos de entrenamiento).
Cuando el polvo se asienta
Los algoritmos de aprendizaje automático han generado imágenes y texto extraños y novedosos, pero no particularmente útiles durante años. La IA que podría generar un trabajo de calidad apareció por primera vez en 2020 cuando OpenAI lanzó el algoritmo de lenguaje natural GPT-3. El algoritmo podía producir texto que, a veces, era casi indistinguible de algo escrito por un humano. GPT-3 es ahora, como DALL-E 2, un producto de pago y también un prodigioso productor .
Pero a pesar de lo grande que era GPT-3, DALL-E 2 puede tomar la delantera. “Hemos visto mucho más interés de lo que habíamos anticipado, mucho más grande de lo que era para GPT-3”, dijo el vicepresidente de productos y asociaciones de OpenAI, Peter Welinder, a MIT Technology Review en julio .
No es probable que la tendencia termine con las imágenes. Los desarrolladores de IA ya están mirando el video. La semana pasada, Meta lanzó quizás el algoritmo de este tipo más avanzado hasta el momento. Aunque su producción aún está lejos de ser perfecta, el ritmo de mejora sugiere que no tendremos que esperar mucho .
Cuando el polvo se asiente, es posible que estos algoritmos se establezcan como una nueva forma de arte. La fotografía enfrentó una resistencia similar a su llegada en el siglo XIX y, en última instancia, en lugar de suplantar las formas de arte existentes, se unió a sus filas.
“Lo que ha sido cierto desde al menos el advenimiento de la fotografía sigue siendo cierto ahora: el arte que nace a medias es el más emocionante. Nadie sabe qué puede ser una nueva forma de arte hasta que alguien descubre qué es”, escribió recientemente Stephen March en el Atlantic . “Descubrir qué es el arte de la IA será tremendamente difícil, tremendamente alegre. Comencemos ahora.”
Fuente:
Dorrier, J. (2022, 3 octubre). OpenAI Says DALL-E Is Generating Over 2 Million Images a Day—and That’s Just Table Stakes. Singularity Hub. Recuperado 5 de octubre de 2022, de https://singularityhub.com/2022/10/03/openai-says-dall-e-is-generating-over-2-million-images-a-day-and-thats-just-table-stakes/