Stable Diffusion. Qué es, para qué se utiliza y cómo funciona.

Lanzado el 22 de agosto de 2022, Stable Diffusion es un modelo de difusión latente de aprendizaje profundo que utiliza inteligencia artificial para generar imágenes. Más claramente, es un programa que utiliza la comunicación de texto a imagen para crear ilustraciones. Al igual que otros modelos basados en IA como ChatGPT, Stable Diffusion acepta indicaciones de los usuarios. Sin embargo, en lugar de responder una pregunta o proporcionar un esquema, interpreta visualmente el texto.
Stable Diffusion crea imágenes cuando se le proporcionan indicaciones de texto que se llaman “prompts”. Por ejemplo, el mensaje “manzana” produciría una imagen de una manzana. También puede requerir indicaciones más complicadas, como crear la imagen de una manzana en un estilo artístico específico o como determinadas características de sombras, iluminación o cualquier otra.
Además de generar imágenes, puede reemplazar partes de una imagen existente y ampliar imágenes para hacerlas más grandes. Agregar o reemplazar elementos dentro de una imagen se llama pintar, y extender una imagen para hacerla más grande se llama pintar. Estos procesos pueden alterar cualquier imagen, ya sea que la imagen original se haya creado con IA o no.

Una imagen creada a través de stable diffusion
Además de producir imágenes, Stable Diffusion puede sustituir partes de imágenes preexistentes y ampliarlas. Agregar o sustituir elementos en una imagen se llama pintar, mientras que ampliar o complementar una imagen se conoce como pintar. Estos procedimientos pueden modificar cualquier imagen, independientemente de cómo se creó el original.

¿Cómo funciona Stable Diffusion?

La difusión estable funciona aplicando repetidamente un proceso de difusión a una imagen. Durante cada iteración, el software calcula un coeficiente de difusión utilizando información sobre las propiedades locales de la imagen, como sus bordes y gradientes. Este coeficiente gobierna la intensidad y dirección de la difusión, lo que permite al algoritmo ajustar el grado de suavizado aplicado a la imagen.
Luego, el proceso de difusión continúa redistribuyendo los valores de los píxeles en función de la información contextual cercana. Al difundir de forma incremental los valores de píxeles en las regiones, el algoritmo reduce eficazmente el ruido. Este enfoque discriminante y suavizado ayuda a retener los detalles más finos de una imagen y evita cualquier borrosidad o pérdida de características cruciales.

¿Puedes saber cuándo se genera una imagen con IA?

Stable Diffusion puede crear imágenes fotorrealistas que son difíciles de diferenciar de las reales e imágenes que son difíciles de distinguir de las obras de arte pintadas o dibujadas a mano. También pueden aparecer imágenes claramente falsas dependiendo de las indicaciones y otros factores.
Una forma de detectar arte generado por IA es mirar las manos, ya que Stable Diffusion y otros modelos tienen muchos problemas en esa área. Si el sujeto de una imagen oculta visiblemente sus manos, es un indicio de que alguien utilizó alguna ingeniería inteligente y rápida para solucionar las deficiencias del modelo de IA. Sin embargo, tenga en cuenta que los modelos de IA están cambiando increíblemente rápido, por lo que es probable que estas deficiencias sean de corta duración.

Controversias y problemas con Stable Diffusion

En teoría, las imágenes generadas por Stable Diffusion se pueden utilizar para cualquier propósito, pero  se han sucitado controversias e inconvenientes relacionados con el contenido generado por IA.
Debido a que la generación de imágenes de IA tiene que aprender sobre objetos de alguna parte, sus programadores han buscado en Internet arte con metadatos. Lo hicieron sin el permiso de los creadores del arte original, lo que plantea problemas de derechos de autor.
Este problema es particularmente dudoso ya que Stable Diffusion no crea sus imágenes desde cero; los improvisa a partir de los que ha estudiado. Entonces, tanto para aprender como para crear, utilizar el trabajo de otros artistas, que muchas veces no han dado su permiso para que sus obbras seaan modificadas por otros. Sitios como DeviantArt solo han evitado salidas masivas al permitir que los usuarios opten por no permitir que los sistemas de inteligencia artificial utilicen su arte para entrenamiento.
El tema de los derechos de autor de obras creadas en parte por IA también es turbio, ya que se han rechazado solicitudes de derechos de autor para obras que incluían elementos generados por IA. A pesar de eso, a medida que la generación de imágenes impulsada por la IA se vuelve más frecuente, amenaza los medios de vida de los artistas tradicionales, que corren el riesgo de perder trabajo debido a este método más barato y “más simple”.

Dejá un comentario