Stable Difussion, la IA pionera que convierte texto a imágenes, está en problemas. Parte de sus creadores e ingenieros críticos se han marchado para formar su propia compañía, Black Forest Labs. Y acaba de lanzar un duro competidor, Flux.1, la IA generativa de imágenes más avanzada.
Black Forest Labs ha sido formada por Robin Rombach, Andreas Blattmann, y Dominik Lorenz, tres ingenieros clave de Stabilty AI. Después se le ha unido Patrick Esser.
Todos ellos han sido pieza clave en la creación de Stable Diffusion y, especialmente, en la tecnología de difusión latente que ha hecho posible la generación de imágenes con IA.
Flux.1, una potente IA para generar imágenes
Black Forest Labs no ha perdido el tiempo. Apenas unas semanas después de su fundación ha presentado Flux.1, una IA generativa de imágenes, que asegura es más precisa que la competencia con los prompts, y genera imágenes a más resolución.
Flux.1 está disponible en tres versiones. Flux.1 Pro para profesionales y empresas, Flux.1 Dev para desarrolladores, y Flux.1 schnell para usuarios particulares.
Ya se puede probar gratis en Replicate y Fal. He hecho algunas pruebas, y la verdad es que los resultados son espectaculares. Este es el resultado del prompt “ardilla haciendo un mate en un partido de baloncesto de las olimpiadas”:
Flux.1 presume de haber superado el problema de las manos y los dedos que habitualmente tienen algunas IA que generan imágenes.
Genera manos naturales, como se puede ver en la foto de apertura de la noticia, creada con el prompt: “mujer hermosa haciendo el signo de la victoria con las dos manos, en un escenario de ciencia-ficción”.
“Nuestros modelos establecen nuevos estándares. FLUX.1 [pro] y [dev] superan a modelos populares como Midjourney 6.0, DALL-E 3 (HD) y SD3-Ultra en cada uno de los siguientes aspectos: Calidad visual, seguimiento de instrucciones, variabilidad de tamaño y aspecto, tipografía y diversidad de resultados”, aseguran sus creadores en un comunicado.
Flux.1 usa una arquitectura híbrida de bloques transformadores de difusión multimodal y paralela y se escalan a 12.000 millones de parámetros.
Black Forest Labs también está trabajando en Sota, una IA que convierte texto a vídeo, pero aún no están listos para mostrarla al público.
Flux.1, de los creadores de Stable Diffusion, asegura ser la IA generativa de imágenes más avanzada. Y la puedes comprobarlo por ti mismo, en los enlaces mencionados más atrás.
Conoce cómo trabajamos en ComputerHoy.
Etiquetas: Inteligencia artificial