La società di intelligenza artificiale Stability AI rilascerà il suo modello di generazione di immagini Stable Diffusion 3 mercoledì 12 giugno. L’azienda lo ha annunciato durante il keynote di AMD. Il nuovo modello era precedentemente disponibile come beta chiusa.
Per funzionare su una vasta gamma di dispositivi, Stable Diffusion 3 può gestire un numero diverso di parametri: da 800 milioni a diversi miliardi. In particolare, il limite massimo di 8 miliardi è molto più alto rispetto alle versioni precedenti del modello di generazione delle immagini. Stable Diffusion XL 1.0, rilasciato lo scorso anno, ha ancora un numero massimo di parametri di 3,5 miliardi.
Durante il keynote, AMD e Stability AI hanno dimostrato il nuovo modello sulla scheda acceleratrice Instict MI300X. Rispetto allo Stable Diffusion XL il risultato è stato nettamente migliore e anche le prestazioni sono aumentate.
Stable ha precedentemente affermato che Stable Diffusion 3 è una combinazione di Struttura dei trasformatori di diffusione E Corrispondenza del flusso utente. Questa è la prima volta che queste tecniche vengono fornite per la propagazione stabile. L’architettura del trasformatore di diffusione è il processo di divisione e creazione di un modello di dati in piccoli pezzi e di creazione di un’immagine da molti di questi piccoli pezzi anziché nel loro insieme. Il Flow Matching è una tecnica che permette di generare immagini migliori del rumore senza dover ripetere costantemente il calcolo. Ciò renderebbe il generatore molto più veloce. Inoltre, Stable 3 conterrà nuove tecnologie per prevenire l’abuso dei modelli.