Come è intuibile dal nome, l'AI generativa è quel settore dell'AI che si occupa della produzione di audio, video, immagini, testi, etc. basandosi solitamente su un prompt, ovvero su una richiesta testuale dell'utente: si descrive all'AI cosa si ha in mente ed essa lo realizza, talvolta con risultati sorprendenti, altre volte con palesi errori di produzione. Il prompt engineering, il saper scrivere prompt efficaci, sta diventando a sua volta una abilità oggetto di tutorial e, ovviamente, "aiutini" da parte dell'intelligenza artificiale stessa.

Considerando che quello generativo è un ramo dell'AI piuttosto recente, decollato pubblicamente solo negli ultimi anni con la forma del "text-to-..." (image, video, music, etc.), e che le versioni gratuite non sono certo le più performanti, si tratta di una innovazione tecnologica che è ancora lontana da concretizzare tutto il proprio potenziale e il conseguente impatto sulla società. Ricordiamo comunque che, prima di lasciarsi ammaliare dalla "magia generativa", è sempre bene, come di consueto, leggere le privacy policy dei servizi che si sceglie di utilizzare.

Di seguito proponiamo una lista con i principali siti che consentono di usare gratuitamente online alcune AI generative, rivolgendoci esclusivamente alla creazione di immagini, musica e video, tralasciando quindi la produzione di testi, presentazioni, voci, codice, etc. e le manipolazioni ed ottimizzazioni di materiale già esistente (editing di foto e video o passaggio da foto a video, ad esempio). Va precisato che non si tratta di una classifica qualitativa delle migliori AI generative, ma piuttosto di una raccolta sintetica e, inevitabilmente, parziale (v. PS conclusivo). Considerate le differenti esperienze e risultati possibili, si è scelto di non mostrare o allegare quanto prodotto nei test: per valutare adeguatamente queste AI generative non resta che provarle per i propri scopi e sperimentare, ricordando che le versioni gratuite sono chiaramente più limitate rispetto a quelle a pagamento.

Immagini

Oltre a poter essere una risorsa per chi si occupa di grafica, l'AI generativa applicata alle immagini consente all'utente domestico di generare sfondi, immagini per biglietti, comunicazioni, post, meme, etc. semplicemente descrivendo quello che vuole ottenere e aspettando pochi secondi. Se l'immagine prodotta non soddisfa, a volte può convenire aggiungere particolari descrittivi nel prompt, in modo da dare maggiori elementi all'AI e guidarla meglio verso le nostre aspettative. Se non sappiamo come migliorare il nostro prompt e vogliamo tentare la sorte per un'immagine migliore, le AI consentono solitamente di usare un'immagine già creata per un "remix" o una rigenerazione somigliante. Da segnalare che alcune AI hanno, fra le loro opzioni, il miglioramento del prompt, che rifinirà il prompt fornito dall'utente rendendolo più efficace. Un'altra impostazione solitamente comune alle AI presentate di seguito è il "prompt strength", ossia quanto il risultato deve essere vincolato a ciò che viene descritto nel prompt; non è consigliato imbrigliare l'AI con un prompt strength stroppo elevato, poiché un minimo di flessibilità agevola la qualità del prodotto finale; è comunque un parametro utile da impostare anche in base agli eventuali risultati ottenuti nei tentativi precedenti. I siti dispongono spesso di gallerie con le creazioni altrui o immagini simili trovate nel web, da cui prendere ispirazione per nuovi prompt e nuove creazioni.

  • Runway Text to Image
  • Link al sito
  • Richiede - Account Google, Apple o Single Sign On (SSO), oppure registrazione con mail
  • Limitazioni - 105 immagini (525 crediti totali, 5 ad immagine)
  • Utilizzo - Il text-to-image è solo uno dei molti strumenti della piattaforma Runway, che comprende anche l'editor di immagini, text-to-video, image-to-video e altre risorse per manipolazioni audio e video. Prima di eseguire il prompt, si possono scegliere le proporzioni, lo stile grafico (vasto elenco) e il numero di immagini in output; l'unica risoluzione consentita per gli account free è 720p. Dopo circa 20 secondi le 4 immagini sono solitamente pronte. Risulta anche possibile addestrare il proprio modello AI.
  • Playground
  • Link al sito
  • Richiede - Account Google
  • Limitazioni - 50 immagini al giorno
  • Utilizzo - Le opzioni impostabili sono molte e spaziano da quali elementi o dettagli non devono risultare nell'immagine fino a quali stili grafici utilizzare, passando per il bilanciamento fra velocità nella creazione e qualità, dimensioni dell'immagine e utilizzo dell'AI per migliorare i prompt. Nella sezione Canvas, ci sono strumenti per modificare le immagini create o caricate da altra fonte, è possibile: rimuovere oggetti o lo sfondo, estendere un immagine oltre i propri limiti (aggiungendo elementi), impostare il numero di immagini da generare, creare varianti da un'immagine di partenza, il tutto spiegato con l'ausilio di un tutorial semplice e ben fatto. A volte ci verrà chiesto, tramite pop-up, di scegliere quale preferiamo fra due immagini casuali con stili vistosamente differenti, in modo da "migliorare la nostra esperienza di Playground"; questa scelta è facoltativa e ci verrà proposta massimo 5 volte al giorno. L'AI impiega nemmeno 30 secondi per creare 4 immagini con funzione di prompt migliorato attiva. Si può visualizzare anche una vasta gamma di creazioni, divise per tema, generate da altri utenti.
  • Crayon
  • Link al sito
  • Richiede - Nulla, ma è possibile registrarsi con un account Google o usare il canale Discord
  • Limitazioni - Apparentemente nessuna, se non quella delle 9 immagini per ogni prompt
  • Utilizzo - Ci sono tre stili principali: Art, Photo e Drawing, o si può anche scegliere nessuno dei tre. Per influenzare il risultato, oltre al prompt, c'è il negative prompt, ossia caratteristiche o colori che devono risultare assenti nel risultato finale. Le immagini create, in meno di un minuto, sono 9 varianti, di piccola risoluzione (il formato quadrato è 256x256); sotto di loro vengono suggerite immagini simili già in archivio. Oltre a poter scaricare le immagini e fare uno screenshot automatico con prompt usato e immagini prodotte, ci sono anche le funzioni per modificarle rimuovendo lo sfondo o facendo un upscale (aumentare le dimensioni). Inoltre, è possibile anche acquistare una maglietta con l'immagine creata.
  • Stable Diffusion
  • Link al sito
  • Richiede - Account Google
  • Limitazioni - 10 crediti al giorno (ogni generazione richiede un credito)
  • Utilizzo - CI sono molti stili preimpostati da cui poter scegliere e le proporzioni dell'immagine sono personalizzabili; si possono creare una o due immagini per il medesimo prompt e anche Stable Diffusion ha il negative prompt (v. sopra). L'immagine viene creata in neanche 10 secondi, ha un watermark in basso a destra con il nome del sito e resterà disponibile online per 7 giorni. Ci sono strumenti per l'editing, la rimozione dello sfondo o di un oggetto, l'image-to-image per emulare immagini già esistenti modificandone il contenuto (ad esempio rendendo più realistico un logo stilizzato), o mantenendone alcune caratteristiche come la posa dei personaggi. Inoltre, per chi preferisce potenziare il prompt fornendo anche una propria rudimentale bozza di disegno, c'è la funzione sketch to image.
  • DreamStudio
  • Link al sito
  • Richiede - Account Google o Discord
  • Limitazioni - 25 crediti (circa 125 immagini)
  • Utilizzo - Anche DreamStudio ha molti stili preimpostati e molti modelli di elaborazione (compreso Stable Diffusioni) fra cui poter scegliere, il negative prompt e la possibilità di editare immagini create o caricate cancellando elementi raffigurati. Si possono impostare, oltre alle dimensioni delle immagini, anche i generation steps, ossia quante volte l'immagine viene elaborata, in modo da poter essere più aderente a quanto richiesto. Risulta possibile creare fino a 10 varianti per singolo prompt. In nemmeno 20 secondi sono state create 4 immagini consumando 0,9 crediti. Nel profilo viene anche fornita una chiave API. In fase di salvataggio è possibile raddoppiare le dimensioni dell'immagine.
  • Ideogram
  • Link al sito
  • Richiede - Account Google o Apple
  • Limitazioni - 20 prompt al giorno (4 immagini per ogni prompt)
  • Utilizzo - Gran parte delle opzioni sono inaccessibili o immodificabili con l'account gratuito, ma è comunque possibile scegliere le proporzioni dell'immagine e se avvalersi del magic prompt, una funzione per migliorare automaticamente il nostro prompt. Dopo nemmeno 20 secondi, le 4 versioni dell'immagine sono pronte per essere salvate.
  • Firefly
  • Link al sito
  • Richiede - Account Google, Facebook o Apple, oppure registrazione via mail
  • Limitazioni - 25 crediti al mese (uno per prompt; per aggiornare i crediti può essere necessario uscire del profilo e rientrare)
  • Utilizzo - I due stili disponibili sono Art o Photo, è possibile scegliere le proporzioni dell'immagine, caricare immagini come modello o scegliere alcuni modelli di riferimento preimpostati per condizionare l'immagine. Da segnalare la presenza di impostazioni per personalizzare l'angolo della visuale (dal basso, ravvicinato, etc.), l'illuminazione, il colore e la tonalità. Dopo 15 secondi le 4 immagini create sono disponibili. Nella procedura di download viene anche chiesto se si vogliono aggiungere effetti, testo o cornici all'immagine; da considerare che le immagini hanno in basso a sinistra un piccolo watermark con il logo e il nome "Adobe Firefly". Sono disponibili anche strumenti per rimuovere elementi dalle immagini o espanderle aggiungendo ulteriore contenuto generato artificialmente.
  • Bing Image Creator (Copilot - Designer)
  • Link al sito
  • Richiede - Account Microsoft
  • Limitazioni - 15 creazioni rapide ("boosts!") al giorno, le successive richiederanno maggior tempo di attesa
  • Utilizzo - Basato su DALL-E 3 e fruibile nella barra laterale di Copilot in Edge (se si ha un account nel browser), Designer archivia le immagini create per 90 giorni. Dopo circa 15 secondi le 4 immagini sono pronte. Cliccando sull'immagine create, poi su Customize, verrà aperto Designer, dove poter ritoccare l'immagine eliminando o sfocando lo sfondo, rimuovendo elementi raffigurati, applicando filtri cromatici, aggiungendo testo e regolando i parametri visivi dell'immagine (saturazione, luminosità, etc.). Il salvataggio consente anche di scegliere il formato PDF, oltre a JPEG e PNG. Se proprio siamo a corto di idee e vogliamo un'immagine con cui magari fare pratica usando Designer, affianco alla riga del prompt c'è il pulsante "Surprise Me", che genererà un prompt casuale da cui poter cercare ispirazione.
  • Leonardo
  • Link al sito
  • Richiede - Account Google, Microsoft o Apple, oppure registrazione via mail
  • Limitazioni - 150 tokens al giorno (15 immagini)
  • Utilizzo - Dopo l'accesso, possiamo usare un tutorial per familiarizzare con l'interfaccia, ricca di impostazioni per condizionare l'esito grafico del nostro prompt, scegliendo fra stili preimpostati, ciascuno con i rispettivi elementi caratteristici, alcuni con la possibilità di usare altre immagini come riferimento. Inoltre è disponibile la funzione di miglioramento prompt, prompt negativo e generazione di prompt random. Si possono scegliere le proporzioni e le dimensioni dell'immagine, medie o piccole (per quelle grandi serve un account Pro). Le 4 varianti vengono generate in nemmeno 20 secondi e possono essere modificate eliminando lo sfondo o elementi, ritoccando alcune parti, aggiungendo testo, facendo upscaling o magari chiedendo consigli alla chat, in basso a destra, gestita ovviamente da un chatbot AI. Possono essere caricate e modificate anche immagini esterne alla piattaforma. La funzione "Realtime canvas" consente di coadiuvare il prompt con una bozza di disegno a mano libera, per dare delle linee guida all'immagine, che verrà generata e aggiornata in anteprima in tempo reale. Usando 25 crediti è anche possibile impiegare la funzione Image2Motion per animare il contenuto dell'immagine creata (occorrono almeno 20 minuti di pazienza).
  • Domo
  • Link al sito
  • Richiede - Account Google o Discord
  • Limitazioni - 15 crediti, uno per ogni prompt usato
  • Utilizzo - Ci sono tre proporzioni disponibili per le immagini (1:1, 16:9 e 9:16) e molti stili grafici predefiniti, inoltre è possibile caricare un'immagine come riferimento per la generazione. Vengono create 4 varianti (con in piccolo watermark in basso a sinistra) in circa un minuto, ognuna di loro può essere ingrandita o modificata (usando un altro credito che produrrà altre 4 varianti). Le immagini create possono essere scaricate solo come JPEG.

VIDEO

Le funzionalità gratuite dei siti sottostanti consentono di creare video di pochi secondi, delle piccole animazioni più che dei video comunemente intesi, ma comunque rendono bene l'idea di quello che sia possibile realizzare, in pochi minuti di attesa, partendo da un semplice prompt testuale. Nei mini-video talvolta compaiono errori e deformazioni, più o meno vistosi, nondimeno se consideriamo che si tratta di un campo d'applicazione molto recente per l'AI generativa, è evidente che abbia comunque un potenziale notevole, anche se meno utile per l'utente medio rispetto alla creazione di immagini statiche, testi o musiche.

  • Haiper
  • Link al sito
  • Richiede - Account Google o Discord, oppure accesso con codice via mail
  • Limitazioni - 10 creazioni al giorno
  • Utilizzo - Oltre a poter animare immagini, Haiper consente di usare un prompt per generare mini-video di 2 o 4 secondi, scegliendo le proporzione dell'immagine e alcuni stili preimpostati. Durante l'attesa (circa 5 minuti) è possibile monitorare l'avanzamento della percentuale di completamento. I video hanno un watermark in alto a destra e la risoluzione in 16:9 è 1280x720, con 24 frame al secondo e 2800 kbps. Tramite la funzione "Repaint" e possibile modificare un elemento presente nel video usando un nuovo prompt, ad esempio sostituendo un oggetto o cambiandone le proprietà grafiche (si può selezionare una persona e cambiarle il colore degli abiti o rimpiazzarla con altro); questa modifica viene considerata come una creazione (ma richiede meno tempo, a seconda della modifica), quindi aumenta il totale delle creazioni giornaliere effettuate.
  • Runway Text to video
  • Link al sito
  • Richiede - Account Google, Apple o Single Sign On (SSO), oppure registrazione con mail
  • Limitazioni - 500 crediti (5 crediti per ogni secondo di video generato)
  • Utilizzo - Prima di produrre il mini-video di 4 secondi in 720p, è possibile impostare la quantità di movimento, l'aderenza al prompt, l'orientamento della cinepresa, la direzione che orienta il movimento e scegliere un'immagine da cui partire. Dopo circa 2 minuti il video è pronto, con un watermark in basso a destra; volendo, può esserne estesa la durata (consumando altri crediti) o può essere applicata la funzione di lipsync.
  • Pika
  • Link al sito
  • Richiede - Account Google o Discord, oppure registrazione via mail
  • Limitazioni - 250 crediti iniziali (10 crediti per ogni video di 3 secondi), poi 30 crediti al giorno
  • Utilizzo - Oltre al prompt, abbiamo a disposizione il negative prompt e la possibilità di decidere le proporzioni, la gestione della videocamera, la quantità di movimento, la coerenza con il prompt e i frame al secondo (massimo 24); la presenza di 7 stili grafici preimpostati ci aiuta a definire meglio il risultato finale. C'è inoltre la possibilità di attivare gli effetti sonori e di caricare immagini o video come riferimento per la produzione. In nemmeno 2 minuti il mini-video di 3 secondi ci viene presentato in 4 versioni e può essere esteso, sia per durata che come upscaling, o modificato (anche solo parzialmente) tramite prompt o applicando uno stile predefinito. Nel video, in basso a destra c'è un watermark con la scritta "Pika".
  • Pixverse
  • Link al sito
  • Richiede - Account Google o Discord, oppure registrazione via mail
  • Limitazioni - 100 crediti iniziali (10 crediti per ogni video creato), poi 50 crediti al giorno
  • Utilizzo - Sono disponibili anche il negative prompt, la scelta delle proporzioni del video e dello stile grafico. In nemmeno 3 minuti il video è pronto, con il watermark "Pixverse" in basso a destra; si tratta di 4 secondi a circa 2500kbps e 18 frame al secondo con risoluzione 1408x768.
  • Dream machine
  • Link al sito
  • Richiede - Account Google
  • Limitazioni - 30 generazioni al mese, massimo 5 generazioni al giorno
  • Utilizzo - Si può caricare un immagine per fornire elementi di riferimento per il video, ma tutto il resto dipende dal prompt e dalla funzione enhance prompt atta a migliorarne il contenuto. Dopo circa 6 minuti, il video di 5 secondi, con watermark "Luma" in alto a destra, è disponibile: 24 frame al secondo, risoluzione 1360*752 e circa 4600 kbps. Se il risultato ci aggrada, usando l'apposita funzione è possibile estendere la durata del video.
  • Invideo
  • Link al sito
  • Richiede - Account Google o Apple, oppure accesso con codice via mail
  • Limitazioni - 10 minuti di video complessivi, 4 esportazioni video
  • Utilizzo - A differenza delle precedenti, Invideo non crea un vero e proprio video, quanto piuttosto una presentazione con immagini che si susseguono, musica di sottofondo e voce artificiale (o anche personale, se si usa un account a pagamento). Ci sono altre AI che generano presentazioni (Tome, Gamma, etc.), ma solitamente prive di musica e voce, per questo, oltre che per la sua facilità nel produrre un prodotto completo, abbiamo scelto di presentare Invideo nella sezione video. Inizialmente, per essere certi di utilizzare gli ultimi sviluppi implementati, possiamo andare su Settings e attivare le "Beta features". Nel campo del prompt ci viene chiesto di fornire un argomento, una lingua e informazioni dettagliate, ma conviene essere ancora più precisi e specificare anche il formato del video, la durata, i destinatari, la musica di sottofondo, etc. avendo a disposizione 25000 caratteri, possiamo essere molto dettagliati. Sono comunque disponibili anche alcuni workflow preimpostati che possono aiutare a considerare quali informazioni includere nel prompt. Prima della generazione del video, verrà assegnato automaticamente un titolo (modificabile) e c'è la possibilità di scegliere o confermare alcuni parametri: destinatari, stile e piattaforma di destinazione (Youtube, LinkedIn o Instagram); se in fase di registrazione dell'account è stato scelto un utilizzo diverso da "Content creation" potrebbero esserci parametri differenti. Dopo 3 minuti l'anteprima del video da 2 minuti è visualizzabile; può arrivare fino a 1080p di risoluzione ed è possibile editane il contenuto (gratuitamente fino al 31 luglio), sia tramite prompt (ad esempio chiedendo di aumentare il volume della musica, inserire sottotitoli, etc.) oppure tramite la funzione Edit che consente, tramite interfaccia grafica, di editare il testo, cambiare la musica di sottofondo e le immagini (con licenza, compresa solo nei piani a pagamento) che accompagnano il video. Quando siamo convinti del risultato ottenuto nell'anteprima, possiamo scaricare il video, a cui verranno aggiunti circa 2 secondi con un "outro", una "coda finale", con il logo di Invideo, mentre per tutto il video sarà presente un watermark in alto a destra con la scritta "Invideo" e nome dell'utente.

MUSICA

Nei siti seguenti, il prompt può essere usato per descrivere il genere di musica da generare, gli strumenti utilizzati, il mood del brano, ma anche la tonalità o dettagli più tecnici. Non c'è da aspettarsi una canzone pronta per essere ascoltata come fosse una base musicale prodotta in uno studio, ma è comunque ragguardevole la rapidità nel produrre un brano o una base solitamente, ma non sempre, pertinenti alle richieste dell'utente. Qualora si usi un account è anche possibile pubblicare le "proprie" produzioni.

  • WaveFormer
  • Link al sito
  • Richiede - Nulla
  • Limitazioni - Un minuto complessivo di musica prodotta (è possibile impostare la lunghezza dei brani)
  • Utilizzo - Fra le molte opzioni specifiche impostabili, c'è anche la possibilità di fornire un brano come spunto da emulare oppure da cui continuare; si può scegliere il formato del file prodotto fra MP3 e WAV; solitamente un brano da un minuto è pronto dopo circa 5 minuti.
  • Mubert
  • Link al sito
  • Richiede - Registrazione via mail per il download
  • Limitazioni - 5 brani creati, poi è necessario loggarsi con un account gratuito (azione sempre necessaria per il download), oppure cancellare i cookies
  • Utilizzo - Al posto del prompt è possibile anche usare un'immagine online come musa per la creazione (image-to-music), anche se non funzionerà con tutte le immagini. Si può scegliere fra quattro impostazioni: Track, Loop, Mix e Jingle. La durata del brano è da 5 secondi ai 25 minuti e per brani di circa un minuto la produzione è risultata richiedere tempi diversi, probabilmente a seconda del carico dei server. Se il risultato non ci convince, ma è comunque non lontano dalla nostra idea, è possibile generare un brano simile a quello già prodotto. Ogni traccia audio, a circa 10 secondi dall'inizio una voce femminile dice "mubert", per poi ripeterlo ogni tanto, una sorta di "watermark audio". Nel sito c'è anche un archivio di brani royalty free.
  • Suno
  • Link al sito
  • Richiede - Account Google, Microsoft o Discord
  • Limitazioni - 50 crediti (10 canzoni) al giorno
  • Utilizzo - In fase di creazione è possibile inserire anche un testo (massimo 3000 caratteri) o farne crearne uno random per la canzone; oppure produrre un pezzo solo strumentale. Occorre circa un minuto per produrre il brano in due versioni (comprese nei 10 crediti usati), ciascuna della durata di 4 minuti. Prima di ascoltare il brano è bene attendere un paio di minuti, per accertarsi che l'elaborazione sia completa. Investendo altri 10 crediti in "Extend", si può aumentare la durata del brano, magari per farlo terminare in modo meno brusco. Il download può essere in formato MP3 o come video in MP4, con il testo che scorre in sovraimpressione su uno sfondo colorato con in alto un'immagine creata ad hoc in automatico. Nella Library si possono inoltre ascoltare moltissimi brani, divisi per genere.
  • Udio
  • Link al sito
  • Richiede - Account Google, Discord, Twitter o Apple
  • Limitazioni - 10 crediti al giorno (bonus di 100 crediti ogni mese), 2 crediti per ogni richiesta da cui vengono create 2 canzoni
  • Utilizzo - Anche Udio consente di inserire un testo a piacere o generarne uno in automatico; vengono create due versioni. Dopo circa un minuto i 2 brani da 32 secondi ciascuno (durata di default) sono pronti. Si può decidere di farne un remix, ossia produrne una variazione (in 2 versioni), oppure estenderne la durata di 30 secondi o aggiungere un "outro", una conclusione; da considerare che queste azioni consumeranno altri 2 crediti.

P.s. Se non bastasse quanto sopra presentato, potete avventurarvi qui, qui, qui e qui, per sfogliare corposi elenchi di AI anche per altri utilizzi. Da tenere d'occhio anche lo sviluppo di Google della sua AItestkitchen, per ora riservata all'utenza americana (oppure a chi risulti collegato dagli USA con profilo impostato su lingua e localizzazione americana) e, in ambito produzione video, Kling .