Facebook e Instagram si arricchiscono di nuovi strumenti creativi basati sull’intelligenza artificiale che consentiranno agli utenti di modificare le proprie fotografie e produrre “video di alta qualità” utilizzando descrizioni testuali. Il CEO di Meta, Mark Zuckerberg, ha annunciato due nuove funzionalità basate su Emu, il modello di base dell’azienda per la generazione di immagini, che verranno integrate in Facebook e Instagram.
Emu Edit
La prima nuova funzionalità, denominata “Emu Edit“, consentirà agli utenti di “modificare con precisione le immagini sulla base di input testuali“. Il video dimostrativo sembra simile agli strumenti esistenti forniti da Adobe, Google e Canva, che consentono agli utenti di rimuovere o sostituire oggetti e persone dalle fotografie senza alcuna esperienza professionale di editing delle immagini. Il video suggerisce che si può digitare qualcosa come “trasforma il cane in un panda” ed Emu Edit sarà in grado di identificare il cane all’interno dell’immagine. Meta afferma inoltre che Emu Edit si concentrerà solo sulle modifiche pertinenti alla richiesta di modifica. I metodi attuali spesso tendono a sovra-modificare o a sotto-performare i vari compiti di editing. Il modello dovrebbe invece concentrarsi sulla modifica precisa dei soli pixel rilevanti per la richiesta di modifica. Ad esempio, quando si aggiunge il testo “Aloha!” a un cappellino da baseball, il cappellino stesso deve rimanere invariato.
Emu video
“Emu Video” è il secondo strumento a cui Meta sta lavorando. Secondo il post pubblicato sul blog di Meta insieme al teaser di Zuckerberg, questo strumento è in grado di generare video a partire da richieste di testo, immagini di riferimento o una combinazione dei due input. I risultati sembrano tutt’altro che realistici, ma sembrano anche un passo avanti rispetto alle animazioni approssimative che il sistema Make-A-Video di Meta produceva l’anno scorso. Meta scrive che hanno suddiviso il processo in due fasi: dapprima la generazione di immagini condizionata da una richiesta di testo e poi la generazione di video condizionata sia dal testo che dall’immagine generata. Questo approccio “fattorizzato” permette di addestrare i modelli di generazione video in modo efficiente. Anche secondo le valutazioni umane portate avanti da Meta, le generazioni di video sono fortemente preferite rispetto ai lavori precedenti: infatti, questo modello è stato preferito a Make-A-Video dal 96% degli intervistati in base alla qualità e dall’85% degli intervistati in base alla fedeltà al testo richiesto.
I possibili casi d’uso
Secondo Meta, i potenziali casi d’uso dei due nuovi strumenti sono generare al volo adesivi animati o GIF intelligenti da inviare nella chat di gruppo, invece di dover cercare il media perfetto per la vostra risposta. Oppure, modificare le proprie foto e immagini senza dover ricorrere a competenze tecniche. Oppure aggiungere un tocco in più ai vostri post di Instagram animando foto statiche. O generare qualcosa di completamente nuovo. Meta dice che, sebbene non sostituiscano di certo gli artisti e gli animatori professionisti, Emu Video, Emu Edit e le nuove tecnologie come queste potrebbero aiutare le persone a esprimersi in modi nuovi: da un art director che elabora un nuovo concetto, a un migliore amico che condivide un augurio di compleanno unico. Non si sa ancora quando gli utenti potranno aspettarsi l’arrivo di queste nuove funzionalità di editing su Facebook o Instagram, né se questo annuncio sia legato agli strumenti per i creatori potenziati dall’intelligenza artificiale di cui Meta ha parlato lo scorso anno.