ByteDance ha presentato un sistema di intelligenza artificiale, chiamato “X-Portrait 2”, che trasforma qualsiasi fotografia in un video realistico, completo di espressioni sottili ed emozioni credibili. L’azienda, che controlla TikTok, ha progettato questo sistema per animare immagini statiche in modo che possano riprodurre scene iconiche di film famosi, ottenendo risultati così verosimili da sfumare il confine tra reale e artificiale.
I video dimostrativi mostrano fotografie che “interpretano” scene celebri da film come Shining, Face Off e Barriere, catturando ogni sfumatura emotiva delle performance originali. Un singolo scatto può esprimere paura, rabbia o gioia con la stessa intensità di un attore, mantenendo però l’identità e le caratteristiche del soggetto originale.
X-Portrait 2 arriva in un momento delicato, in cui la società affronta le sfide della disinformazione digitale. La capacità del sistema di generare video indistinguibili dalla realtà da una semplice fotografia solleva interrogativi importanti: mentre le precedenti tecnologie di animazione tendevano a produrre risultati palesemente artificiali, con movimenti meccanici, questo nuovo strumento di ByteDance coglie ogni dettaglio della naturale espressività umana, inclusi i movimenti degli occhi e la dinamica muscolare del viso. Insomma: il risultato è fin troppo realistico e l’idea che una tecnologia simile sia già a disposizione del grande pubblico sta creando più di qualche preoccupazione.
Bytedance’s x-portraits 2 looks very impressive. It nicely completes the entire head in the photo (ears, tongue..) and follows very minuscule movement.
Wonder if they’ll open source this one. pic.twitter.com/So3dW7NO5Q— Matty Mariansky (@mmariansky) November 7, 2024
ByteDance ha raggiunto questo livello di realismo grazie a un approccio innovativo: anziché tracciare punti specifici sul volto, metodo utilizzato dai software di animazione tradizionali, X-Portrait 2 osserva e ricrea i movimenti facciali completi, cogliendo così la fluidità naturale anche durante il parlato rapido o in angolazioni diverse.