I ricercatori di Google hanno creato un’IA che può generare brani musicali di lunghezza variabile partendo da una richiesta (prompt) testuale. Ancora più interessante, l’intelligenza artificiale può generare dei brani molto articolati partendo da una melodia, ad esempio fischiettata dall’utente.
Il progetto di Google si chiama MusicLM ed è l’ennesima pietra miliare nel campo delle intelligenze artificiali generative. Se DALL-E è in grado di creare immagini partendo dalle istruzioni dell’utente, mentre ChatGPT riesce ad elaborare dei testi, MusicLM occupa uno scenario completamente inedito: quello della composizione musicale.
L’utente può dare all’IA delle istruzioni piuttosto vaghe, oppure può fornire dei propt estremamente descrittivi e dettagliati. Si può chiedere a MusicLM di iniziare il brano con degli strumenti musicali specifici, ricreando un’atmosfera o tenendo un certo ritmo. Poi si può chiedere di proseguire con uno stile diverso e così via, indicando l’intervallo temporale di ciascuna parte.
Un esempio di come funziona l’IA ci viene dal seguente prompt:
- musica elettronica riprodotta in un videogioco (0:00-0.15)
- musica per meditazione riprodotta vicina ad un fiume (0:15-0:30)
- fuoco (0:30-0:45)
- fuochi d’artificio (0:45-0:60)
Il promt in questione non è particolarmente dettagliato o sofisticato, ma tanto è bastato a MusicLM per generare questo breve brano.
Google's new music model MusicLM is the breakthrough of the week.
Here it is in action.
Just describe the music and it'll generate the track: pic.twitter.com/xAhzHfGnMH
— Pete (@nonmayorpete) January 27, 2023
MusicLM in teoria può anche generare delle voci umane, ad esempio un coro, ma The Verge sostiene che questo sia l’aspetto in cui l’intelligenza artificiale, al momento, fa più difficoltà.
- Google’s new AI turns text into music (theverge.com)