I ricercatori di Google hanno creato un’IA che può generare brani musicali di lunghezza variabile partendo da una richiesta (prompt) testuale. Ancora più interessante, l’intelligenza artificiale può generare dei brani molto articolati partendo da una melodia, ad esempio fischiettata dall’utente.

Il progetto di Google si chiama MusicLM ed è l’ennesima pietra miliare nel campo delle intelligenze artificiali generative. Se DALL-E è in grado di creare immagini partendo dalle istruzioni dell’utente, mentre ChatGPT riesce ad elaborare dei testi, MusicLM occupa uno scenario completamente inedito: quello della composizione musicale.

L’utente può dare all’IA delle istruzioni piuttosto vaghe, oppure può fornire dei propt estremamente descrittivi e dettagliati. Si può chiedere a MusicLM di iniziare il brano con degli strumenti musicali specifici, ricreando un’atmosfera o tenendo un certo ritmo. Poi si può chiedere di proseguire con uno stile diverso e così via, indicando l’intervallo temporale di ciascuna parte.

Un esempio di come funziona l’IA ci viene dal seguente prompt:

  1. musica elettronica riprodotta in un videogioco (0:00-0.15)
  2. musica per meditazione riprodotta vicina ad un fiume (0:15-0:30)
  3. fuoco (0:30-0:45)
  4. fuochi d’artificio (0:45-0:60)

Il promt in questione non è particolarmente dettagliato o sofisticato, ma tanto è bastato a MusicLM per generare questo breve brano.

MusicLM in teoria può anche generare delle voci umane, ad esempio un coro, ma The Verge sostiene che questo sia l’aspetto in cui l’intelligenza artificiale, al momento, fa più difficoltà.