Il sonoro nei videogiochi

Quando pensiamo a un videogioco, una delle prime cose che ci viene in mente è la sua colonna sonora. Da Space Invaders a Tetris a Mario, passando per i vari Zelda e Final Fantasy fino ad arrivare ai più recenti Journey, Fez e The Last of Us solo per citarne alcuni, le loro musiche ci hanno accompagnato per centinaia di ore mentre stavamo incollati ai nostri monitor.

Potremmo canticchiarle dall’inizio alla fine. Abbiamo i cofanetti. Le ascoltiamo pure quando non giochiamo, mentre cuciniamo o ci facciamo la doccia. Le facciamo ascoltare alle nostre fidanzate dicendo loro “Lo vedi che i videogiochi possono essere bellissimi”. Sono musiche che ci hanno fatto esultare, a volte ci hanno messo paura, spesso ci hanno fatto commuovere.

Pochi giorni fa ho terminato i miei studi in Composizione per la Musica Applicata presso il Conservatorio Santa Cecilia di Roma. La scelta dell’argomento della tesi finale non poteva che ricadere proprio sulla musica per videogiochi, anche se mi domandavo se sarei andato incontro a qualche scetticismo da parte della commissione (l’ambiente del Conservatorio è infatti piuttosto “conservatore”).

Alla fine però sono rimasto davvero soddisfatto: i Maestri presenti alla discussione, compositori di una certa età e (perlopiù) poco avvezzi all’utilizzo della tecnologia, mi hanno ascoltato attentamente mentre illustravo le caratteristiche del genere, mentre mostravo i software per la programmazione dell’audio, mi hanno posto domande e chiesto approfondimenti. Erano anche loro, come me quando per la prima volta ho cominciato a studiare l’argomento, incuriositi dalle potenzialità della musica interattiva.

Riassumere in questo articolo l’intera tesi sarebbe impossibile (anche perché tratta principalmente della musica ma ha anche sezioni relative ad effetti sonori e dialoghi, e certi capitoli entrano abbastanza nello specifico), motivo per cui mi limiterò a citarne i punti più interessanti per incuriosirvi. Ad ogni modo, in fondo a questa pagina trovate il link per scaricare la versione completa. Ho pensato di condividerla qui per due motivi: per evitare di mettere in un cassetto un lavoro a cui ho dedicato mesi della mia vita, e perché in italiano la bibliografia sull’argomento è quasi inesistente.

L’audio dinamico

Un giocatore non è prevedibile.

La caratteristica fondamentale della musica nei videogiochi è che questa deve adattarsi alle azioni del giocatore e alla situazione in cui egli si trova. Se guardassimo la ripresa di una sessione di gioco di un’altra persona, una colonna sonora dinamica avrà raggiunto il suo scopo nel caso in cui ci sembrerà di sentire una musica scritta specificamente per quella scena, in modo del tutto simile ad un film lineare.

Il problema alla base della necessità della musica dinamica è che un giocatore non è prevedibile: non sappiamo infatti quali azioni compierà tra le centinaia a sua disposizione, non sappiamo in quale momento sceglierà di farle e per quanto tempo. La musica dinamica è preparata ad ogni possibilità: essa deve sempre poter mutare ed evolversi in modo naturale.

Sonoro interattivo e adattativo

L’audio cosiddetto dinamico è quindi quell’insieme di musica, effetti sonori e dialoghi che cambia in base alle azioni del giocatore e all’ambiente in cui gioca. Nel primo caso parliamo di audio interattivo: le azioni del giocatore, i suoi input, determinano dei cambiamenti sul sonoro.

Quando, ad esempio, il giocatore preme un tasto sul controller per far saltare il suo personaggio, il suono che sentiremo viene classificato come elemento dell’audio interattivo. Viceversa l’audio adattativo risponde a cambiamenti nei parametri di gioco come conti alla rovescia, cambi di ambientazione, comparsa di nemici, e così via. In diversi titoli, ad esempio, la velocità della musica cresce quando il tempo a disposizione del giocatore per completare un livello sta per finire.

Alcune difficoltà dell’audio dinamico

La musica dinamica è ormai imprescindibile nei nuovi video games: i loop infiniti tipici dei giochi più datati sono superati e la tecnologia odierna mette a disposizione del compositore una vastissima gamma di possibilità per incrementare la varietà nel sonoro.

L’utilizzo intensivo di semplici loop è ora sconsigliato per la maggior parte dei titoli, in quanto può accadere che il giocatore dopo qualche minuto non percepisca più la musica, e quel che è peggio è che potrebbe risultargli addirittura fastidiosa. I problemi della durata del gameplay e dell’affaticamento uditivo sono tenuti in grande considerazione dal compositore, che dovrà studiare attentamente la situazione di gioco e prevedere delle variazioni nella musica – che possono riguardare tempo, pitch, ritmo, volume, effetti, e che possono avvalersi di tecniche quali la generazione algoritmica, le riarmonizzazioni e le matrici di transizioni – per non annoiare il giocatore.

Un’altra grossa difficoltà per il compositore riguarda la gestione della musica quando il gioco è multiplayer: se, infatti, nelle partite in singleplayer è ben chiaro quando un’azione del giocatore debba innescare un certo cambiamento nel sonoro, quando i giocatori diventano due o più il compositore dovrà decidere secondo quale logica il cambio musicale verrà triggerato.

Le categorie di interventi musicali

Interventi principali

Sono quegli interventi musicali che hanno maggiore importanza nel gioco e il loro alto volume li rende percepibili chiaramente dall’ascoltatore. I temi sono spesso in grande evidenza; queste tracce accompagnano le scene più importanti del video game, le scene d’azione, quelle di esplorazione, quelle in generale in cui “succede qualcosa”.

Ambient tracks

Per evitare silenzi non desiderati può essere utilizzata della musica d’ambiente in modo da mantenere attiva la componente sonora all’interno del gioco. Questo tipo di musica di sottofondo resta solitamente nello stile degli interventi principali, alleggerendone i temi tramite l’utilizzo di accordi lunghi, dinamiche tenui e melodie e armonie semplici in modo da passare quasi inosservata nel complesso del panorama sonoro.

Un brano orchestrale, ad esempio, potrebbe utilizzare il legato della sezione degli archi, mentre una colonna sonora con strumenti elettronici si affiderebbe a dei pad; gli elementi principali di cui tenere conto sono l’utilizzo di una scrittura facile e di un volume basso. Normalmente, la musica d’ambiente è ideale per gli scenari di lunga durata in cui il giocatore ha bisogno di concentrarsi (i giochi di sport e i simulatori di volo sono tipicamente devoti a questo tipo di composizioni). Se non fosse presente, il più delle volte si percepirebbe un vuoto ed altri rumori esterni al videogioco potrebbero disturbare l’esperienza del giocatore.

Stinger

Usati unitamente ad altra musica che è già in esecuzione, gli stinger (dall’inglese, pungiglione) sono brevissimi interventi musicali eseguiti in punti specifici del gioco per richiamare l’attenzione su un improvviso evento significativo. La loro durata si aggira solitamente intorno ai 2 o 3 secondi; nonostante siano chiaramente udibili sopra la musica, essi vengono creati in modo da poter convivere con essa utilizzando caratteristiche compatibili (come ad esempio la scelta timbrica o la tonalità).

Oltre ad evidenziare dei momenti del gameplay, gli stinger possono essere anche utilizzati per sottolineare la comparsa di loghi o scritte. Per lo stesso scopo possono essere creati anche degli effetti sonori: la scelta varia in base alle specifiche esigenze del gioco.

Il nostro stinger preferito

La non linearità nei videogiochi

Le conseguenze sul sonoro della struttura di narrazione ramificata tipica del videogioco sono significative. Quando un giocatore effettua alcune scelte (andare in una direzione piuttosto che in un’altra, combattere dei nemici piuttosto che scappare, etc.) la musica deve poter essere in grado di mutare repentinamente da un materiale sonoro ad un altro, e questa transizione deve sembrare naturale al giocatore.

Oltretutto, questi momenti di transizione corrispondono solitamente a punti estremamente importanti nella narrazione, quindi l’importanza del sonoro è cruciale. La pianificazione delle transizioni dal punto di vista dell’audio è complicata, ma anche estremamente importante.

Le transizioni

Il compositore deve tenere conto della moltitudine di situazioni possibili all’interno del gioco e cercare di creare una musica che possa rapidamente adattarsi alle decisioni del giocatore e al cambiamento dei parametri. Comporre per specifici avvenimenti o locazioni è solo una parte del suo compito, in quanto deve anche saper organizzare il modo in cui le diverse musiche possano essere collegate tra loro: transizioni morbide assicurano continuità nel gioco e l’immersione del giocatore. Esiste una grande varietà di approcci a questo problema; le colonne sonore dei videogiochi utilizzano spesso metodi differenti in base al genere e alle caratteristiche specifiche del titolo.

I vecchi giochi, soprattutto nell’era degli 8 e 16 bit, tendevano a praticare tagli netti tra le musiche. Oggi il modo più semplice per effettuare una transizione è quello di far terminare con un rapido fade-out la prima musica per poi far cominciare subito la seconda; una soluzione simile è quella del crossfade. Anche in questi casi però la transizione potrebbe risultare brusca o innaturale. Un altro modo frequente per effettuare una transizione è quello di utilizzare uno stinger, ad esempio un breve accordo sforzato. Soprattutto nelle situazioni in cui la transizione deve essere immediata, come quando passiamo da una situazione di calma ad un improvviso combattimento, lo stinger, spesso combinato con un effetto sonoro violento (uno sparo, spade che cozzano, etc.) aiuta a camuffare in modo efficace il repentino cambio musicale.

Tutte le regole per la gestione delle transizioni nella maggior parte dei casi vengono introdotte in un middleware: i più comuni sono Wwise e Fmod.

Le funzionalità dell’audio engine

La schermata di lavoro in Wwise

È quindi di fondamentale importanza che l’autore delle musiche sia ben consapevole delle potenzialità dell’audio engine e al tempo stesso dei suoi limiti per poter realizzare una colonna sonora adeguata.

L’audio engine può essere sviluppato dagli audio programmers in base alle esigenze specifiche del gioco oppure si può scegliere di utilizzare un middleware già esistente.

L’internal looping

L’internal looping è la possibilità dell’audio engine di far ricominciare un brano quando questo raggiunge la fine o un certo punto specifico. Invece di riprendere dall’inizio è possibile far ripartire la musica da un marker in un punto qualsiasi della traccia in modo tale che l’ascoltatore non percepisca chiaramente che si tratta di una ripetizione.

Con un uso appropriato di questo espediente la musica può sembrare molto più lunga di quanto in realtà non sia: il giocatore sente l’inizio del brano quando comincia un livello, e ne sente la fine quando lo completa (o quando muore).

Per tutto il resto del tempo, ascolta la sezione centrale del brano, che continua incessantemente a ripetersi. Per fare in modo che il giocatore non si accorga che si tratta di un loop, la parte del brano da ripetere non dovrebbe durare meno di 3 o 4 minuti. Loop dalla durata più breve (fra i 30 e i 60 secondi circa) sono usati spesso nelle schermate dei menu, in cui il giocatore trascorre generalmente poco tempo.

Il sideways crossfade

Una feature del motore sonoro è il cosiddetto sideways crossfade, ovvero la possibilità di effettuare un crossfade tra due variazioni di uno stesso brano durante il gioco senza che ci siano interruzioni, per modificarne il carattere.

Ad esempio: il compositore crea all’interno del sequencer un brano dal carattere morbido e disteso; a questo aggiunge delle tracce di percussioni che rendano il pezzo più intenso e dinamico.

Il compositore esporterà il brano con la sua variazione in due file diversi (solo le tracce morbide nel primo, e il mix con anche le percussioni nel secondo): in questo modo, all’interno di uno stesso livello, il primo pezzo accompagnerà le scene in cui non c’è azione (ad esempio, una passeggiata in un bosco) e il secondo, che andrà a sostituire il primo tramite un sideways crossfade, farà da sottofondo ai momenti di tensione (ad esempio, un combattimento nello stesso bosco dove si andava passeggiando). L’orecchio del giocatore percepirà un unico brano che si arricchisce di una traccia di percussioni nei momenti di maggiore tensione.

Istruzioni beat-synchronous

Un’altra feature spesso implementata nel motore audio è il beat-sync: questa permette al compositore di introdurre dei markers all’interno di una traccia musicale.

Queste istruzioni dicono all’audio engine di effettuare le transizioni in momenti musicalmente importanti, come ad esempio l’inizio di una specifica battuta, o il movimento successivo, o la fine di una sequenza di quattro battute. In questo modo le transizioni possono essere gestite da matrici ed effettuate seguendo il tempo metronomico per sembrare naturali evoluzioni musicali.

L’effetto di ducking

L’effetto di ducking consiste nel ridurre il segnale di una traccia quando ci si trova in presenza di un altro segnale. Questo effetto si ottiene abbassando il volume (facendo il ducking, appunto) di una traccia audio secondaria nel momento in cui viene eseguita una traccia più importante, e rialzandolo nuovamente una volta che questa è finita.

Il permutation weighting

Il permutation weighting si utilizza per fare in modo che alcuni passaggi musicali o SFX non si affidino troppo al looping ed in particolare per evitare che il giocatore riesca a distinguere con facilità i suoni fortemente caratterizzati che si ripetono.

Per ogni evento viene assegnato un valore che determina la probabilità che questo venga eseguito. Suoni particolarmente incisivi (nel caso degli effetti sonori, il verso di un gufo in lontananza, ad esempio) avranno una probabilità inferiore di essere riprodotti rispetto a suoni più neutri (il frinire dei grilli).

La dipendenza dalla tecnologia

Gli audio engine non sono tutti uguali: alcuni sono molto completi, altri supportano soltanto le funzioni più basilari. Tutto ciò che riguarda la realizzazione tecnica e artistica del sonoro di un videogioco è fortemente condizionato dalle potenzialità dell’audio engine e della piattaforma per cui il prodotto viene programmato.

Le specifiche hardware della console, del PC o del dispositivo mobile e la programmazione del software forniscono al compositore e agli altri membri della divisione audio un punto di partenza imprescindibile per il loro lavoro, e parallelamente alle inevitabili limitazioni del mezzo (che possono condizionare, ad esempio, la dimensione e quindi la compressione dei file audio) offrono numerosi spunti per la realizzazione di un lavoro musicale creativo.

Si può pensare alla tecnologia come ad un nuovo ensemble a disposizione del compositore, che deve tener conto delle caratteristiche dei suoi strumenti (tecnologici) nello stesso modo in cui si preoccuperebbe di arrangiare al meglio un brano per quartetto d’archi o per orchestra.

Drowning in Problems

La parte finale della mia tesi, e forse la più interessante, riguarda l’applicazione pratica in un videogioco delle teorie e tecniche esposte nella parte scritta. Il gioco in questione è Drowning in Problems di Markus “Notch” Persson, la cui versione originale è giocabile a questo indirizzo. Dopo aver realizzato il porting usando Unity, ho creato le musiche e gli effetti sonori che ho successivamente gestito e implementato utilizzando il middleware Wwise.

Nella tesi trovate una descrizione particolareggiata di tutto il processo di produzione, i motivi per cui ho fatto certe scelte piuttosto che altre, le difficoltà che ho avuto e come ho cercato di risolverle. La mia versione è scaricabile (gratuitamente) qui nella sezione Apps, per Windows e Mac.

Conclusioni

Questo articolo non ha nessuna pretesa di essere esaustivo: vuole solo indagare alcuni degli aspetti generali della composizione per videogiochi.

Venendo da una formazione musicale (più o meno) classica ed essendo stato da sempre appassionato di tecnologia e di video games, ho trovato l’argomento estremamente interessante: le tecniche di composizione per i videogiochi sono assolutamente uniche, e le possibilità creative ed espressive per un compositore sono virtualmente infinite.

Per chi volesse approfondire, questo è il link alla tesi completa, in pdf:

Il sonoro nei videogiochi (PDF 3,7 MB)

Bibliografia

I libri e gli articoli consultati sono numerosi, mi limito a riportare quelli più importanti:

Karen Collins, Game Sound – An Introduction to the History, Theory, and Practice of Video Game Music and Sound Design, The MIT Press, 2008;
G.W. Childs IV, Creating Music and Sound for Games, Thomson Cour- se Technology, 2007;
Aaron Marks, The Complete Guide to Game Audio. For Composers, Musicians, Sound Designers, and Game Developers – Second Edition, Elsevier – Focal Press, 2009.