Il suono digitale

Partiamo dalle basi, ovvero: “Che cos’è il suono?”

[more]

Il suono (dal latino sonum) è la sensazione data dalla vibrazione di un corpo in oscillazione. Tale vibrazione, che si propaga nell’aria o in un altro mezzo elastico, raggiunge l’orecchio che, tramite un complesso meccanismo interno, è responsabile della creazione di una sensazione “uditiva” direttamente correlata alla natura della vibrazione.

cit. da Wikipedia

[/more]

Caratteristiche del suono

Il suono si caratterizza in base a tre proprietà: altezza, intensità e timbro

[more]
Altezza

L’altezza è la qualità che fa distinguere un suono acuto da uno grave. Dipende in massima parte dalla frequenza ma anche dall’ intensità. Al crescere della frequenza corrisponde l’ aumento dell’ altezza.Onde sonore aventi uguali ampiezza ma frequenza diversa generano suoni di diversa altezza. L’orecchio umano percepisce solo i suoni che vanno da 20 a 20.000 vibrazioni al secondo. Al di sotto abbiamo gli infrasuoni, al di sopra gli ultrasuoni. Il sonar, ma anche i delfini ed i pipistrelli percepiscono gli ultrasuoni mentre gli elefanti percepiscono gli infrasuoni.

Intensità

L’intensità, comunemente detta volume, è proporzionale alla densità di energia dell’onda sonora. È la qualità sonora associata alla definizione intuitiva di forza del suono, ed è determinata dall’ampiezza della vibrazione e dalla distanza del punto di percezione da quello di emissione del suono. L’intensità si misura in Decibel (dB)

dB = 10*log10 (I/I0)

dove I0 è l’intensità per cui la sensazione fisiologica è nulla:

I0=10-12W/m2

Timbro

Il timbro, è la qualità che, a parità di frequenza, distingue un suono da un altro. Il timbro dipende dalla forma dell’onda sonora, determinata dalla sovrapposizione delle onde sinusoidali caratterizzate dai suoni fondamentali e dai loro armonici. Dal punto di vista della produzione del suono, il timbro è determinato dalla natura (forma e composizione) della sorgente del suono e dalla maniera in cui questa viene posta in oscillazione.
La scomposizione di un suono nelle proprie componenti sinusoidali fondamentali è detta analisi in frequenza. La frequenze vengono misurate in Hz, ovvero oscillazioni al secondo. Le armoniche di un suono sono suoni con frequenze che sono multipli interi del suono principale. Nella musica, tanto più un suono è composto da diverse componenti, tanto più esso risulta complesso: si va dal suono di un flauto dolce, composto dalla fondamentale e da pochissime armoniche, al suono degli strumenti ad arco, composto da moltissime frequenze armoniche secondarie.
Tanto più le frequenze secondarie che si sovrappongono alla principale non sono armoniche (ovvero hanno frequenze che non sono multipli interi della fondamentale), tanto più ci si avvicina al rumore. [/more]

Parametri fondamentali nella digitalizzazione

Il suono è un segnale continuo, per essere memorizzato deve essere campionato ottenendo così un segnale digitale. Tre sono i parametri che caratterizzano il campionamento, tali parametri influenzano sia lo spazio occupato sia la qualità del suono: numero di canali, risoluzione, frequenza di campionamento

[more]Il numero di canali

Esistono due modi di ripartizione dei canali audio: Mono e Stereo. La modalità Mono ha uno solo canale mentre quella Stereo ne ha due separati ( sinistro e destro ). Ovviamente un segnale Stereo occupa, in termini di spazio, il doppio di uno segnale Mono. Nelle applicazioni più recenti il numero di canali è notevolmente aumentato, si pensi al surround, ma come sempre nell’informatica il problema sorge nel passaggio da uno a molti, e non interessa se questi molti siano due, dieci o più.

La risoluzione

Rappresenta il numero di bit utilizzati per rappresentare i campioni; solitamente si utilizzano 8 o 16 bit per campione: nel primo caso si hanno 256 valori possibili, relativamente pochi, infatti offrono una qualità del suono inferiore a quella di un nastro, nel secondo si hanno circa 65536 valori.

La frequenza di campionamento

È il numero di campioni al secondo; può variare da 11 kHz adatta alla registrazione della voce, a 22 kHz adatta alla registrazione di un nastro fino a 44 kHz per una registrazione a qualità cd.[/more]

Digitalizzazione del suono

Il segnale audio è convertito (quindi codificato) in un segnale elettrico (analogo per informazione contenuta, a meno dell’inevitabile rumore, anche minimo, introdotto da qualsiasi manipolazione) per mezzo di un microfono, il quale produce, quando viene colpito da una onda meccanica sonora continua, un segnale elettrico ininterrotto, i cui valori di tensione, normalmente compresi in un range (detto dinamica del segnale e compreso tra un minimo e un massimo), contengono la forma dell’onda acustica originaria. Questo segnale, continuo nel tempo e che può assumere con continuità tutti i valori all’interno della sua dinamica, è detto analogico. Una seconda conversione può essere fatta associando a questo segnale una serie numerica (quindi digitale) che codifichi con sufficiente precisione la forma d’onda elettrica analogica originaria, ottenendo così la conversione analogico-digitale, detta brevemente conversione A/D. Per far questo è necessario andare ripetutamente a leggere i valori di tensione continui della forma d’onda analogica con sufficiente frequenza temporale, cioè effettuare una lettura sufficientemente fitta di questi valori di tensione, producendo un numero di letture (e quindi di valori numerici) in genere molto alto per ogni secondo di conversione A/D. Le singole letture sono dette campioni e il teorema del campionamento afferma che se la frequenza temporale di queste letture (detta frequenza di campionamento) è sufficientemente grande, non si hanno perdite di informazione rispetto alla forma d’onda originale.

[more]La teoria del campionamento, in particolare il Teorema di Shannon-Nyquist, afferma che per avere una relazione univoca fra il segnale originale e quello campionato è sufficiente che la frequenza di campionamento sia il doppio della massima frequenza del segnale originale. Sinteticamente può essere spiegato così:
“Se si prendono dei campioni molto stretti fra di loro (frequenza di campionamento alta), ed il segnale varia lentamente nel tempo (la banda del segnale è sufficientemente stretta) si possono ricongiungere i vari punti individuati dai campioni senza intaccare la qualità del suono originale.”[/more]

Per comprendere l’importanza della frequenza di campionamento, è necessario ricorrere a Fourier.
Grazie al teorema di Fourier si può dire che qualsiasi onda può essere considerata come la somma di un insieme di onde, di cui la prima è detta fondamentale, e le onde successive prendono il nome di armoniche.
Le armoniche sono frequenze multiple della frequenza fondamentale e di minore ampiezza (intensità). Ad esempio, se il LA fondamentale “internazionale” vibra a 440 kHz, la seconda armonica avrà frequenza di 880 kHz, la terza 1760 kHz, e così via. In questo caso, la sesta armonica ha una frequenza di 28160 kHz e dunque si trova ben oltre il limite di frequenza udibile dall’orecchio umano; d’altra parte, la sua presenza – sommandosi alle armoniche udibuli – può avere effetti udibili sul timbro del suono.

Cioè la serie di numeri prodotta contiene pressoché intatta tutta la informazione sulla forma d’onda elettrica analogica iniziale. Nei moderni standard tecnologici, in genere le frequenze di campionamento spaziano dagli 8.000 campioni al secondo (Samples per second, S/s) per la voce telefonica, fino ai 44.100 e più campioni al secondo per la qualità musicale. Queste letture di valori di tensione possono poi cadere in un qualsiasi punto della dinamica del segnale, cioè ogni singolo campione può avere un valore compreso tra il minimo e il massimo possibile. Quindi potenzialmente si possono avere infiniti valori di lettura di tensione per ogni singolo campione. Per completare l’opera di conversione del segnale da analogico in digitale, va ora suddivisa tutto il possibile range dinamico del segnale (l’intervallo dal suono più basso al più alto percepibile, 96 dB per l’uomo) in un numero finito di intervalli e ogni singolo intervallo va codificato con un valore digitale ben determinato. Queste due operazioni si chiamano quantizzazione e codifica di sorgente.

Quantizzazione

La quantizzazione in genere suddivide il range dinamico del segnale in un numero di intervalli potenza del due (2^n intervalli), in maniera tale che ogni singolo campione cadrà inevitabilmente in uno degli intervalli quantizzati e potrà così essere codificato digitalmente con n bit. I valori più ricorrenti di digitalizzazione attualmente usati vanno da un minimo di 8 bit per campione in campo telefonico (range dinamico del segnale suddiviso in 256 intervallini), fino a 20 e più bit per campione (range dinamico del segnale suddiviso in un milione e più di intervallini). Naturalmente all’aumentare del numeri dei bit per campione aumenta la fedeltà del segnale campionato alla forma d’onda originale e si riduce l’imprecisione introdotta dalla quantizzazione (rumore di quantizzazione). La serie numerica che così discende è detta segnale audio digitale e contiene in sé tutte le informazioni necessarie per ricostruire la forma elettrica originale, che a sua volta era l’immagine quasi perfetta della forma d’onda acustica che l’aveva originata.

Codifica di sorgente

La codifica consiste nell’associare ad un livello di tensione un determinato numero binario. Si ottiene così un codificato detto “raw”, cioè grezzo. Un secondo livello di codifica è ora possibile, che consenta di comprimere le informazioni in sequenze numeriche più corte e che occupino meno bit per ogni secondo di conversione.

Il segnale audio così digitalizzato è pronto per essere stamparto su di un’opportuno supporto fruibile alle masse.

Fonte 1
Fonte 2
Fonte 3

OSSIC X, le prime cuffie con suono 3D
OSSIC X, le prime cuffie con suono 3D
Dithering: cos'è e come funziona
Dithering: cos'è e come funziona
Dithering: cos'è e come funziona
Dithering: cos'è e come funziona