Automazione dei parametri nella compressione della gamma dinamica

Maselec-MLA-3-compressore-multibanda

La corretta configurazione dei compressori di dinamica non è un’operazione banale a causa della reciproca correlazione tra i parametri: tempo d’attacco e tempo di rilascio – attack time τA, release time τR –, livello di soglia – threshold T –, grado di compressione – rate R –, ampiezza/tipo di curva di compressione – knee width W – e guadagno – gain M.
L’ampia variabilità dei segnali musicali può rendere sostanzialmente impossibile configurare staticamente in maniera
ottimale i parametri di compressione: l’automazione della DRC (dynamic range compression), capace di adattare i parametri di compressione sulla base delle caratteristiche istantanee del segnale audio può offrire risultati sonori superiori alla configurazione statica tipicamente utilizzata.
Attualmente non sono noti sistemi totalmente automatizzati capaci di offrire tale risultato.
D. Giannoulis, M. Massberg e J.D. Reiss suggeriscono un metodo per determinare automaticamente i parametri di compressione in funzione delle proprietà del segnale e di valutazioni statistiche.
L’obiettivo è quello di automatizzare la DRC in modo da operare con un singolo parametro, realizzando un compressore adatto ad applicazioni broadcast e live.

Il modello si basa sulla compressione feed-forward con analisi del livello di picco del segnale in side-chain.
Nel modello utilizzato, i parametri di compressione agiscono in punti differenti della catena di elaborazione del segnale e quindi, sebbene legati alle caratteristiche istantanee del segnale, possono essere modificati indipendentemente.
Tempi τA e τR troppo brevi dovrebbero essere evitati per non introdurre artefatti, ma altrettanto deleteri sono tempi troppo lunghi.
Siccome la maggior parte dei segnali audio varia le proprie caratteristiche nel tempo, anche τA e τR devono
adattarsi dinamicamente ad esempio assumendo valori bassi quando il segnale presenta elevati transienti (es. percussivo) e alti quando il segnale è stazionario.
La configurazione di τA e τR si basa sull’analisi del fattore di cresta ed è effettuata combinando i dati di un rilevatore di picco con uno di valore rms e grazie alla trasformata di Fourier del segnale con una finestratura breve che permette di valutare il flusso spettrale – FS –, utile nell’individuazione dei transienti.
R è impostato staticamente a un valore infinito: variando l’ampiezza W della curva di compressione e impostando un softknee, è possibile “spazzare” tutti i rapporti di compressione limitandosi ad impostare solo W.

L’automazione di W si basa sull’attenuazione media del guadagno desiderata, sulla base di un algoritmo empirico che tiene conto di T, il ché rende l’automazione di W indipendente dalle caratteristiche del segnale.
Per ottimizzare W in funzione del segnale pesa il valor sulla base del FS.
Il guadagno M ha lo scopo di equilibrare il loudness del segnale compresso con quello del segnale in ingresso: implementando lo standard EBU R-128, il modello analizza i livelli di loudness dei due segnali per ricavare il valore di M.
Attraverso alcuni test audio percettivi è stato possibile valutare l’efficacia del modello proposto, in particolare per quel che riguarda l’automazione di τA, τR, R e W; per quest’ultimo è risultata fondamentale la pesatura attraverso l’analisi del FS.
Ulteriori studi devono essere approntati, in particolare per l’individuazione delle costanti di tempo e dell’algoritmo di automazione di W.
In generale lo sviluppo di un sistema DRC automatizzato è semplice se è noto a priori il tipo di segnale: percussivo, parlato, musica o broadcast.