La storia relativa all’audio e, quindi, all’ambito
della registrazione e della riproduzione, si sviluppa per lo più
a partire dalla fine del 1800 con l’invenzione del grammofono
di Berliner nel 1893, che altro non era che una evoluzione del
fonografo proposto una ventina di anni prima da parte di T. A.
Edison. Il grammofono di Berliner era infatti una sorta di fonografo
a disco, il cui principio di funzionamento è rimasto per
lo più invariato fino ai giorni nostri, eccetto per il
fatto che, in origine, andava alimentato manualmente e che aveva
una velocità di lettura in riproduzione di 70 rpm. Tuttavia,
nel 1925, la prima registrazione elettrica rappresentò
un passo importante e fu premessa fondamentale allo sviluppo della
tecnologia degli anni successivi. Gli anni ’30 infatti videro
innovazioni di un certo rilievo, tra cui l’introduzione
dell’ LP (long playing), in lettura a 33 rpm, e il cui sviluppo
fu curato dalla nota CBS, la stessa che all’inizio degli
anni 70 rilevò la Fender Guitars, segnando la fine della
produzione di chitarre di liuteria e rendendo così l’attuale
mercato vintage così ricco. L’ obbiettivo principale
della ricerca era quello di migliorare la qualità di ascolto
senza gravare eccessivamente sui costi di produzione, cosi che
si potesse sviluppare un mercato consumer. Un certo miglioramento
qualitativo fu infatti ottenuto con il 45 rpm, introdotto dalla
RCA. Negli anni 60 il passaggio in Broadcast dall’AM all’
FM, segnò un aumento della qualità sonora, che fu
a sua volta accompagnato da una delle svolte, in campo audio,
più significative del secolo appena scorso: l’introduzione,
nel 1956, della registrazione stereo. Ritornando al nostro giradischi
è importante fare una riflessione super partes: aldilà
dell’eterna diatriba che ci impegna continuamente nell’elencare
difetti e pregi fra i sistemi analogici e quelli digitali, dato
certo è l’aumento del rapporto segnale/rumore che
si è ottenuto con l’avvento delle macchine digitali.
Il range dinamico di un Cd audio è di 90 db mentre un registratore
LP ottiene, in stereo, un massimo di 65 db fra i 30 Hz e i 15
Khz. Sebbene questo miglioramento qualitativo nel digitale abbia
portato, nell’attività di studio, una serie di conseguenti
interventi per migliorare le condizioni di registrazione, fra
cui, ad esempio, l’abbassamento dei livelli massimi di rumore
(Noise Criterion) presenti in studio, non dobbiamo dimenticare
la sua enorme importanza. Infatti i giradischi, così come
i registratori a nastro possiedono un rumore proprio, generato
dal contatto della testina su nastro o disco, dal suo scorrimento,
che non si può in alcun modo eludere; al punto che, con
la nascita del disco stereo, ridurre il peso e la pressione della
puntina su disco fu uno dei principali obbiettivi , insieme all’utilizzo
di servo motori che fossero stabili, immuni dalle vibrazioni e
a velocità costante. Per quanto riguarda i registratori
a nastro, negli anni ’70, vennero introdotti sistemi quali
il Dolby, sviluppato dalla stessa Dolby, che tentavano di migliorare
il rapporto segnale / rumore. A livello consumer, il registratore
a nastro (a cassette) venne introdotto nel 1963 ed ebbe un impatto
molto forte su tutti i tipi di utenti: la sua semplicità
di utilizzo e il costo ridotto ne consentì le applicazioni
più diverse. In seguito, alla fine degli anni ’70,
ci si rese conto che, in qualche modo lo sviluppo della registrazione
analogica aveva toccato i suoi limiti, almeno se si voleva considerare
necessario il compromesso fra la qualità e i costi di ricerca
e di produzione. Questi limiti erano legati in qualche modo alla
ridotta risposta in frequenza, al rapporto segnale/rumore, in
particolare se si considera il fenomeno “collo di bottiglia”
che si genera nella catena di processamento del segnale, alla
distorsione causata dalla non linearità delle macchine,
etc…
Ed ecco il digitale: il primo esempio di registrazione digitale
PCM fu sviluppato dai giapponesi della NHK (Japan Broadcasting
Corporation), mentre il primo esemplare era costituito da un VTR
a 4 testine, con un nastro da 2 pollici, convertitore a 13 bit
e frequenza di campionamento che si aggirava intorno ai 48 Khz.
Ma cos’è un registratore PCM? PCM sta per Pulse Code
Modulation ed è un registratore costituito da 3 sistemi
fondamentali: un convertitore analogico-digitale, che converte
le tensioni elettriche presenti in ingresso in un segnale digitale,
un convertitore digitale-analogico che compie il processo esattamente
opposto in uscita, ed un supporto, quale un nastro magnetico nel
caso del primo registratore PCM (sviluppato dalla Sony-PCM F1-)
sul quale registrare e dal quale riprodurre il segnale.
Dal punto di vista tecnico in realtà il processo di conversione
è costituito da due momenti distinti: il primo è
il Campionamento, in cui il segnale viene rilevato ad istanti
regolari per un numero di volte al secondo determinato dalla frequenza
di campionamento con cui si sceglie di operare. Così come
in un film quello che noi vediamo non è che una serie di
foto, l’una successiva all’altra, il cui numero per
ogni istante è talmente alto da offrirci un’immagine
fluida e continua, allo stesso modo il segnale audio viene campionato
un numero tale di volte al secondo da rendere un ascolto reale
rispetto alla sorgente registrata. A questo riguardo il Teorema
di Nyquist stabilisce che la frequenza di campionamento di un
segnale audio deve essere almeno il doppio della frequenza massima
dello spettro udibile ed essendo la frequenza più alta
dello spettro umano pari a 20000 Hz, una frequenza di campionamento
di 44.100 Hz, quale quella standardizzata del Cd Audio, risponde
a questo teorema. A questo processo si affianca quello della Quantizzazione:
le tensioni relative ad ogni istante campionato vengono tradotte
in numeri binari per poter essere gestite in dominio digitale.
Ogni parola digitale, costituita da una serie di bit, rappresenta
quindi una tensione relativa. Esistono poi problemi relativi al
rumore (rumore di quantizzazione) che questo processo genera attraverso
l’inserimento di armoniche nella banda audio e relative
tecniche (dither), di elaborazione digitale, che permettono di
mascherarlo. Con questa breve premessa tecnica, ora sarà
forse più semplice capire la differenza fra un registratore
a 16 bit ed uno a 24, o fra una frequenza di campionamento 44.100
Hz e una 48.100 Hz.
Tornando al primo registratore digitale PCM, ricordiamo che l’avvento
del digitale sconvolse in maniera profonda il mondo dell’audio,
sia a livello professionale che consumer. Nel 1983 venne lanciato
il Compact Disc in Europa: la sua introduzione permise a tutti
di apprezzare la qualità e la velocità applicativa
dei sistemi digitali.
Fra le sue caratteristiche:
1) Range Dinamico 90 db su tutte le frequenze dello spettro udibile
2) Distorsione armonica inferiore allo 0,001%
3) Rapporto segnale/rumore Non vi è contatto fisico fra
puntina e disco, quindi non vi è rumore né deterioramento
con il riascolto
4) Accesso Random Si può accedere in maniera diretta in
qualsiasi punto del disco
5) Dimensioni Appena 12 cm di diametro
6) Tempo di riproduzione 74min
Ancora di più queste specifiche assumono valore se poste
a confronto con i precedenti sistemi di registrazione analogica,
considerando anche l’ultimo stadio di tecnologia dei registratori
LP. Se parliamo di Compact Disc, parliamo di dischi ottici: un
raggio laser registra delle impronte sulla superficie del disco
seguendo una spirale che ha la sua origine al centro del disco.
Se non vi sono impronte la luce verrà riflessa al 100 %,
al contrario se vi sono, solamente una parte del fascio originale
di luce verrà riflesso in modo tale che queste variazioni
di intensità vengano tradotte in parole digitali. Questo
spiega perché la presenza di polvere, graffi sulla superficie
del disco può influenzare l’ascolto o addirittura
comprometterlo. Il segnale audio digitale non rappresenta l’unico
flusso di dati presente sul CD, ma vi sono informazioni aggiuntive
che fanno riferimento alla correzione di errori, ai segnali di
sincronizzazione, a dati di controllo, e fra queste la TOC (Table
of Contents), la tabella che gestisce informazioni sul contenuto
del disco. Lo standard del Cd-Audio è di 16 Bit a 44.100
HZ.
Per molti anni le registrazioni audio di alto livello venivano
realizzate utilizzando registratori video convenzionali, ma l’esigenza
di gestire l’audio su un supporto a nastro specifico portò
all’introduzione del DAT. DAT ( Digital Audio Tape ) ed
è un nastro audio digitale basato fondamentalmente sul
sistema del registratore video a testina rotante; ne sono state
sviluppate, in realtà, due tipologie: l’ R-DAT, un
nastro audio digitale a testina rotante, e l’ S-DAT, un
nastro audio digitale a testina fissa. Nonostante le origini di
progettazione l’ R-DAT si distingueva dai registratori video
a testina rotante per il fatto che la testina aveva contatto con
il nastro solo per il 50 %, poiché il segnale audio era,
in realtà, compresso nel tempo; a livello pratico questo
particolare tecnico permetteva un’usura del nastro notevolmente
minore nonché una minore quantità di tensione di
movimento che significava maggior tempo di riproduzione a disposizione.
Il suo standard gli permetteva di lavorare a tre frequenze di
campionamento diverse: 48.1Khz, 44.1 Khz, 32 Khz ed una quantizzazione
lineare a 16 bit o non lineare a 12 bit, che permetteva di aumentare
il tempo di riproduzione. Il DAT vide poi un’ulteriore evoluzione
con l’ NT-DAT, una tecnologia che offriva una minore sensibilità
agli urti e ad ogni forma di vibrazione, ma questa non ebbe grande
diffusione a livello commerciale, eccetto per alcuni sistemi di
lettura, in particolare nelle installazioni nelle autovetture.
Una delle applicazioni consumer che ha avuto più successo
negli ultimi anni, ovvero dall’anno della sua presentazione,
nel 1992, è stato il MINIDISC. Il Minidisc consiste di
un sistema che ha come supporto un disco riscrivibile e non un
nastro magnetico. Le sue dimensioni sono inferiori rispetto a
quelle del Compact Disc: la possibilità di poter gestire
migliaia e migliaia di registrazioni sullo stesso supporto, la
sua economia e leggerezza e l’elevata insensibilità
alle sollecitazioni meccaniche lo rendono un prodotto interessante.
Tuttavia, a livello professionale, una certa diffidenza ed un
mancato adeguato sviluppo sono giustificati da un aspetto: è
ovvio che, viste le dimensioni ridotte, per poter avere la stessa
capacità di dati di un Compact Disc, il segnale deve essere
necessariamente compresso; questo sistema di compressione è
chiamato ATRAC e sta per Adaptive Transform Acoustic Coding: è
sì una compressione, ma che cerca di diminuire la densità
di informazioni sul segnale in funzione delle caratteristiche
del segnale in ingresso, nonché delle proprietà
dell’ascolto umano, senza così degradare la qualità
del suono. Il tasso di compressione è di 1:5 rispetto ad
un Compact Disc. Tuttavia, bisogna inoltre considerare il principio
di base della tecnologia Minidisc, ovvero che i dati memorizzati
perdono il loro legame con il segnale audio originale, poiché
esso viene, in realtà, ricostruito attraverso una complessa
serie algoritmica.
Verso la fine degli anni ’90, un passo avanti rispetto ai
limiti di qualità sonora del Compact Disc che erano ormai
noti dalla metà degli anni ’80, fu rappresentato
dalla presentazione sul mercato di un nuovo formato: il SACD –
Super Audio Cd. Le sue capacità sono notevolmente superiori
a quelle del CD convenzionale: innanzitutto non si campiona più
a 44.100 Hz ma a 2.8224 Mhz, la codifica non è a 16-bit
PCM ma ad 1-bit DSD e la capacità può arrivare 8540
Mb per un massimo di 255 tracce. In realtà esistono tre
tipologie di disco, quello a strato singolo e memoria di 4,7 Gb,
il disco a strato doppio che permette un tempo di riproduzione
maggiore ed infine il disco ibrido che possiede un’enorme
flessibilità di utilizzo, vista la compatibilità
con i lettori di comuni Compact Disc. Il Super Audio Cd si serve,
nella codifica del segnale, del sistema DSD, Direct Stream Digital;
questo sistema permette di lavorare su una banda che arriva a
100 Khz e permette quindi di considerare quel contenuto armonico,
oltre la soglia di udibilità, che è un’importante
informazione musicale nell’ascolto. Appena è stato
possibile costruire convertitori ad alta velocità, il sistema
DSD ha compensato i limiti del normale Compact Disc; la filosofia
del Direct Strema Digital è quella di convertire direttamente
il segnale analogico in una serie di impulsi 0 e 1, sostituendo
il classico convertitore D/A in uscita con un più semplice
filtro passa basso; anche il livello di rumore è, in qualche
modo, meno problematico, in quanto viene spostato alle alte frequenze
rendendo così non necessario l’utilizzo di noise
shaping nonché di complessi e costosi filtri digitali.
Simile al formato SACD è il DVD-Audio (DVD – Digital
Versatile Disc); Pur utilizzando il sistema di codifica PCM già
utilizzato per i CD, il DVD-Audio permette di gestire frequenze
di campionamento fino a 192 Khz, con una larghezza di banda che
arriva ai 96 Khz ed utilizzando una quantizzazione a 24 bit. Per
ottenere un tempo massimo di registrazione pari a 74 min a 24
bit, è stato sviluppato un particolare sistema di compressione
che prende il nome di MLP – Meridian Lossless Packing. Questa
tecnologia di compressione effettua una sorta di confronto fra
serie successive di campionamenti e, invece di codificare l’intero
segnale, considera solo le differenze fra questi, permettendo
di non perdere bit in uscita e riuscendo a risparmiare il 50 %
della capacità su disco. Si può anche gestire il
multicanale, arrivando a sei canali a 192 Khz o a 36 a 32 Khz,
anche se in realtà bisognerebbe ottenere un compromesso
di sample rate diversi per i vari canali. La struttura di un DVD-Audio
è simile a quella di un Compact Disc, con l’unica
eccezione che rappresenta la possibilità, nel primo, di
creare fino ad un massimo di nove gruppi, permettendo così
una navigazione più semplice.
Si è visto come spesso l’ottenere un alta qualità
audio insieme ad una grande capacità di immagazzinamento
di dati, richieda l’utilizzo di tecniche di compressione
del segnale: la nota codifica MPEG, utilizzata anche in sistemi
di compressione più complessi, comprime il segnale fino
ad un rapporto di 1:12; similarmente alla tecnica ATRAC, precedentemente
vista nel Minidisc, questa codifica tiene conto, in particolar
modo, delle caratteristiche psicoacustiche dell’ascolto:
fra queste le curve di Isofonia che rappresentano una sorta di
risposta in frequenza dell’orecchio umano, evidenziando
la sua scarsa sensibilità alle basse frequenze ed un suo
picco tra i 2000 e i 4000 Hz, l’effetto di mascheramento
che fa sì che una frequenza con un determinato livello
tenda a coprire le frequenze adiacenti di livello minore, e, per
ultimo, l’effetto di questo stesso mascheramento a livello,
però, temporale, ovvero indipendentemente dalla simultaneità
della presenza del tono di livello più forte rispetto a
quello più debole. Il principio di base della compressione
MPEG è legato alla divisione dello spettro audio in 32
bande critiche. Le bande critiche sono una caratteristica del
nostro ascolto e sono, in altre parole, dei filtri passa banda
centrati intorno a qualunque frequenza che limitano, in qualche
modo, la nostra sensibilità rispetto alla percezione di
variazioni in frequenza. Il primo stato MPEG riduce di quattro
volte la quantità di dati, con una velocità di trasferimento
di 384 Kb/s, tenendo in considerazione un segnale PCM 16 bit a
44.1 Khz; il secondo strato riduce da 6 ad 8 volte mentre il terzo
fino a 12 volte a 112 Kb/s. Miglioramenti di questi aspetti della
codifica hanno portato lo sviluppo di compressioni diverse, specifiche
per ogni applicazioni.
L’arrivo di nuovi sistemi di registrazione digitale ha notevolmente
modificato la possibilità di copiare i dati da supporti
diversi, con tutti i problemi relativi alle questioni di Copyright.
Tuttavia, una tecnica utilizzata per limitare questa possibilità
è la SCMS – Serial Copy Management System; tale tecnica
permette, tra connessioni digitali e se il materiale di origine
è protetto da Copyright, di eseguire una sola copia del
prodotto. Le informazioni necessarie a questo sistema di protezione
fanno parte di quella serie di dati ausiliari contenuti in ogni
sistema di registrazione digitale, gli stessi che vengono poi
modificati nel nuovo supporto di copiatura per identificare quest’ultimo
come una copia e non un originale, in modo tale da non consentire,
secondo la SCMS, ulteriori copie.
Rimanendo in ambito di connessioni digitali, un importante standard
di collegamento tra apparecchiature digitali è stato sviluppato
dalla Sony/Philips con il nome di SPDIF – Sony/Philips Digital
Interface Format: una sola linea gestisce un segnale stereo.
Paolo Paterna