Formati audio : capiamoli e vediamo come usarli
Breve viaggio sui principali formati audio, pregi, difetti, quando usarli e quando no.
Come funziona l'audio digitale ?
Concetti base
L'audio, i suoni , la musica sono segnali, cioè funzioni che trasportano una informazione. In questo caso l'informazione è il segnale acustico, quella bella sensazione che ascoltiamo quando viene prodotta una variazione di pressione in un mezzo elastico.
Anche se poco romantico , sia l'assolo di Clare Torry in "The Great Gig in the Sky" del 1973 che il rumore dell' avviamento della Panda Diesel del 1988 sono per il nostro computer un segnale analogico che deve essere immagazzinato in qualche modo tramite l'utilizzo di due soli segnali elettrici : lo "0" e l' "1".
Quindi ogni volta che ci troviamo di fronte ad una grandezza variabile, possiamo osservare un segnale. Non tutte le grandezze variabili trasportano informazioni utili. Il rumore è un esempio di questo tipo, altri ci mettono anche la musica Trap, ma è un discorso personale :-).
Un segnale audio come lo sente il nostro orecchio sarà ad AMPIEZZA e TEMPO continui, cioè potrà assumere con continuità tutti i valori di un intervallo, eventualmente illimitato, sia in tempo che in ampiezza.
Un segnale così si dice analogico , come poteva essere il segnale di un disco in vinile, del registratore a cassette (non il DAT) o anche il segnale della radio Fm che ben presto verrà spento in favore del Dab.
I computer però gestiscono i dati con logica binaria : o zero o uno, non c'è altra possibilità.
Quindi un segnale analogico per poter essere gestito da un computer va campionato, cioè vanno presi i valori del segnale con una precisa velocità di campionamento.
Più sarà veloce il campionamento e più sarà precisa la misurazione e più il segnale digitale sarà fedele alla sorgente analogica.
La velocità con cui si campiona è detta frequenza di campionamento, la precisione è tanto più alta quanto sono i bit usati per la quantizzazione.
Aiuto ! tutto sto pasticcio per registrare "fra Martino" che i miei studenti suonano col flauto dolce ?
Eh ... magari .. siamo solo all' inizio :-)
Facciamo due esempi:
un cd audio, classico esempio di suono digitale anche se ormai un po' obsoleto, campiona la musica a 44.1 khz, cioè viene preso un valore più di 44mila volte al secondo, tale valore viene memorizzato con una precisione di 16 bit cioè viene scelto un valore tra 65536 disponibili.
Facendo un calcolo veloce si deduce che :
1 secondo: 44100*2(byte) = 88,2 kB ma poichè i canali audio sono 2 (stereo), lo spazio occupato è pari a 176,4 kB
1 minuto: 176,4*60 = 10584 kB e tenendo conto che 1024 kB = 1 MB, si ha che un minuto di audio stereo 44,1/16 occupa lo spazio pari a 10,1 MB
10 MegaBytes al minuto ! è tantissimo !
Immaginate quanto spazio ci andrebbe per gestire ore di audio , magari con suoni multitraccia .
Sarebbe ingestibile .
La compressione
La soluzione si chiama compressione, ma proprio perche a noi piace non farci mancare nulla, questa compressione viene fatta con due strategie diverse : quella Lossy e quella Lossless
Lossy
I formati lossy nascono dall’idea che i suoni, o meglio le frequenze contenute in un brano musicale, non vengono tutte percepite dall’orecchio umano. Si vanno allora a “tagliare le alte frequenze, che si ritiene siano quelle meno distinte dal nostro orecchio.
Ovviamente più frequenze si “tagliano” più lo spazio occupato dalla traccia audio diminuisce, e quindi diminuisce anche la qualità del risultato.
La riconversione, partendo dai formati lossy, non permette di riportare la traccia audio al livello di qualità originale. E questo in quanto non consente di ripristinare le frequenze “tagliate”.
In realtà esistono software che permettono di ripristinare alcune di queste alte frequenze, ma logicamente più di tanto non è possibile fare.
Per dare una idea della potenza di compressione, un mp3 (formato lossy più diffuso anche se oggi obsoleto) di buona qualità è circa 10 volte più piccolo di un file audio non compresso.
Lossless
senza perdita: quando l’informazione contenuta nel file compresso è identica a quella contenuta nel file di origine. Come funziona ? più o meno come i file "zip" o "rar" , ciè vengono raccolti i dati simili in "gruppi" per ridurre lo spazio occupato
un fomato lossless può sempre essere convertito in un file non compresso, senza alcuna perdita .
Lo svantaggio dei formati lossless è che arrivano al massimo a ridurre i file del 50 per cento, mentre i lossy sanno fare molto di più in fatto di compressione.
Formati
Ecco qui che allora tutti si sono lanciati a creare formati semprte più efficienti , che "suonano bene" , che occupano poco spazio e che vanno bene per lo streaming.
Vediamo i più diffusi :
1. Tipo di file audio M4A (lossy)
L'M4A è un file audio mpeg-4. Si tratta di un file audio compresso utilizzato nell'ambiente moderno a causa della maggiore richiesta di qualità come risultato dell'archiviazione cloud e dello spazio su disco rigido più ampio nei computer contemporanei.
La sua alta qualità lo mantiene rilevante per audiofili e professionisti
I tipi di file M4A sono file audio compressi utilizzati da Apple iTunes.
I software per il download di musica come Apple iTunes utilizzano M4A invece di MP3 perché è di dimensioni inferiori e di qualità superiore. I suoi limiti si presentano sotto forma di compatibilità, poiché molti software non sono in grado di riconoscere l'M4A, rendendolo ideale solo per un tipo selezionato di utente.
2. FLAC
Il file audio FLAC è Free Lossless Audio Codec. È un file audio compresso in una dimensione più piccola del file originale. È un tipo di file sofisticato che è meno utilizzato tra i formati audio. Questo perché, anche se ha i suoi vantaggi, spesso necessita di download speciali per funzionare. Se si considera che i file audio vengono condivisi spesso, ciò può creare un notevole inconveniente per ogni nuovo utente che ne riceve uno.
FLAC è un file audio senza perdita di dati, ciò che rende il FLAC così importante è che la compressione senza perdita di dati può salvare le dimensioni e promuovere la condivisione di un file audio pur essendo in grado di tornare allo standard di qualità originale. La quantità quasi esatta di spazio di archiviazione richiesta per il file audio originale è del 60% questo consente di risparmiare molto spazio sul disco rigido e tempo speso per caricare o scaricare.
3. MP3
Il file audio MP3 è un formato file audio MPEG layer 3. La caratteristica chiave dei file MP3 è la compressione che consente di risparmiare spazio prezioso mantenendo una qualità quasi impeccabile della sorgente audio originale. Questa compressione rende l'MP3 molto popolare per tutti i dispositivi mobili di riproduzione audio.
MP3 continua ad essere rilevante nel panorama digitale odierno perché è compatibile con quasi tutti i dispositivi in grado di leggere file audio e funziona bene anche per i siti Web che ospitano file audio. Infine, l'MP3 rimane popolare grazie alla sua qualità audio complessiva, sebbene non sia il migliore, fa bene il suo lavoro e l'utenza non sente la necessità di abbandonarlo per soluzioni più efficienti
4. MP4
Un file audio MP4 viene spesso scambiato per una versione migliorata del file MP3. Cosa assolutamente errata . I due sono completamente diversi e le somiglianze derivano dal loro omonimo piuttosto che dalla loro funzionalità.
Si noti inoltre che a volte l'MP4 viene definito file video anziché file audio. Questo non è un errore, poiché in realtà è sia un file audio che video.
Ci sono molte differenze tra MP4 e MP3.
Un tipo di file audio MP4 è un'estensione multimediale completa, in grado di contenere audio, video e altri media.
5. WAV
Un file audio WAV è un file audio della forma d'onda memorizzata senza compressione. Il WAV viene tipicamente utilizzato sui sistemi Windows e non va bene per i siti internet in quanto occupa un sacco di spazio
Il modo più semplice per immaginare questo concetto è pensare alle onde dell'oceano. L'acqua è più forte, più piena e più forte quando l'onda è alta. Lo stesso vale per la forma d'onda nel WAV. Le immagini sono alte e grandi quando il suono aumenta nel file.
6. WMA
WMA (Windows Media Audio) è un'alternativa basata su Windows al tipo di file MP3 più comune e popolare. Ciò che rende così vantaggioso è la sua compressione senza perdite, mantenendo un'elevata qualità audio durante tutti i tipi di processi di ristrutturazione. Anche se è un formato audio di tale qualità, non è il più popolare perché è inaccessibile a molti utenti, specialmente a quelli che non utilizzano il sistema operativo Windows.
a la possibilità di convertire il WMA in un formato audio diverso. Sono disponibili molti strumenti di conversione.
7. AAC
L'AAC (Advanced Audio Coding) è un file audio che offre un suono di qualità decentemente alta ed è migliorato utilizzando la codifica avanzata. Non è mai stato uno dei formati audio più popolari, soprattutto quando si tratta di file musicali, è molto usato nella creazione dei suoni dei videogiochi.
8. Ogg Vorbis
Formato compresso lossy completamente aperto e opensource che sta lentamente soppiantando il vecchio mp3 : è compatibile con qualsiasi piattaforma e non richiede il pagamento di alcuna royalty per chi implementa sistemi che lo usano.
Usato anche da colossi come Netflix per trasmettere le loro colonne sonore.
E i midi ?
MIDI è l’abbreviazione di Musical Instrument Digital Interface. È un linguaggio che consente ai computer, agli strumenti musicali e ad altri hardware di comunicare. Il protocollo MIDI include l’interfaccia, il linguaggio in cui i dati MIDI vengono trasmessi e le connessioni necessarie per la comunicazione tra hardware.
La definizione del formato midi risale all' ormai lontano 1982 quando il fondatore di Roland Ikutaro Kakehashi propose l’idea di un linguaggio standard degli strumenti per gli altri maggiori produttori, tra cui Oberheim, Dave Smith Instruments e Moog.
Quando si utilizza uno strumento MIDI o si suona un file midi ogni volta che si preme un tasto o viene eseguita una nota MIDI si crea un "Evento midi"
Ogni evento MIDI contiene istruzioni che determinano:
- Tasto ON e OFF: quando viene premuto/rilasciato il tasto
- Pitch o note suonate
- Velocità: quanto velocemente e duramente viene premuto il tasto
- Aftertouch: quanto duramente viene tenuto premuto il tasto
- Tempo (o BPM)
- Panoramica (Panning)
- Modulazioni
- Volume
linguaggio che consente ai computer, agli strumenti musicali e ad altri hardware di comunicare. Il protocollo MIDI include l’interfaccia, il linguaggio in cui i dati MIDI vengono trasmessi e le connessioni necessarie per la comunicazione tra hardware.
E' importante notare che :.
MIDI NON trasmette un segnale audio effettivo.
MIDI contiene dati che descrivono il suonoi. È un insieme di istruzioni che le macchine utilizzano per parlare.
I sequenziatori registrano i dati trasmessi tramite MIDI. NON registrano il segnale audio effettivo.
Ecco perché una sequenza MIDI appare come piccoli rettangoli nei software audio, NON una forma d’onda come una traccia audio.
Questo rende il MIDI così vantaggioso. I dati MIDI sono compatti, modificabili e facili da spostare.
Le note MIDI sono istruzioni su come eseguire la riproduzione della macchina. Le note MIDI non sono effettivamente la clip audio medesima.
Così, invece di ascoltare la registrazione audio effettiva riprodotta, le note MIDI che se registrano o eseguono dicono al sintetizzatore o alla batteria di attivare qualsiasi suono si desideri.