Primo riguarda il numero e il formato effettivo delle informazioni che sono memorizzatte in un file, cioè i numeri dell'ampiezza del segnale o una sequenza di note vengono organizzati in modo da essere poi letti di programmai di elaborazione e riproduzione o dai sequencer.
L'organizzazione dei dati è spesso molto articolata, perché tra i suoi obbiettivi ha la flessibilità dei parametri della rappresentazione e la robustezza rispetto rispetto a possibili errori di registrazione e trasmissione.
Secondo connesso all'archiviazione, concerne le problematiche relative ai supporti fisici che devono avere ampia capacità, alta velocità di accesso e tempi ridotti di recupero dati.
Convenzioni dell'archiviazione dei dati audio
La digitalizzazione del segnale comporta la definizione dei parametri di campionamento, quantizzazione, codifica.
Per definire un formato queste info devono essere integrate con ulteriori convenzioni:
la modalità di memorizzazione dei canali multipli e la struttura interna dei campioni.
Canali multipli e formati non compressi, occorre decidere come i campioni dei diversi canali vengono alternati nella memorizzazione.
Procedimento: costruzione di gruppi di campioni da tutti i canali presenti secondo uno schema detto interfogliamento (interleaving).
Campione 1 sx Tutti i primi campioni
Campione 1 dx
Campione 2 sx Tutti i secondi campioni
Campione 2 dx
…………………...
Campione n sx Tutti i campioni n-esimi
Campione n dx
I canali sx dx si alternano, prima i canali con il canale sinistro.
Vantaggi della memorizzazione:
- facile sincronizzazione dei canali;
- maggiore velocità nell'archiviazione o trasmissione dei dati;
Svantaggi:
eventuali sprechi di spazio(a volte alcuni canali non trasportano segnale);
difficoltà di effettuare operazioni di elaborazione del segnale che concernono un solo canale;
Struttura interna dei campioni
aspetto di rilievo nell'archiviazione è l'ordine dei byte quando un dato necessita di più di un byte, come nel caso di 16 bit.
I byte vengono memorizzati mediante interi positivi.
Campione di 16 bit è formato da 2 byte:
uno meno significativo (LSB) per i bit da 0 a 7;
uno più significativo (MSB) per i bit da 8 a 15;
Un ordine naturale sarebbe quello di far precedere LSB negli indirizzi in memoria: nel caso, l'indirizzo LSB sarebbe un numero inferiore all'indirizzo MSB.
Ordine naturale: LITTLE-ENDIAN, macchine Intel.
Ma i produttori di hardware hanno perseguito anche la soluzione inversa:
BIG-ENDIAN, processori Motorola, produttori Apple e Sun.
Scambiare dati tra macchine differenti, i dati verrebbero interpretati in modo errato.
I formati dei file audio
Sono stati sviluppati per standardizzare la riproduzione e la distribuzione dei dati audio nei sistemi digitali.
Storicamente, ogni tipo di piattaforma usava un formato proprietario per i dati audio:
alcuni formati sono applicabili in modo più generale,
altri sono tipici di una piattaforma.
Esistono programmi per la conversione tra quasi tutti i programmi anche se tavolta si ha perdita di informazione.
Parametri che determinano i dati audio sono principalmente tre:
- tasso di campionamento(sampling rate) misurato in campioni/s per canale;
- lunghezza e tipo di codifica della parola binaria: numero di bit per campione;
- numero di canali
Due tipi di formati
Con intestazione(header), detti autodescriventi.
Hanno una forma più flessibile , permette di inserire nell'intestazione i parametri espliciti del formato.
Definisce una famiglia di codifiche per i dati audio:
un parametro dell'intestazione definisce la variante adottata.
L'intestazione inizia spesso con una parola chiave e prosegue con i dati della codifica(segno/senza segno, mono/stereo).
Sono molto diffusi , la maggior parte dei programmi di elaborazione audio riesce a interpretarli e a produrli.
Senza intestazione(headerless - raw).
Parametri sono impliciti e verranno interpretati caso per caso(parametri e codifica fissati a priori).
Definiscono una singola codifica dei dati (anziché una famiglia);
Non ammettono variazione dei parametri;
A volte permettono più frequenze di campionamento, ma può essere un problema ricavare quale è quella giusta attualmente.
Il Formato Wave di Microsoft
estensione .wav, molto versatile e usato anche in altri ambienti.
Supporta: più livelli di quantizzazione, tassi di campionamento e canali.
Si basa sul formato RIFF: prevede la memorizzazione dei dati in sezioni logiche all'interno del file, dette chunk.
Chunk sono di diversi tipi.
Due sono obbligatoriamente presenti:
formato: contiene info sui dati audio(es. tasso di campionamento); "FMT"
dati: contiene i veri e propri campioni della forma d'onda; "data"
L'intestazione dei file RIFF (Formato di File per l'interscambio di Risorse) e i due chunk.
Primi 4 byte: l'identificazione del formato: RIFF
Secondi 4 byte: indicano la lunghezza rimanente del file
Dall'ottavo Byte: vi sono i dati.
Chunk dei dati
primi 4 byte: identificatore del tipo dei dati contenuti nel chunk dati: WAVE
24 byte: chunk del formato, l'intestazione del file Wave
Dal 28 Byte: dati audio veri e propri, campioni.
Chunk del formato: parametri fondamentali della forma d'onda:
identificatore del chunk: "fmt"
Lunghezza del chunk
WformatTAG: formato effettivo dati audio, distinzione principale riguarda l'eventuale compressione, se si usa la compressione il valore sarà diverso da 1 , ulteriori campi addizionali al fondo del chunk per permettere la giusta decompressione.
Numero di canali
Tasso di campionamento
#Blok align: numero che rappresenta la dimensione in byte di un sample frame. Si calcola moltiplicando numero di canali per la quntizzazione diviso 8
Q= 16 bit C=1 #BA= 2byte
Q= 16 bit C=2 #BA= 4byte
#AvgByte: quanti byte riprodotti al secondo, stimare la memoria Ram.
Moltiplica tasso di campionamento per #Block Align, che indica i byte per gruppo di campioni.
Chunk dei dati veri e propri
inizia con la stringa "data", prosegue con i 4 byte della lunghezza dei dati e termina con i dati audio, campioni.
I supporti
I campioni del segnale audio digitale possono essere registrati su una moltitudine di supporti, con caratteristiche fisiche e logiche diverse (magnetici, ottici, elettronici).
Dal punto di vista logico ciascun supporto è caratterizzato da uno standard proprio per la struttura dei dati.
Due caratteristiche rilevanti: capacità di contenere i dati e la velocità di lettura/scrittura per garantire una corretta registrazione/riproduzione.
Segnale a qualità CD
Frammento audio stereo di 1 minuto
tasso di campionamento 44.100 hertz
quantizzazione 16 bit (2 byte)
Capacità:
2 canali,
Campioni totali in un secondo sono 88.200 (44.100 x 2)
Campioni totali in un minuto sono 5.292.000(88.200 x 60)
bit per campione sono 16(2 byte)
byte occupati sono 10.584.000(5.292.000 x 2) = oltre 10 Megabyte
Trasferimento:
Campioni totali in un secondo sono 88.200 e ciascuno occupa 2 byte
byte totali che occorre inviare in un secondo sono 176.400 (88.200 x 2 ) = 176 kilobyte/sec
Compact disc (CD)
inizi anni '80, Sony e philips in collaborazione.
Anatomia
Disco in policarbonato di 12 cm di Diametro, con un buco in mezzo di 1,5 cm.
Parte più interna e esterna non contengono dati. Dati partono da 2,5 cm dal centro per finire a 11,6 cm, scritti dall'interno verso l'esterno, con un percorso a spirale.
Esternamente all'area dati vi sono due aree di info aggiuntive: una di entrata e l'altra di uscita che si riferiscono alla direzione in cui il disco viene letto.
La memorizzazione dei dati si basa sulle proprietà di riflessione della luce sulla superficie del disco.
Per poter rappresentare gli 0 e 1 occorre modificare delle zone della superficie in modo che la riflessione in tali zone sia differente dal resto della superficie.
Zone dette avvallamenti o pit, procurati mediante la bruciatura sulla superficie mediante un raggio laser intenso.
I pit sono disposti su tracce(sentieri, percorsi) a spirale dal centro verso l'esterno.
Superficie tra pit: land
Pit: larghi 1/2 mm e lunghi da 0,83 a 3,56 mm; profondità tra 0,1 e 0,2 mm
Tra due tracce: 1,6 mm
Dimensioni ridotte
La lunghezza della spirale dei pit si allunga fino a 5 km.
Il policarbonato è ricoperto da un sottile strato di alluminio e da una pellicola protettiva su cui viene applicata l'etichetta.
La lettura dei pit avviene dal lato opposto al quale sono stati impressi(gobbe più che avvallamenti);
In lettura un raggio laser percorre la traccia di pit e land, la luce riflessa passa attraverso un prisma che la deflette verso un fotosensore che genera impulsi di ampiezza proporzionale alla quantità di luce ricevuta.
Gli 1 vengono segnalati dalla lettura del bordo di un pit, quando viene rilevata una differenza di riflessione.
La tecnica della rotazione dei dischi l'unica rimasta possibile è a velocità angolare costante, aumentando la velocità di trasferimento dati: 48x = 7,2 Mb/sec(150 kb/sec x 48), gira a 12.000 giri al minuto(rpm).
Formato di scrittura segue una struttura molto articolata.
Il formato dei CD include i codici di rilevamento e correzione dell'errore , e i dati vengono rimescolati e sottoposti alla codifica EFM.
Codici di rilevamento e correzione dell'errore(ECC), bit di parità. Idea è di aggiungere dei bit di controllo per rilevare e correggere.
Il rimescolamento dei dati segue una tecnica di interfogliamento , per cui i campioni in un gruppo fissato vengono disposti in modo differente dall'ordine cronologico originale. In caso di errore in lettura, la forma d'onda originale è più facilmente ricostruibile a partire dai frammenti a disposizione.
Processo totale di memorizzazione dei dati su CD
1.Forma d'onda digitalizzata in parole binarie da 16 bit per campione, e i campioni sono interfogliati tra il canale sinistro e quello destro.
2. Si raggruppano i campioni consecutivi in frame, prendendo sei campioni da ciascun canale, totale=12; 192 bit
3. Ogni campione è di 16 bit, Canali sinistro e destro sono composti da due byte.
Quindi il frame è composto da 24 unità da 1 byte: blocco base dei dati.
Ora aggiungiamo codici per arrivare alla struttura completa del CD.
Contollo degli errori e rimescolamento : Codifica di Reed-Solomon di Interfogliamento Incrociato CIRC.
1. Rimescolamento: i byte di numero pari ritardati di 2 blocchi, ciò che risulta viene rimescolato.
2. Si aggiungono 4 byte di parità = 32 bit (media di un bit ogni 6 bit di dati )
Risultato = Blocco di 28 byte (24+4).
3. Rimescomento più sofisticato. Ciascuno dei 28 byte viene riposizionato in un nuovo blocco, calcolato moltiplicando per 4 la posizione del byte.
1 byte: 4 blocchi più avanti
2 byte: 8 blocchi più avanti
3 byte: 12 blocchi più avanti
l'ultimo,24 byte: 112 blocchi più avanti
4.I nuovi blocchi, sempre di 28 byte, sottoposti a una codifica di parità.
Risultato= + 4 byte, 32 byte
5. Ulteriore spostamento dei byte dispari di un singolo blocco.
6. Si aggiunge 1 byte all'inizio del gruppo di 32 byte. Bit di info aggiuntive. Tutte queste info sono distribuite su tutti i gruppi di 8 bit che accompagnano i frame.
Totale di 33 byte per un frame.
Infine viene aggiunta la codifica EFM
Il nostro frame attuale viene convertito in formato EFM. L'idea è di minimizzare il numero di transizioni 0-1 e 1-0 in lettura,evitando la bruciatura di pit dipiccole dimensioni, che provocano transizioni veloci. I codici di 8 bit diventano di 14 bit.
Da 33 byte da 8 bit ora ci ritroviamo 462 bit (33x14).
Per completare il frame si aggiungono ancora 24 bit di sincronizzazione all'inizio del frame .
Bit del frame sono diventati 486.
Infine a ogni sequenza di 14 bit vengono agganciati 3 bit di intercapedine tra una sequenza di 14 e la successiva, per tenere distinti i codici EFM.
Codici EFM all'interno di un frame ce ne sono 33;
32 gruppi di 3 bit in mezzo e 2 agli estremi per un totale di 34 gruppi di 3 bit.
Totale bit di intercapedine fa 102, 102 + 486 = 588 bit per frame.
Lettore CD legge ogni frame da 588 bit in 136 msec = 4.323.529 bit/sec
1.411.765 bit/sec di puri dati audio (192/588) = 176.471 byte/sec
TC= 44.100
Q= 16 bit
Segnale stereo
Per poter ascoltare la musica tranquillamente
velocità di trasferimento dei bit dal CD audio = 1.411.765 bit/sec (44.100 x 2 x 16)
La velocità del lettore è sufficiente a mantenere il tasso per la riproduzione.(buffer che funge da tampone.)
DVD Digital Versatile Disc
1996 primo standard, dimenticare dei problemi di spazio, mantengo alta la qualità audio/video.
Differenze con il CD:
1. densità del pit e tracce inferiore, la capacità supera di 4 volte
2. L'informazione è disposta su più livelli, possono essere letti in modo distinto.
3. Possono avere due facce
4. tecniche più efficientidi correzione degli errori, assicurano più spazio per i dati effettivi.
DVD-Audio compete Super Audio CD(Sony e philps),
dvd-audio multicanale codifica il segnale in due gruppi di canali, con differenti tassi di campionamento e quantizzazione.(massimo bit-rate permesso è 9,6 Mbps).
Struttura lógica contiene tutta l'informazione in file: cartelle AUDIO_TS, DVD_TS, l'audio associato al video è sempre compresso.
Super Audio CD prende forma con l'obbiettivo di unificare la tecnologia DVD con la compatibilità verso il CD tradizionale.
Autore: Fabrizio Garis
Formati e Supporti by http://lucciolaonline.blogspot.com/2012/03/5-formati-e-supporti.html is licensed under a Creative Commons Attribuzione - Non commerciale 3.0 Italia License.
Nessun commento:
Posta un commento