Cyfrowe audio otacza nas wszędzie – w telefonach, serwisach streamingowych, studiach nagraniowych, telewizji i radiu. Jednak zanim analogowy dźwięk trafi do komputera lub na cyfrowy nośnik, musi zostać przekształcony w postać cyfrową. Proces ten nie jest prosty: wymaga filtracji, próbkowania, kwantyzacji, korekcji błędów i odpowiedniego kodowania.
Ten artykuł szczegółowo wyjaśnia jak działa system cyfrowego zapisu dźwięku, co faktycznie oznaczają „24 bity”, dlaczego dithering jest koniecznością, jak działa konwersja sigma-delta i czemu filtry antyaliasingowe są tak ważne – w sposób zrozumiały, ale bez upraszczania techniki.
1. Podstawy: sampling, kwantyzacja i konwersja
Żeby zapisać dźwięk w formie cyfrowej, trzeba wykonać trzy kroki:
- Próbkowanie (sampling) – system mierzy poziom sygnału co określony czas (np. 48 000 razy na sekundę).
- Kwantyzacja – każda próbka zostaje zaokrąglona do najbliższego dostępnego poziomu (np. jednego z 65 536 poziomów w systemie 16-bitowym).
- Konwersja – wartości te są zapisywane jako liczby binarne.
Najprostszy i najważniejszy system zapisu dźwięku to PCM – Pulse Code Modulation. To właśnie PCM jest fundamentem wszystkich standardów cyfrowych: CD-Audio, WAV, FLAC, AES/EBU, SPDIF itd.
2. Jak dużo danych zajmuje dźwięk?
Dla próbkowania 48 kHz i 16 bitów, przepływność wynosi:
48000 próbek × 16 bitów = 768 000 bitów/s ≈ 768 kb/s (mono)
Po dodaniu danych synchronizacyjnych, korekcji błędów i kodowania kanałowego, wartość ta rośnie do ok. 1 Mb/s na kanał.
Celem systemów cyfrowych jest jak najwierniejsze odwzorowanie sygnału przy optymalnym użyciu miejsca i przepustowości.
3. Problem aliasingu i konieczność filtrów antyaliasingowych
Każdy sygnał zawierający częstotliwości wyższe niż połowa częstotliwości próbkowania (tzw. częstotliwość Nyquista) powoduje aliasing – słyszalne zniekształcenia.
Dlatego przed próbkowaniem dźwięk musi zostać odfiltrowany. Filtr wejściowy to tzw. anti-aliasing filter – filtr dolnoprzepustowy.
Dla próbkowania 48 kHz:
- pasmo użyteczne: 0–22 kHz
- martwa strefa ochronna: ok. 2 kHz
- powyżej 24 kHz wszystko musi zostać odcięte
Wczesne systemy używały analogowych filtrów „brick-wall”, które mocno degradowały dźwięk (ripple, przesunięcia fazowe). Rozwiązaniem stało się:
- oversampling (nadpróbkowanie),
- łagodny filtr analogowy,
- precyzyjna filtracja cyfrowa wewnątrz konwertera.
Tak działają dzisiejsze przetworniki AD/DA.
4. Sample & Hold – ukryty bohater konwersji
Zanim próbka zostanie zmierzona, konwerter musi zamrozić jej wartość. Do tego służy układ Sample & Hold (S/H): kondensator przechowuje chwilowe napięcie.
S/H musi:
- próbować sygnał w precyzyjnych odstępach czasu,
- utrzymać napięcie bez „opadania” (droop),
- działać szybciej niż trwa konwersja próbki.
Największym wrogiem jest jitter, czyli niestabilność zegara próbkowania.
5. Dlaczego dithering jest konieczny?
Kwantyzacja = zaokrąglanie sygnału → powoduje zniekształcenia nieliniowe (trzaski, szorstkość, modulacje zniekształceń).
Rozwiązaniem jest dither – celowo dodawany, bardzo cichy szum, który:
- zamienia zniekształcenia nieliniowe w szum liniowy,
- umożliwia zapis sygnałów ciszej niż 1 LSB (!),
- sprawia, że zmniejszenie bitowości (np. z 24→16 bitów) nie wprowadza zniekształceń.
Dither to nie „pogorszenie sygnału”, tylko niezbędna część cyfrowego audio.
6. AD Converter – serce systemu
Konwerter analogowo-cyfrowy (ADC) zamienia napięcie na liczby. Mimo że producenci reklamują „24 bity”, rzeczywista użyteczna rozdzielczość wynosi:
- ok. 19–20 bitów w profesjonalnym sprzęcie,
- 16–18 bitów w urządzeniach konsumenckich.
Prawdziwe 24 bity wymagałyby szumu własnego poniżej –145 dBFS, czyli 0,1 µV RMS – to poziom szumu termicznego rezystora. Dziś nieosiągalne.
7. Konwertery SAR a sigma-delta
SAR (Successive Approximation Register) – klasyczna metoda krokowego dopasowania wartości.
Zalety:
- dobra liniowość
- stosowane w aparaturze pomiarowej
Wady:
- trudność osiągnięcia >18 bitów
- konieczność stromych filtrów analogowych
Sigma-Delta (ΔΣ) – dominująca technologia w audio.
Działa poprzez:
- bardzo wysokie próbkowanie (np. 64×44,1 kHz),
- kwantyzację do 1 bitu,
- noise shaping – przeniesienie szumu powyżej pasma słyszalnego,
- cyfrową filtrację dolnoprzepustową.
Zalety:
- bardzo niski poziom szumu w słyszalnym paśmie
- mniejsze wymagania wobec filtrów analogowych
- niższe koszty
Dlatego wszystkie współczesne przetworniki audio są sigma-delta.
8. Jitter – wróg numer jeden precyzji
Jitter to nieregularność zegara próbkowania.
- losowy jitter → zwiększa szum,
- okresowy jitter → dodaje zniekształcenia i sygnały lustrzane.
Stąd nacisk na:
- zegary kwarcowe,
- reklockowanie,
- układy PLL i ASRC.
Uwaga: niski jitter zegara wejściowego nie gwarantuje jakości, jeśli sam układ ADC/DA jest słaby.
9. Co dzieje się z sygnałem po konwersji?
Kiedy mamy już dane PCM, system wykonuje:
- interleaving – rozrzucanie danych, żeby uszkodzenia były rozproszone,
- korekcję błędów (Reed-Solomon, CIRC, LDPC),
- multiplexing – łączenie wielu kanałów w jeden strumień,
- kodowanie kanałowe – zamiana danych binarnych na sygnał możliwy do zapisania lub transmisji.
Zapis cyfrowy nie przechowuje „zer i jedynek” jako prostych stanów logicznych. Najważniejsze są przejścia, czyli miejsca, gdzie sygnał zmienia stan. Dlatego stosuje się modulacje samosynchronizujące (np. EFM w CD, BMC w SPDIF).
10. Dlaczego cyfrowe audio nie brzmi „zimno”, jeśli jest zrobione dobrze?
Bo system PCM jest teoretycznie bezstratny – można idealnie odtworzyć sygnał, jeśli:
- filtracja jest prawidłowa,
- dithering został użyty poprawnie,
- jitter jest na niskim poziomie,
- konwerter ma odpowiedni zakres dynamiczny.
Jeżeli cyfrowe audio brzmi źle – winna jest implementacja, nie sama idea.
11. Najważniejsze fakty praktyczne
- 24-bitowy plik NIE oznacza 24 bitów realnej dynamiki.
- CD-Audio (16/44,1) ma zakres 96 dB – to i tak więcej niż dynamika muzyki popularnej (zwykle 8–12 dB).
- Dithering jest obowiązkowy, a nie „opcjonalny”.
- Oversampling i filtry cyfrowe są powodem, dla którego nowoczesne przetworniki brzmią dobrze.
- Twierdzenie „cyfra jest zimna” wynika głównie z błędów w implementacjach lat 80/90.
12. Podsumowanie
Proces cyfrowej konwersji audio to precyzyjna operacja matematyczno-elektroniczna, nie „magia”. Wymaga:
- filtracji sygnału,
- precyzyjnego próbkowania,
- właściwej kwantyzacji,
- ditheringu,
- korekcji błędów i kodowania transmisyjnego.
Dzisiejsze konwertery sigma-delta w połączeniu z dobrym zegarem i prawidłowym ditheringiem pozwalają osiągnąć jakość przewyższającą wszelkie analogowe systemy zapisu pod względem dynamiki i zniekształceń – przy nieporównywalnej wygodzie obróbki.
Wbrew mitom – cyfrowe audio nie jest ograniczeniem, lecz najbardziej precyzyjną formą zapisu dźwięku, jaką ludzkość stworzyła.