Jak działa cyfrowe audio? Kompletny przewodnik od A do Z: sampling, kwantyzacja, dithering i konwersja

Cyfrowe audio otacza nas wszędzie – w telefonach, serwisach streamingowych, studiach nagraniowych, telewizji i radiu. Jednak zanim analogowy dźwięk trafi do komputera lub na cyfrowy nośnik, musi zostać przekształcony w postać cyfrową. Proces ten nie jest prosty: wymaga filtracji, próbkowania, kwantyzacji, korekcji błędów i odpowiedniego kodowania.

Ten artykuł szczegółowo wyjaśnia jak działa system cyfrowego zapisu dźwięku, co faktycznie oznaczają „24 bity”, dlaczego dithering jest koniecznością, jak działa konwersja sigma-delta i czemu filtry antyaliasingowe są tak ważne – w sposób zrozumiały, ale bez upraszczania techniki.


1. Podstawy: sampling, kwantyzacja i konwersja

Żeby zapisać dźwięk w formie cyfrowej, trzeba wykonać trzy kroki:

  1. Próbkowanie (sampling) – system mierzy poziom sygnału co określony czas (np. 48 000 razy na sekundę).
  2. Kwantyzacja – każda próbka zostaje zaokrąglona do najbliższego dostępnego poziomu (np. jednego z 65 536 poziomów w systemie 16-bitowym).
  3. Konwersja – wartości te są zapisywane jako liczby binarne.

Najprostszy i najważniejszy system zapisu dźwięku to PCM – Pulse Code Modulation. To właśnie PCM jest fundamentem wszystkich standardów cyfrowych: CD-Audio, WAV, FLAC, AES/EBU, SPDIF itd.


2. Jak dużo danych zajmuje dźwięk?

Dla próbkowania 48 kHz i 16 bitów, przepływność wynosi:

48000 próbek × 16 bitów = 768 000 bitów/s ≈ 768 kb/s (mono)

Po dodaniu danych synchronizacyjnych, korekcji błędów i kodowania kanałowego, wartość ta rośnie do ok. 1 Mb/s na kanał.

Celem systemów cyfrowych jest jak najwierniejsze odwzorowanie sygnału przy optymalnym użyciu miejsca i przepustowości.


3. Problem aliasingu i konieczność filtrów antyaliasingowych

Każdy sygnał zawierający częstotliwości wyższe niż połowa częstotliwości próbkowania (tzw. częstotliwość Nyquista) powoduje aliasing – słyszalne zniekształcenia.

Dlatego przed próbkowaniem dźwięk musi zostać odfiltrowany. Filtr wejściowy to tzw. anti-aliasing filter – filtr dolnoprzepustowy.

Dla próbkowania 48 kHz:

  • pasmo użyteczne: 0–22 kHz
  • martwa strefa ochronna: ok. 2 kHz
  • powyżej 24 kHz wszystko musi zostać odcięte

Wczesne systemy używały analogowych filtrów „brick-wall”, które mocno degradowały dźwięk (ripple, przesunięcia fazowe). Rozwiązaniem stało się:

  • oversampling (nadpróbkowanie),
  • łagodny filtr analogowy,
  • precyzyjna filtracja cyfrowa wewnątrz konwertera.

Tak działają dzisiejsze przetworniki AD/DA.


4. Sample & Hold – ukryty bohater konwersji

Zanim próbka zostanie zmierzona, konwerter musi zamrozić jej wartość. Do tego służy układ Sample & Hold (S/H): kondensator przechowuje chwilowe napięcie.

S/H musi:

  • próbować sygnał w precyzyjnych odstępach czasu,
  • utrzymać napięcie bez „opadania” (droop),
  • działać szybciej niż trwa konwersja próbki.

Największym wrogiem jest jitter, czyli niestabilność zegara próbkowania.


5. Dlaczego dithering jest konieczny?

Kwantyzacja = zaokrąglanie sygnału → powoduje zniekształcenia nieliniowe (trzaski, szorstkość, modulacje zniekształceń).

Rozwiązaniem jest dither – celowo dodawany, bardzo cichy szum, który:

  • zamienia zniekształcenia nieliniowe w szum liniowy,
  • umożliwia zapis sygnałów ciszej niż 1 LSB (!),
  • sprawia, że zmniejszenie bitowości (np. z 24→16 bitów) nie wprowadza zniekształceń.

Dither to nie „pogorszenie sygnału”, tylko niezbędna część cyfrowego audio.


6. AD Converter – serce systemu

Konwerter analogowo-cyfrowy (ADC) zamienia napięcie na liczby. Mimo że producenci reklamują „24 bity”, rzeczywista użyteczna rozdzielczość wynosi:

  • ok. 19–20 bitów w profesjonalnym sprzęcie,
  • 16–18 bitów w urządzeniach konsumenckich.

Prawdziwe 24 bity wymagałyby szumu własnego poniżej –145 dBFS, czyli 0,1 µV RMS – to poziom szumu termicznego rezystora. Dziś nieosiągalne.


7. Konwertery SAR a sigma-delta

SAR (Successive Approximation Register) – klasyczna metoda krokowego dopasowania wartości.

Zalety:

  • dobra liniowość
  • stosowane w aparaturze pomiarowej

Wady:

  • trudność osiągnięcia >18 bitów
  • konieczność stromych filtrów analogowych

Sigma-Delta (ΔΣ) – dominująca technologia w audio.

Działa poprzez:

  1. bardzo wysokie próbkowanie (np. 64×44,1 kHz),
  2. kwantyzację do 1 bitu,
  3. noise shaping – przeniesienie szumu powyżej pasma słyszalnego,
  4. cyfrową filtrację dolnoprzepustową.

Zalety:

  • bardzo niski poziom szumu w słyszalnym paśmie
  • mniejsze wymagania wobec filtrów analogowych
  • niższe koszty

Dlatego wszystkie współczesne przetworniki audio są sigma-delta.


8. Jitter – wróg numer jeden precyzji

Jitter to nieregularność zegara próbkowania.

  • losowy jitter → zwiększa szum,
  • okresowy jitter → dodaje zniekształcenia i sygnały lustrzane.

Stąd nacisk na:

  • zegary kwarcowe,
  • reklockowanie,
  • układy PLL i ASRC.

Uwaga: niski jitter zegara wejściowego nie gwarantuje jakości, jeśli sam układ ADC/DA jest słaby.


9. Co dzieje się z sygnałem po konwersji?

Kiedy mamy już dane PCM, system wykonuje:

  • interleaving – rozrzucanie danych, żeby uszkodzenia były rozproszone,
  • korekcję błędów (Reed-Solomon, CIRC, LDPC),
  • multiplexing – łączenie wielu kanałów w jeden strumień,
  • kodowanie kanałowe – zamiana danych binarnych na sygnał możliwy do zapisania lub transmisji.

Zapis cyfrowy nie przechowuje „zer i jedynek” jako prostych stanów logicznych. Najważniejsze są przejścia, czyli miejsca, gdzie sygnał zmienia stan. Dlatego stosuje się modulacje samosynchronizujące (np. EFM w CD, BMC w SPDIF).


10. Dlaczego cyfrowe audio nie brzmi „zimno”, jeśli jest zrobione dobrze?

Bo system PCM jest teoretycznie bezstratny – można idealnie odtworzyć sygnał, jeśli:

  • filtracja jest prawidłowa,
  • dithering został użyty poprawnie,
  • jitter jest na niskim poziomie,
  • konwerter ma odpowiedni zakres dynamiczny.

Jeżeli cyfrowe audio brzmi źle – winna jest implementacja, nie sama idea.


11. Najważniejsze fakty praktyczne

  • 24-bitowy plik NIE oznacza 24 bitów realnej dynamiki.
  • CD-Audio (16/44,1) ma zakres 96 dB – to i tak więcej niż dynamika muzyki popularnej (zwykle 8–12 dB).
  • Dithering jest obowiązkowy, a nie „opcjonalny”.
  • Oversampling i filtry cyfrowe są powodem, dla którego nowoczesne przetworniki brzmią dobrze.
  • Twierdzenie „cyfra jest zimna” wynika głównie z błędów w implementacjach lat 80/90.

12. Podsumowanie

Proces cyfrowej konwersji audio to precyzyjna operacja matematyczno-elektroniczna, nie „magia”. Wymaga:

  • filtracji sygnału,
  • precyzyjnego próbkowania,
  • właściwej kwantyzacji,
  • ditheringu,
  • korekcji błędów i kodowania transmisyjnego.

Dzisiejsze konwertery sigma-delta w połączeniu z dobrym zegarem i prawidłowym ditheringiem pozwalają osiągnąć jakość przewyższającą wszelkie analogowe systemy zapisu pod względem dynamiki i zniekształceń – przy nieporównywalnej wygodzie obróbki.

Wbrew mitom – cyfrowe audio nie jest ograniczeniem, lecz najbardziej precyzyjną formą zapisu dźwięku, jaką ludzkość stworzyła.

Dodaj komentarz