Cyfrowe audio – wbrew pozorom – nie jest zbiorem „idealnych zer i jedynek”, które zawsze docierają perfekcyjnie na czas. Aby dźwięk cyfrowy po konwersji do postaci analogowej brzmiał dobrze, musi być spełniony jeszcze jeden warunek: precyzyjna kontrola czasu. Tym właśnie zajmuje się zegar taktujący, a jego niedoskonałości określamy jednym słowem – jitter.
To jedno z najbardziej enigmatycznych zjawisk we współczesnej elektroakustyce. W specyfikacjach urządzeń widzimy „< 100 ps jitter”, w dyskusjach audiofilskich słyszymy o „złotych kablach USB” redukujących jitter, a na forach krążą mity, że jitter niszczy brzmienie tak samo jak kiepski DAC. Które z tych twierdzeń są prawdziwe?
Poniżej znajduje się rzetelne, merytorycznie poprawne i dogłębne omówienie jittera – od fizyki zjawiska, przez jego skutki, aż po realne metody minimalizacji i sytuacje, w których… nie ma znaczenia.
Cyfrowe audio to nie tylko „zapis zer i jedynek”. To skomplikowana seria decyzji projektowych: jak mierzyć sygnał, jak go opisywać, jak przechowywać i jak odtworzyć. Wraz z nadejściem ery streamingu przeciętny słuchacz słyszy słowo „PCM” lub „DSD”, ale rzadko rozumie, co kryje się pod spodem.
Ten artykuł dogłębnie i przystępnie wyjaśnia:
czym różni się PCM od delta modulacji i ADPCM,
jak działa cyfrowe próbkowanie i kwantyzacja,
dlaczego jedne systemy mają 1 bit, a inne 24,
skąd bierze się szum kwantyzacji i dither,
dlaczego floating-point PCM istnieje mimo „wystarczającego” 24-bitowego zapisu,
jak to wszystko wpływa na jakość dźwięku.
1. PCM – fundament całego cyfrowego audio
Linear PCM (Pulse Code Modulation) to standardowy sposób zamiany fali akustycznej na cyfry.
Jego kluczowe cechy:
próbki są pobierane w stałych odstępach czasu,
każda próbka ma tę samą liczbę możliwych poziomów, niezależnie od głośności,
liczba poziomów zależy od długości słowa, np. 16 bitów → 65 536 poziomów, 24 bity → ok. 16,7 mln.
To prosty i genialny system: jeśli sygnał nie przekracza połowy częstotliwości próbkowania (zasada Nyquista) i mieści się w zakresie amplitudy – może być odtworzony bez błędów.
Dlaczego PCM stał się standardem?
✔ jest liniowy i przewidywalny ✔ łatwo się go filtruje i rekonstruuje ✔ można go bezstratnie kopiować ✔ nie pogarsza się przy wielokrotnym przenoszeniu
2. Problem: dźwięk nie jest równomierny
W idealnym świecie amplituda dźwięku byłaby rozłożona równomiernie. Ale w rzeczywistości:
większość czasu sygnał jest cichy, a tylko chwilowo głośny,
muzyka ma ogromny zakres dynamiki,
ludzki słuch jest dużo bardziej czuły na szumy przy niskich poziomach.
Dlatego powstały systemy niejednolitej kwantyzacji, czyli takie, w których:
duże sygnały zapisuje się z mniejszą dokładnością, a małe z większą.
Zaleta → lepsza precyzja przy małej liczbie bitów. Wada → szum nie jest równomierny, trudniej stosować dither.
Rozwinięciem ADM jest CVSDM (Continuously Variable Slope DM), używane m.in. w systemach wojskowych i telekomunikacji.
6. Companding – kompresja i ekspansja w świecie cyfry
To technika logarytmicznej kwantyzacji, znana jako:
μ-law (Ameryka Północna),
A-law (Europa).
W skrócie:
sygnał przed kwantyzacją jest kompresowany (małe poziomy wzmacniane, duże osłabiane),
po odtworzeniu – rozszerzany do oryginalnego kształtu.
Zyskujemy:
✔ mniejszy szum na cichych fragmentach ✗ zniekształcenia intermodulacyjne przy dużych sygnałach
Dlatego telekomunikacja mogła używać 8-bitowego audio, które brzmiało „prawie jak 12-bit”.
7. DPCM i ADPCM – zapisujemy nie próbki, lecz różnice
DPCM zapisuje różnicę między kolejnymi próbkami. To opłaca się, bo kolejna próbka zwykle nie różni się dużo od poprzedniej.
Jeszcze lepszy jest ADPCM (Adaptive DPCM):
przewiduje kolejną próbkę,
zapisuje tylko błąd predykcji,
zmienia krok kwantyzacji adaptacyjnie.
Zalety:
✔ mniejszy bitrate przy podobnej jakości do PCM ✔ mniejsze błędy widoczne w transmisji ✔ doskonały do telefonii, gier, kompresji bez DSP
ADPCM do dziś siedzi w:
VoIP,
radiotelefonach,
starych grach (PS1, Sega, arcade audio),
systemach wojskowych.
8. Sigma-delta i DSD – współczesny spadkobierca delta modulacji
Sigma-delta to zaawansowana forma delta modulacji z noise shapingiem.
Zasada:
sygnał jest próbkowany w ekstremalnie wysokiej częstotliwości,
ale przy małej liczbie bitów (często 1),
szum kwantyzacji jest przenoszony poza pasmo słyszalne.
Tak działają:
prawie wszystkie współczesne ADC i DAC,
format DSD / SACD (2,8224 MHz / 1 bit),
przetworniki ESS, AKM, TI, Cirrus Logic.
To nie jest PCM, choć często jest konwertowane do PCM w torze cyfrowym.
9. Co naprawdę decyduje o jakości? (Nie to, o czym piszą ulotki)
❌ liczba bitów na folderze ❌ częstotliwość próbkowania „384 kHz” ❌ marketingowe hasła „dual mono”, „audio grade”
✔ liniowość przetwornika (DNL, INL) ✔ rzeczywista liczba bitów efektywnych (ENoB) ✔ poziom jittera ✔ jakość filtrów (FIR / IIR / analog LFP) ✔ algorytm oversamplingu i noise shapingu
Najlepszy przykład:
Wiele 24-bitowych DAC-ów ma w rzeczywistości 18–19 bitów efektywnych. Stare TDA1541 (16 bitów) miały 15 realnych bitów, ale perfekcyjną liniowość i do dziś brzmią genialnie.
10. Podsumowanie
System
Zalety
Wady
Zastosowania
Linear PCM
najwyższa wierność
duży bitrate
studio, audio hi-fi
Floating-point PCM
ogromna dynamika
nie do końca „bit perfect”
produkcja, DAW
Delta modulacja
prosty układ
fatalna jakość
historia
ADM / CVSDM
lepszy niż DM
szum zależny od sygnału
telekomunikacja
Companding (μ-law)
lepsza jakość z 8 bitów
zniekształcenia
telefonia
ADPCM
wysoka efektywność
mniejsza wierność
VoIP, gry
Sigma-delta
wysoka jakość, mało bitów
wymaga zarządzania szumem
wszystkie współczesne DAC-y
DSD
brak filtracji w cyfrowej domenie
gigantyczny szum powyżej 20 kHz
SACD, audio high-end
wyjaśnienie:
W końcówce artykułu mowa o tym, co naprawdę wpływa na jakość cyfrowego audio, a nie na marketingowe hasła. Jeden z kluczowych punktów to „rzeczywista liczba bitów efektywnych (ENoB)”, czyli Effective Number of Bits. To pojęcie jest ważne, bo pokazuje różnicę między tym, co obiecuje specyfikacja (np. „24 bity”), a tym, co przetwornik (DAC lub ADC) naprawdę dostarcza w praktyce. Wyjaśnię to krok po kroku, bez ściemy.
1. Co to jest ENoB?
Nominalna liczba bitów to po prostu długość słowa cyfrowego w formacie, np. 16 bitów w CD-Audio (65 536 możliwych poziomów) czy 24 bity w hi-res audio (ponad 16 milionów poziomów). To teoretyczna rozdzielczość – ile „schodków” możesz mieć do opisu amplitudy sygnału.
ENoB to miara efektywnej rozdzielczości, czyli ile z tych bitów jest naprawdę użytecznych po uwzględnieniu błędów i szumów w rzeczywistym urządzeniu. Oblicza się ją na podstawie stosunku sygnału do szumu i zniekształceń (SINAD – Signal-to-Noise and Distortion Ratio).
Formuła uproszczona: ENoB = (SINAD – 1,76) / 6,02, gdzie SINAD jest w dB. To pokazuje, ile bitów działa „jakby idealnie”, bez zakłóceń.
Inaczej mówiąc: nawet jeśli DAC jest reklamowany jako 24-bitowy, w rzeczywistości może zachowywać się jak 18- lub 19-bitowy z powodu niedoskonałości sprzętowych.
2. Dlaczego ENoB jest niższe niż nominalna liczba bitów?
Szum kwantyzacji: Podstawowy błąd zaokrąglania podczas kwantyzacji – zawsze istnieje, ale w idealnym świecie wynosi ok. -6 dB na bit (dla 24 bitów to teoretycznie -144 dB szumu).
Inne zakłócenia:
Szum termiczny: Od oporników i tranzystorów w układzie – nieunikniony w analogowej części.
Jitter: Niestabilność zegara, która „rozmywa” próbki w czasie.
Nieliniowość (DNL/INL): Błędy w równomierności schodków kwantyzacji – np. niektóre poziomy są za duże, inne za małe.
Zniekształcenia harmoniczne (THD): Dodatkowe częstotliwości powstające przy przetwarzaniu.
W rezultacie, pełny zakres dynamiczny (różnica między najcichszym a najgłośniejszym sygnałem) jest ograniczony. Dla ludzkiego słuchu 20 bitów to już maksimum (ok. 120 dB dynamiki), bo szum tła w pokoju to 30-40 dB, a koncert rockowy to 110 dB. Więcej bitów nominalnych nie pomaga, jeśli ENoB nie rośnie.
3. Przykład z artykułu: 24-bitowe DAC-i z 18-19 bitami efektywnymi
Wiele nowoczesnych przetworników (np. ESS Sabre, AKM, Cirrus Logic) jest 24- lub 32-bitowych, ale ich ENoB to typowo 18-20 bitów. Dlaczego?
Szum termiczny ogranicza do ok. -110/-120 dB SINAD, co odpowiada 18-20 bitom.
Oversampling i noise shaping (jak w sigma-delta) przesuwają szum poza pasmo słyszalne, ale nie eliminują go całkowicie.
W praktyce: Jeśli masz DAC z ENoB 19 bitów, to jego rzeczywista rozdzielczość to ok. 524 288 poziomów (zamiast 16 milionów dla 24 bitów). Dla ucha to i tak więcej niż potrzeba, ale pokazuje, że „24 bity” to często marketing.
To nie oznacza, że taki DAC brzmi źle – po prostu nie wykorzystuje pełnego potencjału formatu. Lepsze DAC-i (np. high-endowe jak Chord czy dCS) zbliżają się do 21-22 bitów ENoB dzięki zaawansowanym filtrom i izolacji.
4. Przykład ze starym TDA1541: 16 bitów nominalnie, 15 efektywnie, ale genialna liniowość
Philips TDA1541 (z lat 80., używany w starych CD-playerach jak Philips CD304 czy high-endowych modach) to klasyczny 16-bitowy DAC.
Jego ENoB to ok. 15 bitów – tracił 1 bit na szumy i błędy.
Ale dlaczego „brzmi genialnie do dziś”?
Perfekcyjna liniowość: Małe błędy DNL/INL, czyli schodki były równomierne. To ważniejsze niż sama liczba bitów, bo nieliniowość powoduje ostre zniekształcenia (jak „cyfrowy chłód” w tanich DAC-ach).
Brak oversamplingu: Pracował w „pure” multibitowym trybie (R-2R ladder), co dawało naturalny, analogowy charakter dźwięku.
Entuzjaści audio modują go do dziś, bo subiektywnie brzmi cieplej i bardziej muzykalnie niż niektóre 24-bitowe sigma-delta DAC-i z wyższym ENoB, ale gorszą liniowością.
Lekcja: ENoB to nie wszystko. Jakość zależy od całego łańcucha – filtrów, jittera, a nawet subiektywnego odbioru.
5. Jak to wpływa na Ciebie jako słuchacza?
Nie gon za „32-bit/768 kHz” w specyfikacjach – sprawdzaj recenzje z pomiarami (np. na Audio Science Review, gdzie mierzą ENoB i SINAD).
W streamingu (Spotify, Tidal) większość to 16- lub 24-bit PCM, ale realna jakość zależy od masteringu, a nie bitów.
Jeśli produkujesz muzykę: Używaj floating-point (np. 32-bit float) w DAW, bo chroni przed clippingiem, ale finalny export to 24-bit fixed-point.
Podsumowując: ENoB pokazuje, że cyfrowe audio to nie magia bitów, ale inżynieria. Wiele „hi-res” to placebo, jeśli sprzęt nie nadąża.
Cyfrowe audio jest dziś wszechobecne – w smartfonach, systemach streamingowych, telewizji, studio nagraniowym, kinie domowym i high-endowych systemach stereo. Jednak za prostym wrażeniem „odtwarzania pliku” kryje się niezwykle złożony proces przekształcania dźwięku z formy analogowej do cyfrowej i z powrotem. Aby ten proces był wierny oryginałowi, potrzebne są precyzyjne filtry, układy korekcji błędów, bufory czasowe i przetworniki o wysokiej liniowości.
Ten artykuł krok po kroku tłumaczy, jak działa cyfrowy tor odtwarzania, jakie błędy się w nim pojawiają, czym różni się zwykły DAC od sigma-delta, na czym polega oversampling, noise shaping oraz dlaczego bit depth to nie wszystko.
1. Konwersja cyfrowa – od analogu do cyfr i z powrotem
Cyfrowy system audio składa się z dwóch głównych konwerterów:
ADC (analog-to-digital) – zamienia fale akustyczne na liczby.
DAC (digital-to-analog) – zamienia liczby z powrotem na sygnał analogowy.
Na wejściu i wyjściu pracują również filtry dolnoprzepustowe, które ograniczają pasmo zgodnie z twierdzeniem Nyquista. Oznacza to, że:
Żaden sygnał nie może mieć częstotliwości powyżej połowy częstotliwości próbkowania, inaczej pojawi się aliasing (zniekształcenia widma).
2. Co dzieje się podczas odtwarzania dźwięku?
Cyfrowy odtwarzacz wykonuje operacje odwrotne do tych z procesu nagrywania:
Buforuje dane i koreluje czas próbkowania – kompensuje jitter.
Dekoduje i demultipleksuje strumień danych – przywraca strukturę ramek.
Wykonuje korekcję błędów (parity, Reed–Solomon itp.).
Konwertuje sygnał na kod NRZ (non-return-to-zero) zrozumiały dla DAC.
Przekazuje dane do przetwornika.
Filtruje i wygładza sygnał analogowy.
3. Jitter – największy wróg cyfrowej dokładności
Cyfrowy system audio wcale nie jest „odporny na wszystko”. Choć nie ma szumu taśmy ani wow&flutter jak w gramofonie, występuje jitter, czyli losowe odchylenia w czasie próbkowania.
Dlaczego to ważne? Bo DAC musi odtworzyć dokładnie w tym samym momencie, w którym próbki zostały zapisane. Nawet niewielkie przesunięcia powodują zniekształcenia intermodulacyjne.
Dlatego stosuje się:
bufory FIFO – dane wpadają nieregularnie, ale wypadają równo,
asynchroniczne re-clocking – w lepszych konstrukcjach.
4. Korekcja błędów i ukrywanie uszkodzonych danych
Nośniki cyfrowe – CD, pliki na dyskach, streaming – mogą zawierać błędy. Cyfrowy system audio:
wykrywa błędy dzięki dodatkowym bitom kontrolnym,
naprawia małe błędy dzięki algorytmom korekcji,
maskuje większe błędy metodami concealment (interpolacja).
To dlatego:
CD z rysami czasem gra czysto, podczas gdy analogowa płyta winylowa zawsze oddaje rysę jako trzask.
5. DAC – czyli najbardziej krytyczna część odtwarzacza
Przetwornik cyfrowo-analogowy decyduje, jak wierny będzie sygnał analogowy względem danych cyfrowych. Najważniejszym parametrem nie jest bit depth, lecz liniowość.
Rodzaje błędów:
błąd liniowości absolutnej – przesunięcie wszystkich poziomów napięcia,
błąd różnicowy (DNL) – skoki między poziomami nie są równomierne.
To DNL powoduje, że:
głośne dźwięki są ok,
ciche dźwięki ulegają zniekształceniu i „ziarnistości”.
6. R-2R kontra sigma-delta: dwa światy konwersji
R-2R ladder (drabinka rezystorowa)
Bez noise shapingu
Brak ultrawysokich częstotliwości szumu − Wymaga ekstremalnie precyzyjnych rezystorów − DNL rośnie z temperaturą i starzeniem
Dlatego stare Philipsy TDA1541 lub Burr-Brown PCM1704 są do dziś czczone przez audiofilów – miały prawdziwą liniowość, choć tylko 16 bitów.
Sigma-delta
Bardzo wysoka teoretyczna rozdzielczość
Wbudowany oversampling
Tanie w produkcji − Wymagają noise shapingu (szum przenoszony poza pasmo) − Mogą emitować ultradźwiękowe artefakty
Tu właśnie pojawia się spór „R-2R kontra sigma-delta”, ale prawda jest prosta:
To nie typ DAC-a gra, tylko jego implementacja.
7. Oversampling i interpolacja – po co „wymyślać próbki”?
Próbkowanie CD to 44,1 kHz. To oznacza:
Nyquist = 22,05 kHz
Filtr antyaliasingowy musiałby być bardzo stromy i zniekształcający.
Dlatego stosuje się oversampling:
Dodaje się sztuczne próbki 0.
Filtr FIR oblicza wartości pośrednie.
Pasmo niepożądanych sygnałów przesuwa się np. z 24 kHz do 192 kHz.
Analogowy filtr może być łagodny i liniowy fazowo.
To zmniejsza problem:
przesunięć fazowych,
dzwonienia (ringing),
zniekształceń przy częstotliwości odcięcia.
8. Noise shaping – przenoszenie szumu tam, gdzie nie słyszymy
Każda konwersja cyfrowa dodaje szum kwantyzacji.
Noise shaping nie usuwa go – tylko przesuwa jego energię tam, gdzie ucho jest mniej czułe, czyli:
powyżej 15–20 kHz (dla standardowych systemów),
jeszcze wyżej w systemach hi-res.
Dlatego:
24-bitowy DAC nie daje „więcej informacji” – daje niższy szum w paśmie słyszalnym.
9. Sample-and-hold i korekcja apertury
DAC nie zmienia napięcia natychmiast. Rzeczywisty sygnał wygląda jak schody (PAM – Pulse Amplitude Modulation). Aby je wygładzić:
układ sample-and-hold trzyma wartość próbki, aż pojawi się następna,
filtr dolnoprzepustowy usuwa „schodki”.
W starych DAC-ach trzeba było to robić osobnym układem. W nowoczesnych – jest wbudowane w chip.
10. Filtry wyjściowe – ostatnia granica między cyfrą a analogiem
Filtr anty-imaging usuwa:
obrazy widma (image spectra),
ultradźwięki powyżej Nyquista,
zakłócenia HF z układów cyfrowych.
Jeśli nie zostaną usunięte, mogą modulować:
stopnie analogowe,
wzmacniacze,
przetworniki głośnikowe (!)
Nawet jeśli nie słyszysz 80 kHz, to Twój wzmacniacz może się wzbudzać i zniekształcać pasmo 1–10 kHz.
11. Czy wyższa częstotliwość próbkowania daje lepszy dźwięk?
To największy mit audio.
Jeśli sygnał jest ograniczony pasmem, to:
Próbki zawierają komplet informacji.
Więcej próbek nie dodaje informacji, jedynie:
ułatwia filtrację,
poprawia współpracę DAC-a z filtrem.
Dlatego 96 kHz może być lepsze technicznie, ale 44,1 kHz już zawiera cały dźwięk, jeśli system jest zaprojektowany prawidłowo.
12. Jak ocenić rzeczywistą jakość DAC-a?
Nie po:
❌ liczbie bitów ❌ częstotliwości próbkowania ❌ „dual mono” i złotych kondensatorach
Tylko po:
✔ dynamice (SNR) ✔ efektywnej liczbie bitów (ENoB) ✔ błędzie liniowości (DNL) ✔ poziomie jittera ✔ jakości filtrów
Przykład:
DAC 16-bitowy o dynamice 96 dB = 15,4 bitów efektywnych
DAC 24-bitowy w realu często ma 18–19 bitów efektywnych Reszta to marketing.
Podsumowanie
Cyfrowy tor audio jest technicznie genialny – pozwala zachować dźwięk bit w bit przez dekady, kopiować go bez strat, naprawiać błędy i usuwać zniekształcenia niemożliwe do usunięcia w analogu.
Ale nie jest systemem idealnym. Wrażliwy jest na:
jitter,
błędy liniowości DAC,
szum kwantyzacji,
niedoskonałe filtry.
To dlatego masz wrażenie, że „różne DAC-i brzmią różnie”, choć „to tylko zera i jedynki”.
Cyfrowe audio otacza nas wszędzie – w telefonach, serwisach streamingowych, studiach nagraniowych, telewizji i radiu. Jednak zanim analogowy dźwięk trafi do komputera lub na cyfrowy nośnik, musi zostać przekształcony w postać cyfrową. Proces ten nie jest prosty: wymaga filtracji, próbkowania, kwantyzacji, korekcji błędów i odpowiedniego kodowania.
Ten artykuł szczegółowo wyjaśnia jak działa system cyfrowego zapisu dźwięku, co faktycznie oznaczają „24 bity”, dlaczego dithering jest koniecznością, jak działa konwersja sigma-delta i czemu filtry antyaliasingowe są tak ważne – w sposób zrozumiały, ale bez upraszczania techniki.
1. Podstawy: sampling, kwantyzacja i konwersja
Żeby zapisać dźwięk w formie cyfrowej, trzeba wykonać trzy kroki:
Próbkowanie (sampling) – system mierzy poziom sygnału co określony czas (np. 48 000 razy na sekundę).
Kwantyzacja – każda próbka zostaje zaokrąglona do najbliższego dostępnego poziomu (np. jednego z 65 536 poziomów w systemie 16-bitowym).
Konwersja – wartości te są zapisywane jako liczby binarne.
Najprostszy i najważniejszy system zapisu dźwięku to PCM – Pulse Code Modulation. To właśnie PCM jest fundamentem wszystkich standardów cyfrowych: CD-Audio, WAV, FLAC, AES/EBU, SPDIF itd.
2. Jak dużo danych zajmuje dźwięk?
Dla próbkowania 48 kHz i 16 bitów, przepływność wynosi:
Po dodaniu danych synchronizacyjnych, korekcji błędów i kodowania kanałowego, wartość ta rośnie do ok. 1 Mb/s na kanał.
Celem systemów cyfrowych jest jak najwierniejsze odwzorowanie sygnału przy optymalnym użyciu miejsca i przepustowości.
3. Problem aliasingu i konieczność filtrów antyaliasingowych
Każdy sygnał zawierający częstotliwości wyższe niż połowa częstotliwości próbkowania (tzw. częstotliwość Nyquista) powoduje aliasing – słyszalne zniekształcenia.
Dlatego przed próbkowaniem dźwięk musi zostać odfiltrowany. Filtr wejściowy to tzw. anti-aliasing filter – filtr dolnoprzepustowy.
Dla próbkowania 48 kHz:
pasmo użyteczne: 0–22 kHz
martwa strefa ochronna: ok. 2 kHz
powyżej 24 kHz wszystko musi zostać odcięte
Wczesne systemy używały analogowych filtrów „brick-wall”, które mocno degradowały dźwięk (ripple, przesunięcia fazowe). Rozwiązaniem stało się:
oversampling (nadpróbkowanie),
łagodny filtr analogowy,
precyzyjna filtracja cyfrowa wewnątrz konwertera.
Tak działają dzisiejsze przetworniki AD/DA.
4. Sample & Hold – ukryty bohater konwersji
Zanim próbka zostanie zmierzona, konwerter musi zamrozić jej wartość. Do tego służy układ Sample & Hold (S/H): kondensator przechowuje chwilowe napięcie.
S/H musi:
próbować sygnał w precyzyjnych odstępach czasu,
utrzymać napięcie bez „opadania” (droop),
działać szybciej niż trwa konwersja próbki.
Największym wrogiem jest jitter, czyli niestabilność zegara próbkowania.
Rozwiązaniem jest dither – celowo dodawany, bardzo cichy szum, który:
zamienia zniekształcenia nieliniowe w szum liniowy,
umożliwia zapis sygnałów ciszej niż 1 LSB (!),
sprawia, że zmniejszenie bitowości (np. z 24→16 bitów) nie wprowadza zniekształceń.
Dither to nie „pogorszenie sygnału”, tylko niezbędna część cyfrowego audio.
6. AD Converter – serce systemu
Konwerter analogowo-cyfrowy (ADC) zamienia napięcie na liczby. Mimo że producenci reklamują „24 bity”, rzeczywista użyteczna rozdzielczość wynosi:
ok. 19–20 bitów w profesjonalnym sprzęcie,
16–18 bitów w urządzeniach konsumenckich.
Prawdziwe 24 bity wymagałyby szumu własnego poniżej –145 dBFS, czyli 0,1 µV RMS – to poziom szumu termicznego rezystora. Dziś nieosiągalne.
7. Konwertery SAR a sigma-delta
SAR (Successive Approximation Register) – klasyczna metoda krokowego dopasowania wartości.
Zalety:
dobra liniowość
stosowane w aparaturze pomiarowej
Wady:
trudność osiągnięcia >18 bitów
konieczność stromych filtrów analogowych
Sigma-Delta (ΔΣ) – dominująca technologia w audio.
Działa poprzez:
bardzo wysokie próbkowanie (np. 64×44,1 kHz),
kwantyzację do 1 bitu,
noise shaping – przeniesienie szumu powyżej pasma słyszalnego,
cyfrową filtrację dolnoprzepustową.
Zalety:
bardzo niski poziom szumu w słyszalnym paśmie
mniejsze wymagania wobec filtrów analogowych
niższe koszty
Dlatego wszystkie współczesne przetworniki audio są sigma-delta.
8. Jitter – wróg numer jeden precyzji
Jitter to nieregularność zegara próbkowania.
losowy jitter → zwiększa szum,
okresowy jitter → dodaje zniekształcenia i sygnały lustrzane.
Stąd nacisk na:
zegary kwarcowe,
reklockowanie,
układy PLL i ASRC.
Uwaga: niski jitter zegara wejściowego nie gwarantuje jakości, jeśli sam układ ADC/DA jest słaby.
9. Co dzieje się z sygnałem po konwersji?
Kiedy mamy już dane PCM, system wykonuje:
interleaving – rozrzucanie danych, żeby uszkodzenia były rozproszone,
korekcję błędów (Reed-Solomon, CIRC, LDPC),
multiplexing – łączenie wielu kanałów w jeden strumień,
kodowanie kanałowe – zamiana danych binarnych na sygnał możliwy do zapisania lub transmisji.
Zapis cyfrowy nie przechowuje „zer i jedynek” jako prostych stanów logicznych. Najważniejsze są przejścia, czyli miejsca, gdzie sygnał zmienia stan. Dlatego stosuje się modulacje samosynchronizujące (np. EFM w CD, BMC w SPDIF).
10. Dlaczego cyfrowe audio nie brzmi „zimno”, jeśli jest zrobione dobrze?
Bo system PCM jest teoretycznie bezstratny – można idealnie odtworzyć sygnał, jeśli:
filtracja jest prawidłowa,
dithering został użyty poprawnie,
jitter jest na niskim poziomie,
konwerter ma odpowiedni zakres dynamiczny.
Jeżeli cyfrowe audio brzmi źle – winna jest implementacja, nie sama idea.
11. Najważniejsze fakty praktyczne
24-bitowy plik NIE oznacza 24 bitów realnej dynamiki.
CD-Audio (16/44,1) ma zakres 96 dB – to i tak więcej niż dynamika muzyki popularnej (zwykle 8–12 dB).
Dithering jest obowiązkowy, a nie „opcjonalny”.
Oversampling i filtry cyfrowe są powodem, dla którego nowoczesne przetworniki brzmią dobrze.
Twierdzenie „cyfra jest zimna” wynika głównie z błędów w implementacjach lat 80/90.
12. Podsumowanie
Proces cyfrowej konwersji audio to precyzyjna operacja matematyczno-elektroniczna, nie „magia”. Wymaga:
filtracji sygnału,
precyzyjnego próbkowania,
właściwej kwantyzacji,
ditheringu,
korekcji błędów i kodowania transmisyjnego.
Dzisiejsze konwertery sigma-delta w połączeniu z dobrym zegarem i prawidłowym ditheringiem pozwalają osiągnąć jakość przewyższającą wszelkie analogowe systemy zapisu pod względem dynamiki i zniekształceń – przy nieporównywalnej wygodzie obróbki.
Wbrew mitom – cyfrowe audio nie jest ograniczeniem, lecz najbardziej precyzyjną formą zapisu dźwięku, jaką ludzkość stworzyła.