Tag: ADC

  • JITTER – wróg cyfrowego audio – kompletny przewodnik


    Cyfrowe audio – wbrew pozorom – nie jest zbiorem „idealnych zer i jedynek”, które zawsze docierają perfekcyjnie na czas. Aby dźwięk cyfrowy po konwersji do postaci analogowej brzmiał dobrze, musi być spełniony jeszcze jeden warunek: precyzyjna kontrola czasu. Tym właśnie zajmuje się zegar taktujący, a jego niedoskonałości określamy jednym słowem – jitter.

    To jedno z najbardziej enigmatycznych zjawisk we współczesnej elektroakustyce. W specyfikacjach urządzeń widzimy „< 100 ps jitter”, w dyskusjach audiofilskich słyszymy o „złotych kablach USB” redukujących jitter, a na forach krążą mity, że jitter niszczy brzmienie tak samo jak kiepski DAC. Które z tych twierdzeń są prawdziwe?

    Poniżej znajduje się rzetelne, merytorycznie poprawne i dogłębne omówienie jittera – od fizyki zjawiska, przez jego skutki, aż po realne metody minimalizacji i sytuacje, w których… nie ma znaczenia.


    CO TO JEST JITTER?

    (więcej…)
  • Cyfrowe systemy audio: jak naprawdę działa PCM, delta modulacja, floating-point i inne formaty? Pełny przewodnik bez marketingu

    Cyfrowe audio to nie tylko „zapis zer i jedynek”. To skomplikowana seria decyzji projektowych: jak mierzyć sygnał, jak go opisywać, jak przechowywać i jak odtworzyć. Wraz z nadejściem ery streamingu przeciętny słuchacz słyszy słowo „PCM” lub „DSD”, ale rzadko rozumie, co kryje się pod spodem.

    Ten artykuł dogłębnie i przystępnie wyjaśnia:

    • czym różni się PCM od delta modulacji i ADPCM,
    • jak działa cyfrowe próbkowanie i kwantyzacja,
    • dlaczego jedne systemy mają 1 bit, a inne 24,
    • skąd bierze się szum kwantyzacji i dither,
    • dlaczego floating-point PCM istnieje mimo „wystarczającego” 24-bitowego zapisu,
    • jak to wszystko wpływa na jakość dźwięku.

    1. PCM – fundament całego cyfrowego audio

    Linear PCM (Pulse Code Modulation) to standardowy sposób zamiany fali akustycznej na cyfry.

    Jego kluczowe cechy:

    • próbki są pobierane w stałych odstępach czasu,
    • każda próbka ma tę samą liczbę możliwych poziomów, niezależnie od głośności,
    • liczba poziomów zależy od długości słowa, np. 16 bitów → 65 536 poziomów, 24 bity → ok. 16,7 mln.

    To prosty i genialny system: jeśli sygnał nie przekracza połowy częstotliwości próbkowania (zasada Nyquista) i mieści się w zakresie amplitudy – może być odtworzony bez błędów.

    Dlaczego PCM stał się standardem?

    ✔ jest liniowy i przewidywalny
    ✔ łatwo się go filtruje i rekonstruuje
    ✔ można go bezstratnie kopiować
    ✔ nie pogarsza się przy wielokrotnym przenoszeniu


    2. Problem: dźwięk nie jest równomierny

    W idealnym świecie amplituda dźwięku byłaby rozłożona równomiernie. Ale w rzeczywistości:

    • większość czasu sygnał jest cichy, a tylko chwilowo głośny,
    • muzyka ma ogromny zakres dynamiki,
    • ludzki słuch jest dużo bardziej czuły na szumy przy niskich poziomach.

    Dlatego powstały systemy niejednolitej kwantyzacji, czyli takie, w których:

    duże sygnały zapisuje się z mniejszą dokładnością, a małe z większą.


    3. Floating-point PCM – cyfrowy odpowiednik „automatycznej regulacji poziomu”

    W przeciwieństwie do zwykłego PCM, floating-point PCM zachowuje:

    • wartość sygnału (mantysa)
    • informację o skali (eksponent)

    Dzięki temu może:

    • opisać dźwięki bardzo ciche i bardzo głośne jednocześnie,
    • uniknąć przesterowania podczas nagrywania,
    • lepiej nadaje się do obróbki dźwięku niż do końcowego masteringu.

    Dlatego:

    Plik w 32-bit float nie brzmi lepiej od 24-bit PCM – ale jest bezpieczniejszy w produkcji.

    Floating-point nie zwiększa realnej rozdzielczości, tylko przesuwa zakres pracy.


    4. Delta modulacja – „jednobitowa” alternatywa dla PCM

    Delta modulacja (DM) jest ekstremalnie prosta:

    • zamiast zapisywać wartość próbki,
    • system zapisuje tylko czy sygnał wzrósł, czy spadł.

    Dlatego:

    • potrzebuje tylko 1 bit na próbkę,
    • ale wymaga bardzo wysokiej częstotliwości próbkowania, aby śledzić sygnał.

    To techniczna prehistoria DAC-ów sigma-delta. DM:

    ✓ ma proste układy
    ✗ dramatycznie traci jakość przy złożonym sygnale
    ✗ potrzebuje absurdalnie wysokich częstotliwości (setki MHz dla 16-bitowej jakości!)


    5. Adaptive Delta Modulation (ADM) – poprawiamy krok kwantyzacji

    W ADM wielkość kroku nie jest stała:

    • rośnie, gdy sygnał zmienia się gwałtownie,
    • maleje przy stabilnych fragmentach.

    Zaleta → lepsza precyzja przy małej liczbie bitów.
    Wada → szum nie jest równomierny, trudniej stosować dither.

    Rozwinięciem ADM jest CVSDM (Continuously Variable Slope DM), używane m.in. w systemach wojskowych i telekomunikacji.


    6. Companding – kompresja i ekspansja w świecie cyfry

    To technika logarytmicznej kwantyzacji, znana jako:

    • μ-law (Ameryka Północna),
    • A-law (Europa).

    W skrócie:

    1. sygnał przed kwantyzacją jest kompresowany (małe poziomy wzmacniane, duże osłabiane),
    2. po odtworzeniu – rozszerzany do oryginalnego kształtu.

    Zyskujemy:

    ✔ mniejszy szum na cichych fragmentach
    ✗ zniekształcenia intermodulacyjne przy dużych sygnałach

    Dlatego telekomunikacja mogła używać 8-bitowego audio, które brzmiało „prawie jak 12-bit”.


    7. DPCM i ADPCM – zapisujemy nie próbki, lecz różnice

    DPCM zapisuje różnicę między kolejnymi próbkami.
    To opłaca się, bo kolejna próbka zwykle nie różni się dużo od poprzedniej.

    Jeszcze lepszy jest ADPCM (Adaptive DPCM):

    • przewiduje kolejną próbkę,
    • zapisuje tylko błąd predykcji,
    • zmienia krok kwantyzacji adaptacyjnie.

    Zalety:

    ✔ mniejszy bitrate przy podobnej jakości do PCM
    ✔ mniejsze błędy widoczne w transmisji
    ✔ doskonały do telefonii, gier, kompresji bez DSP

    ADPCM do dziś siedzi w:

    • VoIP,
    • radiotelefonach,
    • starych grach (PS1, Sega, arcade audio),
    • systemach wojskowych.

    8. Sigma-delta i DSD – współczesny spadkobierca delta modulacji

    Sigma-delta to zaawansowana forma delta modulacji z noise shapingiem.

    Zasada:

    • sygnał jest próbkowany w ekstremalnie wysokiej częstotliwości,
    • ale przy małej liczbie bitów (często 1),
    • szum kwantyzacji jest przenoszony poza pasmo słyszalne.

    Tak działają:

    • prawie wszystkie współczesne ADC i DAC,
    • format DSD / SACD (2,8224 MHz / 1 bit),
    • przetworniki ESS, AKM, TI, Cirrus Logic.

    To nie jest PCM, choć często jest konwertowane do PCM w torze cyfrowym.


    9. Co naprawdę decyduje o jakości? (Nie to, o czym piszą ulotki)

    ❌ liczba bitów na folderze
    ❌ częstotliwość próbkowania „384 kHz”
    ❌ marketingowe hasła „dual mono”, „audio grade”

    liniowość przetwornika (DNL, INL)
    rzeczywista liczba bitów efektywnych (ENoB)
    poziom jittera
    jakość filtrów (FIR / IIR / analog LFP)
    algorytm oversamplingu i noise shapingu

    Najlepszy przykład:

    Wiele 24-bitowych DAC-ów ma w rzeczywistości 18–19 bitów efektywnych.
    Stare TDA1541 (16 bitów) miały 15 realnych bitów, ale perfekcyjną liniowość i do dziś brzmią genialnie.


    10. Podsumowanie

    SystemZaletyWadyZastosowania
    Linear PCMnajwyższa wiernośćduży bitratestudio, audio hi-fi
    Floating-point PCMogromna dynamikanie do końca „bit perfect”produkcja, DAW
    Delta modulacjaprosty układfatalna jakośćhistoria
    ADM / CVSDMlepszy niż DMszum zależny od sygnałutelekomunikacja
    Companding (μ-law)lepsza jakość z 8 bitówzniekształceniatelefonia
    ADPCMwysoka efektywnośćmniejsza wiernośćVoIP, gry
    Sigma-deltawysoka jakość, mało bitówwymaga zarządzania szumemwszystkie współczesne DAC-y
    DSDbrak filtracji w cyfrowej domeniegigantyczny szum powyżej 20 kHzSACD, audio high-end

    wyjaśnienie:

    W końcówce artykułu mowa o tym, co naprawdę wpływa na jakość cyfrowego audio, a nie na marketingowe hasła. Jeden z kluczowych punktów to „rzeczywista liczba bitów efektywnych (ENoB)”, czyli Effective Number of Bits. To pojęcie jest ważne, bo pokazuje różnicę między tym, co obiecuje specyfikacja (np. „24 bity”), a tym, co przetwornik (DAC lub ADC) naprawdę dostarcza w praktyce. Wyjaśnię to krok po kroku, bez ściemy.

    1. Co to jest ENoB?

    • Nominalna liczba bitów to po prostu długość słowa cyfrowego w formacie, np. 16 bitów w CD-Audio (65 536 możliwych poziomów) czy 24 bity w hi-res audio (ponad 16 milionów poziomów). To teoretyczna rozdzielczość – ile „schodków” możesz mieć do opisu amplitudy sygnału.
    • ENoB to miara efektywnej rozdzielczości, czyli ile z tych bitów jest naprawdę użytecznych po uwzględnieniu błędów i szumów w rzeczywistym urządzeniu. Oblicza się ją na podstawie stosunku sygnału do szumu i zniekształceń (SINAD – Signal-to-Noise and Distortion Ratio).
    • Formuła uproszczona: ENoB = (SINAD – 1,76) / 6,02, gdzie SINAD jest w dB. To pokazuje, ile bitów działa „jakby idealnie”, bez zakłóceń.

    Inaczej mówiąc: nawet jeśli DAC jest reklamowany jako 24-bitowy, w rzeczywistości może zachowywać się jak 18- lub 19-bitowy z powodu niedoskonałości sprzętowych.

    2. Dlaczego ENoB jest niższe niż nominalna liczba bitów?

    • Szum kwantyzacji: Podstawowy błąd zaokrąglania podczas kwantyzacji – zawsze istnieje, ale w idealnym świecie wynosi ok. -6 dB na bit (dla 24 bitów to teoretycznie -144 dB szumu).
    • Inne zakłócenia:
      • Szum termiczny: Od oporników i tranzystorów w układzie – nieunikniony w analogowej części.
      • Jitter: Niestabilność zegara, która „rozmywa” próbki w czasie.
      • Nieliniowość (DNL/INL): Błędy w równomierności schodków kwantyzacji – np. niektóre poziomy są za duże, inne za małe.
      • Zniekształcenia harmoniczne (THD): Dodatkowe częstotliwości powstające przy przetwarzaniu.
      • Interferencje zewnętrzne: Zasilanie, EMI (zakłócenia elektromagnetyczne).
    • W rezultacie, pełny zakres dynamiczny (różnica między najcichszym a najgłośniejszym sygnałem) jest ograniczony. Dla ludzkiego słuchu 20 bitów to już maksimum (ok. 120 dB dynamiki), bo szum tła w pokoju to 30-40 dB, a koncert rockowy to 110 dB. Więcej bitów nominalnych nie pomaga, jeśli ENoB nie rośnie.

    3. Przykład z artykułu: 24-bitowe DAC-i z 18-19 bitami efektywnymi

    • Wiele nowoczesnych przetworników (np. ESS Sabre, AKM, Cirrus Logic) jest 24- lub 32-bitowych, ale ich ENoB to typowo 18-20 bitów. Dlaczego?
      • Szum termiczny ogranicza do ok. -110/-120 dB SINAD, co odpowiada 18-20 bitom.
      • Oversampling i noise shaping (jak w sigma-delta) przesuwają szum poza pasmo słyszalne, ale nie eliminują go całkowicie.
      • W praktyce: Jeśli masz DAC z ENoB 19 bitów, to jego rzeczywista rozdzielczość to ok. 524 288 poziomów (zamiast 16 milionów dla 24 bitów). Dla ucha to i tak więcej niż potrzeba, ale pokazuje, że „24 bity” to często marketing.
    • To nie oznacza, że taki DAC brzmi źle – po prostu nie wykorzystuje pełnego potencjału formatu. Lepsze DAC-i (np. high-endowe jak Chord czy dCS) zbliżają się do 21-22 bitów ENoB dzięki zaawansowanym filtrom i izolacji.

    4. Przykład ze starym TDA1541: 16 bitów nominalnie, 15 efektywnie, ale genialna liniowość

    • Philips TDA1541 (z lat 80., używany w starych CD-playerach jak Philips CD304 czy high-endowych modach) to klasyczny 16-bitowy DAC.
    • Jego ENoB to ok. 15 bitów – tracił 1 bit na szumy i błędy.
    • Ale dlaczego „brzmi genialnie do dziś”?
      • Perfekcyjna liniowość: Małe błędy DNL/INL, czyli schodki były równomierne. To ważniejsze niż sama liczba bitów, bo nieliniowość powoduje ostre zniekształcenia (jak „cyfrowy chłód” w tanich DAC-ach).
      • Brak oversamplingu: Pracował w „pure” multibitowym trybie (R-2R ladder), co dawało naturalny, analogowy charakter dźwięku.
      • Entuzjaści audio modują go do dziś, bo subiektywnie brzmi cieplej i bardziej muzykalnie niż niektóre 24-bitowe sigma-delta DAC-i z wyższym ENoB, ale gorszą liniowością.
    • Lekcja: ENoB to nie wszystko. Jakość zależy od całego łańcucha – filtrów, jittera, a nawet subiektywnego odbioru.

    5. Jak to wpływa na Ciebie jako słuchacza?

    • Nie gon za „32-bit/768 kHz” w specyfikacjach – sprawdzaj recenzje z pomiarami (np. na Audio Science Review, gdzie mierzą ENoB i SINAD).
    • W streamingu (Spotify, Tidal) większość to 16- lub 24-bit PCM, ale realna jakość zależy od masteringu, a nie bitów.
    • Jeśli produkujesz muzykę: Używaj floating-point (np. 32-bit float) w DAW, bo chroni przed clippingiem, ale finalny export to 24-bit fixed-point.
    • Podsumowując: ENoB pokazuje, że cyfrowe audio to nie magia bitów, ale inżynieria. Wiele „hi-res” to placebo, jeśli sprzęt nie nadąża.
  • Jak działają cyfrowe systemy audio? Kompletny przewodnik po konwersji, filtrach, jitterze i błędach liniowości

    Cyfrowe audio jest dziś wszechobecne – w smartfonach, systemach streamingowych, telewizji, studio nagraniowym, kinie domowym i high-endowych systemach stereo. Jednak za prostym wrażeniem „odtwarzania pliku” kryje się niezwykle złożony proces przekształcania dźwięku z formy analogowej do cyfrowej i z powrotem. Aby ten proces był wierny oryginałowi, potrzebne są precyzyjne filtry, układy korekcji błędów, bufory czasowe i przetworniki o wysokiej liniowości.

    Ten artykuł krok po kroku tłumaczy, jak działa cyfrowy tor odtwarzania, jakie błędy się w nim pojawiają, czym różni się zwykły DAC od sigma-delta, na czym polega oversampling, noise shaping oraz dlaczego bit depth to nie wszystko.


    1. Konwersja cyfrowa – od analogu do cyfr i z powrotem

    Cyfrowy system audio składa się z dwóch głównych konwerterów:

    • ADC (analog-to-digital) – zamienia fale akustyczne na liczby.
    • DAC (digital-to-analog) – zamienia liczby z powrotem na sygnał analogowy.

    Na wejściu i wyjściu pracują również filtry dolnoprzepustowe, które ograniczają pasmo zgodnie z twierdzeniem Nyquista. Oznacza to, że:

    Żaden sygnał nie może mieć częstotliwości powyżej połowy częstotliwości próbkowania, inaczej pojawi się aliasing (zniekształcenia widma).


    2. Co dzieje się podczas odtwarzania dźwięku?

    Cyfrowy odtwarzacz wykonuje operacje odwrotne do tych z procesu nagrywania:

    1. Buforuje dane i koreluje czas próbkowania – kompensuje jitter.
    2. Dekoduje i demultipleksuje strumień danych – przywraca strukturę ramek.
    3. Wykonuje korekcję błędów (parity, Reed–Solomon itp.).
    4. Konwertuje sygnał na kod NRZ (non-return-to-zero) zrozumiały dla DAC.
    5. Przekazuje dane do przetwornika.
    6. Filtruje i wygładza sygnał analogowy.

    3. Jitter – największy wróg cyfrowej dokładności

    Cyfrowy system audio wcale nie jest „odporny na wszystko”.
    Choć nie ma szumu taśmy ani wow&flutter jak w gramofonie, występuje jitter, czyli losowe odchylenia w czasie próbkowania.

    Dlaczego to ważne?
    Bo DAC musi odtworzyć dokładnie w tym samym momencie, w którym próbki zostały zapisane. Nawet niewielkie przesunięcia powodują zniekształcenia intermodulacyjne.

    Dlatego stosuje się:

    • bufory FIFO – dane wpadają nieregularnie, ale wypadają równo,
    • PLL (phase-locked loop) – obwody synchronizacji zegarów,
    • asynchroniczne re-clocking – w lepszych konstrukcjach.

    4. Korekcja błędów i ukrywanie uszkodzonych danych

    Nośniki cyfrowe – CD, pliki na dyskach, streaming – mogą zawierać błędy.
    Cyfrowy system audio:

    • wykrywa błędy dzięki dodatkowym bitom kontrolnym,
    • naprawia małe błędy dzięki algorytmom korekcji,
    • maskuje większe błędy metodami concealment (interpolacja).

    To dlatego:

    CD z rysami czasem gra czysto, podczas gdy analogowa płyta winylowa zawsze oddaje rysę jako trzask.


    5. DAC – czyli najbardziej krytyczna część odtwarzacza

    Przetwornik cyfrowo-analogowy decyduje, jak wierny będzie sygnał analogowy względem danych cyfrowych. Najważniejszym parametrem nie jest bit depth, lecz liniowość.

    Rodzaje błędów:

    • błąd liniowości absolutnej – przesunięcie wszystkich poziomów napięcia,
    • błąd różnicowy (DNL) – skoki między poziomami nie są równomierne.

    To DNL powoduje, że:

    • głośne dźwięki są ok,
    • ciche dźwięki ulegają zniekształceniu i „ziarnistości”.

    6. R-2R kontra sigma-delta: dwa światy konwersji

    R-2R ladder (drabinka rezystorowa)

    • Bez noise shapingu
    • Brak ultrawysokich częstotliwości szumu
      − Wymaga ekstremalnie precyzyjnych rezystorów
      − DNL rośnie z temperaturą i starzeniem

    Dlatego stare Philipsy TDA1541 lub Burr-Brown PCM1704 są do dziś czczone przez audiofilów – miały prawdziwą liniowość, choć tylko 16 bitów.

    Sigma-delta

    • Bardzo wysoka teoretyczna rozdzielczość
    • Wbudowany oversampling
    • Tanie w produkcji
      − Wymagają noise shapingu (szum przenoszony poza pasmo)
      − Mogą emitować ultradźwiękowe artefakty

    Tu właśnie pojawia się spór „R-2R kontra sigma-delta”, ale prawda jest prosta:

    To nie typ DAC-a gra, tylko jego implementacja.


    7. Oversampling i interpolacja – po co „wymyślać próbki”?

    Próbkowanie CD to 44,1 kHz. To oznacza:

    • Nyquist = 22,05 kHz
    • Filtr antyaliasingowy musiałby być bardzo stromy i zniekształcający.

    Dlatego stosuje się oversampling:

    • Dodaje się sztuczne próbki 0.
    • Filtr FIR oblicza wartości pośrednie.
    • Pasmo niepożądanych sygnałów przesuwa się np. z 24 kHz do 192 kHz.
    • Analogowy filtr może być łagodny i liniowy fazowo.

    To zmniejsza problem:

    • przesunięć fazowych,
    • dzwonienia (ringing),
    • zniekształceń przy częstotliwości odcięcia.

    8. Noise shaping – przenoszenie szumu tam, gdzie nie słyszymy

    Każda konwersja cyfrowa dodaje szum kwantyzacji.

    Noise shaping nie usuwa go – tylko przesuwa jego energię tam, gdzie ucho jest mniej czułe, czyli:

    • powyżej 15–20 kHz (dla standardowych systemów),
    • jeszcze wyżej w systemach hi-res.

    Dlatego:

    24-bitowy DAC nie daje „więcej informacji” – daje niższy szum w paśmie słyszalnym.


    9. Sample-and-hold i korekcja apertury

    DAC nie zmienia napięcia natychmiast. Rzeczywisty sygnał wygląda jak schody (PAM – Pulse Amplitude Modulation). Aby je wygładzić:

    • układ sample-and-hold trzyma wartość próbki, aż pojawi się następna,
    • filtr dolnoprzepustowy usuwa „schodki”.

    W starych DAC-ach trzeba było to robić osobnym układem.
    W nowoczesnych – jest wbudowane w chip.


    10. Filtry wyjściowe – ostatnia granica między cyfrą a analogiem

    Filtr anty-imaging usuwa:

    • obrazy widma (image spectra),
    • ultradźwięki powyżej Nyquista,
    • zakłócenia HF z układów cyfrowych.

    Jeśli nie zostaną usunięte, mogą modulować:

    • stopnie analogowe,
    • wzmacniacze,
    • przetworniki głośnikowe (!)

    Nawet jeśli nie słyszysz 80 kHz, to Twój wzmacniacz może się wzbudzać i zniekształcać pasmo 1–10 kHz.


    11. Czy wyższa częstotliwość próbkowania daje lepszy dźwięk?

    To największy mit audio.

    Jeśli sygnał jest ograniczony pasmem, to:

    Próbki zawierają komplet informacji.

    Więcej próbek nie dodaje informacji, jedynie:

    • ułatwia filtrację,
    • poprawia współpracę DAC-a z filtrem.

    Dlatego 96 kHz może być lepsze technicznie, ale 44,1 kHz już zawiera cały dźwięk, jeśli system jest zaprojektowany prawidłowo.


    12. Jak ocenić rzeczywistą jakość DAC-a?

    Nie po:

    ❌ liczbie bitów
    ❌ częstotliwości próbkowania
    ❌ „dual mono” i złotych kondensatorach

    Tylko po:

    ✔ dynamice (SNR)
    ✔ efektywnej liczbie bitów (ENoB)
    ✔ błędzie liniowości (DNL)
    ✔ poziomie jittera
    ✔ jakości filtrów

    Przykład:

    DAC 16-bitowy o dynamice 96 dB = 15,4 bitów efektywnych

    DAC 24-bitowy w realu często ma 18–19 bitów efektywnych
    Reszta to marketing.


    Podsumowanie

    Cyfrowy tor audio jest technicznie genialny – pozwala zachować dźwięk bit w bit przez dekady, kopiować go bez strat, naprawiać błędy i usuwać zniekształcenia niemożliwe do usunięcia w analogu.

    Ale nie jest systemem idealnym. Wrażliwy jest na:

    • jitter,
    • błędy liniowości DAC,
    • szum kwantyzacji,
    • niedoskonałe filtry.

    To dlatego masz wrażenie, że „różne DAC-i brzmią różnie”, choć „to tylko zera i jedynki”.

  • Jak działa cyfrowe audio? Kompletny przewodnik od A do Z: sampling, kwantyzacja, dithering i konwersja

    Cyfrowe audio otacza nas wszędzie – w telefonach, serwisach streamingowych, studiach nagraniowych, telewizji i radiu. Jednak zanim analogowy dźwięk trafi do komputera lub na cyfrowy nośnik, musi zostać przekształcony w postać cyfrową. Proces ten nie jest prosty: wymaga filtracji, próbkowania, kwantyzacji, korekcji błędów i odpowiedniego kodowania.

    Ten artykuł szczegółowo wyjaśnia jak działa system cyfrowego zapisu dźwięku, co faktycznie oznaczają „24 bity”, dlaczego dithering jest koniecznością, jak działa konwersja sigma-delta i czemu filtry antyaliasingowe są tak ważne – w sposób zrozumiały, ale bez upraszczania techniki.


    1. Podstawy: sampling, kwantyzacja i konwersja

    Żeby zapisać dźwięk w formie cyfrowej, trzeba wykonać trzy kroki:

    1. Próbkowanie (sampling) – system mierzy poziom sygnału co określony czas (np. 48 000 razy na sekundę).
    2. Kwantyzacja – każda próbka zostaje zaokrąglona do najbliższego dostępnego poziomu (np. jednego z 65 536 poziomów w systemie 16-bitowym).
    3. Konwersja – wartości te są zapisywane jako liczby binarne.

    Najprostszy i najważniejszy system zapisu dźwięku to PCM – Pulse Code Modulation. To właśnie PCM jest fundamentem wszystkich standardów cyfrowych: CD-Audio, WAV, FLAC, AES/EBU, SPDIF itd.


    2. Jak dużo danych zajmuje dźwięk?

    Dla próbkowania 48 kHz i 16 bitów, przepływność wynosi:

    48000 próbek × 16 bitów = 768 000 bitów/s ≈ 768 kb/s (mono)

    Po dodaniu danych synchronizacyjnych, korekcji błędów i kodowania kanałowego, wartość ta rośnie do ok. 1 Mb/s na kanał.

    Celem systemów cyfrowych jest jak najwierniejsze odwzorowanie sygnału przy optymalnym użyciu miejsca i przepustowości.


    3. Problem aliasingu i konieczność filtrów antyaliasingowych

    Każdy sygnał zawierający częstotliwości wyższe niż połowa częstotliwości próbkowania (tzw. częstotliwość Nyquista) powoduje aliasing – słyszalne zniekształcenia.

    Dlatego przed próbkowaniem dźwięk musi zostać odfiltrowany. Filtr wejściowy to tzw. anti-aliasing filter – filtr dolnoprzepustowy.

    Dla próbkowania 48 kHz:

    • pasmo użyteczne: 0–22 kHz
    • martwa strefa ochronna: ok. 2 kHz
    • powyżej 24 kHz wszystko musi zostać odcięte

    Wczesne systemy używały analogowych filtrów „brick-wall”, które mocno degradowały dźwięk (ripple, przesunięcia fazowe). Rozwiązaniem stało się:

    • oversampling (nadpróbkowanie),
    • łagodny filtr analogowy,
    • precyzyjna filtracja cyfrowa wewnątrz konwertera.

    Tak działają dzisiejsze przetworniki AD/DA.


    4. Sample & Hold – ukryty bohater konwersji

    Zanim próbka zostanie zmierzona, konwerter musi zamrozić jej wartość. Do tego służy układ Sample & Hold (S/H): kondensator przechowuje chwilowe napięcie.

    S/H musi:

    • próbować sygnał w precyzyjnych odstępach czasu,
    • utrzymać napięcie bez „opadania” (droop),
    • działać szybciej niż trwa konwersja próbki.

    Największym wrogiem jest jitter, czyli niestabilność zegara próbkowania.


    5. Dlaczego dithering jest konieczny?

    Kwantyzacja = zaokrąglanie sygnału → powoduje zniekształcenia nieliniowe (trzaski, szorstkość, modulacje zniekształceń).

    Rozwiązaniem jest dither – celowo dodawany, bardzo cichy szum, który:

    • zamienia zniekształcenia nieliniowe w szum liniowy,
    • umożliwia zapis sygnałów ciszej niż 1 LSB (!),
    • sprawia, że zmniejszenie bitowości (np. z 24→16 bitów) nie wprowadza zniekształceń.

    Dither to nie „pogorszenie sygnału”, tylko niezbędna część cyfrowego audio.


    6. AD Converter – serce systemu

    Konwerter analogowo-cyfrowy (ADC) zamienia napięcie na liczby. Mimo że producenci reklamują „24 bity”, rzeczywista użyteczna rozdzielczość wynosi:

    • ok. 19–20 bitów w profesjonalnym sprzęcie,
    • 16–18 bitów w urządzeniach konsumenckich.

    Prawdziwe 24 bity wymagałyby szumu własnego poniżej –145 dBFS, czyli 0,1 µV RMS – to poziom szumu termicznego rezystora. Dziś nieosiągalne.


    7. Konwertery SAR a sigma-delta

    SAR (Successive Approximation Register) – klasyczna metoda krokowego dopasowania wartości.

    Zalety:

    • dobra liniowość
    • stosowane w aparaturze pomiarowej

    Wady:

    • trudność osiągnięcia >18 bitów
    • konieczność stromych filtrów analogowych

    Sigma-Delta (ΔΣ) – dominująca technologia w audio.

    Działa poprzez:

    1. bardzo wysokie próbkowanie (np. 64×44,1 kHz),
    2. kwantyzację do 1 bitu,
    3. noise shaping – przeniesienie szumu powyżej pasma słyszalnego,
    4. cyfrową filtrację dolnoprzepustową.

    Zalety:

    • bardzo niski poziom szumu w słyszalnym paśmie
    • mniejsze wymagania wobec filtrów analogowych
    • niższe koszty

    Dlatego wszystkie współczesne przetworniki audio są sigma-delta.


    8. Jitter – wróg numer jeden precyzji

    Jitter to nieregularność zegara próbkowania.

    • losowy jitter → zwiększa szum,
    • okresowy jitter → dodaje zniekształcenia i sygnały lustrzane.

    Stąd nacisk na:

    • zegary kwarcowe,
    • reklockowanie,
    • układy PLL i ASRC.

    Uwaga: niski jitter zegara wejściowego nie gwarantuje jakości, jeśli sam układ ADC/DA jest słaby.


    9. Co dzieje się z sygnałem po konwersji?

    Kiedy mamy już dane PCM, system wykonuje:

    • interleaving – rozrzucanie danych, żeby uszkodzenia były rozproszone,
    • korekcję błędów (Reed-Solomon, CIRC, LDPC),
    • multiplexing – łączenie wielu kanałów w jeden strumień,
    • kodowanie kanałowe – zamiana danych binarnych na sygnał możliwy do zapisania lub transmisji.

    Zapis cyfrowy nie przechowuje „zer i jedynek” jako prostych stanów logicznych. Najważniejsze są przejścia, czyli miejsca, gdzie sygnał zmienia stan. Dlatego stosuje się modulacje samosynchronizujące (np. EFM w CD, BMC w SPDIF).


    10. Dlaczego cyfrowe audio nie brzmi „zimno”, jeśli jest zrobione dobrze?

    Bo system PCM jest teoretycznie bezstratny – można idealnie odtworzyć sygnał, jeśli:

    • filtracja jest prawidłowa,
    • dithering został użyty poprawnie,
    • jitter jest na niskim poziomie,
    • konwerter ma odpowiedni zakres dynamiczny.

    Jeżeli cyfrowe audio brzmi źle – winna jest implementacja, nie sama idea.


    11. Najważniejsze fakty praktyczne

    • 24-bitowy plik NIE oznacza 24 bitów realnej dynamiki.
    • CD-Audio (16/44,1) ma zakres 96 dB – to i tak więcej niż dynamika muzyki popularnej (zwykle 8–12 dB).
    • Dithering jest obowiązkowy, a nie „opcjonalny”.
    • Oversampling i filtry cyfrowe są powodem, dla którego nowoczesne przetworniki brzmią dobrze.
    • Twierdzenie „cyfra jest zimna” wynika głównie z błędów w implementacjach lat 80/90.

    12. Podsumowanie

    Proces cyfrowej konwersji audio to precyzyjna operacja matematyczno-elektroniczna, nie „magia”. Wymaga:

    • filtracji sygnału,
    • precyzyjnego próbkowania,
    • właściwej kwantyzacji,
    • ditheringu,
    • korekcji błędów i kodowania transmisyjnego.

    Dzisiejsze konwertery sigma-delta w połączeniu z dobrym zegarem i prawidłowym ditheringiem pozwalają osiągnąć jakość przewyższającą wszelkie analogowe systemy zapisu pod względem dynamiki i zniekształceń – przy nieporównywalnej wygodzie obróbki.

    Wbrew mitom – cyfrowe audio nie jest ograniczeniem, lecz najbardziej precyzyjną formą zapisu dźwięku, jaką ludzkość stworzyła.