Tag: częstotliwość próbkowania

  • Jak działa cyfrowe audio? Kompletny przewodnik od A do Z: sampling, kwantyzacja, dithering i konwersja

    Cyfrowe audio otacza nas wszędzie – w telefonach, serwisach streamingowych, studiach nagraniowych, telewizji i radiu. Jednak zanim analogowy dźwięk trafi do komputera lub na cyfrowy nośnik, musi zostać przekształcony w postać cyfrową. Proces ten nie jest prosty: wymaga filtracji, próbkowania, kwantyzacji, korekcji błędów i odpowiedniego kodowania.

    Ten artykuł szczegółowo wyjaśnia jak działa system cyfrowego zapisu dźwięku, co faktycznie oznaczają „24 bity”, dlaczego dithering jest koniecznością, jak działa konwersja sigma-delta i czemu filtry antyaliasingowe są tak ważne – w sposób zrozumiały, ale bez upraszczania techniki.


    1. Podstawy: sampling, kwantyzacja i konwersja

    Żeby zapisać dźwięk w formie cyfrowej, trzeba wykonać trzy kroki:

    1. Próbkowanie (sampling) – system mierzy poziom sygnału co określony czas (np. 48 000 razy na sekundę).
    2. Kwantyzacja – każda próbka zostaje zaokrąglona do najbliższego dostępnego poziomu (np. jednego z 65 536 poziomów w systemie 16-bitowym).
    3. Konwersja – wartości te są zapisywane jako liczby binarne.

    Najprostszy i najważniejszy system zapisu dźwięku to PCM – Pulse Code Modulation. To właśnie PCM jest fundamentem wszystkich standardów cyfrowych: CD-Audio, WAV, FLAC, AES/EBU, SPDIF itd.


    2. Jak dużo danych zajmuje dźwięk?

    Dla próbkowania 48 kHz i 16 bitów, przepływność wynosi:

    48000 próbek × 16 bitów = 768 000 bitów/s ≈ 768 kb/s (mono)

    Po dodaniu danych synchronizacyjnych, korekcji błędów i kodowania kanałowego, wartość ta rośnie do ok. 1 Mb/s na kanał.

    Celem systemów cyfrowych jest jak najwierniejsze odwzorowanie sygnału przy optymalnym użyciu miejsca i przepustowości.


    3. Problem aliasingu i konieczność filtrów antyaliasingowych

    Każdy sygnał zawierający częstotliwości wyższe niż połowa częstotliwości próbkowania (tzw. częstotliwość Nyquista) powoduje aliasing – słyszalne zniekształcenia.

    Dlatego przed próbkowaniem dźwięk musi zostać odfiltrowany. Filtr wejściowy to tzw. anti-aliasing filter – filtr dolnoprzepustowy.

    Dla próbkowania 48 kHz:

    • pasmo użyteczne: 0–22 kHz
    • martwa strefa ochronna: ok. 2 kHz
    • powyżej 24 kHz wszystko musi zostać odcięte

    Wczesne systemy używały analogowych filtrów „brick-wall”, które mocno degradowały dźwięk (ripple, przesunięcia fazowe). Rozwiązaniem stało się:

    • oversampling (nadpróbkowanie),
    • łagodny filtr analogowy,
    • precyzyjna filtracja cyfrowa wewnątrz konwertera.

    Tak działają dzisiejsze przetworniki AD/DA.


    4. Sample & Hold – ukryty bohater konwersji

    Zanim próbka zostanie zmierzona, konwerter musi zamrozić jej wartość. Do tego służy układ Sample & Hold (S/H): kondensator przechowuje chwilowe napięcie.

    S/H musi:

    • próbować sygnał w precyzyjnych odstępach czasu,
    • utrzymać napięcie bez „opadania” (droop),
    • działać szybciej niż trwa konwersja próbki.

    Największym wrogiem jest jitter, czyli niestabilność zegara próbkowania.


    5. Dlaczego dithering jest konieczny?

    Kwantyzacja = zaokrąglanie sygnału → powoduje zniekształcenia nieliniowe (trzaski, szorstkość, modulacje zniekształceń).

    Rozwiązaniem jest dither – celowo dodawany, bardzo cichy szum, który:

    • zamienia zniekształcenia nieliniowe w szum liniowy,
    • umożliwia zapis sygnałów ciszej niż 1 LSB (!),
    • sprawia, że zmniejszenie bitowości (np. z 24→16 bitów) nie wprowadza zniekształceń.

    Dither to nie „pogorszenie sygnału”, tylko niezbędna część cyfrowego audio.


    6. AD Converter – serce systemu

    Konwerter analogowo-cyfrowy (ADC) zamienia napięcie na liczby. Mimo że producenci reklamują „24 bity”, rzeczywista użyteczna rozdzielczość wynosi:

    • ok. 19–20 bitów w profesjonalnym sprzęcie,
    • 16–18 bitów w urządzeniach konsumenckich.

    Prawdziwe 24 bity wymagałyby szumu własnego poniżej –145 dBFS, czyli 0,1 µV RMS – to poziom szumu termicznego rezystora. Dziś nieosiągalne.


    7. Konwertery SAR a sigma-delta

    SAR (Successive Approximation Register) – klasyczna metoda krokowego dopasowania wartości.

    Zalety:

    • dobra liniowość
    • stosowane w aparaturze pomiarowej

    Wady:

    • trudność osiągnięcia >18 bitów
    • konieczność stromych filtrów analogowych

    Sigma-Delta (ΔΣ) – dominująca technologia w audio.

    Działa poprzez:

    1. bardzo wysokie próbkowanie (np. 64×44,1 kHz),
    2. kwantyzację do 1 bitu,
    3. noise shaping – przeniesienie szumu powyżej pasma słyszalnego,
    4. cyfrową filtrację dolnoprzepustową.

    Zalety:

    • bardzo niski poziom szumu w słyszalnym paśmie
    • mniejsze wymagania wobec filtrów analogowych
    • niższe koszty

    Dlatego wszystkie współczesne przetworniki audio są sigma-delta.


    8. Jitter – wróg numer jeden precyzji

    Jitter to nieregularność zegara próbkowania.

    • losowy jitter → zwiększa szum,
    • okresowy jitter → dodaje zniekształcenia i sygnały lustrzane.

    Stąd nacisk na:

    • zegary kwarcowe,
    • reklockowanie,
    • układy PLL i ASRC.

    Uwaga: niski jitter zegara wejściowego nie gwarantuje jakości, jeśli sam układ ADC/DA jest słaby.


    9. Co dzieje się z sygnałem po konwersji?

    Kiedy mamy już dane PCM, system wykonuje:

    • interleaving – rozrzucanie danych, żeby uszkodzenia były rozproszone,
    • korekcję błędów (Reed-Solomon, CIRC, LDPC),
    • multiplexing – łączenie wielu kanałów w jeden strumień,
    • kodowanie kanałowe – zamiana danych binarnych na sygnał możliwy do zapisania lub transmisji.

    Zapis cyfrowy nie przechowuje „zer i jedynek” jako prostych stanów logicznych. Najważniejsze są przejścia, czyli miejsca, gdzie sygnał zmienia stan. Dlatego stosuje się modulacje samosynchronizujące (np. EFM w CD, BMC w SPDIF).


    10. Dlaczego cyfrowe audio nie brzmi „zimno”, jeśli jest zrobione dobrze?

    Bo system PCM jest teoretycznie bezstratny – można idealnie odtworzyć sygnał, jeśli:

    • filtracja jest prawidłowa,
    • dithering został użyty poprawnie,
    • jitter jest na niskim poziomie,
    • konwerter ma odpowiedni zakres dynamiczny.

    Jeżeli cyfrowe audio brzmi źle – winna jest implementacja, nie sama idea.


    11. Najważniejsze fakty praktyczne

    • 24-bitowy plik NIE oznacza 24 bitów realnej dynamiki.
    • CD-Audio (16/44,1) ma zakres 96 dB – to i tak więcej niż dynamika muzyki popularnej (zwykle 8–12 dB).
    • Dithering jest obowiązkowy, a nie „opcjonalny”.
    • Oversampling i filtry cyfrowe są powodem, dla którego nowoczesne przetworniki brzmią dobrze.
    • Twierdzenie „cyfra jest zimna” wynika głównie z błędów w implementacjach lat 80/90.

    12. Podsumowanie

    Proces cyfrowej konwersji audio to precyzyjna operacja matematyczno-elektroniczna, nie „magia”. Wymaga:

    • filtracji sygnału,
    • precyzyjnego próbkowania,
    • właściwej kwantyzacji,
    • ditheringu,
    • korekcji błędów i kodowania transmisyjnego.

    Dzisiejsze konwertery sigma-delta w połączeniu z dobrym zegarem i prawidłowym ditheringiem pozwalają osiągnąć jakość przewyższającą wszelkie analogowe systemy zapisu pod względem dynamiki i zniekształceń – przy nieporównywalnej wygodzie obróbki.

    Wbrew mitom – cyfrowe audio nie jest ograniczeniem, lecz najbardziej precyzyjną formą zapisu dźwięku, jaką ludzkość stworzyła.