Kodeki mowy są niewidzialnym fundamentem współczesnej komunikacji. Bez nich nie działałaby telefonia komórkowa, VoIP, komunikatory internetowe, wideokonferencje – czyli wszystko, czego używamy każdego dnia, często nie zastanawiając się, jak to w ogóle możliwe, że kilka tysięcy bitów na sekundę potrafi przenieść pełną ludzką wypowiedź.
W przeciwieństwie do kodeków muzycznych, które starają się wiernie odtworzyć dowolny, złożony sygnał akustyczny, kodeki mowy mają przewagę: obsługują tylko jeden instrument – ludzki głos. To sprawia, że mogą zredukować ilość danych znacznie bardziej niż np. MP3, i to bez utraty zrozumiałości.
Poniżej znajdziesz przystępne wyjaśnienie tego, jak działa kodowanie mowy – od fizjologii głosu, przez modele źródło–filtr, aż po zaawansowane algorytmy takie jak LPC, CELP, VQ czy BWE.
(więcej…)