KWALIFIKACJA AUD9 - CZERWIEC 2017

PYTANIE NR 16.
Algorytmy stratnej kompresji dźwięku wykorzystują zjawisko psychoakustyczne polegające na
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
Algorytmy kompresji stratnej usuwają te składowe sygnału, które i tak nie będą słyszalne dla człowieka. Kluczowe jest tu maskowanie słuchowe: silniejszy dźwięk (w danym paśmie lub czasie) potrafi "przykryć" słabszy, więc jego dokładne kodowanie nie jest potrzebne. Pozostałe odpowiedzi opisują efekty audio, nie psychoakustykę.

Pełne wyjaśnienie:

Kompresja stratna dźwięku (np. w popularnych kodekach) opiera się na założeniu, że nie każda informacja obecna w sygnale jest równie ważna dla percepcji słuchu. Celem nie jest idealne zachowanie przebiegu fali, lecz zachowanie wrażenia słuchowego przy mniejszej ilości danych.

Najważniejszym zjawiskiem psychoakustycznym wykorzystywanym w takim podejściu jest maskowanie słuchowe (zjawisko maskowania dźwięków). W praktyce oznacza to, że:

  • silniejszy dźwięk może ograniczać słyszalność słabszego w pobliżu częstotliwości (maskowanie częstotliwościowe),
  • głośne zdarzenie może utrudniać usłyszenie krótkich, cichszych zdarzeń tuż przed lub po nim (maskowanie czasowe).

Jeżeli pewne składowe sygnału zostaną zamaskowane, kodek może je zakodować mniej dokładnie albo pominąć, bo ich utrata będzie mało zauważalna. To właśnie mechanizm "oszczędzania bitów" bez proporcjonalnej utraty jakości odbieranej przez słuchacza.

Pozostałe propozycje nie opisują zjawiska psychoakustycznego wykorzystywanego do redukcji danych:

  • Dodanie dodatkowych harmonicznych to rodzaj nieliniowego przetwarzania/brzmieniowego wzbogacania (może być elementem efektu lub zniekształcenia), ale nie jest podstawą kompresji stratnej.
  • Fizjologiczna korekta głośności kojarzy się z korekcją zależną od krzywych jednakowej głośności (percepcja głośności), jednak samo "korygowanie głośności" nie jest typową zasadą stratnego kodowania; kodeki przede wszystkim modelują słyszalność i maskowanie, a nie "wyrównują" sygnał.
  • Dodanie do sygnału oryginalnego sygnału opóźnionego opisuje efekt echa/chorusa lub filtr grzebieniowy, czyli obróbkę efektową. To nie jest mechanizm psychoakustyczny, tylko konkretne przekształcenie sygnału w dziedzinie czasu.

W kontekście realizacji nagłośnień warto pamiętać, że artefakty kompresji są zwykle bardziej słyszalne na transjentach i w wysokich częstotliwościach oraz przy wielokrotnej rekompresji. Dlatego najlepiej unikać kaskadowania stratnych formatów i pracować możliwie długo na materiałach bezstratnych.

Dodatkowe pytania

Dodatkowe pytania (FAQ):
Maskowanie słuchowe to zjawisko, w którym silniejszy dźwięk utrudnia usłyszenie słabszego (w podobnym paśmie częstotliwości lub w bliskim czasie). Kodeki stratne wykorzystują to, aby mniej dokładnie kodować elementy, które i tak nie będą odebrane przez słuchacza.
Ponieważ celem jest zmniejszenie ilości danych bez wyraźnej utraty jakości percepcyjnej. Jeśli model psychoakustyczny przewiduje, że dana składowa zostanie zamaskowana, jej dokładne kodowanie nie poprawi odsłuchu, a tylko zwiększy bitrate.
Najczęściej wskazuje się maskowanie (częstotliwościowe i czasowe). To ono pozwala kodekom "ukryć" część błędów/uprościć zapis, bo słuch i tak ich nie wyłapie w obecności silniejszych dźwięków. Inne elementy to m.in. model progów słyszenia.
Nie w sensie podstawowej zasady działania. Dodawanie harmonicznych to typowe dla nieliniowych efektów (np. przester, saturacja) i zmienia barwę. Kompresja stratna zwykle nie "dodaje brzmienia", tylko ogranicza informację w sposób możliwie mało słyszalny.
Sygnał opóźniony dodany do oryginału to opis echa lub efektów modulacyjnych (np. flanger/chorus). To są techniki przetwarzania audio, a nie zjawiska psychoakustyczne wykorzystywane do oszczędzania danych w kodowaniu stratnym.
Najczęściej jako utrata szczegółów, "metaliczność", pogorszenie wysokich tonów lub zniekształcenia krótkich transjentów (np. stopa, werbel). Przy gęstym miksie maskowanie może je ukrywać, ale w solówkach i ciszy stają się bardziej zauważalne.
Gdy materiał będzie wielokrotnie przetwarzany i ponownie kodowany (kaskadowanie stratnych formatów), gdy potrzebujesz maksymalnej jakości do dalszej obróbki oraz gdy w materiale jest dużo transjentów. W takich sytuacjach lepiej bazować na plikach bezstratnych.
Najczęściej myli się "kompresję" danych z kompresją dynamiki oraz z efektami typu echo. Często też wybiera się odpowiedzi o harmonicznych, bo brzmią "audiofilowo". Klucz to rozpoznać, że pytanie dotyczy percepcji (maskowania), a nie efektów.
Kompresja stratna zmniejsza rozmiar pliku/strumienia przez usuwanie informacji mało słyszalnej. Kompresja dynamiki to proces studyjny/sceniczny, który zmienia relacje głośności w czasie (redukuje zakres dynamiki), ale nie jest metodą kodowania pliku.
Skup się na pojęciach: maskowanie, próg słyszenia, pasma krytyczne, transjenty i artefakty kompresji. Pomagają krótkie testy odsłuchowe (porównania bitrate). W pytaniach wybieraj odpowiedzi opisujące percepcję słuchu, a nie typowe efekty DSP.
info

To pytanie poprawnie rozwiązuje 46% zdających egzamin. trudne

W praktyce zawodowej kluczowe jest to, że algorytmy kompresji stratnej usuwają te składowe sygnału, które i tak nie będą słyszalne dla człowieka.

Źródła:

  • Wikipedia: Auditory masking — https://en.wikipedia.org/wiki/Auditory_masking (dostęp: 2026-02-27)
  • Wikipedia: Psychoacoustics — https://en.wikipedia.org/wiki/Psychoacoustics (dostęp: 2026-02-27)
  • Wikipedia: Audio data compression — https://en.wikipedia.org/wiki/Audio_data_compression (dostęp: 2026-02-27)

Materiały:

  • Materiały dydaktyczne z podstaw psychoakustyki (maskowanie częstotliwościowe i czasowe)
  • Wprowadzenie do kodowania audio (MP3/AAC) z opisem modeli percepcyjnych
  • Ćwiczenia odsłuchowe: porównanie plików PCM vs skompresowanych przy różnych bitrate

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego