Kompresja stratna dźwięku (np. w popularnych kodekach) opiera się na założeniu, że nie każda informacja obecna w sygnale jest równie ważna dla percepcji słuchu. Celem nie jest idealne zachowanie przebiegu fali, lecz zachowanie wrażenia słuchowego przy mniejszej ilości danych.
Najważniejszym zjawiskiem psychoakustycznym wykorzystywanym w takim podejściu jest maskowanie słuchowe (zjawisko maskowania dźwięków). W praktyce oznacza to, że:
- silniejszy dźwięk może ograniczać słyszalność słabszego w pobliżu częstotliwości (maskowanie częstotliwościowe),
- głośne zdarzenie może utrudniać usłyszenie krótkich, cichszych zdarzeń tuż przed lub po nim (maskowanie czasowe).
Jeżeli pewne składowe sygnału zostaną zamaskowane, kodek może je zakodować mniej dokładnie albo pominąć, bo ich utrata będzie mało zauważalna. To właśnie mechanizm "oszczędzania bitów" bez proporcjonalnej utraty jakości odbieranej przez słuchacza.
Pozostałe propozycje nie opisują zjawiska psychoakustycznego wykorzystywanego do redukcji danych:
- Dodanie dodatkowych harmonicznych to rodzaj nieliniowego przetwarzania/brzmieniowego wzbogacania (może być elementem efektu lub zniekształcenia), ale nie jest podstawą kompresji stratnej.
- Fizjologiczna korekta głośności kojarzy się z korekcją zależną od krzywych jednakowej głośności (percepcja głośności), jednak samo "korygowanie głośności" nie jest typową zasadą stratnego kodowania; kodeki przede wszystkim modelują słyszalność i maskowanie, a nie "wyrównują" sygnał.
- Dodanie do sygnału oryginalnego sygnału opóźnionego opisuje efekt echa/chorusa lub filtr grzebieniowy, czyli obróbkę efektową. To nie jest mechanizm psychoakustyczny, tylko konkretne przekształcenie sygnału w dziedzinie czasu.
W kontekście realizacji nagłośnień warto pamiętać, że artefakty kompresji są zwykle bardziej słyszalne na transjentach i w wysokich częstotliwościach oraz przy wielokrotnej rekompresji. Dlatego najlepiej unikać kaskadowania stratnych formatów i pracować możliwie długo na materiałach bezstratnych.