Format WAV najczęściej zawiera dźwięk zapisany jako PCM, czyli w postaci kolejnych próbek sygnału (np. 44,1 kHz, 16 bit, stereo). Taki zapis jest bardzo "dosłowny" i z reguły nie usuwa informacji, więc pliki WAV są duże.
MP3 osiąga dużo mniejszy rozmiar przede wszystkim dzięki kompresji stratnej. Oznacza to, że w procesie kodowania część informacji jest trwale odrzucana lub kodowana z mniejszą precyzją. Kluczową ideą jest wykorzystanie właściwości ludzkiego słuchu (psychoakustyki): pewne składowe dźwięku mogą być słabiej słyszalne albo maskowane przez inne, głośniejsze składowe. W praktyce pozwala to znacząco zmniejszyć ilość danych przy akceptowalnym (dla wielu zastosowań) spadku jakości.
Dlaczego pozostałe odpowiedzi nie pasują jako główne wyjaśnienie "znacznego" zmniejszenia rozmiaru?
- "Huffmana" – kodowanie Huffmana jest techniką kompresji bezstratnej i może występować jako element kodowania, ale samo w sobie zwykle nie tłumaczy tak dużej redukcji jak w MP3 względem PCM. Duży zysk daje przede wszystkim etap stratny (psychoakustyczny i kwantyzacja).
- "kompresji bezstratnej" – kompresja bezstratna nie usuwa informacji, więc dla sygnałów audio PCM jej typowy stopień redukcji jest ograniczony i zwykle nie daje tak małych plików jak MP3 przy porównywalnym czasie nagrania.
- "cosinusów" – transformacje oparte o funkcje cosinus (np. w analizie widmowej) są narzędziem przekształcenia reprezentacji sygnału, ale nie są równoznaczne z główną przyczyną dużej oszczędności miejsca. Kluczowy jest mechanizm stratnego ograniczania informacji zgodnie z percepcją.
Na egzaminie warto zapamiętać praktyczną zasadę: WAV = duże, bo zwykle PCM; MP3 = mniejsze, bo stratne. Jeśli w odpowiedziach pojawia się "stratna" i pytanie akcentuje "znaczne" zmniejszenie rozmiaru, to zwykle jest to właściwy trop.