KWALIFIKACJA INF2 + INF3 - CZERWIEC 2009

PYTANIE NR 19.
Znaczne zmniejszenie rozmiaru pliku typu MP3, w stosunku do pliku typu WAV wynika z zastosowania algorytmu
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
MP3 jest znacznie mniejsze od WAV głównie dzięki kompresji stratnej:
wykorzystuje model psychoakustyczny, który usuwa lub upraszcza dane mało istotne dla percepcji słuchu. WAV zwykle przechowuje nieskompresowane próbki PCM, więc wymaga dużo więcej miejsca na dysku.

Pełne wyjaśnienie:

Format WAV najczęściej zawiera dźwięk zapisany jako PCM, czyli w postaci kolejnych próbek sygnału (np. 44,1 kHz, 16 bit, stereo). Taki zapis jest bardzo "dosłowny" i z reguły nie usuwa informacji, więc pliki WAV są duże.

MP3 osiąga dużo mniejszy rozmiar przede wszystkim dzięki kompresji stratnej. Oznacza to, że w procesie kodowania część informacji jest trwale odrzucana lub kodowana z mniejszą precyzją. Kluczową ideą jest wykorzystanie właściwości ludzkiego słuchu (psychoakustyki): pewne składowe dźwięku mogą być słabiej słyszalne albo maskowane przez inne, głośniejsze składowe. W praktyce pozwala to znacząco zmniejszyć ilość danych przy akceptowalnym (dla wielu zastosowań) spadku jakości.

Dlaczego pozostałe odpowiedzi nie pasują jako główne wyjaśnienie "znacznego" zmniejszenia rozmiaru?

  • "Huffmana" – kodowanie Huffmana jest techniką kompresji bezstratnej i może występować jako element kodowania, ale samo w sobie zwykle nie tłumaczy tak dużej redukcji jak w MP3 względem PCM. Duży zysk daje przede wszystkim etap stratny (psychoakustyczny i kwantyzacja).
  • "kompresji bezstratnej" – kompresja bezstratna nie usuwa informacji, więc dla sygnałów audio PCM jej typowy stopień redukcji jest ograniczony i zwykle nie daje tak małych plików jak MP3 przy porównywalnym czasie nagrania.
  • "cosinusów" – transformacje oparte o funkcje cosinus (np. w analizie widmowej) są narzędziem przekształcenia reprezentacji sygnału, ale nie są równoznaczne z główną przyczyną dużej oszczędności miejsca. Kluczowy jest mechanizm stratnego ograniczania informacji zgodnie z percepcją.

Na egzaminie warto zapamiętać praktyczną zasadę: WAV = duże, bo zwykle PCM; MP3 = mniejsze, bo stratne. Jeśli w odpowiedziach pojawia się "stratna" i pytanie akcentuje "znaczne" zmniejszenie rozmiaru, to zwykle jest to właściwy trop.

Dodatkowe pytania

Dodatkowe pytania (FAQ):
Kompresja stratna usuwa część informacji z sygnału, aby zmniejszyć rozmiar pliku. W audio robi to tak, by straty były jak najmniej zauważalne: wykorzystuje cechy słuchu (maskowanie) i zapisuje mniej danych tam, gdzie ucho ma mniejszą wrażliwość.
MP3 zmniejsza rozmiar, bo stosuje stratne kodowanie: nie zapisuje "wszystkich" próbek z pełną dokładnością jak PCM w WAV. WAV jest często nieskompresowany (albo słabo), więc dla tego samego czasu nagrania zajmuje wielokrotnie więcej miejsca.
PCM to zapis dźwięku jako kolejnych wartości próbek amplitudy. W WAV zwykle przechowuje się właśnie taki bezpośredni zapis (np. 44,1 kHz i 16 bit). To daje wysoką jakość, ale też duży rozmiar pliku, bo danych jest bardzo dużo.
MP3 jest stratne, więc teoretycznie zawsze wprowadza jakieś różnice względem oryginału. W praktyce przy wyższym bitrate pogorszenie może być trudne do usłyszenia, ale przy niskim bitrate pojawiają się artefakty (szumy, "metaliczność", gorsze wysokie tony).
Kompresja bezstratna pozwala odzyskać identyczne dane jak przed kompresją (np. w typowych archiwach). Kompresja stratna usuwa część informacji na stałe, zyskując większą redukcję rozmiaru. W audio stratna często daje znacznie mniejsze pliki niż bezstratna.
Kodowanie Huffmana jest metodą bezstratną: zmienia sposób zapisu symboli na krótszy/dłuższy zależnie od częstości, ale nie usuwa informacji. Może być elementem większego procesu (np. w kodekach), jednak samo nie tłumaczy największych oszczędności jak etap stratny.
Transformacja zmienia reprezentację sygnału (np. z czasu na "składowe"), co ułatwia dalsze kodowanie. Sama transformacja nie musi jednak zmniejszać ilości informacji. Duży zysk rozmiaru w MP3 wynika głównie z decyzji o odrzuceniu/ograniczeniu danych zgodnie z psychoakustyką.
WAV jest korzystny, gdy liczy się maksymalna jakość i brak strat, np. przy nagraniach do dalszej obróbki, archiwizacji "master", pracy w DAW lub przy analizie sygnałów. MP3 jest lepsze do dystrybucji i oszczędności miejsca, gdy akceptujesz straty.
Jeśli pytanie mówi o "znacznym zmniejszeniu rozmiaru" pliku audio (szczególnie MP3 vs WAV/PCM), najczęściej chodzi o kompresję stratną. Warto też kojarzyć słowa: psychoakustyka, maskowanie, bitrate, kodek – to typowe tropy dla MP3.
Częsty błąd to wybór "kompresji bezstratnej", bo brzmi profesjonalnie, mimo że nie daje zwykle tak dużej redukcji. Inny błąd to wskazanie nazw algorytmów pomocniczych (np. Huffman) zamiast kluczowej idei stratności i psychoakustyki, która odpowiada za główny zysk.
info

Około 62% zdających odpowiada poprawnie na to pytanie. średnie

Według specjalistów z branży: "MP3 jest znacznie mniejsze od WAV głównie dzięki kompresji stratnej:wykorzystuje model psychoakustyczny, który usuwa lub upraszcza dane mało istotne dla percepcji słuchu."

Źródła:

  • ISO/IEC 11172-3:1993, Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s — Part 3: Audio (MPEG-1 Audio, podstawy warstw i kodowania audio)
  • Microsoft, "Multimedia Programming Interface and Data Specifications 1.0" / opis RIFF WAVE (WAV/PCM), https://www.mmsp.ece.mcgill.ca/Documents/AudioFormats/WAVE/WAVE.html (dostęp: 2026-02-28)
  • Fraunhofer IIS, "MP3 (MPEG Audio Layer III)" – opis idei stratnej kompresji i zastosowań, https://www.iis.fraunhofer.de/en/ff/amm/consumer-electronics/mp3.html (dostęp: 2026-02-28)

Materiały:

  • Dokumentacja/opracowania o standardach MPEG-1/2 Audio Layer III (MP3)
  • Opis formatu WAV/RIFF i PCM
  • Materiały o podstawach psychoakustyki w kompresji dźwięku

Aktualizacja pytania: 03.04.2026



Aktualizacja pytania: 03.04.2026
📡 Brak połączenia internetowego