Mediana to wartość środkowa w uporządkowanym szeregu danych: dzieli zbiór na dwie części tak, aby co najmniej połowa obserwacji była nie większa od mediany i co najmniej połowa nie mniejsza.
W tym zadaniu dane są podane w tabeli częstości (wartość kosztu + liczba przedsiębiorstw). Dlatego najpierw trzeba uwzględnić liczebności jako "wagi" i policzyć łączną liczbę obserwacji: N = 2 + 4 + 3 + 1 = 10.
Ponieważ N jest parzyste, mediana nie jest pojedynczą pozycją, tylko średnią arytmetyczną wartości na pozycjach N/2 oraz (N/2)+1, czyli na pozycjach 5. i 6.
Tworzymy więc szereg rozwinięty (uporządkowany rosnąco), powtarzając każdą wartość tyle razy, ile wynosi jej liczebność:
- 30 000 zł – 2 razy
- 40 000 zł – 4 razy
- 50 000 zł – 3 razy
- 60 000 zł – 1 raz
Szereg ma postać: 30k, 30k, 40k, 40k, 40k, 40k, 50k, 50k, 50k, 60k. Widzimy, że pozycje 5. i 6. nadal należą do bloku "40k". Zatem mediana = (40 000 + 40 000)/2 = 40 000 zł.
Dlaczego pozostałe odpowiedzi są błędne? "30 000 zł" to wartość zbyt niska (dotyczy tylko 2 obserwacji i nie leży w środku szeregu). "50 000 zł" pojawia się w szeregu, ale dopiero na pozycjach 7–9, więc jest powyżej środka. "60 000 zł" to skrajność (pozycja 10), a mediana nie jest wartością maksymalną. Typową pomyłką jest też liczenie średniej z czterech kwot bez uwzględnienia liczebności – w tym zadaniu liczy się 10 obserwacji, nie 4.