Średnia arytmetyczna i mediana opisują "położenie" danych, ale reagują inaczej na wartości skrajne. Średnia uwzględnia każdą obserwację w równym stopniu, więc pojedyncze bardzo wysokie dochody mogą ją silnie podnieść. Mediana to wartość środkowa (50% obserwacji jest nie większe niż mediana), dlatego jest znacznie bardziej odporna na odstające.
Jeśli w danych miesięcznych mamy średnią 100 tys. zł, a medianę 50 tys. zł, to typowy obraz jest taki, że większość miesięcy przynosi dochody bliższe 50 tys. niż 100 tys., a podniesienie średniej wynika z kilku miesięcy o wyjątkowo dużych dochodach. Taki układ jest charakterystyczny dla rozkładu prawostronnie skośnego (długi "ogon" po stronie wysokich wartości).
Dlaczego poprawna jest odpowiedź "Większość miesięcy ma dochód poniżej średniej"? Skoro mediana wynosi 50 tys., to co najmniej połowa miesięcy ma dochód ≤ 50 tys. Jednocześnie średnia 100 tys. jest dużo wyższa, co sugeruje, że część miesięcy ma dochody znacznie powyżej 100 tys. i to one "ciągną" średnią w górę. W efekcie wiele (często większość) miesięcy będzie miało dochód mniejszy niż średnia.
Dlaczego pozostałe odpowiedzi są niepoprawne?
- "Dochody są równomiernie rozłożone" – przy rozkładzie równomiernym (bez wyraźnych ogonów) średnia i mediana są zwykle bliżej siebie; duża różnica wskazuje na nierównomierność i wpływ skrajnych wartości.
- "Większość miesięcy ma dochód powyżej średniej" – to sprzeczne z sytuacją, w której średnia jest zawyżona przez nieliczne wysokie obserwacje; wtedy raczej wiele miesięcy leży poniżej średniej.
- "Dochody są skoncentrowane wokół średniej" – koncentracja wokół średniej oznaczałaby, że typowe wartości krążą blisko 100 tys.; mediana 50 tys. temu przeczy i sugeruje, że środek rozkładu jest dużo niżej.
Wskazówka egzaminacyjna: zapamiętaj regułę: gdy średnia > mediana, często mamy prawostronną skośność (kilka dużych wartości). Gdy średnia < mediana, bywa odwrotnie (kilka bardzo niskich wartości zaniża średnią).