Wariancja to klasyczna miara rozproszenia (zmienności) danych. Informuje, jak "rozrzucone" są obserwacje wokół wartości przeciętnej. Jej istotą jest porównanie każdej obserwacji ze średnią arytmetyczną i uśrednienie tych różnic po zastosowaniu kwadratu.
Dlaczego pojawia się kwadrat odchylenia? Ponieważ odchylenia od średniej mogą być dodatnie i ujemne. Gdyby je zwyczajnie zsumować, mogłyby się znosić i dać wynik bliski zeru mimo dużego zróżnicowania. Podniesienie do kwadratu sprawia, że wszystkie wkłady są nieujemne, a większe odchylenia są silniej "karane".
Poprawna definicja brzmi więc: wariancja to średnia kwadratów odchyleń poszczególnych wartości od średniej arytmetycznej (w zależności od ujęcia: dla populacji dzieli się przez liczbę elementów, a dla próby często stosuje się korektę z dzieleniem przez n−1, ale sens pojęcia pozostaje ten sam).
Pozostałe odpowiedzi opisują inne pojęcia:
- "Różnica między największą a najmniejszą wartością" to rozstęp – prosta miara zmienności, ale nie jest to wariancja.
- "Wartość dzieląca zbiór na dwie równe części" to mediana, czyli miara położenia (poziomu), a nie rozproszenia.
- "Najczęściej występująca wartość" to dominanta (moda), również miara położenia.
W praktyce ekonomicznej wariancja (i wynikające z niej odchylenie standardowe) jest używana m.in. do oceny wahań kosztów, przychodów, popytu czy ryzyka — im większa wariancja, tym większe rozproszenie danych wokół średniej.