Normalizacja w relacyjnych bazach danych ma na celu zmniejszenie redundancji oraz ograniczenie typowych problemów (anomalii) pojawiających się przy wstawianiu, aktualizacji i usuwaniu danych. W praktyce ocenia się, czy tabela spełnia kolejne postacie normalne, analizując klucze oraz zależności funkcyjne między atrybutami.
Dlaczego poprawne jest stwierdzenie "Tabela nie jest znormalizowana."
Taką odpowiedź wybiera się wtedy, gdy w przedstawionej tabeli da się zauważyć naruszenie co najmniej jednej z podstawowych zasad:
- 1NF: każda komórka powinna zawierać pojedynczą (atomową) wartość, bez list i powtarzających się grup w jednej kolumnie lub w wielu podobnych kolumnach.
- 2NF: jeżeli występuje klucz złożony, to każdy atrybut niekluczowy musi zależeć od całego klucza, a nie tylko od jego części (brak zależności częściowych).
- 3NF: atrybuty niekluczowe nie powinny zależeć od innych atrybutów niekluczowych (brak zależności przechodnich typu: klucz → A, A → B).
Jeśli tabela zawiera atrybuty opisujące różne byty naraz (np. dane klienta i dane zamówienia w jednym rekordzie) albo przechowuje informacje, które powinny być wydzielone do osobnych tabel, wówczas uznaje się, że nie jest poprawnie znormalizowana.
Dlaczego pozostałe stwierdzenia są błędne (w kontekście tabeli uznanej za nieznormalizowaną):
- "Tabela jest w pierwszej postaci normalnej." jest nieprawdziwe, gdy widać wartości nieatomowe lub powtarzające się grupy danych.
- "Tabela jest w drugiej postaci normalnej." odpada, gdy atrybuty zależą tylko od części klucza złożonego albo gdy nadal występują typowe redundancje związane z mieszaniem bytów.
- "Tabela jest w trzeciej postaci normalnej." jest najsilniejszym twierdzeniem: wymaga spełnienia 1NF i 2NF oraz braku zależności przechodnich; jakiekolwiek "opisowe" pola zależne od innych pól niekluczowych to częsta przyczyna niespełnienia 3NF.
Wskazówka egzaminacyjna: zacznij od znalezienia klucza (lub klucza złożonego), potem sprawdź, czy jakiekolwiek pole opisowe może zmieniać się niezależnie od klucza (to sygnał redundancji). Jeśli tak, zwykle potrzebna jest dekompozycja na 2–3 tabele z relacją i kluczami obcymi.