Proces eliminowania powtarzających się danych w relacyjnej bazie danych nazywa się normalizacją. Polega on na porządkowaniu schematu: dzieleniu dużych, "przeładowanych" tabel na mniejsze oraz ustalaniu poprawnych zależności między nimi tak, aby każdy fakt był zapisany możliwie w jednym miejscu.
Normalizacja jest opisywana kolejnymi postaciami normalnymi (m.in. 1NF, 2NF, 3NF). W praktyce bardzo często dąży się do 3NF, bo zwykle daje dobrą równowagę między porządkiem danych a złożonością zapytań.
Dlaczego to jest ważne? Nadmiarowe (zdublowane) dane sprzyjają błędom: jeśli ta sama informacja występuje w kilku miejscach, łatwo zaktualizować tylko jedno z nich i utracić spójność. Normalizacja ogranicza też anomalię wstawiania (problem z dopisaniem danych), anomalię modyfikacji (niespójne aktualizacje) oraz anomalię usuwania (utrata informacji "przy okazji" skasowania rekordu).
Odpowiedź "planowanie" jest zbyt ogólna i nie jest terminem opisującym formalny proces projektowania schematu tabel. Odpowiedź "redukcja" może kojarzyć się z ograniczaniem danych, ale w bazach danych nie oznacza konkretnego, zdefiniowanego procesu postaci normalnych. Odpowiedź "relacja" to podstawowe pojęcie modelu relacyjnego (tabela/związek), a nie nazwa procesu optymalizującego strukturę pod kątem redundancji.
Warto pamiętać też o praktycznym wyjątku: czasem stosuje się kontrolowaną denormalizację dla wydajności odczytu, ale jest to świadome odejście od zasad normalizacji, a nie jej zamiennik.