KWALIFIKACJA EKA6 - TEST WIEDZY NR 1

PYTANIE NR 5.
Przygotowujesz dokumenty do optycznego rozpoznawania znaków (OCR). W jakiej kolejności powinieneś wykonać poniższe kroki?
A)Konfiguracja metody przetwarzania obrazu
B)Skalowanie obrazu
C)Usunięcie szumów z obrazu
D)Segmentacja obrazu
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
Prawidłowa kolejność przygotowania obrazu do rozpoznawania tekstu zwykle zaczyna się od skalowania (ujednolicenie rozmiaru/rozdzielczości), następnie wykonuje się odszumianie, aby poprawić czytelność znaków. Dopiero na oczyszczonym obrazie sensownie przeprowadza się segmentację, a na końcu dobiera i ustawia metodę przetwarzania pod OCR.

Pełne wyjaśnienie:

W przygotowaniu dokumentów do optycznego rozpoznawania znaków kluczowe jest wykonanie kroków w takiej kolejności, aby każdy etap "ułatwiał" kolejny. Sekwencja skalowanie → usunięcie szumów → segmentacja → konfiguracja metody przetwarzania jest typowa, bo odpowiada logice standaryzacji i poprawy jakości danych wejściowych.

Skalowanie obrazu (normalizacja rozmiaru) wykonuje się na początku, aby ujednolicić dokumenty (np. różne DPI, różne wielkości stron/wycinków). Zbyt mała skala utrudnia rozróżnienie detali liter, a zbyt duża może wzmacniać artefakty — dlatego warto najpierw ustalić sensowny rozmiar wejścia.

Usunięcie szumów z obrazu jest kolejnym krokiem, bo szum (ziarnistość, artefakty kompresji, zabrudzenia, drobne kropki) może zostać błędnie uznany za element znaku lub tła, co obniża trafność rozpoznawania. Odszumianie przed segmentacją zmniejsza ryzyko "pocięcia" tekstu na przypadkowe fragmenty.

Segmentacja obrazu (wydzielanie obszarów tekstu, wierszy lub znaków) najlepiej działa na obrazie możliwie czystym i o ustalonym rozmiarze. Jeśli segmentację wykona się zbyt wcześnie, szum i niestabilna skala powodują błędne granice segmentów (np. łączenie sąsiednich znaków lub rozrywanie jednego znaku).

Konfiguracja metody przetwarzania obrazu (dobór i ustawienie podejścia, np. sposobu progowania/binarizacji, parametrów filtrów, trybu rozpoznawania) sensownie jest wykonywać po przygotowaniu obrazu, ponieważ dopiero wtedy widać rzeczywistą jakość wejścia i można dobrać parametry do typu dokumentu (druk/odręczne pismo, tło, kontrast, krój pisma). W praktyce konfiguracja jest często iteracyjna, ale w pytaniu chodzi o logiczną kolejność głównych kroków.

  • Odpowiedź zaczynająca od "konfiguracji metody" jest myląca, bo bez wstępnego ujednolicenia i oczyszczenia trudno dobrać właściwe parametry.
  • Układ, w którym segmentacja jest przed odszumianiem, zwiększa ryzyko błędnego wydzielania obszarów tekstu przez artefakty.
  • Warianty mieszające skalowanie z innymi krokami bez logiki standaryzacji zwykle pogarszają powtarzalność wyników OCR.

Wskazówka egzaminacyjna: zapamiętaj zasadę "najpierw ujednolić, potem oczyścić, potem podzielić, na końcu ustawić metodę".

Dodatkowe pytania

Dodatkowe pytania (FAQ):
Optyczne rozpoznawanie znaków to technika zamiany obrazu tekstu (np. skanu) na edytowalny tekst. W pracy biurowej używa się jej do szybkiego przeszukiwania dokumentów, kopiowania danych z faktur/umów oraz automatycznego wprowadzania informacji do systemów obiegu dokumentów.
Najczęściej kluczowe są: odpowiednia rozdzielczość, równy kontrast i brak poruszenia skanu. Zbyt niska rozdzielczość zlewa litery, a zbyt wysoka może uwidocznić zabrudzenia. Warto też unikać silnej kompresji, bo generuje artefakty utrudniające odczyt.
Skalowanie na początku ujednolica dokumenty do przewidywalnego rozmiaru i "gęstości" znaków. Dzięki temu kolejne kroki (np. odszumianie i segmentacja) działają stabilniej, a parametry przetwarzania można dobierać do stałych warunków zamiast do przypadkowej wielkości skanu.
Usunięcie szumów to redukcja drobnych zakłóceń: kropek, ziarnistości, smug czy artefaktów kompresji. Ogranicza sytuacje, w których program błędnie "widzi" kropki jako część liter lub myli tło z tekstem. Poprawia to rozpoznawanie cienkich czcionek i cyfr.
Segmentacja polega na wydzieleniu obszarów, w których znajduje się tekst (np. bloki, wiersze, czasem pojedyncze znaki). To ułatwia silnikowi rozpoznawania analizę właściwych fragmentów dokumentu. W praktyce pomaga też pomijać tła, pieczęcie lub elementy graficzne.
Segmentacja bywa błędna, gdy obraz jest zaszumiony, ma niski kontrast albo nierówną geometrię (krzywo zeskanowana kartka). Zapobiega się temu przez wcześniejsze odszumianie, poprawę kontrastu oraz wyrównanie i skalowanie obrazu. Dopiero wtedy granice tekstu są bardziej jednoznaczne.
Typowe błędy to: skanowanie w zbyt niskiej jakości, pomijanie odszumiania, segmentacja na "brudnym" obrazie oraz ustawianie parametrów przetwarzania bez sprawdzenia próbek wyników. Często też myli się kolejność kroków, co pogarsza skuteczność rozpoznawania.
Nie zawsze. Jeśli skan jest bardzo dobrej jakości i ma powtarzalne parametry, część kroków może być minimalna lub wykonywana automatycznie. Jednak w środowisku biurowym dokumenty są często niejednorodne (różne urządzenia, różne wydruki), więc pełny zestaw kroków zwykle zwiększa stabilność wyników OCR.
Najprościej wykonać próbne rozpoznanie na kilku reprezentatywnych stronach i porównać błędy (np. pomyłki cyfr, polskich znaków, łączenie wyrazów). Dobra konfiguracja daje powtarzalne wyniki dla podobnych dokumentów. Warto też kontrolować, czy nie "znika" cienki tekst po filtracji.
Ucz się logiki procesu: ujednolić (skalowanie), oczyścić (odszumianie), wydzielić (segmentacja), a na końcu dostroić parametry przetwarzania. Ćwicz na skanach o różnej jakości i obserwuj, który etap najbardziej wpływa na liczbę błędów.
info

To pytanie poprawnie rozwiązuje 26% zdających egzamin. bardzo trudne

Według specjalistów z branży: "Dopiero na oczyszczonym obrazie sensownie przeprowadza się segmentację, a na końcu dobiera i ustawia metodę przetwarzania pod OCR."

Źródła:

  • Tesseract OCR GitHub Wiki: "ImproveQuality" (sekcja o preprocessingu: rozdzielczość, odszumianie, segmentacja) https://github.com/tesseract-ocr/tessdoc/blob/main/ImproveQuality.md - dostęp 2026-03-01
  • OpenCV Documentation: Image Processing (sekcje o filtracji/odszumianiu i operacjach przygotowania obrazu) https://docs.opencv.org/4.x/d7/dbd/tutorial_document_scanner.html - dostęp 2026-03-01
  • OpenCV Documentation: Smoothing Images (filtry, redukcja szumu) https://docs.opencv.org/4.x/d4/d13/tutorial_py_filtering.html - dostęp 2026-03-01

Materiały:

  • Dokumentacja narzędzi OCR (sekcje o poprawie jakości wejścia i preprocessingu)
  • Podstawowe materiały o przetwarzaniu obrazów (rozdziały: filtracja, odszumianie, segmentacja)
  • Instrukcje stanowiskowe dot. digitalizacji dokumentów (ustawienia skanera: DPI, tryb szarości, kontrast)

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego