KWALIFIKACJA INF2 - WRZESIEŃ 2015

PYTANIE NR 19.
Dla zamiany zeskanowanego obrazu na tekst należy zastosować oprogramowanie wykorzystujące techniki
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
OCR to techniki optycznego rozpoznawania znaków, które analizują zeskanowany obraz (np. dokument) i zamieniają go na edytowalny tekst.
DTP dotyczy składu publikacji, DPI jest parametrem rozdzielczości skanowania, a OMR służy do rozpoznawania zaznaczeń (np. na testach), nie pełnego tekstu.

Pełne wyjaśnienie:

Zamiana zeskanowanego obrazu na tekst wymaga technologii, która potrafi rozpoznać znaki widoczne na obrazie (litery, cyfry, interpunkcję) i przekształcić je do postaci danych tekstowych. Do tego służy OCR (optyczne rozpoznawanie znaków). W praktyce OCR analizuje obraz rastrowy strony, wykrywa układ wierszy i znaków, a następnie przypisuje im odpowiednie symbole kodowe, tworząc tekst możliwy do kopiowania, wyszukiwania i edycji.

Pozostałe pojęcia są często mylone z OCR, bo również pojawiają się przy pracy z dokumentami, ale oznaczają coś innego:

  • DTP odnosi się do składu i przygotowania materiałów do publikacji (layout, typografia, łamanie tekstu). DTP pracuje na treści, która już jest tekstem lub elementami graficznymi, ale samo w sobie nie służy do rozpoznawania znaków z obrazu.
  • DPI to miara rozdzielczości (gęstości punktów) przy skanowaniu i druku. Wyższe DPI może poprawić jakość obrazu i pośrednio zwiększyć skuteczność OCR, ale DPI nie jest techniką zamiany obrazu na tekst — to parametr jakości wejścia.
  • OMR (rozpoznawanie znaków/znaczników) jest używane głównie do odczytu zaznaczeń w polach formularzy (np. kółka do zamalowania na arkuszach). OMR nie jest przeznaczone do pełnego odczytu tekstu z dokumentu.

W kontekście pracy technika informatyka warto pamiętać o typowym łańcuchu działań: skanowanie (pozyskanie obrazu) → dobór parametrów (np. DPI, kontrast) → OCR (rozpoznanie) → weryfikacja i korekta błędów (np. liter podobnych: O/0, l/1). Na egzaminie kluczowe jest rozróżnienie: OCR = rozpoznawanie tekstu, DPI = jakość/rozdzielczość obrazu, DTP = skład publikacji, OMR = odczyt zaznaczeń.

Dodatkowe pytania

Dodatkowe pytania (FAQ):
OCR to optyczne rozpoznawanie znaków: technika, która zamienia tekst widoczny na obrazie (skan, zdjęcie, PDF) na edytowalny tekst komputerowy. Umożliwia kopiowanie, wyszukiwanie w dokumencie oraz dalszą obróbkę treści w edytorze.
Proces zwykle obejmuje: wczytanie obrazu, poprawę jakości (kontrast, odszumianie), wykrycie układu strony, segmentację na wiersze i znaki, rozpoznanie znaków oraz zapis do formatu tekstowego (np. DOCX/TXT/PDF z warstwą tekstu).
DPI opisuje rozdzielczość skanu lub wydruku, czyli liczbę punktów na cal. To parametr jakości obrazu wejściowego. Może wpływać na skuteczność OCR, ale sam nie wykonuje rozpoznawania znaków i nie tworzy tekstu z obrazu.
DTP dotyczy składu publikacji (layout, łamanie tekstu, typografia). Programy DTP pracują na gotowej treści tekstowej i grafice, ale nie są przeznaczone do odczytywania liter z obrazu. Do "wyciągnięcia" tekstu ze skanu potrzebne jest OCR.
OMR służy do rozpoznawania zaznaczeń (np. zamalowanych pól na ankietach lub testach). OCR rozpoznaje znaki alfanumeryczne i całe słowa. OMR nie jest typowo używane do konwersji pełnych dokumentów tekstowych ze skanu.
Częste są pomyłki podobnych znaków (O/0, l/1, rn/m), błędy przy małej rozdzielczości, krzywym skanie, słabym kontraście lub przy nietypowych czcionkach. Dlatego po OCR zwykle wykonuje się korektę i weryfikację treści.
Gdy skan jest nieczytelny: ma małe litery, słabą jakość, rozmazanie albo drobny druk. Zbyt niskie DPI może powodować "zlewanie się" znaków. Zbyt wysokie DPI zwiększa rozmiar pliku, więc dobiera się je rozsądnie do rodzaju dokumentu.
Tak, wiele aplikacji i usług wykonuje OCR na zdjęciach. Kluczowe jest dobre oświetlenie, brak poruszenia, proste ujęcie (bez perspektywy) i wyraźny kontrast. Im lepsza jakość zdjęcia, tym mniej błędów rozpoznawania.
Najprościej spróbować zaznaczyć i skopiować fragment treści w czytniku PDF albo użyć wyszukiwania w dokumencie. Jeśli kopiowanie zwraca czytelny tekst, a wyszukiwarka znajduje słowa, dokument prawdopodobnie ma warstwę tekstu utworzoną przez OCR.
Utrwal różnice między OCR, DPI, DTP i OMR oraz przećwicz typowy proces: skan → ustawienia jakości → OCR → korekta. Na testach zwracaj uwagę na słowa kluczowe "zamiana obrazu na tekst", bo to bezpośrednio wskazuje na OCR.
info

To pytanie poprawnie rozwiązuje 79% zdających egzamin. średnio łatwe

Źródła:

  • Wikipedia (PL): "Optyczne rozpoznawanie znaków" – https://pl.wikipedia.org/wiki/Optyczne_rozpoznawanie_znak%C3%B3w (dostęp: 2026-02-27)
  • Wikipedia (PL): "DTP" – https://pl.wikipedia.org/wiki/Desktop_publishing (dostęp: 2026-02-27)
  • Wikipedia (PL): "Dots per inch" – https://pl.wikipedia.org/wiki/Dots_per_inch (dostęp: 2026-02-27)

Materiały:

  • Dokumentacja lub poradniki narzędzi OCR (np. moduły OCR w pakietach biurowych i czytnikach PDF)
  • Materiały o parametrach skanowania (DPI, formaty plików, kompresja) i ich wpływie na skuteczność OCR
  • Ćwiczenia praktyczne: skan → OCR → korekta błędów rozpoznawania

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego