KWALIFIKACJA PGF4 + PGF5 - STYCZEŃ 2020

PYTANIE NR 20.
Oprogramowanie służące do rozpoznawania znaków w zeskanowanym dokumencie określa się akronimem
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
OCR to powszechnie używany akronim od Optical Character Recognition, czyli optycznego rozpoznawania znaków. Oprogramowanie OCR analizuje obraz ze skanu i zamienia go na edytowalny tekst, umożliwiając wyszukiwanie oraz kopiowanie treści. Pozostałe skróty nie oznaczają technologii rozpoznawania znaków.

Pełne wyjaśnienie:

Akronim OCR pochodzi od ang. Optical Character Recognition i oznacza technologię (oraz potocznie: oprogramowanie) służącą do optycznego rozpoznawania znaków w obrazie dokumentu. W praktyce jest to etap, w którym skan (czyli obraz rastrowy) jest analizowany, a następnie zamieniany na tekst możliwy do edycji lub co najmniej na warstwę tekstową w pliku (np. w PDF), co ułatwia wyszukiwanie fraz i kopiowanie treści.

W poligrafii i obszarze prepress/DTP OCR bywa wykorzystywany, gdy materiał źródłowy istnieje tylko na papierze (np. stare wydruki, formularze, instrukcje). Zamiast przepisywać treść ręcznie, wykonuje się skan i uruchamia OCR, a potem przeprowadza korektę błędów rozpoznania (np. liter podobnych kształtem, znaków diakrytycznych, podziałów wyrazów z łamania wierszy).

Dlaczego pozostałe odpowiedzi są błędne?

  • SCT – nie jest standardowym skrótem oznaczającym rozpoznawanie znaków w zeskanowanym dokumencie; wybór tej opcji zwykle wynika z mylenia przypadkowych akronimów.
  • STL – skrót kojarzony jest w informatyce z innymi obszarami (np. formatami/strukturami danych), ale nie opisuje technologii rozpoznawania tekstu ze skanów.
  • CMS – najczęściej odnosi się do systemów zarządzania treścią lub (w innych kontekstach) zarządzania kolorem; nie jest to termin definiujący rozpoznawanie znaków.

Wskazówka egzaminacyjna: jeśli w treści pytania pojawia się "rozpoznawanie znaków" i "zeskanowany dokument", najbardziej typowym i utrwalonym skrótem jest właśnie OCR.

Dodatkowe pytania

Dodatkowe pytania (FAQ):
OCR to optyczne rozpoznawanie znaków (Optical Character Recognition). Służy do zamiany obrazu skanu na tekst, który można przeszukiwać, kopiować i często także edytować. Jest to kluczowe przy digitalizacji archiwów i pracy z materiałami papierowymi.
Najpierw skan tworzy obraz (piksele). Następnie OCR wykrywa układ strony, rozpoznaje kształty liter, dopasowuje je do znaków i tworzy wynikowy tekst. Na końcu zwykle potrzebna jest korekta, bo błędy mogą wynikać z jakości skanu, czcionki i zabrudzeń.
Błędy biorą się z niskiej rozdzielczości, poruszenia skanu, słabego kontrastu, tła z fakturą, nietypowych fontów oraz zniekształceń papieru. Polskie znaki (ą, ę, ł, ń) bywają mylone, gdy diakrytyki są słabo widoczne albo "zlewają się" z tłem.
Często tak, ale nie zawsze idealnie. OCR może utworzyć tekst edytowalny (np. w DOCX) lub tylko warstwę tekstową w PDF. Jakość edycji zależy od ustawień, języka rozpoznawania i jakości skanu; po OCR zwykle wykonuje się korektę i formatowanie.
Pomaga wysoka czytelność: odpowiednia rozdzielczość, dobry kontrast, proste ułożenie kartki, brak cieni od zagięć i czyste tło. Ważne jest też skanowanie bez przechyłu oraz unikanie zbyt agresywnej kompresji, która rozmywa krawędzie liter.
Najczęściej wtedy, gdy treść ma zostać ponownie złożona, a źródło jest tylko na papierze (stare wydruki, formularze, instrukcje). OCR oszczędza czas przepisywania, ale wymaga sprawdzenia poprawności tekstu przed składem i przygotowaniem do druku.
Jeśli PDF jest tylko obrazem, bez warstwy tekstowej, wyszukiwanie i kopiowanie nie będzie działać poprawnie. OCR dodaje warstwę tekstową albo tworzy dokument tekstowy. Dzięki temu można szybko znaleźć frazy, zrobić korektę i użyć treści w składzie.
OCR dotyczy rozpoznawania tekstu z obrazu i konwersji skanu na znaki. CMS to zwykle system zarządzania treścią (lub w innych obszarach – zarządzania kolorem), czyli narzędzie do gromadzenia i publikowania materiałów. To inne zadania w workflow.
Najczęściej myli się akronimy i wybiera skrót, który "brzmi technicznie". Inny błąd to kojarzenie skanów wyłącznie z grafiką i pomijanie, że OCR dotyczy tekstu. Pomaga zapamiętać, że w nazwie jest "Character Recognition", czyli rozpoznawanie znaków.
Warto przećwiczyć pełny proces: skan strony, uruchomienie OCR, eksport do tekstu i ręczna korekta. Dobrze też znać podstawowe skróty spotykane w prepress i digitalizacji. Na egzaminie szukaj słów-kluczy: "skan", "rozpoznawanie znaków", "tekst".
info

Statystycznie 80% uczniów zna prawidłową odpowiedź. średnio łatwe

W praktyce zawodowej kluczowe jest to, że oCR to powszechnie używany akronim od Optical Character Recognition, czyli optycznego rozpoznawania znaków.

Źródła:

  • Encyclopaedia Britannica, hasło "optical character recognition (OCR)" (definicja technologii) https://www.britannica.com/technology/optical-character-recognition (dostęp: 2026-02-18)
  • Wikipedia (en), "Optical character recognition" (opis pojęcia i zastosowań) https://en.wikipedia.org/wiki/Optical_character_recognition (dostęp: 2026-02-18)
  • Adobe Acrobat Help, opis funkcji OCR ("Recognize text in scanned documents") https://helpx.adobe.com/acrobat/using/ocr.html (dostęp: 2026-02-18)

Materiały:

  • Podręczniki i materiały szkolne z obszaru DTP/prepress dotyczące digitalizacji
  • Dokumentacja użytkownika programów OCR (np. instrukcje funkcji rozpoznawania tekstu w PDF)
  • Słowniki pojęć poligraficznych i DTP (hasła: skanowanie, digitalizacja, OCR)

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego