KWALIFIKACJA PGF4 + PGF5 - STYCZEŃ 2021 (test 2)

PYTANIE NR 4.
Którym skrótem oznaczana jest technologia pozyskiwania tekstu edytowalnego w oparciu o zeskanowany dokument lub bitmapę?
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
OCR (Optical Character Recognition) to technologia automatycznego rozpoznawania znaków z obrazu (skanu lub bitmapy) i zamiany ich na tekst możliwy do edycji. Pozostałe skróty dotyczą innych obszarów (np. ICC – profile barwne), więc nie opisują pozyskiwania tekstu edytowalnego.

Pełne wyjaśnienie:

OCR to skrót od ang. Optical Character Recognition, czyli optycznego rozpoznawania znaków. Taka technologia analizuje obraz rastrowy (np. skan dokumentu lub bitmapę) i przekształca widoczne na nim litery w tekst edytowalny (np. do edytora tekstu lub jako "przeszukiwalny" PDF).

W praktyce w pracy technika fotografii i multimediów OCR jest używany m.in. do:

  • przygotowania materiałów archiwalnych do publikacji,
  • odzyskania treści z zeskanowanych wydruków,
  • tworzenia plików PDF, w których da się zaznaczać i wyszukiwać tekst.

Dlaczego pozostałe odpowiedzi są niepoprawne?

  • ICC – kojarzy się z zarządzaniem barwą (profile ICC) i dotyczy opisu/konwersji kolorów, a nie rozpoznawania liter.
  • CMS – to skrót wieloznaczny (np. system zarządzania treścią albo zarządzanie kolorem), ale nie oznacza technologii zamiany skanu na tekst edytowalny.
  • CTA – najczęściej odnosi się do "call to action" w marketingu; nie jest nazwą technologii rozpoznawania tekstu z obrazu.

Wskazówka egzaminacyjna: jeśli w treści pojawia się warunek "zeskanowany dokument/bitmapa" oraz "tekst edytowalny", praktycznie zawsze chodzi o rozpoznawanie znaków, czyli OCR.

Dodatkowe pytania

Dodatkowe pytania (FAQ):
OCR to technologia rozpoznawania znaków z obrazu (np. skanu) i zamiany ich na tekst edytowalny. W praktyce pozwala skopiować treść z zeskanowanej kartki, zrobić przeszukiwalny PDF i szybciej przygotować materiały do składu lub publikacji bez ręcznego przepisywania.
Program analizuje bitmapę: wykrywa linie tekstu, dzieli je na znaki i porównuje kształty liter z modelami (fontami/wzorami). Następnie zapisuje wynik jako tekst. Jakość zależy od rozdzielczości skanu, kontrastu, prostego ułożenia strony i czytelności kroju pisma.
Skan jest obrazem rastrowym: składa się z pikseli, a nie z "liter". Edytor tekstu nie rozumie pikseli jako znaków, dlatego nie da się ich normalnie zaznaczać i poprawiać. Dopiero OCR interpretuje kształty liter i tworzy warstwę tekstową, którą można edytować.
Najczęściej pomaga wyższa rozdzielczość (np. 300 dpi dla tekstu), dobre oświetlenie i kontrast, brak przekoszenia strony oraz ostrość. Warto też skanować w skali szarości lub czerni i bieli, usuwać tło/szum i dbać o równomierne podparcie kartki, by uniknąć zniekształceń.
Tak, większość współczesnych silników OCR obsługuje język polski, ale skuteczność zależy od jakości skanu i ustawionego języka rozpoznawania. Jeśli język jest błędnie dobrany, częściej pojawiają się pomyłki w znakach diakrytycznych, np. "l" zamiast "ł".
Typowe pomyłki to: mylenie "O/0", "l/1/I", błędne spacje, łamanie wyrazów na końcu wiersza oraz złe znaki diakrytyczne. Po OCR warto wykonać korektę: sprawdzić fragmenty o małym kontraście, użyć sprawdzania pisowni i porównać z oryginałem w kluczowych miejscach.
OCR dotyczy rozpoznawania tekstu z obrazu i tworzenia tekstu edytowalnego. Profile ICC dotyczą zarządzania barwą: opisują charakterystykę urządzeń (monitor, drukarka) i pomagają przewidywalnie konwertować kolory. To zupełnie inne zadania, choć oba mogą pojawić się w workflow DTP.
Tak, ale wynik zależy od jakości zdjęcia: ostrości, braku poruszenia, równomiernego światła i minimalnych zniekształceń perspektywy. Aplikacje często najpierw "prostują" kartkę i poprawiają kontrast, a dopiero potem uruchamiają OCR. Przy słabym świetle rośnie liczba błędów.
Gdy trzeba szybko odzyskać treść z papierowych materiałów: umów, opisów, notatek, starych książek, instrukcji lub podpisów do archiwów. OCR przyspiesza przygotowanie tekstu do składu i publikacji oraz umożliwia budowę cyfrowych archiwów, w których można wyszukiwać słowa.
Szukaj połączenia dwóch elementów w treści: źródło to skan/bitmapa oraz celem jest tekst edytowalny. To definicyjnie wskazuje na rozpoznawanie znaków. Jeśli odpowiedzi zawierają skróty związane z barwą, marketingiem lub systemami, to zwykle są dystraktorami.
info

Statystycznie 75% uczniów zna prawidłową odpowiedź. średnio łatwe

Eksperci podkreślają: "OCR (Optical Character Recognition) to technologia automatycznego rozpoznawania znaków z obrazu (skanu lub bitmapy) i zamiany ich na tekst możliwy do edycji."

Źródła:

  • Wikipedia: Optical character recognition — https://en.wikipedia.org/wiki/Optical_character_recognition (dostęp: 2026-02-18)
  • Adobe Acrobat Help: Scan and OCR — https://helpx.adobe.com/acrobat/using/scan-documents-to-pdf.html (dostęp: 2026-02-18)
  • ABBYY (glossary/knowledge base): OCR definition — https://www.abbyy.com/ocr/ (dostęp: 2026-02-18)

Materiały:

  • Dokumentacja programu Adobe Acrobat (funkcja rozpoznawania tekstu/OCR w skanach PDF)
  • Materiały producentów silników OCR (np. ABBYY) – słowniki pojęć i opisy działania
  • Podręczniki/kompendia z DTP i digitalizacji dokumentów (rozdziały o skanowaniu i OCR)

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego