KWALIFIKACJA INF10 - STYCZEŃ 2020

PYTANIE NR 24.
Aby rozpoznać znaki i cały tekst w pliku graficznym o postaci rastrowej, należy zastosować oprogramowanie typu
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
Aby odczytać znaki z obrazu rastrowego, potrzebne jest rozpoznawanie znaków, czyli OCR. Taki program analizuje piksele grafiki (np. skan lub zdjęcie) i zamienia je na tekst edytowalny oraz możliwy do odczytu przez technologie asystujące. Edytor PDF, interpreter PHP ani IRC nie wykonują rozpoznawania tekstu z obrazu.

Pełne wyjaśnienie:

Grafika rastrowa (np. skan, zrzut ekranu, zdjęcie) składa się z pikseli, a nie z "prawdziwych" znaków tekstowych. Dlatego czytnik ekranu nie odczyta takiej treści jako tekstu, dopóki nie zostanie ona zamieniona z obrazu na znaki.

Do tego służy oprogramowanie typu OCR (optyczne rozpoznawanie znaków). Program OCR analizuje kształty liter w obrazie, wykrywa linie i słowa, a następnie generuje wynik w postaci tekstu (np. do skopiowania, przeszukiwania lub dalszego przetwarzania). W kontekście pracy technika tyfloinformatyka jest to kluczowe narzędzie przy udostępnianiu skanów dokumentów osobom z niepełnosprawnością wzroku.

Dlaczego pozostałe odpowiedzi są błędne?

  • "edytor PDF" – edytuje lub przegląda pliki PDF, ale sam w sobie nie oznacza technologii rozpoznawania tekstu z obrazu. Nawet jeśli niektóre programy PDF mają funkcję OCR, to jest to właśnie moduł OCR, a nie "typ edytora" jako odpowiedź na pytanie o rozpoznawanie znaków.
  • "interpreter PHP" – uruchamia kod w języku PHP po stronie serwera; nie służy do analizy pikseli ani rozpoznawania liter w obrazie.
  • "IRC" – odnosi się do komunikacji czatowej/protokołu, nie ma związku z rozpoznawaniem tekstu z grafiki.

Wskazówka egzaminacyjna: jeżeli w treści pojawia się "plik graficzny", "skan", "zdjęcie" i "rozpoznanie znaków/tekstu", to niemal zawsze chodzi o OCR, czyli konwersję obrazu na tekst możliwy do dalszej obróbki i odczytu przez technologie asystujące.

Dodatkowe pytania

Dodatkowe pytania (FAQ):
OCR to optyczne rozpoznawanie znaków, czyli zamiana obrazu (skanu/zdjęcia) na tekst. W pracy tyfloinformatyka pozwala to przygotować materiał, który można przeszukiwać, kopiować i odczytać czytnikiem ekranu lub syntezatorem mowy.
Jeśli w PDF nie da się zaznaczyć tekstu kursorem lub skopiować go do schowka, to często oznacza, że dokument jest obrazem (skanem). Wtedy potrzebujesz OCR, aby "wydobyć" tekst i udostępnić go technologiom asystującym.
Czytnik ekranu odczytuje znaki zapisane jako tekst, a nie piksele. Obraz rastrowy zawiera tylko kolory punktów, więc dla programu to "grafika", nie litery. OCR zamienia piksele układające się w litery na prawdziwe znaki.
Najczęstsze błędy wynikają ze słabej jakości skanu, niskiej rozdzielczości, przekrzywienia kartki lub nietypowej czcionki. Pomaga prostowanie obrazu, poprawa kontrastu, skan w lepszej jakości oraz ręczna korekta wyniku po rozpoznaniu.
Sam "edytor PDF" nie jest równoznaczny z OCR. Niektóre programy do PDF mają wbudowaną funkcję OCR, ale kluczowa jest właśnie ta funkcja (rozpoznawanie znaków). Bez niej edytor PDF nie zamieni obrazu na tekst.
OCR stosuje się, gdy źródło jest obrazem: skany książek, wydruki, podpisane zdjęcia, zeskanowane umowy, instrukcje. Po OCR tekst można uporządkować i przekazać do czytnika ekranu, syntezatora mowy lub do dalszej konwersji.
OCR dotyczy obrazu i zamienia widoczne litery na tekst. Rozpoznawanie mowy działa na dźwięku i zamienia wypowiedź na tekst. Obie technologie "tworzą tekst", ale z zupełnie innych źródeł: grafiki vs nagrania audio.
Może działać, ale zwykle gorzej niż na skanie, bo zdjęcia mają cienie, perspektywę i nierówne oświetlenie. Najlepsze efekty daje zdjęcie prostopadłe do kartki, przy dobrym świetle i z wyraźnym kontrastem między tłem a tekstem.
Po OCR warto przejrzeć tekst pod kątem literówek, pomyłek w polskich znakach, podziałów wierszy i nagłówków. Dobrą praktyką jest też przetestowanie dokumentu czytnikiem ekranu oraz wyszukanie kilku słów, aby potwierdzić, że tekst jest "prawdziwy".
Zapamiętaj, że "tekst w obrazie/skanie" oznacza potrzebę OCR. Ćwicz rozpoznawanie sytuacji: skan PDF, zdjęcie dokumentu, grafika z tekstem. W pytaniach testowych odróżniaj OCR od narzędzi do edycji, programowania (np. PHP) i komunikacji (np. IRC).
info

To pytanie poprawnie rozwiązuje 82% zdających egzamin. średnio łatwe

Eksperci podkreślają: "Aby odczytać znaki z obrazu rastrowego, potrzebne jest rozpoznawanie znaków, czyli OCR."

Źródła:

  • Wikipedia (PL), "Optyczne rozpoznawanie znaków" (OCR) – https://pl.wikipedia.org/wiki/Optyczne_rozpoznawanie_znak%C3%B3w - dostęp 2026-03-02
  • Tesseract OCR Documentation, "User Manual" – https://tesseract-ocr.github.io/tessdoc/ - dostęp 2026-03-02
  • Adobe Acrobat Help, "Convert scanned documents to PDF / OCR scanned documents" – https://helpx.adobe.com/acrobat/using/scan-documents-pdf.html - dostęp 2026-03-02

Materiały:

  • Dokumentacja narzędzi OCR (np. instrukcje użytkownika i opisy funkcji rozpoznawania tekstu)
  • Materiały o dostępności cyfrowej: jak przygotować tekst możliwy do odczytu przez czytnik ekranu
  • Ćwiczenia praktyczne: skanowanie i OCR krótkich dokumentów oraz weryfikacja poprawności rozpoznania

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego