Rozpoznawanie tekstu w zeskanowanych bitmapach lub w plikach PDF opartych o obraz polega na analizie kształtów liter i zamianie ich na znaki tekstowe. Do tego służy OCR (Optical Character Recognition), czyli technologia/proces optycznego rozpoznawania znaków. Wynikiem OCR jest zwykle tekst, który można kopiować, wyszukiwać oraz (w zależności od jakości) edytować w edytorze tekstu lub w programach do pracy z PDF.
Odpowiedź "OCR" jest poprawna, ponieważ bez tej funkcji skan pozostaje jedynie obrazem: wygląda jak tekst, ale komputer nie "rozumie" liter jako znaków. OCR jest powszechnie używane w pracy technika fotografii i multimediów przy digitalizacji dokumentów, archiwizacji, przygotowaniu materiałów do składu oraz tworzeniu przeszukiwalnych PDF.
Pozostałe odpowiedzi nie pasują do definicji zadania:
- "RIP" (Raster Image Processor) to narzędzie/proces związany z przygotowaniem danych do druku (rastrowanie, separacje, interpretacja PostScript/PDF pod urządzenie drukujące). Nie służy do rozpoznawania liter ze skanu.
- "RAR" to format archiwum skompresowanego. Służy do pakowania plików, zmniejszania rozmiaru i przenoszenia danych, a nie do analizy obrazu i wydobywania tekstu.
- "ZIP" pełni analogiczną funkcję jak RAR: kompresja i archiwizacja plików. Może spakować PDF lub skany, ale nie zmieni obrazu w tekst.
Wskazówka egzaminacyjna: jeśli w treści pojawiają się słowa "rozpoznawanie tekstu", "skan", "obraz w PDF" albo "zamiana obrazu na edytowalny tekst", niemal zawsze chodzi o OCR.