OCR (Optical Character Recognition) to technologia, która analizuje obraz (np. skan dokumentu) i rozpoznaje na nim znaki, a następnie tworzy z nich tekst w postaci możliwej do przeszukiwania, kopiowania lub dalszego przetwarzania. W praktyce oznacza to, że plik będący pierwotnie grafiką (np. JPG, TIFF albo "PDF-obraz") może zyskać warstwę tekstową.
Dlatego odpowiedź "rozpoznawanie tekstu w pliku graficznym" najlepiej opisuje istotę OCR: wejściem jest obraz, a wynikiem jest rozpoznany tekst (często wraz z informacją o położeniu znaków na stronie).
Pozostałe propozycje dotyczą innych, typowych funkcji systemów skanowania:
- "Skanowanie wprost do systemu HIS" opisuje integrację i kierowanie plików do systemu informatycznego, a nie rozpoznawanie znaków. OCR może być użyte w takim procesie, ale nie jest tym samym co wysyłka dokumentu do HIS.
- "Pomijanie białych stron" to funkcja optymalizacji skanowania/plików (oszczędność miejsca i czasu), polegająca na wykrywaniu pustych stron. Nie tworzy tekstu z obrazu.
- "Skanowanie obu stron w jednym przelocie" (dupleks) dotyczy konstrukcji i trybu pracy skanera. Usprawnia skanowanie, lecz nie rozpoznaje treści pisma.
Wskazówka egzaminacyjna: gdy w pytaniu pojawia się OCR, szukaj odpowiedzi związanej z "rozpoznawaniem znaków/tekstu", "warstwą tekstową", "wyszukiwaniem w skanie". Funkcje typu dupleks, usuwanie pustych stron czy eksport do systemu to odrębne elementy procesu digitalizacji.