Coraz częściej przechowujemy dokumenty w postaci cyfrowej. Studenci i uczniowie skanują różne materiały, ale to nie rozwiązuje problemu edycji pliku. Mamy co prawda dokument w komputerze, ale nie możemy z nim nic zrobić.
Skan to tylko graficzne przedstawienie pliku. Nic nie zmienia zapisanie go w pdf. – nadal pozostaje jedynie obrazem. Aby taki plik można było edytować, trzeba go albo przepisać, co trwa długo, albo skorzystać z oprogramowania OCR, które jedną stronę przetworzy w ciągu minuty.
Poza tym dzięki oprogramowaniu OCR w domowym archiwum komputerowym odnajdziemy każdy dokument, bo wyszukamy go według fraz i słów kluczowych.
OCR (Optical Character Recognition) to oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym. Oprócz samego tekstu identyfikuje także krój i wielkość czcionek, tabele, akapity i szpalty. Następnie zmienia je w postać cyfrową, czytelną dla urządzeń komputerowych.
Rozpoznany tekst może zostać wyeksportowany do pliku tekstowego Word, arkusza Excel lub zapisany w formacie pdf. (tzw. searchable pdf., czyli pdf. z możliwością przeszukiwania tekstowego).