Správy o tom, ako sa z papierovej kancelárie stane výhradne digitálna sa roky nie a nie naplniť. Stále pracujeme s papierom, a to podľa IDC až v 80 % prípadov.

Avšak to neznamená, že by sme nepotrebovali digitalizovať. V drvivej väčšine potrebujete mať dáta v počítači. Multifunkčné zariadenia zvládnu skenovať v dávke, a to priamo do PDF. No len málo z nich spraví prehľadávateľné PDF. Teda také, ktorého text by sa dal vybrať a kopírovať alebo v ňom hľadať.

PDF formát je univerzálny a veľmi často sa používa nielen na webe, ale práve v kancelárii. Je to z toho dôvodu, že keď ho otvoríte, dokument v ňom bude vyzerať rovnako na hociktorom počítači a operačnom systéme. To o kancelárskych dokumentoch povedať nemôžete. No ak nemáte v počítači program na spracovanie PDF, ste nahratí. Sami to poznáte, partner alebo klient chce jednu stranu z nejakého dokumentu. Bežnými nástrojmi zadarmo ho nemáte ako vyrezať. Fotiť obrazovku displeja? V akej mierke sa vám tam dokument zmestí s celou stranou? Amaterizmus, ktorý si len ťažko môžete dovoliť.

Hlavné okno programu

Pracujeme s PDF

FineReader 14 je v tomto smere ťažký kaliber. Ten totiž podporuje okrem elementárnych vecí ako pridávanie komentárov, vytváranie prehľadávateľných PDF alebo konverzie aj priame úpravy. Skutočné úpravy v PDF dokumente, ako by ste pracovali s dokumentom vo Worde.

Konverzia je podporovaná z takmer každého dokumentu. Z aj do PDF. Ak máte teda wordovský dokument a potrebujete ho poslať niekomu inému na pozretie, FineReader spraví konverziu do PDF. Je to otázka niekoľkých sekúnd. Rovnako tak to platí aj v opačnom prípade. Dostali ste PDF a potrebujete z neho vytiahnuť text a upraviť. Odteraz to môžete spraviť priamo v programe alebo ho previesť do Wordu, kde sa vám možno pracuje o niečo lepšie. Nevadí, že PDF je vlastne zapuzdrený JPEG.

Program ho prevedie do správneho PDF formátu, aby sa dal extrahovať text. Má v sebe OCR technológiu, ktorá rozpoznáva znaky tak, ako sú „nakreslené“ a vytvára z nich ozajstné písmo. Podporovaných je viac ako 190 jazykov. Môžete si byť istí, že váš dokument bude rozpoznaný. Skenovacie jadro totiž podporuje viac jazykov naraz. Bežne máte slovenský dokument s anglickými výrazmi. A bude rozpoznaný správne. Pokojne pritom môžete ponechať program na úplnej automatike. Nech sám rozpozná v akom jazyku je dokument.

Vytvorenie novej úlohy

Toto nie je zásluha len novej verzie, výrobca roky vylepšuje svoju vlastnú OCR technológiu. Tú mimochodom používajú aj veľkí výrobcovia tlačiarní. Medzi ďalšie špecializácie patrí zachovanie formátovania. To znamená, že PDF dokument skonvertovaný do Wordu alebo Excelu, ak konverzujete tabuľky, bude mať doplnkové formátovacie značky. Ak ide o nadpis druhej úrovne, aj Word ho tak bude mať. Ak má tabuľka žlté zvýraznenie buniek, aj výsledná bunka v Exceli ju bude mať. Platí to aj pre obtekanie textu okolo obrázkov, hlavičky a pätky, poznámky pod čiarou atď.

Takto vyzerá kontrola rozpoznaného PDF

Editovanie PDF

Dôvod prečo si používatelia tento program nakoniec vyberú nie je zrejme ani tak obrovský počet podporovaných jazykov na OCR. Je to najmä práca s PDF a editovanie rozpoznaných dokumentov. Nebudeme tvrdiť, že je program neomylný. Najmä pri neštandardne vyzerajúcich písmenách, nízkej kvalite skenu alebo iných faktoroch, nemusí byť OCR rozpoznanie úplne bezchybné. Program označuje polia tak, ako ich rozpoznal. Potom je vidno, že dodržiava štruktúru blokov. Typicky by ste to videli pri konverzii napríklad zmluvy od operátora alebo nejakého úradného dokumentu.

Texty sú v zelených blokoch, obrázky červeným a tabuľky modré. To je na ľavej strane. Pravá strana už obsahuje editovateľný text. Všetky znaky, ktorými si OCR mechanizmus nebol istý, sú s tyrkysovým zvýraznením. Mnohokrát ide o správne rozpoznaný text. Program ho len pre istotu dáva do pozornosti. Text môžete ignorovať alebo ho označiť ako overený. To hlavne vtedy, keď vás čaká niekoľko desiatok strán a chcete ich skontrolovať aj neskôr. Stačí uložiť vašu prácu ako rozpracovaný projekt a môžete sa k nemu vrátiť neskôr.

Neznamená to však, že každá OCR konverzia vás bude zdržovať nejakým pohľadom na rozdelené okno editora textov. Konverzia môže prebiehať zrýchlene. Potom dostanete výsledok behom niekoľkých sekúnd a konverzia je u konca. Čas závisí od dĺžky a zložitosti dokumentu. V rámci tímovej spolupráce môžete PDF komentovať a schvaľovať či zamietať nové príspevky od rôznych osôb.

Corporate

Táto verzia podporuje tzv. Hot Folder. Vytvoríte si automatizované úlohy na spracovanie súborov, ktoré sa objavia v definovanom adresári. Napríklad môžete všetky DOC dokumenty uložené do špecifického sieťového adresára skonvertovať do PDF alebo iného formátu.

Novinkou je aj porovnávanie dokumentov. Pritom môžu byť v rôznych formátoch. Hodí sa to napríklad pri podpisovaní zmlúv. Chcete vedieť, či sa vám vytlačený a jednou stranou podpísaný originál vrátil tak, ako bol pôvodne v PDF? Stačí ho naskenovať a nechať rozpoznať a následne porovnať. Na porovnávanie je podporovaných 35 jazykov, medzi nimi aj slovenčina.

Elektronická kniha

Poznáte dnešné „e-booky“, čiže len bežné PDF? Na internete ich je veľa a ak nemáte dostatočne veľký tablet, neprečítate si ich. Program podporuje konverziu aj do skutočných e-book formátov, napríklad EPUB. Pre nás je to jedna z kľúčových funkcií. Takto sme si poradili s knihou Insomnia, ktorú slovenská autorka vydala ako e-book, ale bohužiaľ v bežnom formáte PDF. Vďaka tejto konverzii sme ju mohli začať čítať na smartfóne a v čítačke elektronických kníh. Podobných príkladov by bolo viac.

Verdikt

Pokryť všetky funkcie programu ABBYY FineReader 14 by vydalo za oveľa väčší materiál. Načrtli sme jeho základné aj pokročilé možnosti a celkovú podstatu programu. V digitálnej kancelárii by takýto nástroj nemal chýbať. Výrazne vám uľahčí život a získate nové možnosti na prácu s obsahom, digitalizáciou alebo hoci len rapídne zrýchlenie bežných úloh.

Hodnotenie:

+ praktické funkcie, nástroj pre každú kanceláriu, presnosť rozpoznávania, počet podporovaných jazykov, tímové funkcie na prácu s PDF, priama úprava PDF
– žiadne dôležité

Viac info: www.sk.abbyy.com
Cena: 199 EUR / Standard alebo 299 EUR / Corporate

Tento článok vyšiel aj v tlačenom marcovom vydaní TOUCHIT č. 3/2017, preto sa niektoré skutočnosti uvedené v článku, môžu odlišovať oproti aktuálnemu dátumu publikovania.

Značky:

Michal Reiter

Michal Reiter
Publikujem o dianí na internete, súkromí, bezpečnosti a testujem notebooky, smartfóny, audio produkty a ďalšie gadgety.

Máte pripomienku alebo otázku k článku? Napíšte nám na redakcia@touchit.sk alebo priamo autorovi článku. Ďakujeme.