OCR softvér

Spravidla platí, že pokiaľ ide o programy na rozpoznávanie naskenovaného textu (OCR, optické rozpoznávanie znakov), väčšina používateľov si pamätá jediný produkt - ABBYY FineReader, ktorý je nepochybne lídrom medzi takým softvérom v Rusku a jedným z lídrov na svete.

Napriek tomu nie je FineReader jediným riešením tohto druhu: existujú bezplatné programy na rozpoznávanie textu, on-line služby na rovnaké účely a navyše také funkcie sú prítomné v niektorých známych programoch, ktoré už môžu byť nainštalované v počítači , Pokúsim sa o tom napísať v tomto článku. Všetky uvedené programy pracujú vo Windows 7, 8 a XP.

Vedúci rozpoznávania textu - ABBYY Finereader

O programe FineReader (vyslovuje sa ako Fine Reader) ste počuli, pravdepodobne väčšina z vás. Tento program je najlepší alebo jeden z najlepších pre vysoko kvalitné rozpoznávanie textu v ruštine. Program je vyplatený a cena licencie na domáce použitie je o niečo nižšia ako 2000 rubľov. Je tiež možné stiahnuť skúšobnú verziu programu FineReader alebo použiť rozpoznávanie textov online v programe ABBYY Fine Reader Online (niekoľko strán je možné rozpoznať zadarmo a potom za poplatok). To všetko je k dispozícii na oficiálnych stránkach vývojára. http://www.abbyy.ru.

Inštalácia skúšobnej verzie programu FineReader nespôsobila žiadne problémy. Softvér sa môže integrovať do programov Microsoft Office a Windows Explorer, aby sa uľahčilo rozpoznanie. Z obmedzení bezplatnej skúšobnej verzie - 15 dní používania a schopnosť rozpoznať maximálne 50 stránok.

Screenshot pre testovanie programov na rozpoznávanie

Keďže nemám skener, použil som snímku z nekvalitnej kamery telefónu, v ktorej som mierne upravil kontrast, aby som skontroloval. Kvalita nie je dobrá, uvidíme, kto to zvládne.

Menu FineReader

FineReader dokáže získať grafický obraz textu priamo zo skenera, z grafických súborov alebo z fotoaparátu. V mojom prípade stačilo otvoriť obrazový súbor. S výsledkom som bol spokojný - len pár chýb. Povedal som hneď, že je to najlepší výsledok všetkých testovaných programov pri práci s touto vzorkou - podobná kvalita rozpoznávania bola len na bezplatnej on-line službe Free Online OCR (ale v tejto recenzii hovoríme len o softvéri, nie o rozpoznávaní online).

Výsledok rozpoznávania textu v programe FineReader

Úprimne povedané, pre cyrilické texty, FineReader pravdepodobne nemá žiadnych konkurentov.Výhody programu sú nielen kvalita rozpoznávania textu, ale aj široká funkčnosť, podpora formátovania, kompetentný export do mnohých formátov vrátane Word docx, pdf a ďalších funkcií. Takže ak je úloha OCR niečím, s čím sa neustále stretávate, potom neľutujte relatívne malú sumu peňazí a vyplatí sa to: ušetríte obrovské množstvo času rýchlo získať kvalitný výsledok v programe FineReader. Mimochodom, nič neponúkam - skutočne si myslím, že tí, ktorí potrebujú rozpoznať viac ako tucet stránok, by mali myslieť na nákup takéhoto softvéru.

CuneiForm je program na rozpoznávanie voľného textu.

Podľa môjho názoru je druhým najpopulárnejším programom OCR v Rusku bezplatný CuneiForm, ktorý si môžete stiahnuť z oficiálnych webových stránok. http://cognitiveforms.ru/products/cuneiform/.

Inštalácia programu je tiež veľmi jednoduchá, nepokúša sa inštalovať žiadny softvér tretej strany (ako veľa slobodného softvéru). Rozhranie je stručné a jasné. V niektorých prípadoch je najjednoduchší spôsob používania sprievodcu, ktorý je prvým z ikon v ponuke.

So vzorkou, ktorú som použil vo FineReaderu, sa program nepodarilo zvládnuť, alebo presnejšie rozdelil niečo zle čitateľné a fragmenty slov.Druhý pokus bol vykonaný so snímkou ​​obrazovky textu z webu tohto programu, ktorý však musel byť zvýšený (potrebuje skenovanie s rozlíšením 200dpi a vyšším, nečíta sa obrazovky s šírkou písma 1-2 pixely). Tu sa to dobre darilo (časť textu nebola rozpoznaná, pretože sa vybral len ruský).

Rozpoznávanie textu CuneiForm

Môžeme teda predpokladať, že CuneiForm je niečo, čo by ste mali vyskúšať, najmä ak máte kvalitné skenované stránky a chcete ich rozpoznať zadarmo.

Microsoft OneNote - program, ktorý už máte

V balíku Microsoft Office začína s verziou 2007 a končiac s aktuálnym rokom 2013 existuje program na vytváranie poznámok - OneNote. Má aj funkcie rozpoznávania textu. Aby ste ju mohli použiť, jednoducho vložte skenovaný alebo iný textový obrázok do poznámky, kliknite naň pravým tlačidlom myši a použite kontextové menu. Poznamenávam, že predvolená hodnota pre rozpoznávanie je nastavená na angličtinu.

Rozpoznanie v programe Microsoft OneNote

Nemôžem povedať, že text je perfektne rozpoznaný, ale pokiaľ môžem povedať, je o niečo lepšie ako v CuneiForm.Plus, ako už bolo spomenuté, program je s veľkou pravdepodobnosťou už nainštalovaný na vašom počítači. Hoci je samozrejme jeho použitie v prípade potreby pracovať s veľkým množstvom naskenovaných dokumentov, je nepravdepodobné, že by bolo výhodné, skôr je vhodné na rýchle rozpoznanie vizitiek.

OmniPage Ultimate, OmniPage 18 - musí byť niečo veľmi cool

Neviem, aký je dobrý softvér na rozpoznávanie textu v programe OmniPage: neexistujú žiadne skúšobné verzie, nechcem ho niekde stiahnuť. Ale ak je jeho cena ospravedlnená a bude to stáť asi 5 000 rubľov vo verzii pre individuálne použitie a nie Ultimate, potom by to malo byť niečo pôsobivé. Stránka programu: http://www.nuance.com/for-individuals/by-product/omnipage/index.htm

OmniPage Software Cena

Ak si prečítate charakteristiky a recenzie vrátane publikácií v ruskom jazyku, všimli si, že OmniPage naozaj poskytuje vysoko kvalitné a presné rozpoznanie, a to aj v ruštine, je relatívne ľahké rozoberať nie najkvalitnejšie skenovanie a poskytuje súbor ďalších nástrojov. Z nevýhod nie je to najvhodnejšie, najmä pre začínajúceho používateľa rozhrania. Napriek tomu na západnom trhu je OmniPage priamym konkurentom spoločnosti FineReader a v hodnotení v anglickom jazyku bojujú presne medzi sebou, a preto si myslím, že program by mal byť hodný.

To nie sú všetky programy tohto typu, existujú aj rôzne možnosti pre malé bezplatné programy, ale pri ich experimentovaní som našiel dve hlavné nedostatky, ktoré sú pre ne charakteristické: chýbajúca podpora cyriliky alebo iný, nie veľmi užitočný softvér v inštalačnej zostave, a preto sa rozhodli, že o nich nezmieňam tu.