OCR приложения: разпознаване на текст, списъци, програмисти, тегло на програмата, изпълними функции, функции, функции и обратна връзка от потребителите.

Хартията като основен носител на информация постепенно губи значението си. Вместо хартиени документи използвайте електронната им версия, ако е възможно. Но как да преведем електронните архиви в съществуващите архиви? За да се реши този проблем, са създадени специални програми за разпознаване на текста.

Какво представляват OCR програмите и как работят

Тези софтуерни продукти, които използват ORC (оптично разпознаване на символи) или ICR (разпознаване на знаци) технология. На руски език тези съкращения се превеждат като "оптични" или "интелигентно разпознаване на символи". Програми, които използват OCR, работят по този начин. Снимката с текста, получен от скенера, е разделена на много фрагменти. За всяка от тях програмата създава няколко предположения. Чрез проверка и сравняването им със стандартите всеки фрагмент дава оценка, съответстваща на степента на съвпадение. При избора на най-големия от тях, програмата "вижда" символа и го показва в полето на вградения текстов редактор.


IRC работи по същия начин, но изкуствените невронни мрежи се използват за обработка на символи. Основното предимство на този метод е компактността на програмите и непрекъснатото обучение. Това ви позволява ефективно да разпознавате думите, написани от човека с главни букви. Но тази технология не е в състояние да "чете" солиден ръкописен текст. За всяка от съществуващите операционни системи, техните собствениOCR приложения. Най-популярната за Windows е:
  • ABBYY FineReader;
  • OmniPage;
  • Readiris;
  • Програма Samsung Scan OCR;
  • В допълнение към компютърния софтуер, има много услуги за онлайн разпознаване на текст. Сред тях най-известни са FineReader Online, OnlineOCR, FreeOCR.


    ABBYY FineReader 14

    Този софтуерен продукт е разработен от местната компания ABBYY, една от най-добрите сред приложенията, които използват OCR. В основата на програмата е оригиналния двигател, наречен Finereader Engine. Тя осигурява следните характеристики:
  • Бързо разпознаване на отпечатания текст с точност, по-голяма от 98%. Нетърпение към качеството на оригиналния образ. Това ви позволява да разпознавате идентично текста на снимките, направени със скенер или камера.
  • ADRT технологията ви позволява да разпознавате не само текста, но и неговото форматиране: шрифт, тирета, параграфи, колони.
  • Възможността за многопоточна обработка на изображения. Това ви позволява да използвате всички ядра на процесора (максимум 4), за да ускорите процеса на разпознаване.
  • Поддържа повече от 190 езика, включително тези, които използват азбука, различна от латиница или кирилица (японски, китайски, арабски).
  • Вграденият текстов редактор ви позволява да проверите резултата от разпознаването или да го редактирате.
  • Взаимодействие с пакета Office. Тя ви позволява да експортирате разпознат текст в Microsoft Word и Exel за по-нататъшна обработка.
  • Способност за изучаване на програмата. Тази функция ви позволява да научите програмата да "чете" маркировките на конкретни писма. Например, нестандартни шрифтове или букви, написани с ръка.
  • Работа с PDF. FineReader ви позволява да разпознавате текста от този тип файл и да "шиете" множество сканирани изображения в PDF или PDF /A.
  • Основният недостатък на тази програма е цената. Endless лиценз за базовата версия ще струва 7 хиляди рубли. Версии "Бизнес" и "Предприятие" - в 12 и 39 хиляди рубли, съответно. Ако се предполага, че ще използва програмата само у дома, можете да изтеглите от торент тракера счупената 11-та и 12-та версия на продукта.
    Системни изисквания:
  • Процесор: 32 - или 64-битов, 1 GHz, и поддръжка за набор инструкции SSE 2 (Intel Celeron M и по-добре, AMD Athlon 64 и по-добре).
  • RAM: 1 GB. Ако процесорът има повече от 1 ядро, тогава за всеки допълнителен 512 MB се изисква.
  • Видео карта: Всеки, който поддържа разделителната способност 1024 x 800.
  • Твърд диск: 3 GB за инсталиране и работа.
  • Скенер: поддържа TWAIN и WIA драйвери.
  • OS: Windows 788110.
  • Мнения на потребителите за FineReader 14

    Те отговарят положително на FineReader, като подчертават способностите на продукта да разпознава текст от лоши хартиени оригинали, удобен и лесен интерфейс и висока скорост. обработка на изображения. Сред проблемите, които възникват при използването на тази OCR програма, някои потребители посочват злонамерено работещия мениджър на изображения. Например: Недостатъчна работа за регулиране на яркостта на сканираното изображение.

    OmniPage 18

    Основният конкурент на FineReader на руския пазар на ORC-програми. По функционалност тя е много подобна на опонент, но има няколко разлики:
  • Възможност за стартиранепроцеса на сканиране и разпознаване с помощта на бутоните на скенера.
  • Поддръжка на 4-ядрени процесори. Това ви позволява да намалите времето за разпознаване и да конвертирате няколко изображения едновременно.
  • Създаване на собствена електронна библиотека за buccider (ebook Kindle.
  • Автоматично откриване на конкретен език.
  • Сред недостатъците на програмата може да се отбележи ниска скорост, сравнима с 10-та версия на FineReader, а цената за копие на лиценза - 150 долара.
    Системни изисквания:
  • Процесор: x32 или x64-bit, 1 GHz, Intel Pentium и по-добро, AMD Athlon и по-добро.
  • RAM: 512 MB.
  • Видеокарта: всяка, поддържа разделителна способност 1024 x 800 и дълбочина на цветовете 16 бита.
  • ​​
  • Твърд диск: 11 GB за инсталиране на всички компоненти и 100 MB за работа.
  • Сканер: поддържа TWAIN, WIA и ISIS драйвери.
  • ОС: Windows XP SP3 Vista SP2 x32 /x6478.
  • Мнението на потребителите на OmniPage

    Те казват, че е внезапно отрицателно, защото проблемите присъстват във всички части на програмата, като се започне от красив, но неразбираем интерфейс до лоши запитвания. Продуктът не е адаптиран за работа в WinXP. Тя може да бъде принудена да работи, но ще трябва да прекара известно време. OmniPage има проблеми с разпознаването. Например: лесно разпознава обикновен черен текст на лист хартия с чертежи, таблици, получени от скенера. Когато използвате изображения от камера или мобилен телефон, точността на разпознаване намалява до 70%, което е много неприятно при обработката на големи документи.

    Също 18-товерсията може да не започне поради грешки в кода. За да разрешите този проблем, трябва да инсталирате кръпка 1801.

    Прочетете Iris Pro 17

    Прочетете Iris е OCR програма, която с по-малко пари (8000 срещу 12000) може да съчетае функционалността и производителността с FineReader. Професионалната версия има следните характеристики:
  • Пълен работен ден с PDF: разпознаване, създаване на файлове за бази данни, компресия и глас върху текста.
  • Поддръжка за 140 езика.
  • Признаване на хартиени таблици и текстове с възможност за експортиране в Exel и Word.
  • Получаване на изображения от всеки модел на скенер.
  • Има и корпоративна версия, която ви позволява да защитавате PDF файлове с водни знаци и да обработвате документи, по-дълги от 50 страници. Системни изисквания:
  • Процесор: x86 или x64 с 1 GHz или по-висока.
  • RAM: 1 GB.
  • Видеокарта: Всеки, който поддържа резолюция 1024 x 800.
  • Твърд диск: 400 MB за инсталиране.
  • Скенер: поддържа TWAIN, WIA драйвери.
  • ОС: Windows 7810 x32 /x64.
  • Мнение на читателя за ReadIris

    Те говорят за тази програма за разпознаване на OCR текст като добър и най-бърз PDF към Word конвертор с редица проблеми:
  • Сложен интерфейс, в който начинаещият не е лесно да се разбере.
  • Автоматично сканиране на документ, когато променяте областта на сканиране.
  • Лоша техническа поддръжка.
  • Понякога програмата не се активира поради грешки в кода на програмата.
  • Програма Samsung Scan OCR - Какво представлява тази програма?

    Това е свободен софтуер, който се доставя с мултифункционално устройствоУстройства "3 в 1" (принтер, скенер, копирна машина) от фирма "Samsung". Тя е разработена в сътрудничество с Iris, създадена от ReadIris Pro, оптимизирана за работа с MFP на производителя. От оригиналния "Reader", Samsung Scan ORC има интерфейс, подрязана функционалност и размер - отнема 40 MB на твърдия диск.

    Онлайн услуги

    Те са алтернатива на стационарни приложения за разпознаване на текст. Например, OCR е FineReader. Свойствата на системите от подобни проекти ви позволяват да разпознавате текст от изображения много по-бързо, отколкото на самостоятелен компютър. Сред услугите, включени в получаването на текст от снимки, можете да различите три от най-удобните: FineReaderOnline, FreeOCR, OnlineOCR.
    Първото е прякото разработване на стационарната версия на продукта. При регистрация на новия потребител се дават 10 безплатни страници за обработка и 5 всеки месец. Можете да анулирате това ограничение, като закупите годишен абонамент за 3200550017800 рубли за 20005000 и 10,000 страници, съответно. Ако потребителят има лиценз за FineReader 14, той просто трябва да се регистрира и активира за използване в онлайн версията. В този случай той ще получи броя страници, съответстващи на вида на закупения лиценз: Standard (2000), Business (5000) или Enterprise (10,000).
    Услугата onlineOCR.com ви позволява да преобразувате 15 изображения /час (ограничения за нерегистрирани потребители) в текст и да ги записвате като .docx, .xlsx или .txt файлове. След регистрацията става налична:
  • Записване .pdf .doc, .xlx, .rtf.
  • Конвертиране на многостранични PDF файлове.
  • Брой странициувеличава до 50.
  • Ако страниците не са достатъчни, те могат да бъдат закупени в размер на 50-50000 броя.
    Проектът FreeOCR.com се различава от предишния с пълния си безплатен и без ограничения върху броя на обработените страници. OCR двигателя на този сайт поддържа руски, украински, турски, виетнамски и всички европейски езици - само 29. Единственият недостатък на този портал е да работи само с графични изображения, които се зареждат последователно, тъй като опашката за обработка не се предоставя от създателите. Показва разпозната информация без форматиране в TXT формат.

    Становище на потребителите относно онлайн OCR услуги

    Тези сайтове са необходими в случаите, когато изтеглянето и инсталирането на пълна ORC програма е неподходящо. Например, да вмъкнете в резюмето няколко цитирания от книга или списание. Сред недостатъците на такива сайтове са условно свободен (FineReader) и слаб функционален (FreeOCR, OnlineOCR). За да обобщим, можем да кажем, че има много OCR програми за разпознаване на текст с изображения или PDF файлове, а статията показва само най-известните. Следователно, OCR програмите за всеки скенер ще могат да избират сами според изискванията и бюджета. Или използвайте една от многото безплатни OCR услуги.

    Свързани публикации