Програмне забезпечення

	Версия для печати
	Версия для печати с изображениями
	Отправить ссылку
	Поместить в блог
	Добавить комментарий
	Написать в редакцию
	Подписаться на рассылки

ABBYY FineReader Engine научился классифицировать документы

24.10.2013

Компания ABBYY объявляет о выходе ABBYY FineReader Engine 11 – новой версии инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.

Возможности новой версии

• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский).
«Новая интеллектуальная система классификации документов в ABBYY FineReader Engine 11 пригодится разработчикам, предлагающим решения для крупных организаций, которые испытывают необходимость в быстрой обработке гигантских объемов документов», – говорит Михаил Бейрак, руководитель отдела корпоративных проектов ABBYY Украина.

ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.

ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Поместить в блог

<table border="0" width="75%" style="margin:10px; border:2px solid #036; background-color:#FFF;"><tr><td align="right"><a href="http://www.pcweek.ua" target="_blank"><img src="http://www.pcweek.ua/images/pcweek/logo-blog.gif" style="width:100px; height:30px; border:0;" alt="PC Week/UE"></a></td></tr><tr><td><a href="http://www.pcweek.ua/themes/detail.php?ID=144795" target="_blank"><img src="http://www.pcweek.ua/upload/iblock/a91/ABBYY.jpg" alt="Открыть материал" style="width:70px; height:50px; border:1px solid #000; float:left; margin:0 5px 5px 0;"></a><a href="http://www.pcweek.ua/themes/detail.php?ID=144795" target="_blank" style="font:14px Arial; color:#000; text-decoration:none; font-weight:bold;">ABBYY FineReader Engine научился классифицировать документы</a><br><a href="http://www.pcweek.ua/themes/detail.php?ID=144795" target="_blank" style="font:12px Arial; color:#000; text-decoration:none;">Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.</a></td></tr><tr><td align="right"><a href="http://www.pcweek.ua/themes/detail.php?ID=144795" target="_blank" style="font:12px Arial;">Открыть материал</a></td></tr></table>

Комментарии к статье

Статьи по теме

Rakuten Viber запустив чатбот ШІ Санту

Напередодні Різдва Rakuten Viber запустив чатбот, створений на базі штучного інтелекту — ШІ Санту. ШІ помічник допоможе українцям отримати відповіді на святкові питання: що приготувати, які подарунки обрати чи як прикрасити дім.

Airbus намагається перейти з продуктів Microsoft на хмарні сервіси Google, але поки що безуспішно

На сьогоднішній день більше двох третин із 150 тисяч співробітників Airbus повністю перейшли на нову систему, але значна частина продовжує паралельно використовувати Microsoft. Наприклад, фінансовий відділ все ще покладається...

Suse випустила першу корпоративну ОС Linux з інтегрованим агентом штучного інтелекту

Для підприємств цей запуск є чітким кроком до вбудовування інтелекту на рівні інфраструктури. Тепер система може виконувати адміністрування за допомогою штучного інтелекту через Cockpit або командний рядок...

OPPO анонсувала глобальний випуск ColorOS 16

Після успішного впровадження технології Parallel Animation (Паралельна анімація) у ColorOS 15, нова версія представляє Seamless Animation — рішення, що забезпечує миттєву, безперервну реакцію системи на кожну дію користувача.

Microsoft припинила підтримку Windows 10

Але ця дата закінчення підтримки також не є остаточною. Домашні користувачі з ПК під управлінням Windows 10 можуть зареєструватися в програмі Microsoft Extended Security Updates (ESU), яка продовжує термін підтримки ще на один рік...

Форум

Наступило время экспериментов (Noname, 08.04.2016 09:45:00)

Укртелеком в 4 раза снижает стоимость звонков на мобильные (СЕргей, 06.04.2016 19:11:59)

Укравтодор отмечает дорожные работы и перекрытия на Яндекс.Картах (Noname, 05.04.2016 17:30:44)

Яндекс.Карты объявляют конкурс для киевлян (Хтось, 17.02.2016 12:24:08)

Информационная безопасность: в поисках совершенной защиты (Лариса Ершова, 09.11.2015 18:39:47)

Другие темы

Газета PC Week Ukrainian Edition печатается по лицензионному соглашению с компанией Ziff Davis Publishing Inc. Перепечатка материалов допускается только c разрешения редакции. За содержание рекламных объявлений редакция ответственности не несет. Editorial items appearing in PC Week/UE that were originally published in the U.S. edition of PC Week are the copyright property of Ziff Davis Publishing Inc. Copyright 2015 Ziff Davis Inc. All rights reserved. PC Week is trademark of Ziff Davis Publishing Holding Inc.
© 2026 ООО “ПИСИВИК УКРАИНА”. Информация об авторских правах и порядке использования материалов сайта