Миф о безбумажном офисе

Одно время казалось, что по мере развития компьютерных технологий и коммуникаций, сервисов вроде электронной коммерции и электронного банкинга необходимость работы с бумажными документами в деловой среде сойдет на нет — ведь преимущества цифрового представления информации очевидны. Однако привычки и обычаи в этой области оказались сильнее прогресса — «твердых» копий не становится меньше. Так, по некоторым оценкам только в США в среднем каждый офисный служащий ежегодно использует не менее 10 тыс. листов бумаги для прин­теров/копиров, что в совокупности дает порядка 4 млн тонн. Бумажные документы настолько естественны для нас, что порой мы не замечаем даже совершенно парадоксальных ситуаций. К примеру, хотя анкету на получение визы нередко можно заполнить и в электронном виде, подавать в консульский отдел все равно нужно распечатку. Пока что мы не можем избавиться от личных подписей и «мокрых» печатей, и уж, тем более, совсем непросто состыковать законодательства разных стран, каждое из которых, к тому же, так или иначе регламентирует распространение и применение криптографических технологий (необходимых, среди прочего, для цифровых подписей).Таким образом, даже внедрение разнообразных электронных систем, прежде всего класса ECM, далеко не всегда дает однозначный эффект — иногда простота создания и управления документами приводит как раз к росту их количества, разнообразия и, как следствие, распечаток.

Но раз нельзя полностью избавиться от бумажных документов, значит нужно просто научиться с ними работать максимально эффективно. Между тем, это далеко не такая простая задача, как может показаться на первый взгляд. К примеру, IDC подсчитала, что на поиск в них нужной информации типичный офисный служащий тратит до 20% своего рабочего времени, причем половину из него — совершенно впустую. Соответственно, обеспечивсквозную работу с цифровыми копиями в рамах ECM-систем, по оценкам Gartner, можно на 40% сократить общие расходы на работу с документами.

Однако на самом деле проблема еще глубже. Ведь порядка 80% деловых документов представляют собой различные формы, т.е. содержат данные, необходимые для функционирования бизнес-процессов, и, соответственно, требующие оперативного переноса в транзакционные системы (учетные, АБС/ОДБ, ERP). Вот один из показательных примеров: согласно исследованию, проведенному ассоциацией IAPP (International Accounts Payable Professionals), проводка счетов на оплату товаров и услуг (забегая вперед, скажем, что это один из наиболее перспективных с точки зрения автоматизации бизнес-процессов) занимает более 15 дней в 58% крупных европейских коммерческих и государственных организаций и в 26% североамериканских. Понятно, что значительная часть этого времени требуется для различных согласований, но немалая доля также уходит на пересылку, доставку и другие операции, обусловленные бумажной природой документа. При этом зачастую оплата до истечения именно 15-дневного срока обеспечивает 5%-ную скидку, т.е. проволочка в данном случае чревата прямыми убытками.

Еще хуже дело обстоит, когда обработка подобных документов должна быть поставлена на поток. Здесь в действие вступает пресловутый человеческий фактор — ведь люди устают, теряют концентрацию внимания, отвлекаются, ошибаются. Достоверность же данных, особенно финансовых, бывает не просто важна, а критична. Надо ли говорить, что традиционное решение, состоящее в перекрестных проверках введенных данных двумя операторами, далеко от идеала, отнюдь не ускоряет процесс и множит затраты?

Выход — Data Capture

Указанные недостатки можно устранить с помощью автоматизации ввода документов. Ведь компьютер не только работает быстрее человека, но и гораздо лучше справляется с рутиной. Даже там, где нельзя отказаться от перекрестных проверок, он с успехом заменит одного из операто­ров. При этом, как правило, снижается нагрузка и на второго, так как ПО способно бескомпромиссно контролировать свою работу и отслеживать всевозможные сомнительные ситуации. Различные технологии обработки бумажных документов в рамках ECM-систем — от сканирования до извлечения данных — объединяет концепция Data Capture.

Однако ECM-технологии призваны не просто сократить бумажную работу, но, прежде всего, оптимизировать бизнес-процессы, исключить из них лишние этапы, сделать их более простыми и прозрачными. Именно преобразование документов в электронную форму обеспечивает новое качество управления ими, исключает необходимость создания дополнительных копий, упрощает сотрудничество и коммуникации как между своими сотрудниками, так и с партнерами или клиентами. И чем раньше оно будет выполнено, тем больший будет наблюдаться эффект.

Именно из этих соображений и сформировался рынок решений Data Capture. Начинался он с наполнения электронных архивов, одного из наиболее типичных сценариев, сулящих очевидные преимущества. Хранение точных цифровых копий документов вместе с результатом полнотекстового распознавания позволяет гарантировать сохранность информации и при этом ускоряет ее поиск, обработку, тиражирование, распространение. Сегодня базовая функциональность данного плана стандартно присутствует в известных ECM-системах. Технологии, однако, шагнули далеко за пределы обычных OCR. Современные приложения класса Data Capture дополнительно умеют уверенно распознавать раздельные рукописные символы, специальные маркеры и штрихкоды, находить на изображениях конкретные поля, извлекать из них транзакционные данные, контролировать их корректность и пр. При этом они легко встраиваются в существующие бизнес-процессы, не требуя изменения последних, и интегрируются с любыми внешними системами, что позволяет просто посчитать окупаемость и оценить реальный эффект их внедрения.

Исходя из этого, не приходится удивляться, что глобальный рынок Data Capture продолжал развиваться даже в условиях кризиса. Согласно отчету Harvey Spencer Associates, его объем в 2009 г. вырос на 2,1% по сравнению с 2008 г. допочти 2 млрд долл. Напомним, что в целом ИТ-рынок при этом уменьшился на 4,5—4,6% (в данном случае IDC и Gartner были почти единодушны). Также прогнозируется, что начиная с 2010 г. (точных данных пока еще нет) темпы роста Data Capture должны увеличиваться и в 2013 г. превысить 10%, а объем рынка — достичь 3 млрд долл. 

Весь рынок Data Capture принято делить по двум основным критериям: принципу обработки документов — потоковый (пакетный) или спонтанный (по запросу) и характеру оцифровки — получение точной копии документа (в англоязычной терминологии imaging) или извлечение транзакционных данных (соответственно, capture). Продукты, представленные в разных сегментах, довольно сильно отличаются по своим возможностям — в силу разницы стоящих перед ними задач.

Так, потоковый ввод, кроме всего прочего, предполагает классификацию документов с последующей их маршрутизацией в зависимости от типа. Такие операции могут выполняться полностью автоматически (на основе визуального представления документов либо содержащейся в них инфор­мации) или после предварительной сепарации пакетов (перекладыванием пустыми страницами, маркированием штрихкодами и пр.). Именно потоковый ввод, будучи максимально вовлеченным в бизнес-процессы, дает наибольший эффект, который обычно выражается в сокращении затрат, соблюдении регуляторных требований, открытии новых возможностей для бизнеса. Примерами последнего может быть создание сервисных бюро, предоставляющих услуги массовой обработки документов, или предложение новых банковских услуг, требующих высокой оперативности, вроде потребительского кредитования.

Локомотивом рынка Data Capture является пакетный транзакционный ввод, в пользу чего свидетельствуют доля в 42% и ускоряющиеся темпы роста от 4% в 2009 г. до 9—10% в 2011—2013 гг. Такое положение дел вполне понятно — автоматизация ввода данных в транзакционные системы позволяет оптимизировать бизнес-процессы и повысить эффективность операционной деятельности. Не удивительно, что и наибольший рост в транзакционных сегментах в последние годы наблюдался в развивающихся странах (на фонестагнации в США) — чем сильнее влияние кризисных явлений, тем острее потребность в сокращении издержек, ускорении бизнес-процессов, оптимизации персонала.

В пользу уверенного дальнейшего развития рынка Data Capture говорят и современные тенденции:

• стремление организаций к централизации обработки документов как в широком, географическом смысле (в головном ЦОД), так и в узком, подразумевающем единое решение для различных департаментов внутри крупных организаций. Это упрощает внедрение и сопровождение, обеспечивает лучшую безопасность, позволяет привлекать распределенную рабочую силу;

• рост потребности в максимально гибких решениях, легко адаптируемых к реальным бизнес-процессам, с возможностью интеграции с широким спектром существующих информационных систем различных классов;

• популяризация аутсорсинга бизнес-процессов — как в обычном понимании, так и «внутреннего», когда ИТ-подразделения в крупных компаниях переводятся на сервисный режим работы;

• необходимость обработки большого разнообразия сложных документов, которая диктуется диверсификацией бизнеса, укрупнением поставщи­ков, развитием связей в условиях глобализации экономики;

• повышенное внимание к проектам с быстрыми внедрением и окупаемостью на фоне по-прежнему неоднозначной экономической ситуации;

• рост заинтересованности SMB в решениях класса ECM, которые при этом должны отличаться легкостью внедрения, невысокой TCO и пр.;

• движение индустрии в сторону «облачных» вычислений, которые открывают новые возможности, как для поставщиков услуг, так и для заказчиков, прежде всего из среднего бизнеса;

• все более широкое использование персональных данных, обеспечение конфиденциальности и безопасности которых регламентируется законодательно.

ABBYY Flexi Capture

Одним из представителей мирового рынка Data Capture, хорошо знакомым отечественным пользователям, является компания ABBYY. Ее флагманский продукт ABBYY Flexi Capture представляет собой универсальную платформу для потокового ввода транзакционных данных из произвольных документов. Последнее — не преувеличение. Построенные на базе ABBYY Flexi Capture решения действительно могут обрабатывать документы любых типов:

• с фиксированной структурой — к примеру, анкет, экзаменационных тестов, страховых полисов, налоговых деклараций. Это формы в клас­сическом понимании, расположение полей на них не меняется, вследствие чего и обработка их сравнительно проста — достаточно лишь по имеющемуся образцу сформировать соответствующее описание. Более того, в составе ABBYY Flexi Capture имеется инструмент Form Designer для создания шаблонов машиночитаемых форм с нуля (описание при этом будет получено автоматически) — черно-белых и цветных, линейчатых, растровых, штрихкодовых;

• слабоструктурированных — счетов-фактур, заказов, транспортных накладных. Как правило они поступают из различных источников и имеют отличающееся оформление, т.е. одни и те же данные могут размещаться в разных местах страницы. Обрабатывать их гораздо сложнее, для этих целей с помощью еще одного дополнительного инструмента — FlexiLayout Studio — создается так называемое «гибкое» описание (Flexi Layout), которое может учитывать взаимное расположение полей и различных атрибутов изображения, использовать регулярные выражения и логические проверки. К примеру, в нем можно указать, что идентификационный налоговый номер представляет собой последовательность символов определенной длины и состава, следующую на небольшом расстоянии за текстом «ИНН»;

• неструктурированные — письма, контракты, статьи. Обычно они оцифровываются для помещения в электронный архив и последующего индексирования. Дополнительно ABBYY Flexi Capture может извлекать из них различные атрибуты, для сохранения, к примеру, в качестве метаданных, а также выполнять высокоуровневые проверки целостности и комплектности.

Под обработкой документов в ABBYY Flexi Capture понимается сквозной процесс, от импорта изображений до экспорта данных во внешние системы. На стадии распознавания возможен дополнительный контроль с помощью специальных скриптов, с обращением к внешним БД или готовым словарям. Это обеспечивает высокое качество и достоверность извлеченных данных, а при необходимости для их верификации могут привлекаться операторы.

Отметим, что ABBYY Flexi Capture изначально ориентирована на проекты различного масштаба. Соответственно, возможны два варианта развертывания: локальный и сетевой (распределенный). Первый подразумевает установку всех компонентов на одну рабочую станцию и предназначен для небольших организаций и проектов (до 5 тыс. страниц в день), второй состоит из набора серверов и выделенных станций. Принципиальным компонентом сетевой установки является высокомасштабируемый сервер обработки, обеспечивающий балансировку нагрузки и автоматическое распределение заданий между станциями обработки. Увеличение числа последних позволяет добиться необходимой про­изводительности и справиться с любой нагрузкой. Важно, что оба варианта совместимы между собой, соответственно, малый и средний бизнес может быстро и с небольшими затратами начать проект по автоматизации ввода документов и данных с локальной установки, и по мере развития легко его расширить.

Конечной целью применения ABBYY Flexi Capture является передача извлеченных данных во внешние приложения. Для этого могут применяться несколько механизмов, в том числе экспорт в промежуточные файлы (XLS, DBF, CSV, XML, PDFи др.) и непосредственно в СУБД (через ODBC), скрипты, а также интеграционные модули, разрабатываемые под заказ специалистами ABBYY. Кроме того, у сервера обработки имеется Web Service API, что позволяет использовать ABBYY Flexi Capture в качестве сервиса автоматической обработки документов в крупных SOA-решениях.

В ногу со временем

Описанные выше тенденции, характерные для современного рынка Data Capture, нашли отражение в недавно представленной новой версии ABBYY Flexi Capture 10.

Подготовительная фаза внедрения ABBYY Flexi Capture нередко оказывается достаточно трудоемкой из-за необходимости создания «гибких» описаний и классификаторов документов и, соответственно, способна удлинить и удорожить проект. Для решения этой проблемы в ABBYY Flexi Capture 10 появились функции самообучения. Теперь достаточно обозначить необходимые поля и реперы (статические элементы) на образцах документов определенного типа, а FlexiLayout Studio постарается автоматически установить взаимосвязи между ними и сформировать описание. Для сравнительно простых документов работа будет проделана довольно точно, а необходимые коррективы всегда можно внести вручную. Для тренировки классификатора также достаточно указать 3—5 образцов документов каждого типа. Вместе эти функции призваны помочь в настройке программы неопытными пользователями и ускорить старт проекта.

Поскольку ABBYY Flexi Capture предполагает интеграцию в текущие бизнес-процессы, очень важной оказывается возможность адаптации си­стемы для соответствия их специфике. ABBYY Flexi Capture 10 позволяет гибко изменять базовый рабочий поток обработки документов, к примеру, благодаря использованию внешних модулей OCR/ICR, подключению специализированных станций верификации или изменению интерфейса стандартных, скажем, путем добавления инструментов для работы с документами определенного типа. Таким образом, можно учесть любые нюансы текущей деятельности и максимально задействовать прежний опыт персонала.

Для работы в крупных проектах с высокой нагрузкой была переработана внутренняя архитектура ABBYY Flexi Capture 10 и добавлена поддержка кластерных технологий Microsoft. Высокая производительность позволит справиться с любыми пиковыми нагрузками, а от­казоустойчивость обеспечит непрерывность бизнес-процессов и надежность хранения важных данных.

Территориально распределенные проекты становятся все более характерными не только для государственных структур, но и для коммерческих компаний, которые таким образом, прежде всего, стремятся привлечь более дешевую рабочую силу. При этом важно быстро обеспечить ввод документов и данных на местах, а обработку проводить централизованно — из соображений оперативности, оптимизации инфраструктуры, безопасности. Для реализации такой схемы ABBYY Flexi Capture 10 поддерживает удаленное развертывание станций сканирования и веб-интерфейс верификации, обеспечивающий работу оператора из любого места, где доступен Интернет.

Типичные сценарии

Универсальность ABBYY Flexi Capture позволяет применять ее для решения самых различных задач, в том числе, и для обработки многих типов документов в одном потоке. Последнее обеспечивается соответствующей настройкой «гибких» шаблонов, классификатора, правил маршрутизации, модулей импорта.

Один из наиболее типичных сценариев использования ABBYY Flexi Capture, актуальный для организаций любых размеров и из любых отраслей, — наполнение электронных архивов. Оцифровка документов обеспечивает совершенно новое качество работы с ними, обусловленное простотой доступа, поиска и копирования, тем более что ABBYY Flexi Capture позволяет автоматически извлекать различные атрибуты, сохранять их в качестве метаданных, выполнять классификацию и проверку целостности, что гарантирует высокую достоверность сохраненной информации. Новые возможности ABBYY Flexi Capture 10 — повышенные масштабирование и отказоустойчивость, удаленное развертывание станций сканирования и пр. — позволят провести преобразование архива максимально быстро, справиться с пиковыми нагрузками на начальном этапе.

Наибольшее число применений ABBYY Flexi Capture находит в различных финансовых организациях, прежде всего банках, где все бизнес-процессы так или иначе строятся вокруг документов. Преобразование в электронный вид кардинально ускоряет их обработку и передачу в центральный офис, что особенно повышает эффективность предоставления услуг для физических лиц, таких как выпуск платежных карт или потребительское кредитование. Обработка с помощью ABBYY Flexi Capture кредитных досье как физических, так и юридических лиц обеспечивает оперативный контроль их полноты, корректность оформления, актуальность предоставленных документов, позволяет оперативно направлять собранные данные в АБС или ECM-систему и т.д. В нынешних условиях также немаловажной окажется возможность быстрого сбора пакета необходимой информации для коллекторской службы.

Автоматизированный ввод платежных поручений, которые все еще нередко подаются на бумаге, позволяет не только обеспечить их централизованную обработку и тем самым разгрузить или оптимизировать персонал отделений, но и гарантирует высокую достоверность данных. Кроме исключения обычных ошибок, которые не редкость при ручном вводе, с помощью ABBYY Flexi Capture можно обеспечить оперативный контроль реквизитов плательщика и получателя по банковским справочникам, соответствия сумм, записанных цифрами и прописью, допустимых диапазонов дат и пр., сомнительные документы можно сразу направлять на дополнительные проверки соответствующим специалистам.

Государственные службы также заинтересованы в автоматизации ввода различных документов — налоговых деклараций, переписных анкет, экзаменационных тестов. Обычно такие проекты жестко привязаны ко времени, а значит, характеризуются пиковыми нагрузками, справиться с которыми помогут повышенные масштабируемость и отказоустойчивость ABBYY Flexi Capture 10. Поскольку обрабатываемые документы обычно содержат финансовые и персональные данные, на первый план выходит необходимость обеспечения их безопасности. Для этого ABBYY Flexi Capture позволяет гибко управлять правами доступа всех участников процесса, сохранять цифровые подписи и пр. Несколько решений, построенных на основе ABBYY Flexi Capture, прошли сертификацию ГСССЗИ.

Большая потребность в автоматизированном вводе данных из различных документов имеется и у коммерческих организаций. Один из характерных примеров — обработка счетов-фактур, при которой в полной мере раскрывается потенциал «гибких» описаний. Эти вполне типовые по содержанию документы могут весьма различаться оформлением, количеством страниц и пр., и ввести их вручную — быстро и безошибочно — не так просто. На базе ABBYY Flexi Capture можно не только автоматизировать собственно ввод, но также организовать различные дополнительные проверки, вплоть до правильности вычислений (сумм, итогов и пр.). В частности, такие возможности присутствуют в разработанных «ABBYY Украина» интеграционных модулях, обеспечивающих двусторонние коммуникации с системой «1C:Предприятие» для контроля реквизитов по реальным справочникам и оперативного заполнения электронных документов.

Кроме того, ABBYY Flexi Capture применяется в реальных проектах по сбору персональных данных для программ лояльности, обработке заполняемых вручную внутренних производственных документов, заказов на поставку продукции от розничных точек и т.д. Важно также отметить, что, благодаря универсальности ABBYY Flexi Capture, проект, начатый с решения одной конкретной задачи, в дальнейшем может быть расширен и на другие.