Пример решения: технологии Cognitive Technologies для банков
С появлением высоконадежных серверов со сверхбольшими объемами внешней памяти (сотни и тысячи Гигабайт информации), появилась возможность создавать архивы электронных графических образов оригиналов документов на уровне вполне приемлемых для многих организаций затрат. Скоростные сканеры, обеспечивающие ввод нескольких тысяч документов в час, позволяют ввести за смену весь документопоток (десятки тысяч документов), проходящий за сутки через организацию, а современные программы распознавания произвести в процессе ввода распознавание текстов. Высокая пропускная способность и надежность телекоммуникаций дают возможность строить централизованные архивы документов для корпоративных и глобальных сетей. Таким образом, достижения в области компьютерных технологий позволяют по-новому решать проблемы автоматизации в банках и страховых компаниях, заметно повышая управляемость организации за счет существенного повышения оперативности в работе и новых возможностей проведения аналитических исследований.
Автоматизация обработки платежных документов
Система Cognitive Forms Ввод Платежных Документов (ВПД) осуществляет ввод основных видов платежных документов в одном потоке
Ввод различных типов платежных документов (платежные поручения, платежные требования, инкассовые поручения) в одном потоке до настоящего момента осуществлялся либо вручную, либо с элементами автоматизации (ввод каждого из типов документов по отдельности). Это отнимало до 30% времени операторов банка на набивку, сортировку и т.д., а также создавало значительные неудобства.
Новая система Cognitive Forms ВПД является единственной система в России, обеспечивающая автоматический ввод разнотипных платежных документов в одном потоке.
Система «Cognitive Forms Ввод Платежных Документов (ВПД)» компании Cognitive Technologies позволяет автоматизировать и значительно ускорить (в 6 12 раз) процесс обработки банковских платежных документов. Подсчитано, что при установке одного рабочего места, система позволяет обрабатывать от 700 до 900 документов в день. К тому же ее производительность можно увеличить за счет применения распределенной схемы организации работ. Например, к одному рабочему месту можно подключить 2 3 модуля верификации, что позволит обрабатывать больший объем платежных документов за единицу времени.
Система «Cognitive Forms: ВПД» позволяет практически полностью автоматизировать процесс ввода платежных документов. Роль оператора сводится к тому, что он должен поместить пачку насортированных платежных документов в сканер, после чего система самостоятельно осуществит сканирование, распознавание содержащихся в документах данных, проверку их достоверности и экспорт в АБС.
Отличительной особенностью системы является способность вести автоматизированную обработку всех основных типов банковских платежных документов платежных поручений, требований и инкассовых поручений в едином потоке. На разработку технологии потоковой обработки различных форм документов, получившей название FlexDocs, у Cognitive Technologies ушло около трех лет. Она основана на современных алгоритмах поиска типа А*Sеаrсh, успешно используемых в генной инженерии при выявлении соответствия между фрагментами нуклеиновых кислот. Научная ценность проделанной работы позволила сотрудникам Cognitive Technologies защитить по этой теме две диссертации.
Другой, не менее важной особенностью системы «Cognitive Forms: ВПД» является то, что она не только повышает оперативность обработки платежных документов, но и обеспечивает гарантию 100%-ной правильности вводимых в АБС данных. Недостатки ручного набора заключаются не только в том, что человек работает медленнее машины, но и в том, что человек совершает ошибки. Согласно проведенным исследованиям, оператор делает от 5 до 15 ошибок на тысячу знаков. В лучшем случае это оборачивается дополнительной потери времени, в худшем отправлением платежа по неверному адресу со всеми вытекающими отсюда последствиями. При использовании системы «Cognitive Forms: ВПД» подобное невозможно.
Технологии, используемые в системе, позволяют распознавать документы даже низкого полиграфического качества: присланные по факсу, отпечатанные на печатной машинке или матричном принтере. После того как распознанные данные поступают в систему, начинается их комплексная проверка. В «Cognitive Forms: ВПД» встроены справочники, содержание информацию о клиентах, реквизиты российских банков, географические и адресные названия и т.д. все виды данных, указываемых в платежных документах. Система сравнивает данные документов с данными справочника и при несоответствии сообщает об этом оператору. В зависимости от характера ошибки оператор либо исправляет ее самостоятельно, либо отправляет платежный документ обратно клиенту на переделку. Таким образом, в конце процесса обеспечивается 100%-ная точность распознавания данных.
К достоинствам системы «Cognitive Forms ВПД» следует отнести большую гибкость и способность настраиваться под индивидуальные технические требования каждого банка. Система совместима с основными АБС, используемыми российскими банками: Диасофт, R-Style, ПрограмБанк, Кворум. Но она легко может быть настроена на работу с другими АБС.
О высоком качестве и надежности работы «Cognitive Forms ВПД» говорит тот факт, что система успешно прошла аттестацию в крупнейшем банке страны Сбербанке РФ. Для этого ей пришлось выдержать серьезную проверку путем тестовых испытаний, проведенных специалистами Сбербанка. В результате руководством Сбербанка было принято решение установить систему во всех отделениях банка г.Москвы. В настоящее время планируется внедрение «Cognitive Forms ВПД» в территориальных банках Сбербанка России.
Стоимость одного рабочего места системы «Cognitive Forms: ВПД» $580. При покупке новых версий (upgrade) пользователям данного программного продукта предоставляется скидка 50%.
Дополнительно компания Cognitive Technologies объявляет о начале новой маркетинговой акции. Банкам, использующим системы потоковой обработки платежных поручений других разработчиков, предоставляется возможность покупки системы «Cognitive Forms», обеспечивающей автоматизированный ввод в АБС банка всех видов платежных документов, со скидкой 50% (Crossgrade).
При этом затраты на внедрение системы следует скорее отнести не к разряду расходов, а к разряду инвестиций. Расчеты показывают, что экономия средств от внедрения системы составляет от $800 до $2,5 тыс. в год в расчете на одно автоматизированное рабочее место. В расчетах учитывается количество сотрудников банка, необходимых на этом этапе работы, уровень их заработной платы, расходы на содержание рабочих мест в офисе. И надо сказать, что система окупает себя менее чем за год.
По результатам сравнительного тестирования (см. «Экономика и жизнь» № 36, 2003 г. или http://www.cognitive.ru/about/news/2003/34.htm) система Cognitive Forms ВПД занимает лидирующие позиции в России.
Базовая технология Cognitive Forms широко используется в различных банках, отделениях Пенсионного Фонда России, страховых компаниях, структурных подразделениях МВД и других организациях для обеспечения обработки стандартных форм документов (бланков, анкет, платежных поручений и других).
Автоматизация документооборота и управление документами
Банк, наверное, как ни одно другое предприятие нуждается в средствах хранения, систематизации и поиска разнородных документов с возможностью организации их эффективной коллективной обработки и жесткого разделения прав доступа. Платежные документы, договора, аналитические исследования и отчеты, наконец, организационно-распорядительная документация формируют в наши дни вал информации, с которой персонал может справиться лишь при помощи специально созданного для этих целей инструмента системы ведения электронного архива (или системы управления электронными документами) корпоративного масштаба. Подобные продукты обеспечивают:
организацию оперативного архива с документами, находящимися в данный момент в работе, равно как и крупных архивов длительного хранения;
простой и унифицированный доступ к архивным единицам информации, подготовленным в различных офисных приложениях (например, электронные таблицы, тексты, презентации, почтовые сообщения);
быстрый и точный поиск по атрибутам и контексту, благодаря мощным поисковым инструментам, встроенным в систему;
сохранность документов за счет высокой надежности серверного оборудования;
ведение истории работы с документами, с возможностью выявить виновника серьезной ошибки или попытку нарушения конфиденциальности;
эффективный и безошибочный перевод документов из бумажной в электронную форму (обратный процесс поддерживается как само собой разумеющееся);
интеграцию со службами баз данных АБС.
Компания Cognitive Technologies выполнила для КБ «Газпромбанк» проект по созданию электронного архива «Евфрат/400». Лучшим подтверждением их технологичности служит перечень поддерживаемых платформ, среди которых широко известные и прекрасно себя зарекомендовавшие индустриальные СУБД DB2/400 и Oracle. Базовая поставка осуществляется вместе с серверным аппаратным обеспечением в виде IBM AS/400.
Основу « Евфрат/400» составляет система создания и ведения электронного архива документов самых различных типов: тексты, электронные таблицы, графические изображения, аудио и видео. В процессе ввода и последующей обработки документов пользователь имеет возможность снабжать их необходимыми реквизитами, систематизировать их, размещая в системе иерархических папок, и находить, используя разнообразные средства поиска документов. Регистрация входящих документов по всем словам текста (в различных форматах файлов), а также по реквизитам. Имеется возможность создания реквизитов с фиксированным словарем значений, который может быть пополнен или изменен.
Пользователь может выполнять сложный полнотекстовый и реквизитный поиск документов с применением ряда логических операций и учетом морфологии русского языка. Реализованы варианты поиска: по аннотации, по названию документов, смешанный поиск в любой комбинации. Найденный документ можно просматривать во встроенном режиме просмотра с сохранение первозданного вида документов, без вызова внешних программ.
Задачи делопроизводства решаются с помощью обеспечения групповой работы с документами на основе развитой системы управления правами доступа, создания иерархической структуры папок для хранения, реализации механизма контроля исполнения заданий. При этом можно выполнять операции формирования сводных отчетов по документам, хранящимся в архиве или по результатам поиска.
Важной положительной чертой « Евфрат/400» является то, что система учитывает основные особенности российского делопроизводства, складывавшиеся десятилетиями. Кроме того, система обеспечивает полнотекстовой и гиперполнотекстовой поиск информации с учетом морфологии русского языка (для многих импортных систем это все еще проблема).
Нельзя не отметить и тот факт, что в « Евфрат/400» встроено ПО сканирования и распознавания бумажных документов, причем речь идет не только о неструктурированных первоисточниках (в этом случае применяется CuneiForm), но и о банковских формах, которые обрабатываются с помощью Cognitive Forms. В первую очередь это, конечно, касается платежных поручений. За счет интеграции всего этого комплекса с АБС появляется возможность существенно упростить и удешевить ввод данных в АБС без потери качества. Альтернативный вариант применения подразумевает использование комплекса для верификации клавиатурного ввода. Примечательно, что с ПО Диасофт-Банк и RS-Bank « Евфрат/400» уже «дружит». Выгоды от применения данной системы очевидны: документы обрабатываются быстро и без ошибок, внутренний алгоритм работы АБС не изменяется, а в случае необходимости всегда можно практически мгновенно свериться с отсканированными образами оригиналов.
Система документооборота для КБ «Газпромбанк»
По мере увеличения объемов обрабатываемой информации в филиалах и отделениях КБ «Газпромбанк» возникла потребность в применении новейших информационных технологий ввода, хранения и обработки документов, а также в обеспечении информационной безопасности при работе с конфиденциальными документами.
В результате реализации проекта была создана система, автоматизирующая следующие функции документооборота:
регистрация входящей, исходящей и внутренней корреспонденции;
ведение журналов регистрации;
поиск зарегистрированных документов;
внесение резолюции руководства;
постановка документов на контроль;
рассылка документов и регистрационной карточки (РК) на ознакомление;
автоматическая рассылка напоминаний о приближении сроков исполнения документа;
составление разнообразных отчетов по введенной информации;
получение сводок о ходе выполнения документов;
печать регистрационной карточки документа;
печать журналов регистрации за указанный период;
печать различных отчетов и сводок за указанный период
Срок реализации проекта составил 1 год.
Платформа. Базовые аппаратные и программные средства:
Сервер AS/400 с операционной системой OS/400, база данных DB2/400 Клиентские места Windows 95/98/NT
Поддержка принятия решений, анализ и прогнозирование. Система «АСТАРТА»
Не секрет, что своевременность и объективность получаемой руководством компании информации во многом определяет качество управления и стратегического планирования. В наше время, когда существует огромное количество источников информации, и темпы ее появления и изменения во много раз выше, чем раньше, обработка всего объема информации ручным способом становится невыполнимой задачей. На помощь аналитических служб все чаще приходят новые информационные технологии, позволяющие эффективно использовать разнообразную информацию. Информационные системы, специализирующиеся на анализе информации из внешних источников, это то, что нужно сегодня для максимально эффективного использования аналитики в бизнесе. При реализации современных подходов к управлению подобные системы являются необходимым инструментом поддержки принятия решений.
Динамичная смена политической и экономической обстановки в стране требует от управленцев российского банка быстрой и адекватной реакции. Сегодня существует необходимость в оперативном анализе и основанных на нем разносрочных прогнозах.
Однако, если заглянуть в информационно-аналитический отдел одного из крупных банков, то с большой долей вероятности можно заметить, что его сотрудники зачастую до сих пор используют ножницы и клей для составления подборок новостей. Полученные подборки затем размещаются по папкам, объединяющим максимум две рубрики; если же сообщение относится сразу к нескольким рубрикам, его приходится размножать. Чтобы найти потом нужные сообщения, требуется времени от часа до дня. Это притом, что такой труд еще и крайне утомителен.
Даже если аналитический отдел подвергся информатизации, многие рутинные операции при обработке поступающих извне сведений сегодня по-прежнему возлагаются на операторов. Это и ручное вычленение сообщений из новостной ленты, и прочитывание всей поступившей информации, и ручное же формирование отчетов и дайджестов. Традиционные программные средства в данном случае ничем существенно помочь не могут. Кроме того, для повышения скорости работы операторы практикуют просмотр не самого текста сообщения, а лишь его заголовка и атрибутов это зачастую снижает качество анализа сообщений и их рубрицирования.
Для решения подобных задач компанией Cognitive Technologies разработана информационно аналитическая система (ИАС) «АСТАРТА».
«АСТАРТА» предназначена для работы с новостными лентами и прочей информации, поступающей на предприятие из информационных агентств, новостных сайтов и СМИ; ее отличительной чертой является автоматизация всех рутинных процедур от обработки ленты до составления отчета (дайджеста), включая процедуру отнесения сообщения к той или иной рубрике. Вообще технологии интеллектуального анализа текстов имеются у разработчиков ПО в России, однако до настоящего времени они использовались только в поисковых системах.
Решение включает в себя следующие подсистемы: перевода бумажных документов в электронные; хранения и поиска электронных документов (архив); автоматического создания дайджестов и отчетов, учета новых документов, их пересылки, отправки на печать, в архив или удаления.
Принцип работы ИАС состоит в следующем. Если изначально новостная информация поступает на предприятие в бумажном виде, тут есть два пути: либо сканировать сообщения и автоматически распозновать с помощью встроенного модуля OCR CuneiForm, либо организовывать поступление новостей из информационного агенства или в целом из Интернета. Таким образом, мы получаем файл или набор различного рода файлов с электронным текстом, содержащих новостные сообщения. Система принимает данные файлы, анализирует их содержимое, выделяя сообщения, и приводит к единому формату, помещая их в отдельные файлы (каждое сообщение один файл).
После этого сообщения распределяются по рубрикам. Система может самостоятельно просмотреть каждое сообщение и определить, к какой рубрике его следовало бы отнести. Стоит подробнее рассмотреть механизм автоматического рубрицирования сообщений. Система является обучаемой, т.е. сначала эксперт должен «натаскать» ее на определенные типы новостей. Эксперт дает системе понять, какого рода тексты соответствуют конкретной рубрике он вручную рубрицирует некоторое количество сообщений (100 обработанных сообщений на рубрику обеспечивают высокое качество сортировки, хотя результат дадут и 3 сообщения). Для каждого рубрицированного экспертом сообщения система строит семантическую модель; сравнивая их затем, она выделяет общие признаки принадлежности текстов к каждой отдельно взятой рубрике.
Поскольку система является обучаемой, ее можно настроить на рубрицирование сообщений по любой тематике, количество рубрик может быть также сколь угодно большим. Иногда экспертные знания системы могут устаревать (например, при смене правительства) тогда эксперт должен их обновить. Что касается контроля правильности автоматической рубрикации, то его можно проводить, просматривая реквизиты сообщений, которые система помещает в отдельный файл. Тотальный контроль здесь не обязателен достаточно выборочных проверок.
Далее по заранее заданному набору рубрик составляется дайджест новостей за произвольный период времени, задаваемый в запросе. Полные тексты сообщений из нужных рубрик автоматически помещаются в соответствующим образом оформленный файл формата MS Word далее нужно просто его распечатать и дайджест готов. Следует подчеркнуть, что наряду с печатной версией обзора доступной является и его электронный аналог, который может быть разослан по сети всем заинтересованным лицам. Электронная версия обзора более удобна в обращении уже тем, что не занимает место на столе и в мусорной корзине. Если учесть что поиск материалов в этой версии в сотни раз быстрее, то «полезность» её, по сравнению с традиционной бумажной, становится очевидной.
Кроме этого все полученные из новостной ленты сообщения отправляются на хранение в электронный архив, откуда нужный текст всегда можно извлечь буквально за несколько секунд. В архиве каждое сообщение является отдельным документом, имеющим свои реквизиты и проиндексированым по словам. Соответственно поиск нужного сообщения (или нескольки сообщений) можно проводить как по ключевым словам из текста или заголовка, так и по таким аттрибутам, как дата, автор, источник и, конечно, рубрика. Стоит отметить, что поиск по словам производится с учетом морфологии, т.е. все вхождения слова будут найдены, даже если оно встречается в разных формах. Это делает поиск более эффективным, а запросы более простыми.
ИАС тесно интегрирована со вспомогательными программами, обеспечивающими разнообразие возможностей при работе с информацией. Во-первых, возможно взаимодействие с ресурсами Интернета, такими как электронная почта и универсальное адресное пространство, дающее доступ к документам в среде WWW, FTP и т.д. Это может быть полезно как для публикации актуальных для предприятия новостей в Сети, таки и для получения информации из нее. Если же предприятие широко распределено территориально, такие возможности системы обеспечивают оперативную доставку тех же дайджестов в разные отделы и представительства.
Таким образом, ИАС позволяет свести на нет все рутинные процедуры, связанные с первичной обработкой, хранением, поиском сообщений, обеспечивает автогенерацию регулярных отчетов (дайджестов), а также проводить автоматическую рубрикацию принимаемых сообщений. Данный инструмент мог бы существенно повысить эффективность работы аналитических отделов предприятий, улучшая временные и качественные показатели их работы.
В заключение хочется отметить, что банки нынешнего тысячелетия будут использовать целый ряд наукоемких технологий, контуры которых просматриваются сегодня. Это переход к интеллектуальным АБС со встроенной аналитической поддержкой, интеграция с системами ведения безбумажного делопроизводства, внедрение распределенных, гибких систем электронного банкинга. Основным критерием успеха банка станет то, насколько полно финансовые технологии используют потенциал стремительно развивающихся информационных технологий.