8 800 700-04-04
Звонок бесплатный по всей России

ЭЛАР Фрагмент

Оцифровка конфиденциальных документов — всегда сложный процесс, особенно в случае большого объема и сжатых сроков. Основной риск связан с тем, что для извлечения данных доступ к документам необходимо дать большому количеству временных сотрудников, операторов ввода, на территории заказчика. Причем необходимость проверки данных операторами остается даже в случае автоматического распознавания текстов. ЭЛАР Фрагмент позволяет устранить эти риски.

Принцип работы

Основные функции ЭЛАР Фрагмент — разделение документов на фрагменты, не имеющие смысловой нагрузки, но достаточные для ввода данных операторами.

Такая разрезка скан-образов документов на отдельные «обезличенные» части снимает ограничения конфиденциальности и открывает возможность простого и эффективного перевода
любых конфиденциальных сведений из документов в формат базы данных, в том числе с привлечением внешнего исполнителя. При этом полностью исключается утечка информации из-за того, что оператор увидит конфиденциальную информацию.

ПО Фрагмент обеспечивает различные способы обработки электронных образов документов:

  • Реализованы механизмы фрагментирования любых структурированных документов с помощью создания графических шаблонов (указания областей присутствия сведений на документе)
  • Для слабоструктурированных документов созданы механизмы фрагментирования путем выделения необходимых слов, словосочетаний и смысловых сущностей в тексте (ФИО, адреса, наименования и т.п.)
  • Обеспечивается обезличивание фрагментов по ключу кодирования, то есть превращение электронного образа документа в набор частичных изображений, связанных друг с другом только по ключу заказчика (база ключей кодирования остается на территории заказчика).

Получаемые фрагменты документов могут обрабатываться любым удобным способом: программно или вручную, внутри организации или на внешней территории, с привлечением любого количества собственных сотрудников или заказом услуг подрядчиков. Возможно как распознавание документов с верификацией, так и полностью ручной ввод силами операторов.

Функции ПО ЭЛАР Фрагмент

  1. Разрезка скан-образов формализованных документов с помощью шаблона:
    • Готовые шаблоны для распространенных типов формализованных документов
    • Быстрое создание шаблона с помощью удобного графического интерфейса
    • Выделение областей документа, в том числе произвольной формы (Ctrl+), назначение имен и создание групп извлекаемых данных
    • Сохранение, экспорт/импорт шаблонов.

Графический механизм создания шаблонов позволяет быстро с помощью мышки настроить правила выделения фрагментов в формализованных документах, назначить имена и типы данных, которые должны быть извлечены с каждого фрагмента.

  1. Интеллектуальное выделение фрагментов неформализованных документов с заданными сущностями (отдельные фрагменты на ФИО, наименования, адреса, ИНН, ...) на основе анализа распознанного текста:
    • Готовые настройки — нужно просто отметить требуемые сущности
    • Встроенная OCR система распознавания
    • Гибридный метод для повышения качества — выделение нужной сущности в заданном районе документа.
  2. Кодирование и выгрузка
    • Обезличивание фрагментов путем присвоения кодированных ID-имен
    • Выгрузка на носители
    • Передача онлайн или оффлайн во внешние системы индексирования.

За территорию закрытого контура для ввода/индексирования выходят только закодированные, не связанные между собой фрагменты. Также могут передаваться фрагменты текста, распознанные встроенной OCR-системой. Ключ — БД кодирования, способная объединить несколько фрагментов воедино, остается на территории заказчика.

  1. Сборка базы данных
    • Прием и загрузка обработанных фрагментов в XML-формате, автоматическая сборка возвращенных данных в единую запись (карточку документа) с помощью кодировочной таблицы в БД (по приходу всех фрагментов)
    • Автоматизированный контроль качества сданных подрядчиком результатов ввода данных
    • Контроль разрезки образов и сборки данных — визуализация, корректировка настроек и возможность уточнения причины невозврата извлеченных данных по каждому фрагменту одним кликом.

ПО реализует полную последовательность заданий обработки (создание шаблона — самообучаемая классификация на основе математических алгоритмов — OCR распознавание — разрезка фрагментов по шаблону или ключевым словам — кодирование — экспорт фрагментов — импорт xml фрагментов — сбор итоговой записи по приходу всех фрагментов документа — проверка результатов)

Особенности ПО и последовательности обработки

  1. ЭЛАР Фрагмент представляет собой программное обеспечение, устанавливаемое на аппаратные средства заказчика. ПО требует настройки и обучения на реальных массивах документов заказчика. Трудоемкость такой процедуры составляет от 2 часов до 5 дней.
    После этого ЭЛАР Фрагмент работает в автоматическом режиме под контролем одного сотрудника заказчика, который может вносить в настройки ПО необходимые корректировки для более эффективной работы.
    • Программное обеспечение готово к аттестации/сертификации на обработку документов с различными уровнями секретности.
  2. ПО Фрагмент работает со сканированными документами в любом графическом формате (скан-образы предоставляются заказчиком).
    • ЭЛАР готов предоставить производительное сканирующее оборудование для оперативной оцифровки документов небольшим штатом сотрудников заказчика, имеющих допуск. Мы также готовы оказать услуги сканирования, обеспечив персонал с соответствующими формами допуска.
  3. ПО предусматривает гибкое масштабирование — каждое из заданий обработки может быть делегировано другим компьютерам/серверам на любой ОС для повышения производительности и качества обработки
    • Например, вместо встроенной системы распознавания может быть установлен любой другой продукт или подключен имеющийся OCR-сервер заказчика
  4. В итоге обработки исходящий массив представляет собой обезличенный набор фрагментов образов документов. Их обработка с извлечением данных может быть осуществлена в любой внешней системе или форме индексирования (ручного ввода). Результат должен быть возвращен в стандартном формате xml (легко настраивается в любом внешнем приложении или системе).
    • Мы готовы оказать помощь в настройке формы ввода данных и xml-формата выгрузки в вашей системе.

Документы

  1. ПО_Фрагмент_Общее описание.docx
  2. ПО_Фрагмент_Руководство администратора.docx
  3. ПО_Фрагмент_Руководство по установке.docx
  4. ПО_Фрагмент_Руководство пользователя.docx

Возврат к списку



Для получения более подробной информации Вы можете позвонить по бесплатному номеру телефона

8 800 700 04 04 или Отправьте заявку

Наши специалисты обязательно свяжутся с Вами и ответят на все интересующие вопросы!

Новости корпорации

13 Июня 2018
ПО «ЭЛАР СканИмидж» используют в Госархиве Магаданской области Государственный архив Магаданской области (ГАМО) начал использовать программное обеспечение «ЭЛАР СканИмидж» для обработки электронных копий документов. ГАМО существует с 1955 года и содержит документы трех областных архивов. Сотрудники архива осуществляют прием, учет, постоянное хранение и научное использование Архивного фонда области, предоставляют государственные услуги в сфере архивного дела.
6 Июня 2018
В Республике Татарстан завершен проект создания Единой архивной информационной системы Корпорация ЭЛАР завершила проект создания Единой архивной информационной системы Республики Татарстан (ЕАИС РТ) на базе АИС ЭЛАР-Архив. Впервые в России полностью автоматизирована передача на хранение в государственные и муниципальные архивы не только бумажных, но и электронных документов по истечении установленного срока. Благодаря инновационному решению автоматизирована вся архивная отрасль региона, включающая Государственный комитет, Государственный архив и 46 муниципальных архивов.
30 Мая 2018
Национальная академическая библиотека Республики Казахстан расширяет парк оборудования для оцифровки Корпорация ЭЛАР оснастила Национальную академическую библиотеку Республики Казахстан (НАБРК) двумя комплексами ЭларСКАН А2.
Напишите нам
CAPTCHA
Обратный звонок
CAPTCHA
Спросите эксперта
CAPTCHA
Заявка
CAPTCHA