8 800 700-04-04
Звонок бесплатный по всей России

ЭЛАР Фрагмент

Оцифровка конфиденциальных документов — всегда сложный процесс, особенно в случае большого объема и сжатых сроков. Основной риск связан с тем, что для извлечения данных доступ к документам необходимо дать большому количеству временных сотрудников, операторов ввода, на территории заказчика. Причем необходимость проверки данных операторами остается даже в случае автоматического распознавания текстов. ЭЛАР Фрагмент позволяет устранить эти риски.

Принцип работы

Основные функции ЭЛАР Фрагмент — разделение документов на фрагменты, не имеющие смысловой нагрузки, но достаточные для ввода данных операторами.

Такая разрезка скан-образов документов на отдельные «обезличенные» части снимает ограничения конфиденциальности и открывает возможность простого и эффективного перевода
любых конфиденциальных сведений из документов в формат базы данных, в том числе с привлечением внешнего исполнителя. При этом полностью исключается утечка информации из-за того, что оператор увидит конфиденциальную информацию.

ПО Фрагмент обеспечивает различные способы обработки электронных образов документов:

  • Реализованы механизмы фрагментирования любых структурированных документов с помощью создания графических шаблонов (указания областей присутствия сведений на документе)
  • Для слабоструктурированных документов созданы механизмы фрагментирования путем выделения необходимых слов, словосочетаний и смысловых сущностей в тексте (ФИО, адреса, наименования и т.п.)
  • Обеспечивается обезличивание фрагментов по ключу кодирования, то есть превращение электронного образа документа в набор частичных изображений, связанных друг с другом только по ключу заказчика (база ключей кодирования остается на территории заказчика).

Получаемые фрагменты документов могут обрабатываться любым удобным способом: программно или вручную, внутри организации или на внешней территории, с привлечением любого количества собственных сотрудников или заказом услуг подрядчиков. Возможно как распознавание документов с верификацией, так и полностью ручной ввод силами операторов.

Функции ПО ЭЛАР Фрагмент

  1. Разрезка скан-образов формализованных документов с помощью шаблона:
    • Готовые шаблоны для распространенных типов формализованных документов
    • Быстрое создание шаблона с помощью удобного графического интерфейса
    • Выделение областей документа, в том числе произвольной формы (Ctrl+), назначение имен и создание групп извлекаемых данных
    • Сохранение, экспорт/импорт шаблонов.

Графический механизм создания шаблонов позволяет быстро с помощью мышки настроить правила выделения фрагментов в формализованных документах, назначить имена и типы данных, которые должны быть извлечены с каждого фрагмента.

  1. Интеллектуальное выделение фрагментов неформализованных документов с заданными сущностями (отдельные фрагменты на ФИО, наименования, адреса, ИНН, ...) на основе анализа распознанного текста:
    • Готовые настройки — нужно просто отметить требуемые сущности
    • Встроенная OCR система распознавания
    • Гибридный метод для повышения качества — выделение нужной сущности в заданном районе документа.
  2. Кодирование и выгрузка
    • Обезличивание фрагментов путем присвоения кодированных ID-имен
    • Выгрузка на носители
    • Передача онлайн или оффлайн во внешние системы индексирования.

За территорию закрытого контура для ввода/индексирования выходят только закодированные, не связанные между собой фрагменты. Также могут передаваться фрагменты текста, распознанные встроенной OCR-системой. Ключ — БД кодирования, способная объединить несколько фрагментов воедино, остается на территории заказчика.

  1. Сборка базы данных
    • Прием и загрузка обработанных фрагментов в XML-формате, автоматическая сборка возвращенных данных в единую запись (карточку документа) с помощью кодировочной таблицы в БД (по приходу всех фрагментов)
    • Автоматизированный контроль качества сданных подрядчиком результатов ввода данных
    • Контроль разрезки образов и сборки данных — визуализация, корректировка настроек и возможность уточнения причины невозврата извлеченных данных по каждому фрагменту одним кликом.

ПО реализует полную последовательность заданий обработки (создание шаблона — самообучаемая классификация на основе математических алгоритмов — OCR распознавание — разрезка фрагментов по шаблону или ключевым словам — кодирование — экспорт фрагментов — импорт xml фрагментов — сбор итоговой записи по приходу всех фрагментов документа — проверка результатов)

Особенности ПО и последовательности обработки

  1. ЭЛАР Фрагмент представляет собой программное обеспечение, устанавливаемое на аппаратные средства заказчика. ПО требует настройки и обучения на реальных массивах документов заказчика. Трудоемкость такой процедуры составляет от 2 часов до 5 дней.
    После этого ЭЛАР Фрагмент работает в автоматическом режиме под контролем одного сотрудника заказчика, который может вносить в настройки ПО необходимые корректировки для более эффективной работы.
    • Программное обеспечение готово к аттестации/сертификации на обработку документов с различными уровнями секретности.
  2. ПО Фрагмент работает со сканированными документами в любом графическом формате (скан-образы предоставляются заказчиком).
    • ЭЛАР готов предоставить производительное сканирующее оборудование для оперативной оцифровки документов небольшим штатом сотрудников заказчика, имеющих допуск. Мы также готовы оказать услуги сканирования, обеспечив персонал с соответствующими формами допуска.
  3. ПО предусматривает гибкое масштабирование — каждое из заданий обработки может быть делегировано другим компьютерам/серверам на любой ОС для повышения производительности и качества обработки
    • Например, вместо встроенной системы распознавания может быть установлен любой другой продукт или подключен имеющийся OCR-сервер заказчика
  4. В итоге обработки исходящий массив представляет собой обезличенный набор фрагментов образов документов. Их обработка с извлечением данных может быть осуществлена в любой внешней системе или форме индексирования (ручного ввода). Результат должен быть возвращен в стандартном формате xml (легко настраивается в любом внешнем приложении или системе).
    • Мы готовы оказать помощь в настройке формы ввода данных и xml-формата выгрузки в вашей системе.

Документы

  1. ПО_Фрагмент_Общее описание.docx
  2. ПО_Фрагмент_Руководство администратора.docx
  3. ПО_Фрагмент_Руководство по установке.docx
  4. ПО_Фрагмент_Руководство пользователя.docx

Возврат к списку



Для получения более подробной информации Вы можете позвонить по бесплатному номеру телефона

8 800 700 04 04 или Отправьте заявку

Наши специалисты обязательно свяжутся с Вами и ответят на все интересующие вопросы!

Новости корпорации

22 Ноября 2017
На ЭларСКАН А2-400 оцифруют экспонаты Коми-Пермяцкого краеведческого музея Корпорация ЭЛАР поставила планетарный сканер ЭларСКАН А2−400 в Коми-Пермяцкий краеведческий музей им. П.И. Субботина-Пермяка. С помощью оборудования здесь будет создаваться страховой фонд экспонатов в электронном виде.
17 Ноября 2017
Стяги и лозунги Великого Октября перевели в цифру Корпорация ЭЛАР оцифровала экспонаты из коллекции знамен Государственного центрального музея современной истории России. Двадцать семь лозунгов и флагов периода Октябрьской революции переведены в цифровой формат по заказу компании-организатора экспозиционных проектов «Культурное наследие».
8 Ноября 2017
Десять ЭларСКАН А2-300 будут работать в БТИ Крыма Корпорация ЭЛАР поставила в ГУП РК «Крым БТИ» десять единиц оборудования ЭларСКАН А2−300. На комплексах планетарного сканирования формата А2+ сотрудники предприятия, в том числе в его филиалах, будут переводить в электронный вид различные типы документации, необходимой для учета и технической инвентаризации объектов недвижимости.
Напишите нам
CAPTCHA
Обратный звонок
CAPTCHA
Спросите эксперта
CAPTCHA
Заявка
CAPTCHA