Запуск Шаблонизатора осуществляется на верхней панели основного меню Дизайнера во вкладке «Разработка» — раздел «Запись» — «Извлечь по шаблону».

При нажатии на кнопку «Извлечь по шаблону» открывается обработка «Генератор шаблонов» (далее Шаблонизатор).

Пользовательский интерфейс Шаблонизатора состоит из следующих основных областей:

1.Основное меню (верхняя панель)
2.Центральная рабочая область – область для работы с шаблоном обрабатываемого документа
3.Панель настроек.

.

2.1. Основное меню (верхняя панель)

Верхняя панель основного меню позволяет увидеть данные, вычисленные встроенным OCRмодулем, а также предлагает основные действия для создания и обработки шаблонов.

2.1.1. Меню Файл

Новый шаблон

Создает новый шаблон

Открыть исходный файл

Предлагает выбрать исходный файл для создания шаблона. При нажатии на кнопку открывается окно для поиска исходного файла с возможность указать (выбрать) путь и название файла.

Открыть файл шаблона

Предлагает выбрать один из ранее созданных шаблон по указанному пути.

Сохранить шаблон

Сохраняет созданный шаблон по указанному пути. Имя шаблона задается вручную. Расширение сохраняемого файла .json

Действие может быть вызвано сочетанием клавиш Ctrl+S

Также сохранить файл можно нажав на в левом верхнем углу панели основного меню.

Имя файла указываем исходя из вида документа, например, «ТОРГ 12».

Сохранить как…

Сохраняет созданный шаблон по указанному пути. Имя шаблона задается вручную. Расширение сохраняемого файла .json

Последние файлы

Из выпадающего списка позволяет выбрать один из ранее сохраненных файлов.

Автоматическое открытие предыдущих файлов

При каждом открытии Шаблонизатора автоматически открывает файл, с которым велась работа до закрытия окна Генератор шаблонов. Для активации функции необходимо кликнуть левой клавишей мыши по строке до появления

Выход

Выходит из Шаблонизатора (генератора шаблонов)

.

2.1.2. Меню Обработка  

Производит основные действия по обработке документа:

Обработать документ

Выполняет обработку текущего файла по заданным инструментам и атрибутам, выбранным в верхней панели основного меню (Якоря, Атрибуты, Таблицы, Чертежи таблиц, OCR-блоки, OCR-таблицы, OCR-линии).

Действие может быть вызвано сочетанием клавиш Ctrl+R

Обработать элементы

Предлагает выбрать один из ранее созданных шаблон по указанному пути для его обработки по заданным инструментам и атрибутам, выбранным в верхней панели основного меню.

Действие может быть вызвано нажатием клавиши F5

Выполнить полное сканирование

Открывает окно «Результат полного сканирования»

Автоматическая обработка документов на следующей странице

Выполняет автоматическую обработку следующей открытой страницы по заданным инструментам и атрибутам, выбранным в верхней панели основного меню для текущей страницы. Используется в случае, когда в одном файле находится несколько однотипных одностраничных документов, размещенных на одной странице (например, документ ТОРГ 12). При нажатии кнопки Следующая страница открывается и распознается следующий документ.

При работе с многостраничным документом, содержащим в себе разные типы документов, рекомендуем не использовать эту функцию, т.к. робот будет распознавать все якоря, созданные на каждой странице документа. Многократный переход между страницами может увеличивать время работы робота.

2.1.3. Открыть исходный файл

Шаблонизатор предлагает выбрать и открыть ранее сохраненный сканированный документ, который будет использоваться в качестве образца при создании шаблона для распознавания роботом определенного типа документа.

Файл может быть представлен в одном из форматов: .pdf, .png, .jpeg, .jpg. Файл .pdf может быть многостраничным.

2.1.4. Обработать документ

Шаблонизатор запускает обработку документа по выбранным параметрам для отображения (Якоря, Атрибуты, Таблицы, Чертежи таблиц, OCR блоки, OCR таблицы, OCR линии).

Обработанный документ выглядит так, как показано на скриншоте выше.

Можно выбрать один или несколько критериев также на верхней панели основного меню Шаблонизатора.

При нажатии на кнопку появляется возможность произвести обработку следующей страницы (Ctrl+Right) или предыдущей страницы (Ctrl+Left), перейти на страницу (Ctrl+G)

Кнопка «Открыть страницу повторно» — открывает исходный документ без внесенных изменений в настройках Шаблонизатора.

Данная кнопка используется для проверки корректности заданных настроек в Шаблонизаторе. Таким образом можно проверить, например, срабатывает ли настройка «Автоповорот страницы». Если при нажатии кнопки «Открыть страницу повторно» мы видим, что документ изначально был неверно повернут, значит настройки Шаблонизатора были заданы верно и при обработке сработал Автоповорот страницы.

2.1.5. Добавить атрибут

Атрибутыпозволяют определить и обозначить области документа, данные из которых будут распознаваться роботом и импортироваться в таблицу «Результаты».

Существует несколько способов добавления Атрибута:

1.Нажатием кнопки на верхней панели Основного меню

.

.

2.Нажатием кнопки   на правой рабочей панели меню во вкладке Атрибуты

.

.

.

Подробнее в разделе Атрибуты.

2.1.6. Выполнить полное сканирование

После нажатия на кнопку открывается окно «Результат полного сканирования», в котором отображаются распознанные данные из документа в виде заполненной таблицы. Если при проверке обнаружены неточности, то их в любой момент можно исправить.

2.1.7. Масштаб

В Шаблонизаторе есть возможность задать масштаб при работе со сканированным документом. Размер изображения может быть задан несколькими способами:

1.Выбрать значение из выпадающего списка
2.Указать значение вручную
3.Увеличить или уменьшить масштаб при помощи лупы

.

2.1.8. Меню Отображать

Кнопки OCR блоки, OCR таблицы и OCR линии используются перед обработкой шаблона для настройки шаблона. Они отображают данные, полученные после обработки документа OCR модулем.

OCR блоки

Отображает блоки, распознанные OCR-модулем

OCR таблицы

Отображает таблицы, распознанные OCR-модулем

OCR линии

Отображает линии, распознанные OCR-модулем

.

Кнопки Якоря, Атрибуты, Таблицы и Чертежи таблиц относятся напрямую к шаблону. Данные, отображаемы по ним, являются вычисленными после обработки шаблона.

Якоря

Отображает точки на сканированном документе, с помощью которых робот определяет, в какой части документа размещаются определенные данные. Якорей может быть сколь угодно много, в зависимости от типа документа. 

Атрибуты

Отображает области документа, данные из которых будут распознаваться роботом и импортироваться в таблицу «Результаты»

Таблицы

Отображает границы таблиц, данные из которых будут распознаваться роботом и импортироваться в таблицу «Результаты»

Чертежи таблиц

Отображает чертежи таблиц

2.1.9. Проверить

Для проверки корректности отображения табличной части, из которой будут импортироваться данные, нажимаем кнопку «Проверить» на верхней рабочей панели.

Также проверку можно запустить нажатием клавиши F5.

2.1.10. Результат полного сканирования

Результат полного сканирования представляет собой окно с результатами, полученными в процессе работы робота со сканированным документом по созданному шаблону. В появившейся форме отображаются все атрибуты и таблицы, обнаруженные в документе.

Окно с результатами поделено на две табличные части:

1.Атрибуты (слева) – в данной табличной части отображаются данные, полученные роботом по заданным Атрибутам и Якорям. Чаще всего, это общая информация о Заказчике, Подрядчике, Инвесторе, например, наименование и реквизиты. Также в Атрибутах указываются Номер и Дата документа.
2.Таблица (справа) – в табличной части отображаются данные, содержащиеся в таблицах сканированного документа, полученные роботом в результате работы по созданному шаблону при помощи OCR-модулей.

Эти данные могут быть числового формата, например, цена, стоимость, сумма и т.д.

По умолчанию указан режим «Простое сканирование».

При работе с многостраничными документами (если файл содержит в себе два и более документа), на одной из страниц которого указан якорь «LastPage», необходимо использовать «Режим полного распознавания».

При этом будет отображаться выходной параметр – количество страниц, которые участвовали в работе Шаблонизатора.

Полное распознавание будет проводиться с текущей страницы до момента, пока не будет найден якорь «LastPage».

В случае, если мы запускаем «Полное сканирование», находясь не на первой странице многостраничного документа, и, если на одной из страниц указан якорь «LastPage», Шаблонизатор выдаст окно с запросом: «Вы хотите выполнить распознавание с первой страницы?».

При нажатии кнопки «Да» алгоритм Шаблонизатора будет распознавать документ с первой страницы документа до момента, пока не будет найден якорь «LastPage».

При нажатии кнопки «Нет» алгоритм Шаблонизатора будет распознавать документ с текущей страницы документа до момента, пока не будет найден якорь «LastPage».

2.2. Центральная рабочая область Шаблонизатора

Область для работы с шаблоном обрабатываемого документа. Здесь отображается исходный файл/сканированный документ, по которому создается шаблон для дальнейшей работы робота.

При наведении курсора на нижней панели отображаются координаты страницы, курсора и области. Это удобно, когда нужно проверить или скорректировать координаты какого- либо атрибута.

В центральной рабочей области отображаются результаты всех манипуляций, которые мы производим на верхней панели основного меню и на боковой панели настроек Шаблонизатора.