Запуск Шаблонизатора осуществляется на верхней панели основного меню Дизайнера во вкладке «Разработка» — раздел «Запись» — «Извлечь по шаблону».
При нажатии на кнопку «Извлечь по шаблону» открывается обработка «Генератор шаблонов» (далее Шаблонизатор).
Пользовательский интерфейс Шаблонизатора состоит из следующих основных областей:
2.1. Основное меню (верхняя панель)
Верхняя панель основного меню позволяет увидеть данные, вычисленные встроенным OCR—модулем, а также предлагает основные действия для создания и обработки шаблонов.
2.1.1. Меню Файл
Новый шаблон |
Создает новый шаблон |
Открыть исходный файл |
Предлагает выбрать исходный файл для создания шаблона. При нажатии на кнопку открывается окно для поиска исходного файла с возможность указать (выбрать) путь и название файла. |
Открыть файл шаблона |
Предлагает выбрать один из ранее созданных шаблон по указанному пути. |
Сохранить шаблон |
Сохраняет созданный шаблон по указанному пути. Имя шаблона задается вручную. Расширение сохраняемого файла .json Действие может быть вызвано сочетанием клавиш Ctrl+S Также сохранить файл можно нажав на Имя файла указываем исходя из вида документа, например, «ТОРГ 12». |
Сохранить как… |
Сохраняет созданный шаблон по указанному пути. Имя шаблона задается вручную. Расширение сохраняемого файла .json |
Последние файлы |
Из выпадающего списка позволяет выбрать один из ранее сохраненных файлов. |
Автоматическое открытие предыдущих файлов |
При каждом открытии Шаблонизатора автоматически открывает файл, с которым велась работа до закрытия окна Генератор шаблонов. Для активации функции необходимо кликнуть левой клавишей мыши по строке до появления |
Выход |
Выходит из Шаблонизатора (генератора шаблонов) |
2.1.2. Меню Обработка
Производит основные действия по обработке документа:
2.1.3. Открыть исходный файл
Шаблонизатор предлагает выбрать и открыть ранее сохраненный сканированный документ, который будет использоваться в качестве образца при создании шаблона для распознавания роботом определенного типа документа.
Файл может быть представлен в одном из форматов: .pdf, .png, .jpeg, .jpg. Файл .pdf может быть многостраничным.
2.1.4. Обработать документ
Шаблонизатор запускает обработку документа по выбранным параметрам для отображения (Якоря, Атрибуты, Таблицы, Чертежи таблиц, OCR блоки, OCR таблицы, OCR линии).
Обработанный документ выглядит так, как показано на скриншоте выше.
Можно выбрать один или несколько критериев также на верхней панели основного меню Шаблонизатора.
При нажатии на кнопку появляется возможность произвести обработку следующей страницы (Ctrl+Right) или предыдущей страницы (Ctrl+Left), перейти на страницу (Ctrl+G)
Кнопка «Открыть страницу повторно» — открывает исходный документ без внесенных изменений в настройках Шаблонизатора.
Данная кнопка используется для проверки корректности заданных настроек в Шаблонизаторе. Таким образом можно проверить, например, срабатывает ли настройка «Автоповорот страницы». Если при нажатии кнопки «Открыть страницу повторно» мы видим, что документ изначально был неверно повернут, значит настройки Шаблонизатора были заданы верно и при обработке сработал Автоповорот страницы.
2.1.5. Добавить атрибут
Атрибуты — позволяют определить и обозначить области документа, данные из которых будут распознаваться роботом и импортироваться в таблицу «Результаты».
Существует несколько способов добавления Атрибута:

Подробнее в разделе Атрибуты.
2.1.6. Выполнить полное сканирование
После нажатия на кнопку открывается окно «Результат полного сканирования», в котором отображаются распознанные данные из документа в виде заполненной таблицы. Если при проверке обнаружены неточности, то их в любой момент можно исправить.
2.1.7. Масштаб
В Шаблонизаторе есть возможность задать масштаб при работе со сканированным документом. Размер изображения может быть задан несколькими способами:
2.1.8. Меню Отображать
Кнопки OCR блоки, OCR таблицы и OCR линии используются перед обработкой шаблона для настройки шаблона. Они отображают данные, полученные после обработки документа OCR модулем.
OCR блоки |
Отображает блоки, распознанные OCR-модулем |
OCR таблицы |
Отображает таблицы, распознанные OCR-модулем |
OCR линии |
Отображает линии, распознанные OCR-модулем |
Кнопки Якоря, Атрибуты, Таблицы и Чертежи таблиц относятся напрямую к шаблону. Данные, отображаемы по ним, являются вычисленными после обработки шаблона.
Якоря |
Отображает точки на сканированном документе, с помощью которых робот определяет, в какой части документа размещаются определенные данные. Якорей может быть сколь угодно много, в зависимости от типа документа. |
Атрибуты |
Отображает области документа, данные из которых будут распознаваться роботом и импортироваться в таблицу «Результаты» |
Таблицы |
Отображает границы таблиц, данные из которых будут распознаваться роботом и импортироваться в таблицу «Результаты» |
Чертежи таблиц |
Отображает чертежи таблиц |
2.1.9. Проверить
Для проверки корректности отображения табличной части, из которой будут импортироваться данные, нажимаем кнопку «Проверить» на верхней рабочей панели.
Также проверку можно запустить нажатием клавиши F5.
2.1.10. Результат полного сканирования
Результат полного сканирования представляет собой окно с результатами, полученными в процессе работы робота со сканированным документом по созданному шаблону. В появившейся форме отображаются все атрибуты и таблицы, обнаруженные в документе.
Окно с результатами поделено на две табличные части:
Эти данные могут быть числового формата, например, цена, стоимость, сумма и т.д.
По умолчанию указан режим «Простое сканирование».
При работе с многостраничными документами (если файл содержит в себе два и более документа), на одной из страниц которого указан якорь «LastPage», необходимо использовать «Режим полного распознавания».
При этом будет отображаться выходной параметр – количество страниц, которые участвовали в работе Шаблонизатора.
Полное распознавание будет проводиться с текущей страницы до момента, пока не будет найден якорь «LastPage».
В случае, если мы запускаем «Полное сканирование», находясь не на первой странице многостраничного документа, и, если на одной из страниц указан якорь «LastPage», Шаблонизатор выдаст окно с запросом: «Вы хотите выполнить распознавание с первой страницы?».
При нажатии кнопки «Да» — алгоритм Шаблонизатора будет распознавать документ с первой страницы документа до момента, пока не будет найден якорь «LastPage».
При нажатии кнопки «Нет» — алгоритм Шаблонизатора будет распознавать документ с текущей страницы документа до момента, пока не будет найден якорь «LastPage».
2.2. Центральная рабочая область Шаблонизатора
Область для работы с шаблоном обрабатываемого документа. Здесь отображается исходный файл/сканированный документ, по которому создается шаблон для дальнейшей работы робота.
При наведении курсора на нижней панели отображаются координаты страницы, курсора и области. Это удобно, когда нужно проверить или скорректировать координаты какого- либо атрибута.
В центральной рабочей области отображаются результаты всех манипуляций, которые мы производим на верхней панели основного меню и на боковой панели настроек Шаблонизатора.