Атрибуты.

Атрибуты — позволяют определить и обозначить области документа, данные из которых будут распознаваться роботом и импортироваться в таблицу «Результаты».

Свойства атрибутов

При создании нового атрибута на рабочей панели открывается список свойств и инструментов для работы с атрибутом..

.

Имя

Имя атрибута, которое будет отражено в результатах

Якорные привязки

Список якорных привязок

Ограничение линиями

Использовать поиск ограничения линиями. Атрибут может быть ограничен с любой стороны, относительно линий, распознанных OCRмодулем. Эти линии отображаются при нажатии кнопки «OCR Линии». Возможные значения:

1.UpDown – сверху и снизу
2.Upсверху
3.Downснизу

Корректировать угол

Корректировать угол наклона области. Поворачивает область атрибута параллельно ограничивающим его линиям. Область корректируется, если она соприкасается с границами таблицы.

True (правда) – выключено

False (ложь) выключено

При включенном значении «Автовыравнивание» корректировку угла использовать не нужно.

Область

Прямоугольник области атрибута на странице. Подробное описание в п. 2.1.5. Добавить атрибут

Мин количество символов

Минимальное количество символов. По умолчанию стоит 0. Используется, если атрибут должен содержать в себе определенное количество символов, например, атрибут ИНН. Если вычисленное значение будет меньше указанного, — будет сгенерирована ошибка.

Тип данных

Тип данных для атрибута.

1.Text – текст
2.Intчисло
3.Floatвещественное число
4.Date Timeдата и время
5.Chars – только буквы (исключаются цифры и другие символы)
6.CountColorHSV количество точек в заданном интервале цвета. Значение должно быть указано в формате «H1-H2;S1-S2;V1-V2», где Н1, S1, V1 – это минимальные значения, а Н2, S2, V2 – максимальные значения.

Для определения печати задается диапазон цвета, в котором находится цвет печати. Для этого нужно воспользоваться палитрой цвета HSV, которая доступна при выборе «Формат значения» в настройках атрибута.

Цветовой диапазон определяется по трем координатам (H, S, V):

(H) оттенок – измеряется по горизонтальной оси слева направо, измеряется в ̊ (градусах), возможные значения [0;360̊]

(S) насыщенность — измеряется по вертикальной оси, в % (процентах), возможные значения [0;100%]

(V) значение/яркостьизмеряется в % (процентах), возможные значения [0;100%]

Для выбора цвета выберите цветовой диапазан (слева в окне Диапазан цвета), далее выберите цвет минимального значения Н (квадрат 1 — Н1), затем зажмите клавишу Shift и кликните мышкой на нужной точке.

.

Каждой координате соответствует две точки (минимальное и максимальное значение, определенное по палитре цвета HSV).

Значения отображаются в нижней части окна «Диапазон цвета» и устанавливаются нажатием кнопки «Выбрать».

Пример записи координат: «210-249;13-100;90-100». Значения записываются без кавычек, через « ; ».

Формат значения

Задается форматирование значения. Например, если тип значения дата и время, то, чтобы получить только дату, необходимо указать «dd.MM.yyyy».

Если тип значения CountColorHSV, то задайте интервал цвета в формате «H1-H2;S1-S2;V1-V

Формат указывается без кавычек.

Ошибка если значение пустое

В случае, если атрибут не был найден и значение осталось пустым после проверки, — выдается ошибка.

True (правда) – выключено

False (ложь) выключено

Описание

Пользовательское описание

Рабочие данные

Данные, вычисляемы в результате работы

Добавить атрибут

Существует несколько способов добавления Атрибута:

1.Нажатием кнопки на верхней панели Основного меню вы можете добавить новый Атрибут, который отобразится на правой рабочей панели меню во вкладке Атрибуты.

.

.

Этот наиболее простой способ добавления Атрибутов используется только для простых типовых форм документов, когда предполагается, что все обрабатываемые документы будут загружаться в одинаковом формате. Например, стандартные формы документов, сформированные в 1С.

Такой вариант не подойдет, если необходимо создать шаблон для документов, которые могут отличаться между собой размером изображения или расположением данных в самом документе. Т.е. Шаблонизатор будет распознавать атрибуты лишь в заданной области, без привязки к каким-либо якорям.

Прежде чем добавить Атрибут, необходимо нажать на кнопку «Обработать документ» на верхней панели Основного меню. Если этого не сделать, то функция выделения области атрибута будет неактивна и Шаблонизатор выдаст уведомление на нижней панели.

При нажатии кнопки «Добавить атрибут» появляется возможность определить область атрибута при помощи курсора, сделав выделение той области, которая должна содержать в себе Атрибут.

Для этого необходимо навести курсор на область, содержащую необходимый атрибут, нажать на левую кнопку мыши и, удерживая ее, растянуть область до нужных границ. Область атрибута будет отображаться синим прямоугольником, как на скриншоте ниже.

При этом на нижней панели Шаблонизатора будут отображаться координаты заданного Атрибута.

Эти координаты также будут указаны в свойствах Атрибута на панели настроек справа.

2.При создании шаблона для документов, которые могут отличаться между собой размером изображения или расположением текста, используемого в качестве атрибута, необходимо использовать второй способ добавления Атрибута.

.

Нажать кнопку   на правой рабочей панели меню во вкладке Атрибуты и задать основные настройки.

Для корректного распознавания области документа, данные из которой будут импортироваться в результаты, для атрибутов необходимо осуществлять привязку к ранее созданным якорям.

Ограничение линиями

В некоторых документах названия полей, которые мы используем в качестве якорей, могут располагаться не на нижней линии с описанием поля, а сверху или посередине, как на рисунке ниже.

В таких случаях для корректной привязки рекомендуем воспользоваться дополнительным параметром Ограничение линиям. Предварительно нужно проверить присутствуют ли в шаблоне OCR-линии, ограничивающие созданные нами атрибуты.

Нажимаем кнопку OCR-линии на верхней рабочей панели и проверяем наличие линий.

.

Линии подсвечены зеленым цветом и мы можем использовать их в качестве дополнительного ориентира в работе с атрибутами.

На верхней рабочей панели выбираем Атрибуты, кликаем левой клавишей мыши на один из атрибутов, после чего он становится активным и в правой рабочей панели открываются инструменты для работы с выбранным атрибутом.

Выбираем «Ограничение линиями», из выпадающего списка выбираем значение «Down». Таким образом мы ограничиваем нижнюю границу атрибута, которая теперь будет ориентироваться на OCR-линии.

Обязательно проверяем корректность отображения границ атрибута. При необходимости меняем значения данного параметра.

После проверки в шаблоне должен появиться синий прямоугольник, внутри которого отображены данные нашего атрибута.