Якоря

Якоряточки на сканированном документе, с помощью которых робот определяет, в какой части документа размещаются определенные данные.

При помощи якорей мы задаем границы определенных атрибутов. Якорей может быть сколь угодно много, в зависимости от типа документа. 

Инструменты для работы с якорями

При создании нового якоря на рабочей панели открывается список свойств и инструментов для работы с якорем.

Основные инструменты для работы с якорями:

Новый якорь

Добавляет новый якорь

Копировать якорь

Копирует выделенный якорь и автоматически добавляет новый якорь вместе с заданными настройками

Удалить якорь

Удаляет выделенный якорь

Добавить привязку

Добавляет новую привязку к выделенному якорю

Удалить привязку

Удаляет выделенную привязку

Переместить привязку вверх

Перемещает привязку вверх.

Переместить привязку вниз

Перемещает привязку вниз

.

Настройки якоря

Для работы с якорями предусмотрены следующие параметры:

ID

Идентификатор якоря. Присваивается автоматически.

Якорные привязки

Список якорных привязок. Для добавления новой привязки необходимо кликнуть на значение якорные привязки, затем кликнуть клавишей мыши на ранее созданный якорь на документе. Именно к этому якорю будет осуществляться привязка.

Тип

Выбирается из выпадающего списка:

1.Text – текст
2.Table – таблица или ячейка таблицы
3.Packet – пакет взаимозаменяемых якорей (при привязке к этому якорю будут взяты его подчиненные якоря, первый успешно найденный из списка)

Значение

Для якоря типа Text возможно указывать подстановочные знаки (*)(?)

Для якоря типа Table значение записывается в формате «Индекс таблицы:Индекс строки:Индекс колонки». Например, для Text «*обл* страх*» (два слова при включении «Раздельные слова»), для Table – «0:1:2» (таблица 0, строка 1, колонка 2), «1:2» (таблица 1, строка 2), «2» (вся таблица 2)

Режим работы

Режим работы якоря. Возможные значения:

1.Default – якорь обязателен на первой странице многостраничного документа
2.LastPage – якорь будет обязателен в многостраничном документе и укажет на последнюю страницу
3.Optional – необязательный якорь и если он не будет найден на странице, то ошибка не сгенерируется

Раздельные слова

При включенной настройке значение якоря разбивается на слова и каждое слово ищется отдельно

True (правда) – выключено

False (ложь) — выключено

Количество блоков

Если выбрано свойство «Раздельные слова», то при поиске якоря возможна ситуация, когда в заданной области могут быть найдены несколько значений блоков, соответствующие заданным словам.

Данное свойство позволяет ограничить максимальное количество слов между блоками

Описание

Пользовательское описание

Рабочие данные

Данные, вычисляемы в результате работы, используются только для справочной информации.

Подчиненные якоря

Якоря, напрямую зависящие от родительского якоря.

Поиск подчиненных якорей будет происходит только после того, как будет найден главный/родительский якорь. В случае, если в настройках родительского якоря указан режим «Optional» (т.е. он не является обязательным), и если родительский якорь не был найден, то и поиск подчиненных якорей не будет осуществлен, они будут пропускаться.

Эта опция используется, если атрибут находится в середине многостраничного документа.

Создание якоря

Для создания якоря переходим во вкладку «Якоря» в правой рабочей области Шаблонизатора и нажимаем кнопкув верхней части панели. В этот момент становятся активны «OCR блоки» и «OCR таблицы» для удобства выбора определенного блока в качестве якоря.

Для того, чтобы Шаблонизатор мог корректно определить местоположение атрибута в документе, необходимо ограничить его границы. Ограничение верхней границы задается по тексту, находящемуся на строку выше самого атрибута.

Для присвоения значения якорю достаточно кликнуть левой клавишей мыши по OCR-блоку (слову), которое мы выбрали в качестве якоря. Также можно указать значение вручную, написав якорное слово в строке Значение.

Когда значение якоря задается нажатием клавишей мыши на OCR-блок, — к значению автоматически добавляется знак «*», если значение указывается вручную, — вы также можете добавить этот знак. В некоторых документах встречаются слова с невидимыми символами (Unicode) или в конце слова может быть добавлен какой-либо другой символ (№, (, / и т.д.), который не позволит распознать заданный якорь. В таких случаях рекомендуем добавлять знак «*» по аналогии с Wildcard.

При использовании якорных привязок знак «*» нужно удалить и после этого добавить привязку.

В случае, если значение содержит два и более слова, — между ними необходимо ставить пробел, т.к. он выступает разделителем слов.

Шаблонизатор позволяет задать для якоря несколько альтернативных вариантов, по которым робот будет распознавать завершающий атрибут.

В строке «Значение» нажать на кнопку выпадающего окна, в котором достаточно прописать альтернативные варианты. Слово подпис*, указано без окончания, т.к. в документе может быть указано как подпись, там и подписи..

Проверяем корректность расположения якорей.

При создании якорей, в значении которых содержится несколько слов, необходимо указывать знак «*» в конце каждого слова, а между словами ставить пробел.

Если сочетание слов встречается в документе единожды, то второе слово можно написать сокращенно. Например, в качестве якоря по номеру документа можем указать «номер* докум

Если в начале значения якоря присутствует лишний символ (чаще всего это скобка), мы можем удалить этот символ и вместо него поставить знак «*». Тогда получим значение *организация* вместо (организация*.

При создании шаблона необходимо указать якорь, который будет завершать документ. Т.е. по этому якорю мы можем определить, что в документе таблиц больше нет и работу с таблицами можно завершать.

Завершающий якорь

При создании шаблона необходимо указать якорь, который будет завершать документ. Т.е. по этому якорю мы можем определить, что в документе таблиц больше нет и работу с таблицами можно завершать.

Для завершающего якоря указываем Режим работы – LastPage

Например, завершающим якорем может быть слово расшифровка*, т.к. чаще всего это слово указывается на последней странице документа.

Шаблонизатор позволяет задать для якоря несколько альтернативных вариантов, по которым робот будет распознавать завершающий атрибут.

Добавим слово подпис*, укажем намеренно без окончания, т.к. в документе может быть указано как подпись, там и подписи..

Если в документе отсутствует слово расшифровка*, то робот будет искать слово подпис*.

Якорные привязки

Основные инструменты для работы с якорными привязками:

ID якоря

ID якоря, к которому происходит привязка

Параметр

Параметр привязки. Возможные значения:

1.TopLeftпривязка левого верхнего угла якоря к выбранному объекту привязки
2.TopRightпривязка правого верхнего угла якоря к выбранному объекту привязки
3.BottomLeftпривязка левого нижнего угла якоря к выбранному объекту привязки
4.BottomRightпривязка правого нижнего угла якоря к выбранному объекту привязки
5.Leftпривязка левой грани якоря (посередине) к выбранному объекту привязки
6.Topпривязка верхней грани якоря (посередине) к выбранному объекту привязки
7.Rightпривязка правой грани якоря (посередине) к выбранному объекту привязки
8.Bottomпривязка верхней грани якоря (посередине) к выбранному объекту привязки
9.LeftAreaпривязка всей левой области якоря к выбранному объекту привязки
10.RightAreaпривязка всей правой области якоря к выбранному объекту привязки
11.BottomAreaпривязка всей нижней области якоря к выбранному объекту привязки
12.TopAreaпривязка всей верхней области якоря к выбранному объекту привязки
13.FullAreaпривязка якоря со всех сторон к выбранному объекту привязки

Объект привязки

Указывается точка или грань области атрибута для привязки выбранного параметра

Принудительно

При включении указанный параметр якоря будет задан к выбранному объекту привязки принудительно и без проверок

Смещение Х

Смещение по оси Х. Значение указывается в пикселах в формате +- для точного смещения. Например, +10-20

Смещение У

Смещение по оси Y. Укажите значение +- для точного смещения. Например, +10-20

.

Для создания привязок в созданном атрибуте нажимаем «Якорные привязки», далее «Добавить привязку», затем левой клавишей мыши кликаем на якорное слово (OCR-блок)..

Для корректного распознавания области документа, данные из которой будут импортироваться в результаты, для атрибутов необходимо осуществить привязку к ранее созданным якорям.

Привязка может осуществляться не только к атрибутам, находящимся справа и слева, но и к атрибутам сверху или снизу. Для определения нахождения нужной нам области данных необходимо воспользоваться Параметрами якорной привязки и выбрать из выпадающего списка подходящий параметр.

Например, чтобы ограничить область данных атрибута сверху, создаем якорную привязку к OCR-блоку. Нажимаем Добавить привязку, кликаем левой клавишей мыши на созданный ранее якорь. В параметрах привязки выбираем значение Bottom, т.к. в качестве ориентира мы будем использовать нижнюю границу данного якоря.

Помимо параметра в привязке для данного атрибута необходимо указать Объект привязки. Т.к. данные атрибута могут располагаться выше строки, которую мы выделили при помощи первых двух якорей слева и справа.

В строке Объект привязки указываем TopEdge — верхняя грань.

После проверки в шаблоне каждый атрибут будет отображаться в виде синей рамки. В случае, если границы рамки не захватывают всю область данных атрибута, необходимо внести изменения в настройки.

Рамка атрибута не всегда имеет ровную форму, правый верхний угол может быть выше левого верхнего угла, — это некритично. Главное, чтобы данные атрибута полностью помещались в созданную рамку.