Чертежи таблиц

Чертежи таблиц применяются для документов, в которых по каким-либо причинам отсутствуют границы таблиц. Это могут быть иностранные документы (например, Invoice), в которых линии таблиц не предусмотрены. Также это могут быть российские документы, в которых частично не прорисованы линии таблицы, как на скриншоте ниже (отсутствуют межстрочные линии).

.

Создание чертежа таблиц

Алгоритм обработки таблицы запускается после того, как на странице документа будет прорисован чертеж таблицы с недостающими линиями. Каждая линия отрисовывается вручную, например, при помощи языка программирования С# (си шарп).

После этого при нажатии кнопки OCR-таблицы или Чертежи таблицы таблица будет распознаваться с учетом прорисованных линий.

Цвет линий значения не имеет, т.к. алгоритм определения линий преобразует все цвета в градиент серого цвета.

Для корректного распознавания табличной части необходимо произвести привязку к якорям.

На рабочей панели справа отображаются все параметры, которые позволяют произвести настройку чертежа таблицы.

.

.

Описание

Можно указать описание чертежа таблицы

Левый верхний угол

Якорная привязка левого верхнего угла

Правый верхний угол

Якорная привязка правого верхнего угла

Правый нижний угол

Якорная привязка правого нижнего угла

Левый нижний угол

Якорная привязка левого нижнего угла

Колонки

Якорные привязки для колонок

Отображение рамок

Управление отображением рамок чертежа таблицы

Толщина рамки

Толщина рамки в пикселях

Цвет рамки

Цвет рамки в формате RGB. Например, «#000000» — черный цвет, «#FF0000» — красный цвет

Обрамление колонок

Отражает линии колонок на чертеже таблицы

Обрамление строк

Отражает линии строк на чертеже таблицы

Обрамление заголовка

Отображает первую строку на чертеже страницы

Рабочие данные

Данные, вычисляемые в результате работы

.Для осуществления привязки границ таблицы для каждого угла чертежа необходимо указать якорь и задать параметры расположения линий относительно выбранного якоря.

.

.

Свойства чертежей таблицы

Для каждого угла чертежа таблицы применяются следующие свойства:.

ID якоря

ID якоря, к которому происходит привязка

Параметр

Параметр привязки. Возможные значения:

1.TopLeftпривязка левого верхнего угла якоря к выбранному объекту привязки
2.TopRightпривязка правого верхнего угла якоря к выбранному объекту привязки
3.BottomLeftпривязка левого нижнего угла якоря к выбранному объекту привязки
4.BottomRightпривязка правого нижнего угла якоря к выбранному объекту привязки
5.Leftпривязка левой грани якоря (посередине) к выбранному объекту привязки
6.Topпривязка верхней грани якоря (посередине) к выбранному объекту привязки
7.Rightпривязка правой грани якоря (посередине) к выбранному объекту привязки
8.Bottomпривязка верхней грани якоря (посередине) к выбранному объекту привязки
9.LeftAreaпривязка всей левой области якоря к выбранному объекту привязки
10.RightAreaпривязка всей правой области якоря к выбранному объекту привязки
11.BottomAreaпривязка всей нижней области якоря к выбранному объекту привязки
12.TopAreaпривязка всей верхней области якоря к выбранному объекту привязки
13.FullAreaпривязка якоря со всех сторон к выбранному объекту привязки

Объект привязки

Указывается точка или грань области атрибута для привязки выбранного параметра

Принудительно

При включении указанный параметр якоря будет задан к выбранному объекту привязки принудительно и без проверок

Смещение Х

Смещает область атрибута по оси Х. Значение указывается в пикселах в формате +- для точного смещения. Например, +10-20. Используется в случае, когда после якоря указывается какой-либо символ (скобка или двоеточие), который не должен попасть в область атрибута.

Смещение Y

Смещение по оси Y. Укажите значение +- для точного смещения. Например, +10-20

.Привязка углов

Для привязки можно использовать как ранее созданные якоря, так и создавать новые. В момент создания якоря автоматически формируется ID якоря, который нужно указать в свойствах ID якоря..

Параметр привязки выбирается из выпадающего списка в зависимости от того, в каком направлении от якоря находится угол чертежа таблицы.

Например, нам нужно привязать Левый верхний угол чертежа таблицы к якорю «Сведения о поступившем оборудовании» (ID 1), указываем Параметр BottomLeft, также указываем Объект привязки BottomLeft, т.к. интересующий нас угол чертежа находится ниже якоря.

.

Смещение по осям Х и Y

В большинстве случаев для корректной прорисовки угла потребуется указать Смещение по оси Х и по оси У. Это связано с тем, что границы якоря не совпадают с началом границы чертежа. Если не указать смещение, то часть текста табличной части будет обрезана.   

.

.

Степень смещения определяется методом подбора оптимального значения (вручную), чтобы граница чертежа максимально охватывала область непрорисованной на документе таблицы.

Рекомендуем задавать такую степень смещения по оси Х, чтобы линии немного выходили за границы и образовывали угол (пересечение) с имеющимися вертикальными линиями. Точка пересечения позволит корректно распознать таблицу..

Для отображения рабочих данных применяются следующие свойства:.

Область

Текущая вычисленная область

Колонки

Вычисленные линии колонок

Строки

Вычисленные линии строк

Колонки

В случае, если на документе с таблицей отсутствуют также вертикальные линии, то необходимо осуществить настройку Колонок по аналогии с созданием горизонтальных линий.

Указывает ID якоря, к которому осуществляем привязку вертикальной линии, а также параметр (в зависимости от того, с какой стороны якоря необходимо разместить линию). При необходимости можно отрегулировать смещение. Высота вертикальных линий будет ограничена границами ранее заданного нами чертежа таблицы.

Для отображения рамок применяются следующие свойства:

.

Левая рамка

Отображение левой рамки чертежа таблицы

Верхняя рамка

Отображение верхней рамки чертежа таблицы

Правая рака

Отображение правой рамки чертежа таблицы

Нижняя рамка

Отображение нижней рамки чертежа таблицы

Толщина рамок

Указана в пикселах и задается пользователем вручную. При настройке этого параметра рекомендуем ориентироваться на толщину линий, имеющихся в таблице.

Если имеющиеся линии тонкие (например, в стандартных документах из 1С), — то и толщину рамок можем указать равную 1 (единице).

В случае, если имеющиеся линии таблицы толстые, то рекомендуем указывать 3 и более пикселей. Иначе робот может не распознать пересечения толстой и тонкой линий, и таблица распознается некорректно.

Обрамление заголовка

Используется в основном при обработке иностранных документов- Invoice, в которых нет четкого разграничения Заголовка документа. Заголовок отрисовывается по первой строке – линия, по которой будет определяться обрамлением заголовка.

Для отображения рабочих данных применяются следующие свойства:.

Область

Текущая вычисленная область

Колонки

Вычисленные линии колонок

Строки

Вычисленные линии строк