Интеллектуальная обработка документов (IDP) в составе платформы Sherpa RPA — это программное решение, которое собирает, преобразует и обрабатывает данные из документов (PDF или отсканированных документов). 

Sherpa IDP сочетает технологии искусственного интеллекта для лучшей обработки ваших документов: 

  • компьютерное зрение, оптическое распознавание символов (OCR);
  • обработка естественного языка (NLP) и машинное обучение (ML);
  • большие языковые модели (LLM);
  • нейросеть для создания шаблонов.

Основные возможности

  • Определение типа документа (текстовый, табличный; одно- или многостраничный и т.д.). В случае, когда роботу требуется создать несколько шаблонов по различным типам документа (например, Акт отгрузки товара, Акт оказания услуг), Шаблонизатор автоматически подбирает наиболее подходящий шаблон из списка.
  • Исправление перспективы и перекосов скан-копии (фото) обрабатываемого документа.
  • Зонирование и сегментация документов.
  • Автоматический поиск и разметка таблиц, в том числе без видимых границ.
  • Динамическая привязка содержимого.
  • Проверка наличия печатей, подписей, рукописных текстов.
  • Извлечение корректной информации из скан-копии/фото документа.

Оперативная и качественная обработка документов – важный вопрос для каждого предприятия.

Наши специалисты всегда готовы проконсультировать вас по интересующим вопросам. Приглашаем вас записаться на встречу, в рамках которой для вас проведут презентацию и демонстрацию возможностей наших продуктов.

Типичные кейсы для RPA + OCR
Заведение бухгалтерских документов
Заведение кадровых документов
Проверка по чек-листам
Сверка документов
Маршрутизация документов
Особенности
  1. Встроена поддержка технологии распознавания текста OCR. В зависимости от
    решаемой задачи можно выбрать один из пяти OCR движков – Yandex Vision,
    Tesseract, ABBYY Cloud, ABBYY FineReader, Microsoft OCR. Возможно
    подключение дополнительных движков.
  2.  Встроены готовые шаблоны для обработки популярных форм документов
    (счета, накладные, счета-фактуры и т.д.).
  3. Встроена возможность создавать собственные шаблоны для обработки любых
    форм документов с помощью инструмента Шаблонизатор IDP. Основной
    функционал шаблонизатора: исправление перспективы и перекосов,
    зонирование и сегментация документа, автоматический поиск и разметка
    таблиц (даже без видимых границ), динамическая привязка содержимого,
    многопоточное распознавание. Поддерживается разбор многостраничных
    документов. Функционал шаблонизатора входит в поставку платформы и
    работает offline. Помимо работы с текстовой информацией шаблонизатор
    позволяет проверять наличие подписей, печатей, галочек в анкетах,
    штрих-кодов, QR-кодов и т.д. Для разработки шаблонов доступно более 100
    настроек.
  4. Поддерживается автоматическое создание шаблонов для распознавания
    документов — Auto IDP. Особенности технологии:
    ○ Нейросеть анализирует документ и создает шаблон автоматически
    ○ Небольшие правки в шаблон после авторазметки как правило в 5 раз
    быстрее, чем создание шаблона вручную с нуля
    ○ Шаблон обучается по одному экземпляру документа
    ○ Шаблон обучается без ручной разметки
    ○ Нейросеть используется только для создания шаблона. В продуктиве
    шаблоны работают уже без нейросети, автономно, при этом
    поддерживают разнообразные вариации внешнего вида документа
Доверьте обработку документов роботам
  • В 8 раз быстрее обрабатывайте данные из актов, счетов, накладных и других документов.
  • В 3 раза сократите расходы на обработку документов.
  • До 95% всех документов можно обрабатывать автоматически.
  • До 4000 часов в год сотрудники тратят меньше времени на операции с документам.
  • Процесс полностью передается на робота.
  • Робот может выполнять процессы 24 часа в сутки, 7 дней в неделю с минимальным контролем.
Как это работает?

Получение документов

Настраиваем Робота получать документы из нужного вам источника информации: из почты, ERP, CRM, ЭДО, мессенджера, WEB-ресурса и любого другого.

Предобработка

Пытаемся улучшить недочеты документа, полученные при сканировании или фотографировании: исправляем перекосы,  улучшаем контрастность и четкость изображения, проводим зонирование и сегментацию документа. 

Распознавание

Применяем Технологию OCR (оптическое распознавание символов) для преобразования изображения в текстовые данные, с которыми на следующих этапах будем работать.

Можно выбрать один или несколько OCR-движков из встроенных: оффлайн или онлайн, не требующие оплаты за страницы распознавания или с тарификацией от 13 копеек за страницу. 

Встроены: Яндекс.Vision | Tesseract | Microsoft OCR | ABBYY Cloud | ABBYY | Fine Reader Engine

Классификация

Определяем типы документов, категории, нужные признаки документов для выбора сценария их обработки.

Например: классифицировать документы входящие на e-mail по типу Счет-фактура и по названию контрагента (контрагент А, B, С). 

Извлечение данных

Для точного извлечения данных применяются различные методы и технологии на основе искусственного интеллекта:
- извлечение данных по шаблону;
- поиск.

Постобработка документа

Технические правки: исправление ошибок, форматирование текста, преобразование в нужный формат, исправление опечаток, коррекция слов, контекстная обработка и другие методы.

Применение пользовательских проверок

Возможна реализация любого сценария проверки извлеченных данных по техническому заданию. Все, что сотрудник проверяет “глазами” может проверять и робот: 

  • проверки наличия подписей, печатей, галочек;
  • проверки на “правильность” данных, например, подсчет количества символов в полях, проверка по словарям, наличие в базах, проверка на совпадение распознанных данных с данными в информационных системах и так далее;

  • обработки с помощью запросов к классическим генеративным моделям Open AI, ChatGPT.

Подтверждение данных

При необходимости сотрудник может подтвердить или исправить извлеченные данные.

Отправка данных

Извлеченные данные можно анализировать, классифицировать, преобразовывать и экспортировать во внешние системы, в файлы различных форматов, экспорт в базы данных, запись в учетные системы и другие информационные системы, исходя из требований бизнеса.

Аналитика

Используйте Unattended режим для получения расширенной аналитики по обработке документов. Или настройте “отчет робота” с основными параметрами в Attended режиме.

 

Наши специалисты всегда готовы проконсультировать вас по интересующим вопросам. Приглашаем вас записаться на встречу, в рамках которой для вас проведут презентацию и демонстрацию возможностей наших продуктов.

Основные преимущества Sherpa IDP шаблонизатор

Автоматический поиск и разметка таблиц
Автоматический поиск и разметка таблиц, в том числе без видимых границ.

Универсальная и гибкая настройка
Динамическая привязка содержимого позволяет находить необходимые данные, даже если их положение в документе изменилось. 

Высокая точность
Для обеспечения наивысшей точности на выбор встроено пять OCR-движков. Поддерживается обработка многостраничных документов.

Увеличение производительности в 10 раз
Функция распознавания счетов позволяет обрабатывать счета-фактуры намного быстрее, сотрудники освобождаются от утомительного ввода данных.

Снижение затрат на обработку документов
Автоматический ввод данных значительно снижает ваши эксплуатационные расходы.

Сокращение числа ошибок
Устранение человеческих ошибок, вызванных стрессом и усталостью. Весь процесс может выполняться без участия человека.

Полный цикл обработки документов

  • Единый конвейер для обработки всех видов документов для всех бизнес-процессов
  • Взаимодействие с любыми системами без прямой интеграции
  • Гибкая настройка правил обработки для различных бизнес-процессов

 

 

Кейсы

Мебельная фабрика “Мария” роботизирует процессы в бухгалтерии с помощью платформы Sherpa RPA

Компания «Мария» — известный российский производитель мебели для дома. Проект Роботизация процессов бухгалтерии Примеры реализованных роботов 1) Робот для автоматизации процесса сверки бухгалтерских документов. Роботизация всех этапов сверки. 1 этап - рассылка запросов...

КамаСтройИнвест роботизировала внутренние бизнес-процессы с помощью платформы Шерпа Роботикс

КамаСтройИнвест специализируется на строительстве уникальных объектов жилой и коммерческой недвижимости в Казани. Примеры реализованных роботов Составление отчетов по этапам строительства объектов Обработка большого объема банковских выписок Обмен данными между различными информационными системами Анализ...

Группа «Самолет» автоматизировала более 60 внутренних бизнес-процессов с помощью программных роботов

Самолет - одна из крупнейших федеральных корпораций в сфере proptech и девелопмента. Проект Роботизация бизнес-процессов в сфере финансово-экономической деятельности компании Примеры реализованных роботов Сравнение остатков по счетам с данными от банков Распределение банковских...