Интеллектуальная обработка документов (IDP) в составе платформы Sherpa RPA — это программное решение, которое собирает, преобразует и обрабатывает данные из документов (PDF или отсканированных документов).
Sherpa IDP сочетает технологии искусственного интеллекта для лучшей обработки ваших документов:
- компьютерное зрение, оптическое распознавание символов (OCR);
- обработка естественного языка (NLP) и машинное обучение (ML);
- большие языковые модели (LLM);
- нейросеть для создания шаблонов.
Основные возможности
- Определение типа документа (текстовый, табличный; одно- или многостраничный и т.д.). В случае, когда роботу требуется создать несколько шаблонов по различным типам документа (например, Акт отгрузки товара, Акт оказания услуг), Шаблонизатор автоматически подбирает наиболее подходящий шаблон из списка.
- Исправление перспективы и перекосов скан-копии (фото) обрабатываемого документа.
- Зонирование и сегментация документов.
- Автоматический поиск и разметка таблиц, в том числе без видимых границ.
- Динамическая привязка содержимого.
- Проверка наличия печатей, подписей, рукописных текстов.
- Извлечение корректной информации из скан-копии/фото документа.
Оперативная и качественная обработка документов – важный вопрос для каждого предприятия.
Наши специалисты всегда готовы проконсультировать вас по интересующим вопросам. Приглашаем вас записаться на встречу, в рамках которой для вас проведут презентацию и демонстрацию возможностей наших продуктов.
Типичные кейсы для RPA + OCR
Особенности
- Встроена поддержка технологии распознавания текста OCR. В зависимости от
решаемой задачи можно выбрать один из пяти OCR движков – Yandex Vision,
Tesseract, ABBYY Cloud, ABBYY FineReader, Microsoft OCR. Возможно
подключение дополнительных движков. - Встроены готовые шаблоны для обработки популярных форм документов
(счета, накладные, счета-фактуры и т.д.). - Встроена возможность создавать собственные шаблоны для обработки любых
форм документов с помощью инструмента Шаблонизатор IDP. Основной
функционал шаблонизатора: исправление перспективы и перекосов,
зонирование и сегментация документа, автоматический поиск и разметка
таблиц (даже без видимых границ), динамическая привязка содержимого,
многопоточное распознавание. Поддерживается разбор многостраничных
документов. Функционал шаблонизатора входит в поставку платформы и
работает offline. Помимо работы с текстовой информацией шаблонизатор
позволяет проверять наличие подписей, печатей, галочек в анкетах,
штрих-кодов, QR-кодов и т.д. Для разработки шаблонов доступно более 100
настроек. - Поддерживается автоматическое создание шаблонов для распознавания
документов — Auto IDP. Особенности технологии:
○ Нейросеть анализирует документ и создает шаблон автоматически
○ Небольшие правки в шаблон после авторазметки как правило в 5 раз
быстрее, чем создание шаблона вручную с нуля
○ Шаблон обучается по одному экземпляру документа
○ Шаблон обучается без ручной разметки
○ Нейросеть используется только для создания шаблона. В продуктиве
шаблоны работают уже без нейросети, автономно, при этом
поддерживают разнообразные вариации внешнего вида документа
Доверьте обработку документов роботам
- В 8 раз быстрее обрабатывайте данные из актов, счетов, накладных и других документов.
- В 3 раза сократите расходы на обработку документов.
- До 95% всех документов можно обрабатывать автоматически.
- До 4000 часов в год сотрудники тратят меньше времени на операции с документам.
- Процесс полностью передается на робота.
- Робот может выполнять процессы 24 часа в сутки, 7 дней в неделю с минимальным контролем.
Как это работает?
Получение документов
Настраиваем Робота получать документы из нужного вам источника информации: из почты, ERP, CRM, ЭДО, мессенджера, WEB-ресурса и любого другого.
Предобработка
Пытаемся улучшить недочеты документа, полученные при сканировании или фотографировании: исправляем перекосы, улучшаем контрастность и четкость изображения, проводим зонирование и сегментацию документа.
Распознавание
Применяем Технологию OCR (оптическое распознавание символов) для преобразования изображения в текстовые данные, с которыми на следующих этапах будем работать.
Можно выбрать один или несколько OCR-движков из встроенных: оффлайн или онлайн, не требующие оплаты за страницы распознавания или с тарификацией от 13 копеек за страницу.
Встроены: Яндекс.Vision | Tesseract | Microsoft OCR | ABBYY Cloud | ABBYY | Fine Reader Engine
Классификация
Определяем типы документов, категории, нужные признаки документов для выбора сценария их обработки.
Например: классифицировать документы входящие на e-mail по типу Счет-фактура и по названию контрагента (контрагент А, B, С).
Извлечение данных
Для точного извлечения данных применяются различные методы и технологии на основе искусственного интеллекта:
- извлечение данных по шаблону;
- поиск.
Постобработка документа
Технические правки: исправление ошибок, форматирование текста, преобразование в нужный формат, исправление опечаток, коррекция слов, контекстная обработка и другие методы.
Применение пользовательских проверок
Возможна реализация любого сценария проверки извлеченных данных по техническому заданию. Все, что сотрудник проверяет “глазами” может проверять и робот:
- проверки наличия подписей, печатей, галочек;
- проверки на “правильность” данных, например, подсчет количества символов в полях, проверка по словарям, наличие в базах, проверка на совпадение распознанных данных с данными в информационных системах и так далее;
- обработки с помощью запросов к классическим генеративным моделям Open AI, ChatGPT.
Подтверждение данных
При необходимости сотрудник может подтвердить или исправить извлеченные данные.
Отправка данных
Извлеченные данные можно анализировать, классифицировать, преобразовывать и экспортировать во внешние системы, в файлы различных форматов, экспорт в базы данных, запись в учетные системы и другие информационные системы, исходя из требований бизнеса.
Аналитика
Используйте Unattended режим для получения расширенной аналитики по обработке документов. Или настройте “отчет робота” с основными параметрами в Attended режиме.
Наши специалисты всегда готовы проконсультировать вас по интересующим вопросам. Приглашаем вас записаться на встречу, в рамках которой для вас проведут презентацию и демонстрацию возможностей наших продуктов.
Основные преимущества Sherpa IDP шаблонизатор
Автоматический поиск и разметка таблиц
Автоматический поиск и разметка таблиц, в том числе без видимых границ.
Универсальная и гибкая настройка
Динамическая привязка содержимого позволяет находить необходимые данные, даже если их положение в документе изменилось.
Высокая точность
Для обеспечения наивысшей точности на выбор встроено пять OCR-движков. Поддерживается обработка многостраничных документов.
Увеличение производительности в 10 раз
Функция распознавания счетов позволяет обрабатывать счета-фактуры намного быстрее, сотрудники освобождаются от утомительного ввода данных.
Снижение затрат на обработку документов
Автоматический ввод данных значительно снижает ваши эксплуатационные расходы.
Сокращение числа ошибок
Устранение человеческих ошибок, вызванных стрессом и усталостью. Весь процесс может выполняться без участия человека.
Полный цикл обработки документов
- Единый конвейер для обработки всех видов документов для всех бизнес-процессов
- Взаимодействие с любыми системами без прямой интеграции
- Гибкая настройка правил обработки для различных бизнес-процессов
Кейсы
Мебельная фабрика “Мария” роботизирует процессы в бухгалтерии с помощью платформы Sherpa RPA
Компания «Мария» — известный российский производитель мебели для дома. Проект Роботизация процессов бухгалтерии Примеры реализованных роботов 1) Робот для автоматизации процесса сверки бухгалтерских документов. Роботизация всех этапов сверки. 1 этап - рассылка запросов...
КамаСтройИнвест роботизировала внутренние бизнес-процессы с помощью платформы Шерпа Роботикс
КамаСтройИнвест специализируется на строительстве уникальных объектов жилой и коммерческой недвижимости в Казани. Примеры реализованных роботов Составление отчетов по этапам строительства объектов Обработка большого объема банковских выписок Обмен данными между различными информационными системами Анализ...
Группа «Самолет» автоматизировала более 60 внутренних бизнес-процессов с помощью программных роботов
Самолет - одна из крупнейших федеральных корпораций в сфере proptech и девелопмента. Проект Роботизация бизнес-процессов в сфере финансово-экономической деятельности компании Примеры реализованных роботов Сравнение остатков по счетам с данными от банков Распределение банковских...