Обучение модели кластеризации

Создаёт новую модель машинного обучения для кластеризации, обучает её на основе входных данных и сохраняет итоговую модель в файл

Данные для обучения

[Текст] Путь к файлу CSV, содержащему данные для обучения. Файл должен обязательно содержать корректные заголовки. Файл должен быть в формате UTF8

Номера колонок данных

[Текст] Номера колонок, содержащих данные. Разделитель запятая. Нумерация начинается с нуля. Например: «1,3»

Номера строковых колонок

[Текст] Номера колонок, содержащих текстовые данные. Разделитель запятая. Если данное значение будет не заполнено, то тип колонки будет распознаваться автоматически. Нумерация начинается с нуля. Например: «1,3»

Разделитель

[Текст] Разделитель колонок CSV

Тип алгоритма

Выбор типа алгоритма

Путь к модели

[Текст] Путь сохранения файла модели

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: «Default» — по умолчанию; «Ignore» — ошибки игнорируются; «Handle» — ошибки обрабатываются. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: «Default» — по умолчанию; «Release» — вывод отключен; «Debug» — вывод основной информации; «Detailed» — вывод подробной информации. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Кластеризация

Кластеризация входных данных на основе обученной модели машинного обучения.

Путь к модели

[Текст] Путь к файлу модели. Модель должна быть создана с помощью блока «Обучение модели кластеризации»

Данные

[Таблица данных] Входные данные. Колонки у таблицы должны совпадать с колонками, на которых происходило обучение модели

Название целевой колонки

[Текст] Название колонки для записи результата. Если колонки нет в данных, поступающих на вход блока, то она будет добавлена. Алгоритм позволяет записать в разные колонки id кластера и расстояние. Для этого в данном свойстве укажите два названия колонок через запятую. Например: «ClusterId,Distances»

Результат

[Таблица данных] Результат кластеризации

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: «Default» — по умолчанию; «Ignore» — ошибки игнорируются; «Handle» — ошибки обрабатываются. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: «Default» — по умолчанию; «Release» — вывод отключен; «Debug» — вывод основной информации; «Detailed» — вывод подробной информации. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока