Обучение модели кластеризации
Создаёт новую модель машинного обучения для кластеризации, обучает её на основе входных данных и сохраняет итоговую модель в файл
Данные для обучения |
[Текст] Путь к файлу CSV, содержащему данные для обучения. Файл должен обязательно содержать корректные заголовки. Файл должен быть в формате UTF8 |
Номера колонок данных |
[Текст] Номера колонок, содержащих данные. Разделитель запятая. Нумерация начинается с нуля. Например: «1,3» |
Номера строковых колонок |
[Текст] Номера колонок, содержащих текстовые данные. Разделитель запятая. Если данное значение будет не заполнено, то тип колонки будет распознаваться автоматически. Нумерация начинается с нуля. Например: «1,3» |
Разделитель |
[Текст] Разделитель колонок CSV |
Тип алгоритма |
Выбор типа алгоритма |
Путь к модели |
[Текст] Путь сохранения файла модели |
Уровень обработки |
Выбор уровня обработки ошибок. Возможные значения: «Default» — по умолчанию; «Ignore» — ошибки игнорируются; «Handle» — ошибки обрабатываются. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы |
Уровень сообщений |
Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: «Default» — по умолчанию; «Release» — вывод отключен; «Debug» — вывод основной информации; «Detailed» — вывод подробной информации. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы |
Текст ошибки |
[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока |
Кластеризация
Кластеризация входных данных на основе обученной модели машинного обучения.
Путь к модели |
[Текст] Путь к файлу модели. Модель должна быть создана с помощью блока «Обучение модели кластеризации» |
Данные |
[Таблица данных] Входные данные. Колонки у таблицы должны совпадать с колонками, на которых происходило обучение модели |
Название целевой колонки |
[Текст] Название колонки для записи результата. Если колонки нет в данных, поступающих на вход блока, то она будет добавлена. Алгоритм позволяет записать в разные колонки id кластера и расстояние. Для этого в данном свойстве укажите два названия колонок через запятую. Например: «ClusterId,Distances» |
Результат |
[Таблица данных] Результат кластеризации |
Уровень обработки |
Выбор уровня обработки ошибок. Возможные значения: «Default» — по умолчанию; «Ignore» — ошибки игнорируются; «Handle» — ошибки обрабатываются. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы |
Уровень сообщений |
Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: «Default» — по умолчанию; «Release» — вывод отключен; «Debug» — вывод основной информации; «Detailed» — вывод подробной информации. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы |
Текст ошибки |
[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока |