Обучение модели кластеризации. Кластеризация

Обучение модели кластеризации

Создаёт новую модель машинного обучения для кластеризации, обучает её на основе входных данных и сохраняет итоговую модель в файл

Данные для обучения	[Текст] Путь к файлу CSV, содержащему данные для обучения. Файл должен обязательно содержать корректные заголовки. Файл должен быть в формате UTF8
Номера колонок данных	[Текст] Номера колонок, содержащих данные. Разделитель запятая. Нумерация начинается с нуля. Например: «1,3»
Номера строковых колонок	[Текст] Номера колонок, содержащих текстовые данные. Разделитель запятая. Если данное значение будет не заполнено, то тип колонки будет распознаваться автоматически. Нумерация начинается с нуля. Например: «1,3»
Разделитель	[Текст] Разделитель колонок CSV
Тип алгоритма	Выбор типа алгоритма
Путь к модели	[Текст] Путь сохранения файла модели
Уровень обработки	Выбор уровня обработки ошибок. Возможные значения: «Default» — по умолчанию; «Ignore» — ошибки игнорируются; «Handle» — ошибки обрабатываются. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы
Уровень сообщений	Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: «Default» — по умолчанию; «Release» — вывод отключен; «Debug» — вывод основной информации; «Detailed» — вывод подробной информации. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы
Текст ошибки	[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Кластеризация

Кластеризация входных данных на основе обученной модели машинного обучения.

Путь к модели	[Текст] Путь к файлу модели. Модель должна быть создана с помощью блока «Обучение модели кластеризации»
Данные	[Таблица данных] Входные данные. Колонки у таблицы должны совпадать с колонками, на которых происходило обучение модели
Название целевой колонки	[Текст] Название колонки для записи результата. Если колонки нет в данных, поступающих на вход блока, то она будет добавлена. Алгоритм позволяет записать в разные колонки id кластера и расстояние. Для этого в данном свойстве укажите два названия колонок через запятую. Например: «ClusterId,Distances»
Результат	[Таблица данных] Результат кластеризации
Уровень обработки	Выбор уровня обработки ошибок. Возможные значения: «Default» — по умолчанию; «Ignore» — ошибки игнорируются; «Handle» — ошибки обрабатываются. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы
Уровень сообщений	Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: «Default» — по умолчанию; «Release» — вывод отключен; «Debug» — вывод основной информации; «Detailed» — вывод подробной информации. Если выбрано значение «Default«, то будет использоваться значение блока «Старт» данной диаграммы
Текст ошибки	[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока