Как кластеризация объясняет ее роль в майнинге данных?
Как кластеризация объясняет ее роль в майнинге данных?

Видео: Как кластеризация объясняет ее роль в майнинге данных?

Видео: Как кластеризация объясняет ее роль в майнинге данных?
Видео: Целостность данных в микросервисной архитектуре / Николай Голов (Avito) 2024, Май
Anonim

Вступление. Это является интеллектуальный анализ данных техника, используемая для размещения элементов данных в их связанные группы. Кластеризация - это процесс разделения данных (или объектов) в один и тот же класс. Данные в одном классе больше похожи на каждый кроме тех в других кластер.

Кроме того, какая польза от кластеризации?

Кластеризация используется при сегментации рынка; когда мы пытаемся оштрафовать клиентов, похожих друг на друга, будь то поведение или атрибуты, сегментация / сжатие изображений; где мы пытаемся сгруппировать похожие регионы вместе, документ кластеризация по темам и т. д.

Также можно спросить, почему мы используем кластерный анализ? Кластерный анализ может быть мощным инструментом интеллектуального анализа данных для любой организации, которой необходимо идентифицировать отдельные группы клиентов, транзакции продаж или другие типы поведения и других вещей. Например, страховые компании используют кластерный анализ для выявления мошеннических требований, а банки используют его для кредитного скоринга.

Кроме того, что такое кластеризация в интеллектуальном анализе данных на примере?

Кластеризация - это процесс превращения группы абстрактных объектов в классы похожих объектов. А кластер из данные объекты можно рассматривать как одну группу. При этом кластер анализа, мы сначала разбиваем набор данные в группы по данные сходство, а затем присвойте группам метки.

Почему K означает кластеризацию?

Деловое использование. В K - означает, что используется алгоритм кластеризации чтобы найти группы, которые не были явно помечены в данных. Это может быть использовал для подтверждения бизнес-предположений о том, какие типы групп существуют, или для выявления неизвестных групп в сложных наборах данных.

Рекомендуемые: