Интеллектуальные информационные системы

Методы кластерного анализа


Термин "Кластерный анализ" впервые ввел Tryon в 1939.

Кластеризация – это операция автоматической классификации, в ходе которой  объекты объединяются в группы (кластеры) таким образом, что внутри групп различия между объектами минимальны, а между группами – максимальны. При этом в ходе кластеризации не только определяется состав кластеров, но и сам их набор и границы.

Поэтому вполне обоснованно считается, что методы кластерного анализа используются в большинстве случаев тогда, когда нет каких-либо априорных гипотез относительно классов, т.е. исследование находится на первой эмпирической стадии: описательной.

Существует большое количество различных алгоритмов кластеризации, которые обычно связаны с полным перебором объектов и весьма трудоемки в вычислительном отношении, здесь же мы упомянем лишь о трех из них:

– объединение (древовидная кластеризация);

– двухвходовое объединение;

– метод K средних.

Рассмотрим кратко эти алгоритмы (описание взято с сайта http://StatSoft.ru).



Содержание раздела