Интерпретация результатов, выявление кластеров и нетипичных объектов


После того как топологическое представление данных создано, необходимо провести проверку полученного на плоскости выходных параметрах изображения на достоверность. Это можно сделать несколькими способами. Ключевой составляющей в этом является экспертная оценка. С целью простой проверки можно распечатать перечень входных векторов, рассортированных по узлам или кластерам плоскости выходных параметров. В качестве другого способа может быть использован расчет итоговой статистики для каждого кластера. Обычно программы показывают среднее значение, стандартное отклонение, минимальное и максимальное значения, а также сумму значений для одного или нескольких узлов.

Возможность анализа характеристик отдельных узлов дает эффективное средство исследования результатов конкретного визуального представления, а также настройки АНС путем изменения порога или минимального размера кластеров.

В зависимости от используемого программного обеспечения, соответствующие кластерам средние значения могут быть даже отображены на экране. В этом случае исследователь может в интерактивном режиме проанализировать каждый кластер и удостовериться, имеют ли итоговые данные смысл. Программы дают возможность идентифицировать кластеры по характерным значениям компонент в интерактивном режиме. Сравнение значений в различных узлах и кластерах дает исследователю возможность определить оптимальную детализацию плоскости выходных параметров, необходимость преобразования данных и более тонкой настройки приоритетов некоторых компонент и, наконец, оценить универсальность выходного изображения. Иными словами, возможность проверки значений каждого узла и кластера в интерактивном режиме имеет большое значение для реализации динамичного процесса обработки данных, а также для включения в него экспертных оценок и информации о природе исходных данных.

Содержание раздела