Babichev S., Lytvynenko V., Taif M. А., Sharko А. Hybrid model of inductive clustering system of high-dimensional data based on the sota algorithm.

UDK 004.048

S. 1Babichev1, V. Lytvynenko2, M. А. Taif2, А. Sharko2
1Jan Evangelista Purkinje University in Usti nad Labem, Czech Republic
2Kherson National Technical University, Kherson, Ukraine

HYBRID MODEL OF INDUCTIVE CLUSTERING SYSTEM
OF HIGH-DIMENSIONAL DATA BASED ON THE SOTA ALGORITHM

© Babichev S., Lytvynenko V., Taif M. A., Sharko A., 2016

Подано модель системи кластеризації високорозмірних даних на основі комплекс¬ного використання самоорганізуючого алгоритму СОТА і методів індуктивного моделювання складних систем. Якість кластеризації оцінюється на двох рівнопотужних підмножинах з використанням комплексного критерію балансу, у якому враховані як зміщення центрів мас відповідних кластерів різних підмножин, так і розподіл об'єктів у відповідних кластерах відносно центра мас. Для кластеризації об'єктів на кожній з підмножин запропоновано використовувати алгоритм СОТА, що являє собою тип самоорганізуючих нейронних мереж на основі карт Кохонена і алгоритму вирощування просторової клітинної структури Fritzke.

Ключові слова: кластеризація, індуктивне моделювання, алгоритм СОТА, критерій балансу, високорозмірні дані.

Model of high-dimensional data clustering system based on the complex use of Self-organizing SOTA algorithm and inductive modeling methods of complex systems is presented in the article. The quality of clustering is evaluated at two equal power subsets with the use of complex balance criterion, which takes into account both the displacement the mass centers of the appropriate clusters of different subsets and distribution of objects in the appropriate clusters relative to the mass center. The SOTA algorithm, which is a type of Self-organizing neural networks based on Kohonen maps and algorithm of spatial cell structure of Fritzke growing, is proposed to use for the clustering of objects in each of the subsets.

Key words: clustering, inductive modeling, SOTA algorithm, criterion of balance, high-dimensional data.
Література – 10