Кравець П.О. Заохочувальне навчання мультиагентних систем

УДК 004.825; 004.891

П.О. Кравець
Національний університет “Львівська політехніка”,
кафедра інформаційних систем та мереж

ЗАОХОЧУВАЛЬНЕ НАВЧАННЯ МУЛЬТИАГЕНТНИХ СИСТЕМ

© Кравець П.О., 2012

Розглянуто проблему заохочувального навчання мультиагентних систем в ігровому формулюванні. Побудовано марківську модель стохастичної гри, сформульовано критерії ігрового навчання, описано Q-метод та відповідний алгоритм розв’язування стохастичної гри, проаналізовано результати комп’ютерної реалізації Q-методу.
Ключові слова: мультиагентна система, стохастична гра, заохочувальне навчання, Q-метод.

The problem of reinforcement learning of multiagent systems in the game formulation is considered. The Markovian model of stochastic game is constructed, criteria of game learning are formulated, the Q-method and corresponding algorithm of the stochastic game solving are described, results of computer realisation of a Q-method are analysed.
Keywords: multiagent system, stochastic game, reinfocement learning, Q-method.

Кількість посилань 16