Кравець П. О. Матрична стохастична гра з Q-навчанням

УДК 004.852; 004.94

П. О. Кравець
Національний університет “Львівська політехніка”,
кафедра інформаційних систем та мереж

МАТРИЧНА CТОХАCТИЧНА ГРА З Q-НАВЧАННЯМ
© Кравець П. О., 2015

Розроблена модель матричної стохастичної гри для прийняття рішень в умовах невизначеності. Запропоновано метод Q-навчання для розв’язування стохастичної гри з апріорі невідомими матрицями виграшів. Виконано формулювання ігрової задачі, описано марківський рекурентний метод та алгоритм для її розв’язування. Отримано та проаналізовано результати комп’ютерного моделювання стохастичної гри з Q-навчанням.
Ключові слова: стохастична гра, умови невизначеності, Q-навчання, марківський рекурентний метод.

The model of matrix stochastic game for decision-making in the conditions of uncertainty is developed. The method of Q-learning for stochastic game solving with a priori unknown gains matrices is offered. The formulation of a game problem is executed. The Markovian recurrent method and algorithm for the game solving are described. Results of computer modelling of stochastic game with Q-learning are received and analysed.
Key words: stochastic game, uncertainty conditions, Q-learning, Markovian recurrent method.

Література – 13