КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 17-11-01093

НазваниеПриближенно оптимальные стратегии в игровых задачах управления

РуководительАвербух Юрий Владимирович, Доктор физико-математических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт математики и механики им.Н.Н.Красовского Уральского отделения Российской академии наук, Свердловская обл

Период выполнения при поддержке РНФ 2017 г. - 2019 г.  , продлен на 2020 - 2021. Карточка проекта продления (ссылка)

Конкурс№18 - Конкурс 2017 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-204 - Математические проблемы теории управления

Ключевые словауправляемые системы, дифференциальные игры, стохастическое управление, игры со случайной продолжительностью, тауберовы теоремы, равновесие по Нэшу, игры в пространстве вероятностей, уравнения Гамильтона-Якоби, метод исчезающей вязкости

Код ГРНТИ27.37.19


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Игровые задачи управления были предложены как математический аппарат исследования целого ряда постановок, возникающих при исследовании механических систем, экономических и биологических моделей. Игровые задачи управления тесно связаны с теорией уравнений (систем уравнений) в частных производных: функция цены игровой задачи управления является решением уравнения (системы уравнений) Беллмана. Эти уравнения являются уравнениями первого порядка для детерминированного случая и параболическими уравнениями второго порядка для стохастического случая. При этом антагонистические игровые задачи соответствуют одному уравнению, а неантагонистические игры соответствуют системам. Отметим, что для систем уравнений в частных производных теоремы существования и единственности решения доказаны лишь для некоторых частных случаев. В то же время, исследование антагонистических дифференциальных игр позволило в работах А.И. Субботина, M.Crandall, P.-L. Lions построить теорию обобщенных решений одного уравнения в частных производных первого порядка. Представляется, что дальнейшее исследование игровых задач управления будет востребовано в теории уравнений в частных производных. Необходимо отметить, что во многих случаях построение точных решений игровых задач управления затруднено, что приводит к необходимости конструировать и исследовать приближенно оптимальные стратегии и аппроксимации функции цены. Аппроксимации функции цены детерминированной игры, в частности, могут быть получены на основе решений параболических уравнений (систем параболических уравнений), что задает связь между теориями уравнений (систем уравнений) первого и второго порядка. Также аппроксимации функции цены могут быть получены на тауберовых теоремах, которые позволят гарантировать равенство пределов функций цены при изменении временного масштаба (например при стремлении длины промежутка усреднения к бесконечности или параметра дисконтирования к нулю). Также для многих игровых задач характерна неполнота информации о таких параметрах системы как промежуток управления и начальное положение системы. Исследование подобных задач актуально как с точки зрения приложений, так и с точки зрения связи данных задач с уравнениями в частных производных в пространстве вероятностей. Подобные уравнения появляются в бурно развивающейся теории игр среднего поля. Упомянутые выше задачи будут исследоваться как для антагонистической и неантагонистической постановки. В последнем случае под решением игры будет пониматься равновесие по Нэшу. Задачи, которые будут рассматриваться в проекте, можно разделить на три группы. 1. Построение приближенные решений в игровых задачах управления с полной информацией. В рамках этой части проекта будут построены приближенно оптимальные детерминированные и стохастические стратегии. Целью этой части проекта будет исследование связи функции цены и предела решений систем параболически уравнений при стремлении коэффициента вязкости к нулю, построение аппроксимаций функции цены решениями систем обыкновенных дифференциальных уравнений, а также анализ связей между играми на конечном промежутке и играми на бесконечном промежутке с различным дисконтированием. 2. Построение точных решений в игровых задачах с неполной информацией о промежутке управления или о начальной позиции. Неполноту информации планируется моделировать вероятностным распределением. Это приводит к тому, что в рамках данной группы задач будут исследоваться задачи со случайным промежутком управления и задачи игрового управления в пространстве вероятностей. В последнем случае динамика системы будет задаваться уравнением Лиувилля (уравнением неразрывности), которое может быть получено как усреднение обыкновенных дифференциальных уравнений по фазовому пространству. Целями данной части проекта являются теоремы существования решений игровых задач управления, исследование необходимых и достаточных условий оптимальности стратегий в игровых задачах управления. В частности, достаточные условия в некоторых случаях будут получены на основе решений уравнений (систем уравнений) в частных производных Беллмана. 3. Исследование модельных дифференциальных игр, возникающих в экономических задачах и в задачах природно-охранного менеджмента. Рассматриваемые в проекте задачи возникли при анализе проблем снижения вредных выбросов и при анализе экономических рисков демонополизации разработки природных ресурсов. Будут исследоваться в предположении о неполной информации на основе общих методов, разработанных в ходе выполнения проекта. Отметим новизну рассматриваемых в проекте задач. Новыми являются вопросы построения приближенных стратегий и аппроксимаций функции цены как на основе решений систем параболических уравнений и систем обыкновенных дифференциальных уравнений, так и на основе тауберовых теорем. Также новыми являются постановки дифференциальных игр на случайном промежутке. Игровые задачи управления в пространстве вероятностей ранее систематически не изучались.

Ожидаемые результаты
Результатами проекта будут новые подходы к построению приближенно оптимальных стратегий и аппроксимаций функции цены в игровых задач управления, а также теоремы существования и характеризация решений для новых постановок динамических игр, включая игры со случайным промежутком управления и игры в пространстве вероятностей. Предполагается, что будут получены следующие основные результаты. 1. Для дифференциальной игры с полной информацией на конечном промежутке будет построено приближенное равновесие по Нэшу в классе стохастических стратегий. При этом ожидаемый выигрыш игроков будет задаваться решением системы параболических уравнений, описывающих функцию цены неантагонистической стохастической дифференциальной игры, полученной из исходной добавлением малого «белого» шума. Будет показано, что поточечный предел решений систем параболических уравнений при стремлении коэффициента при лапласиане к нулю задает некоторое равновесие в исходной дифференциальной игре. 2. Будут построены приближения функции цены неантагонистической дифференциальной игры конечными и бесконечными системами обыкновенных дифференциальных уравнений. Эти системы являются аналогами уравнений Беллмана для аппроксимирующих марковских игр. 3. Для антагонистических игр на бесконечном промежутке будет найден класс усреднений такой, что всякое приближенное решение для произвольного метода усреднения из данного класса дает ту же асимптотику и для всех методов из этого класса. Будет показано, что усреднения в силу экспоненциального и равномерного законов лежат в данном классе. Для игры n лиц будет показано, что всякое стационарное приближенное равновесие по Нэшу инвариантно к выбору метода усреднения из достаточно широкого класса. 4. Для игр со случайной продолжительностью будет показано существование равновесия по Нэшу в классе программных стратегий для случая гибридной функции распределения момента окончания. В терминах метода динамического программирования будет сформулировано достаточное условие равновесия по Нэшу в классе позиционных стратегий для игр со случайной продолжительностью и гибридной функцией распределения момента окончания. 5. Будет доказана теорема существования равновесия по Нэшу для динамических игр в пространстве вероятностей, описываемых (в том числе нелокальным) уравнением неразрывности. Будут найдены необходимые условия равновесия по Нэшу для игровой задачи в пространстве вероятностей в случае, если динамика описывается уравнением неразрывности. 6. Будут решены следующие модельные задачи: дифференциальная игра управления объемами вредных выбросов со случайной продолжительностью, дифференциальная игра управления инвестициями в рекламную кампанию, момент окончания которой является случайной величиной, игровая задача совместной разработки месторождения компаниями, выходящими на рынок в случайные моменты времени. Предполагаемые результаты позволят установить взаимосвязь между различными постановками игровых задач управления: между задачами на конечном и бесконечном промежутке, между стохастическими играми с непрерывным временем и детерминированными игровыми задачами управления. Также результаты проекта примыкают к теории вязких решений систем уравнений в частных производных первого порядка. Рассматриваемые в проекте новые постановки игровых задач управления (игры со случайным промежутком управления и игры на пространстве вероятностей) возникают, в частности, в экономических задачах, задачах природно-охранного менеджмента и задачах управления системами большого числа однотипных объектов. Полученные, в том числе теоретические, результаты позволят решать целый ряд конкретных прикладных задач. Некоторые задачи будут исследованы в рамках проекта. Предполагаемые результаты проекта находятся на мировом уровне и будут опубликованы в серии статей в рецензируемых российских и зарубежных научных изданиях, в том числе индексируемых в базе данных «Web of Science», «Scopus» и РИНЦ.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2017 году
Работы по проекту, выполненные в 2017 году, можно разделить на три больших группы: - исследование дифференциальных игр с полной информацией; - исследование дифференциальных игр с неопределенностью в тех или иных данных; - решение модельных примеров. В части проекта, касающейся игр с полной информацией, исследовались конструкции и свойства приближенно оптимальных решений. Необходимость построения приближенно оптимальных решений связана с тем, что во многих случаях дифференциальные игры относятся к классу труднорешаемых задач. В частности, неантагонистические игры приводят к системам уравнений Гамильтона-Якоби, общую теорию решений которых пока построить не удалось. Для построения приближенного решения мы рассматриваем вспомогательную динамическую игру другой структуры (с динамикой, задаваемой случайным процессом, или с функционалом платы, обладающим лучшими свойствами сходимости). Для игр на конечном промежутке для построения приближенного равновесия использовалось решение вспомогательной стохастической игры с непрерывным временем. Отметим, что класс этих игр является достаточно широким, в частности, он включает игры с динамикой, задаваемой стохастическими дифференциальными уравнениями, полученными из исходной детерминированной динамики добавлением малого белого шума. Для построения приближенно равновесной пары стратегий использовалась пара функций, удовлетворяющая условиям стабильности во вспомогательной стохастической игре. Отметим, что если в качестве вспомогательной была выбрана стохастическая дифференциальная игра, то искомая пара функций является решением системы параболических уравнений. В этом случае можно говорить о том, что построено приближенное равновесие, реализующее решение системы параболических уравнений с малым коэффициентом вязкости. Было проведено исследование предела выигрышей игроков в случае, когда вспомогательная стохастическая игра сходится к исходной детерминированной. Было показано, что этот предел определяет некоторый выигрыш в ситуации точного равновесия по Нэшу в классе стохастических стратегий. Также было доказано, что множество выигрышей, соответствующих точным равновесиям по Нэшу в классе стохастических стратегий, равно выпуклой оболочке множества выигрышей в ситуациях точного равновесия по Нэшу в классе детерминированных стратегий. Показано, что в случае дифференциальной игры с однотипными игроками переход к стохастическим стратегиям может привести к увеличению симметрического выигрыша. В заданной области были построены аппроксимации функции цены антагонистической дифференциальной игры решением системы конечного числа обыкновенных дифференциальных уравнений. Данная конструкция основана на приближении в заданном компакте дифференциальной игры стохастической игрой, задаваемой марковской цепью с конечным числом состояний. Этот результат и его предполагаемый аналог для неантагонистических игр могут быть использованы для построения численных методов в дифференциальных играх. Также рассматривались антагонистические  игры на бесконечном промежутке. В таких задачах достаточно часто потенциальная бесконечность временного промежутка моделируется платежами, усредненными в соответствии с плотностью, зависящей от некоторого параметра масштабирования. Принципиально важными здесь являются случаи усреднения по всё большему промежутку планирования и усреднения с всё меньшей процентной ставкой (равномерное и экспоненциальное распределения соответственно). Мы исследовали асимптотику функции цены при стремлении параметра масштабирования к предельному значению, заменяя исходную игру на игру с усреднением, задаваемым равномерным или экспоненциальным распределением. Для этого было введено отображение, сопоставляющее каждой платежной функции соответствующую ей функцию цены. Основное утверждение доказано в случае, когда это отображение монотонно и удовлетворяет принципу динамического программирования. Был получен аналог т. н. тауберовой теоремы: если цены нечувствительны к выбору достаточно большого промежутка при равномерном усреднении или нечувствительны к выбору все меньшей процентной ставки при экспоненциальном усреднении, то та же асимптотика цен будет иметь место и при произвольном выборе кусочно-непрерывной плотности (в том числе равномерной и экспоненциальной) при стремлении параметра масштабирования к предельному значению. Отметим, что предложенный подход позволяет единообразно рассматривать игровые постановки задачи управления как в непрерывном, так и в дискретном времени. Вторая часть работ была связана с дифференциальными играми с неопределенностью. В этом случае актуальным является вопрос о существовании и характеризации решения. Рассматривался случай неопределенности в данных о моменте окончания или о начальной позиции. Для неантагонистической дифференциальной игры, в которой момент окончания является случайным и задается гибридной функцией распределения, задача нахождения равновесия по Нэшу в программных стратегиях была сформулирована в рамках теории гибридного оптимального управления. Получены результаты о существовании равновесия по Нэшу для данного класса задач как в непрерывной, так и в дискретной постановке. Также для дифференциальной игры со случайным моментом окончания общего вида получены необходимые и достаточные условия для представления функционала выигрыша в виде бесповторного интеграла для данного класса задач. Неопределенность данных о начальной позиции приводит к дифференциальной игре в пространстве мер с динамикой, описываемой уравнением неразрывности. Был изучен вопрос существования равновесия в классе программных стратегий. Также была построена аппроксимация рассматриваемой игры классической дифференциальной игрой, основанная на аппроксимации начального распределения массы дискретной мерой. Было показано, что равновесие в аппроксимирующей игре является эпсилон-равновесием в исходной игре. Важным частным случаем дифференциальных игр являются игры преследования-уклонения. Мы рассматривали этот класс игр в случае, когда фазовое пространство является только метрическим. Эти задачи возникают, в частности, при анализе задач преследования с неопределенностью в начальных положениях игроков (в этом случае фазовое пространство является пространством вероятностных мер). Было получено достаточное условие разрешимости задачи уклонения в терминах геодезических петель и нерастягивающих отображений. Разработан численный метод поиска решений задачи оптимального управления уравнением неразрывности, основанный на схеме метода игольчатой линеаризации. Этот результат будет использован для численного нахождения равновесия по Нэшу в случае неопределенности данных о начальном положении. Третье направление работ по проекту в 2017 году связано с модельными задачами. Были построены равновесия по Нэшу в модельных задачах экологического менеджмента; в частности, в дифференциальной игре, описывающей задачу, возникающую при анализе поведения сырьевых компаний, и в дифференциальной игре управления вредными выбросами в атмосферу. Кроме этого было изучено множество динамически устойчивых равновесий по Нэшу в модельной игре, возникающей при анализе инвестиций в рекламную кампанию. Во всех упомянутых случаях предполагалось, что момент окончания игры является случайным.

 

Публикации

1. Авербух Ю.В. Markov Approximation of Zero-sum Differential Games Proceedings of the OPTIMA-2017 Conference, Petrovac, Montenegro, 02-Oct-2017, страницы 73-80 (год публикации - 2017)

2. Авербух Ю.В. Randomized Nash equilibrium for differential games Вестник Удмуртского университета. Математика Механика Компьютерные науки, том 27, выпуск 3, страницы 299–308 (год публикации - 2017) https://doi.org/10.20537/vm170301

3. Громова Е.В., Тур А. В. On the form of Integral payoff in differential games with random duration Proceedings of the 26th International Conference on Information, Communication and Automation Technologies, - (год публикации - 2018)

4. Погодаев Н.И. Numerical Algorithm for Optimal Control of Continuity Equations Proceedings of the OPTIMA-2017 Conference, Petrovac, Montenegro, 02-Oct-2017, 467-474 (год публикации - 2017)

5. Хлопин Д.В. On Limit of Value Functions for Various Densities Proceedings of the OPTIMA-2017 Conference, Petrovac, Montenegro, 02-Oct-2017, 328-335 (год публикации - 2017)

6. Юферева О.О. Игра «Лев и Человек» и отображения без неподвижных точек Математическая Теория Игр и ее Приложения, 9, 2,105-120 (год публикации - 2017)


Аннотация результатов, полученных в 2018 году
В 2018 году были продолжены работы по всем трем направлениям проекта: построение приближенно оптимальных стратегий и аппроксимаций функции цены, решение игр с неопределенностью и исследование конкретных классов игровых задач управления, возникающих в различных прикладных задачах. Методы построения приближенно оптимальных стратегий и аппроксимаций функции цены основывались на изучении стратегий с моделью и доказательстве асимптотической эквивалентности игр на бесконечном промежутке с различными плотностями усреднения мгновенного выигрыша. Основная идея построения стратегий с моделью состоит в том, чтобы заменить динамику исходной игры достаточно близкой и получить игру, в которой функция цены и оптимальные стратегии могут быть найдены достаточно простым способом. Важным примером таких модельных игр являются марковские игры, в которых динамика игры задается марковской цепью с непрерывным временем, а функция цены задается системой дифференциальных уравнений или дифференциальных включений. В 2018 году мы построили приближенные равновесия для неантагонистических дифференциальных игр на основе решения вспомогательных марковских игр. Данная конструкция является реализацией общего метода, предложенного в рамках работ над проектом в 2017 году. Найдены условия, при которых функция цены модельной марковской игры может быть построена как решение дифференциального включения, определенного на (вообще говоря) бесконечномерном пространстве. При дополнительных предположениях это дифференциальное включение сводится к системе бесконечного числа обыкновенных дифференциальных уравнений. Полученные результаты позволяют строить приближенное равновесие для неантагонистической дифференциальной игры на основе решения систем дифференциальных включений. Другим (хотя и идейно близким) методом построения модельных игр является замена фазового пространства на другое, близкое к исходному в метрике Громова-Хаусдорфа. Этот подход позволяет исследовать динамические игры в пространствах, не обладающих гладкой структурой. Возникающая при этом конструкция стратегий основывается на чисто топологических аргументах. В 2018 году для случая игры простого преследования на конечном промежутке времени построены приближенно оптимальные стратегии, использующие в качестве модели игру в пространстве, близком к исходному в метрике Громова-Хаусдорфа. В теории игр на бесконечном промежутке времени достаточно часто потенциальная бесконечность временного промежутка эмулируется платежами, усредненными в соответствии с плотностью, зависящей от некоторого параметра масштабирования, например, усреднения по всё большему промежутку планирования (равномерное распределение) или усреднения с всё меньшей процентной ставкой (экспоненциальное распределение). Мы исследовали асимптотику функции цены при стремлении параметра масштабирования к предельному значению, сопоставляя каждой платежной функции соответствующую ей цену. Такой подход позволяет единообразно рассматривать динамические игры и задачи управления как в непрерывном, так и в дискретном времени, как в детерминированной, так и в стохастической постановке. В неантагонистическом случае показано, что нечувствительность цен к выбору достаточно большого промежутка при равномерном усреднении эквивалентна ее нечувствительности и к выбору все меньшей процентной ставки при экспоненциальном распределении. В антагонистическом случае найден класс распределений (включающий экспоненциальные, равномерные и степенные распределения) такой, что асимптотика цен (при стремлении параметра масштабирования к предельному значению) для какой-либо плотности из этого класса, гарантирует ту же асимптотику при произвольном выборе кусочно-непрерывной плотности. Отметим, что в играх на бесконечном промежутке можно по-разному задать невязку при отслеживании траектории моделью на бесконечном промежутке времени (как нижнюю грань или как предел поточечных расстояний вдоль траектории). В ходе работ показано, что эти способы в общем случае неэквивалентны. В многих задачах нельзя достоверно сказать, каким будет промежуток управления и/или какова текущая позиция игры. Такие постановки возникают, в частности, в экономических приложениях, где моменты входа/выхода компаний на рынок не могут быть предсказаны заранее, а также невозможна точная оценка активов. В 2018 году игровая задача управления со случайным моментом начала была сведена к задаче с детерминированным промежутком времени. Для случая гибридной функции распределения момента окончания с зависимостью от состояния системы получены условия существования равновесия по Нэшу. Дифференциальная игра с неопределенностью информации о текущей позиции рассматривалась как игра в пространстве вероятностей. Для нее были найдены необходимые условия равновесия по Нэшу в классе программных стратегий. Близкой к постановкам с неопределенностью информации в пространстве позиций является игровая задача управления системой большого числа однотипных объектов в случае, когда лицо, принимающее решение, не имеет информации о положении каждого конкретного объекта. Фактически, в этом случае также имеет место неполнота информации, которую естественно (при стремлении числа объектов к бесконечности) моделировать вероятностным распределением. Такой подход приводит к дифференциальным играм в пространстве вероятностных мер, с динамикой, зависящей от самого распределения как от фазовой переменой. Для подобных игр была предложена позиционная формализация. Показано существование функции цены и предложен метод построения приближенно оптимальной позиционной стратегии. В рамках проекта также рассматривались конкретные классы неантагонистических дифференциальных игр. Было построено равновесие по Нэшу для модельной игры управления объемами вредных выбросов. Найдено аналитическое решение неантагонистической дифференциальной игры двух лиц с иерархической структурой (т. е. решение для первого игрока может быть определено независимо, а решение для второго игрока строится на основе полученных результатов для первого). Отметим, что построенное равновесие по Нэшу в этом случае основывается на решении системы уравнений Гамильтона-Якоби с разрывным гамильтонианом. В заключение упомянем о задаче отбора равновесий. Хорошо известно, что равновесие по Нэшу неединственно. Также неединственными являются сильно динамически устойчивые равновесия по Нэшу, получаемые на основе решений систем уравнений Гамильтона-Якоби. Для отбора решений было предложено использовать подход, сходный с отбором решений в задаче управления линейно-квадратичным регулятором, где в качестве функции Беллмана выбирается знакоопределенное решение системы уравнений Гамильтона-Якоби, которое также является функцией Ляпунова для замкнутой системы. Этот подход был применен для исследования линейно–квадратичной дифференциальной игры управления инвестициями в рекламную кампанию.

 

Публикации

1. Авербух Ю.В. Krasovskii–Subbotin Approach to Mean Field Type Differential Games Dynamic Games and Applications, - (год публикации - 2019) https://doi.org/10.1007/s13235-018-0282-6

2. Авербух Ю.В. Target problem for mean field type differential game IFAC-PapersOnLine proceedings series, - (год публикации - 2019)

3. Березин А.А. Позиционные стратегии в задачах управления средним полем на пространстве конечного числа состояний Вестник Удмуртского университета. Математика. Механика. Компьютерные науки, том 28, выпуск 1, страницы 15–21 (год публикации - 2018) https://doi.org/10.20537/vm180102

4. Громова Е.В., Громов Д. В., Лахина Ю.Э. О решении дифференциальной игры управления инвестициями в рекламную кампанию Труды Института математики и механики УрО РАН, том 24, №2, страницы 64–75 (год публикации - 2018) https://doi.org/10.21538/0134-4889-2018-24-2-64-75

5. Громова Е.В., Марова Е.В. On the characteristic function construction technique in differential games with prescribed and random duration Contributions to Game Theory and Management, том 11, страницы 53–65 (год публикации - 2018)

6. Погодаев Н.И. Estimates of the domain of dependence for scalar conservation laws Journal of Differential Equations, volume 265, issue 4, pages 1654-1677 (год публикации - 2018) https://doi.org/10.1016/j.jde.2018.04.015

7. Погодаев Н.И. Program strategies for a dynamic game in the space of measures Optimization Letters, - (год публикации - 2019) https://doi.org/10.1007/s11590-018-1318-y

8. Хлопин Д.В. On Tauberian theorem for stationary Nash equilibria Optimization Letters, - (год публикации - 2019) https://doi.org/10.1007/s11590-018-1345-8

9. Юферева О.О. On Limit- and Infimum-Captures of Pursuit-Evasion Problems IFAC-PapersOnLine proceedings series, - (год публикации - 2019)


Аннотация результатов, полученных в 2019 году
В 2019 году были продолжены работы по основным направлениям исследований проекта: построение приближенно оптимальных стратегий и аппроксимаций функций цены для игровых задач управления с полной информацией на конечном и бесконечном промежутках; построение решений для игр с неопределенностью в информации о начале и об окончании промежутка управления, а также в информации о точном положении системы; исследование модельных задач игрового управления. Для дифференциальных игр на конечном промежутке были построены приближенные равновесия по Нэшу в классе стохастических стратегий с моделью, использующие в качестве модели марковскую игру, т.е. стохастическую игру с непрерывным временем, динамика которой задается марковской цепью с конечным числом состояний. Это позволило построить аппроксимацию ожидаемого выигрыша игроков решением дифференциального включения в конечномерном пространстве. Также был предложен метод аппроксимации выигрышей игроков решением системы конечного числа обыкновенных дифференциальных уравнений. На основе классических методов решения систем обыкновенных дифференциальных уравнений были построены численные методы нахождения выигрышей игроков в ситуациях приближенного равновесия по Нэшу. Для игр на бесконечном промежутке было продолжено исследование различных методов усреднения мгновенного выигрыша в интегральном показателе качества с точки зрения асимптотической эквивалентности функции цены. При этом предполагалось, что усреднение задается таким направленным семейством плотностей, что мера каждого конечного промежутка идет к нулю. Классическими методами усреднений являются предел цен для равномерных распределений при стремлении длины промежутка к бесконечности и предел цен для экспоненциальных распределений при стремлении ставки дисконтирования к нулю. В 2019 году был найден класс семейств плотностей такой, что если существует равномерный предел функций цены в ситуациях равновесия по Нэшу при одном семействе плотностей из этого класса, то равномерный предел существует для всех семейств из этого класса, а эти пределы совпадают. Показано, что найденный класс включает в себя семейства, порожденные равномерными, экспоненциальными плотностями и плотностями, определяемыми рациональными функциями. Отметим, что этот результат существенно обобщает тауберовы теоремы для дифференциальных игр. В части проекта, посвященной исследованию дифференциальных игр с неопределенностью в информации о промежутке управления, исследовались постановки задач со случайным моментом начала и случайным моментом окончания. Игровые задачи управления со случайным моментом начала были сведены к задачам с фиксированным моментом начала. Для игровых задач со случайным моментом окончания в предположении о гибридной функции распределения были построены равновесия по Нэшу в классе позиционных и программных стратегий. Также был рассмотрен случай множественных равновесий по Нэшу и предложены критерии отбора равновесий. Было продолжено изучение игровых задач управления с неопределенностью информации о точной позиции системы. Был рассмотрен случай, когда система состоит из большого числа однотипных элементов, при этом положение каждого элемента недоступно лицам, принимающим решение, известно им лишь распределение элементов. Это приводит к задаче управления в пространстве вероятностных мер. Рассматривались две постановки. В первом случае управление осуществляется позиционно (этот случай в литературе принято называть дифференциальными играми с динамикой среднего поля), а во втором случае управление одинаково воздействует на все элементы системы (в этом случае говорят об игровой задаче управления уравнением неразрывности). Для дифференциальных игр с динамикой среднего поля в 2018 году были построены оптимальные позиционные стратегии, основанные на варианте метода экстремального сдвига Н.Н. Красовского и А.И. Субботина, и доказано существование функции цены. В 2019 году была получена инфинитезимальная характеризация функции цены с использованием аналогов производных по направлению. Для игровой задачи управления уравнением неразрывности были найдены необходимые условия равновесия по Нэшу. Также на основе полученных результатов, касающихся игр со случайным моментом окончания, были построены решения в модельной задаче совместной разработки ресурсов.

 

Публикации

1. Авербух Ю.В. Markov approximations of nonzero-sum differential games Вестник Удмуртского университета. Математика. Механика. Компьютерные науки, - (год публикации - 2020)

2. Авербух Ю.В. Approximate Public-Signal Correlated Equilibria for Nonzero-Sum Differential Games SIAM Journal on Control and Optimization, Vol. 57, N. 1, pp. 743-772 (год публикации - 2019) https://doi.org/10.1137/17M1161403

3. Беляков А.О. On necessary optimality conditions for Ramsey-type problems Ural Mathematical Journal, Vol. 5, N. 1, pp. 24–30 (год публикации - 2019) https://doi.org/10.15826/umj.2019.1.003

4. Громова Е.В., Лахина Ю.Э. On the Selection of the Nash Equilibria in a Linear-Quadratic Differential Game of Pollution Control Frontiers of Dynamic Games, Static and Dynamic Game Theory: Foundations and Applications, pp. 37-48 (год публикации - 2019) https://doi.org/10.1007/978-3-030-23699-1_3

5. Громова Е.В., Плеханова Т.М. On the regularization of a cooperative solution in a multistage game with random time horizon Discrete Applied Mathematics, Vol.255, pp. 40-55 (год публикации - 2019) https://doi.org/10.1016/j.dam.2018.08.008

6. Колпакова Е.А. Позиционные стратегии в неантагонистической дифференциальной игре специального вида Математическая теория игр и её приложения, Т.11, вып. 4, с.67-86 (год публикации - 2019)

7. Хлопин Д.В. Об асимптотиках цен в динамических играх на больших промежутках Алгебра и анализ, Т.31, № 1, с. 211–245 (год публикации - 2019)

8. Хлопин Д.В. General Limit Value for Stationary Nash Equilibrium Lecture Notes in Computer Science, Vol. 11548, pp. 607-619. (год публикации - 2019) https://doi.org/10.1007/978-3-030-22629-9_43

9. Хлопин Д.В. Tauberian Theorem for Games with Unbounded Running Cost Journal of Mathematical Sciences, Vol. 239, N 2, pp. 197-213 (год публикации - 2019) https://doi.org/10.1007/s10958-019-04300-2


Возможность практического использования результатов
не указано