КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 21-71-10070

НазваниеПрямые и обратные задачи позиционного управления наследственными системами

РуководительГомоюнов Михаил Игоревич, Кандидат физико-математических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт математики и механики им.Н.Н.Красовского Уральского отделения Российской академии наук, Свердловская обл

Период выполнения при поддержке РНФ 07.2021 - 06.2024 

Конкурс№61 - Конкурс 2021 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-112 - Обыкновенные дифференциальные уравнения и теория динамических систем

Ключевые словаОптимальное управление, дифференциальные игры, динамическая реконструкция, позиционные стратегии управления, наследственные системы, функционально-дифференциальные уравнения нейтрального типа, дифференциальные уравнения с производными дробного порядка, уравнения Гамильтона - Якоби, обобщенные решения.

Код ГРНТИ27.37.17


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Характерным свойством динамических систем, описываемых обыкновенными дифференциальными уравнениями, является то, что их поведение в будущем однозначно определяется их текущим состоянием и никак не зависит от их поведения в прошлом, то есть от того, каким именно образом сложилось текущее состояние. Однако многие реальные процессы протекают согласно более сложным закономерностям, когда будущее зависит не только от настоящего, но и от прошлого. Математическое моделирование таких процессов приводит к понятию наследственных динамических систем. Основное внимание в проекте уделяется исследованию задач управления наследственными системами, эволюция которых описывается дифференциальными уравнениями с производными дробного порядка и функционально-дифференциальными уравнениями нейтрального типа. Большинство работ в рамках данного направления, привлекающего в настоящее время интерес многих исследователей, сосредоточены на задачах стабилизации и оптимального управления с уклоном на разработку численных методов построения решений. Однако на практике процессы управления протекают обычно в условиях неопределенности, неконтролируемых помех со стороны окружающей среды или же под влиянием сознательного противодействия. В этой связи актуальными становятся, с одной стороны, (прямые) задачи об управлении с оптимальной гарантией результата, которые могут быть формализованы как дифференциальные игры, а с другой стороны, (обратные) задачи о динамическом восстановлении как траекторий системы, так и действующих в системе возмущений. Такие задачи для рассматриваемых классов наследственных динамических систем представляют собой относительно новую и практически не изученную область. Именно их исследованию и посвящен проект. Отличительной особенностью проекта является использование в качестве общей базы для проведения исследований подходов и методов, разработанных в научной школе Н.Н. Красовского в рамках теории позиционных дифференциальных игр. В настоящее время основные элементы этой теории в наиболее полной мере развиты для обыкновенных дифференциальных систем и функционально-дифференциальных систем запаздывающего типа. Анализ этих исследований показывает, что привлечение и должная модификация методов конструирования позиционного управления, с одной стороны, позволяют получать фундаментальные теоретические результаты, а с другой – разрабатывать универсальные и эффективные методы решения задач, допускающие численную реализацию. Проект направлен на развитие позиционного подхода для новых и более общих классов наследственных систем – систем дробного порядка и систем нейтрального типа. Как и в случае систем запаздывающего типа, основная сложность здесь заключается в необходимости учета при формировании управления всей истории движения, сформировавшейся к текущему моменту времени. При этом особые свойства систем нейтрального типа и систем дробного порядка, существенно отличающие эти системы от систем запаздывающего типа, вносят ряд дополнительных сложностей как технического, так и принципиального характера. При построении оптимальных позиционных стратегий в дифференциальных играх важную роль играют свойства величины цены игры (оптимального гарантированного результата управления). В дифференциальных играх для систем нейтрального типа и систем дробного порядка эта величина является функционалом, обладающим свойством неупреждаемости и определенным на некотором функциональном пространстве историй движения системы. Исследование инфинитезимальных свойств функционала цены игры приводит к уравнениям типа Гамильтона – Якоби особого вида. Такие уравнения относятся к классу наследственных уравнений Гамильтона – Якоби (в литературе также используются термины "функциональные" и "неупреждающие", в англоязычной литературе распространен термин "path-dependent Hamilton - Jacobi equations"). За последние годы интерес к таким уравнениям существенно возрос. При этом, поскольку такие уравнения, как правило, не имеют решения в классическом смысле, особое внимание уделяется изучению их обобщенных решений. Исторически первым для наследственных уравнений Гамильтона – Якоби был развит минимаксный подход к понятию обобщенного решения, однако сейчас исследования в этой области посвящены в основном изучению вязкостных решений. В рамках проекта планируется развить технику вязкостных решений для новых и более общих классов наследственных уравнений Гамильтона – Якоби, возникающих в задачах оптимального управления и дифференциальных играх для систем дробного порядка и для систем нейтрального типа. Такие уравнения являются мало изученными, имеют свои характерные особенности, требующие детального анализа и разработки принципиально новых подходов. Естественным обобщением дифференциальных игр двух лиц являются дифференциальные игры со многими участниками. В проекте будут изучаться задачи конфликтного взаимодействия группы преследователей с одним или несколькими убегающими, в том числе с дополнительными фазовыми ограничениями, в случае, когда динамика каждого из участников описывается дифференциальными уравнениями с производными дробного порядка. Наилучшее решение задач сближения-уклонения доставляют стабильные предельно широкие мосты в фазовом пространстве. Однако эффективное построение таких максимальных стабильных мостов для исследования реальных управляемых процессов весьма затруднительно. В этой связи актуальной задачей становится построение мостов, не являющихся максимальными, но при этом обладающих свойством стабильности и дающих эффективно реализуемые позиционные процедуры управления. Проект направлен на разработку методов построения таких мостов для указанного класса конфликтно-управляемых процессов. При этом акцент будет сделан на получение достаточных условий разрешимости рассматриваемых задач в различных классах стратегий (позиционные, импульсные, кусочно-программные). На практике использование позиционных законов управления осложняется тем, что численные характеристики отслеживаемых процессов всегда доступны с некоторой погрешностью или не все из них доступны для наблюдения. Эти обстоятельства в совокупности с возросшим в последнее время интересом исследователей к системам дробного порядка обуславливают важность и актуальность планируемых в рамках проекта исследований по созданию эффективных, работающих в темпе реального времени алгоритмов восстановления возмущений и неизвестных характеристик таких систем. Указанные задачи реконструкции формализуются в рамках теории динамического обращения. Методы этой теории, базирующиеся на конструкциях теории позиционного управления и методах решения некорректных задач, в настоящее время хорошо разработаны для детерминированных и стохастических обыкновенных дифференциальных систем, систем запаздывающего типа, систем с распределенными параметрами. В рамках проекта область применения методов динамического обращения будет расширена на системы дробного порядка. Кроме того, в последнее время большое число сложных (многомерных, нелинейных, с неполной информацией) задач управления удается эффективно решать при помощи алгоритмов теории обучения с подкреплением с использованием искусственных нейронных сетей. При этом было экспериментально замечено, что зачастую такие задачи решаются более эффективно, если при позиционном управлении учитывать всю историю движения системы, а не только ее состояние в текущий момент времени. В проекте на базе полученных теоретических результатов планируется исследовать и развить современные алгоритмы обучения с подкреплением в приложении к рассматриваемым задачам позиционного управления для систем со сложной нелинейной и наследственной динамикой.

Ожидаемые результаты
В рамках работ по проекту планируется получить следующие основные результаты. Для систем дробного порядка будет проведено исследование дифференциальных игр на минимакс-максимин заданного показателя качества. Будут рассмотрены соответствующие наследственные уравнения Гамильтона – Якоби с коинвариантными производными дробного порядка. Как правило, такие уравнения не имеют решения в классическом смысле, в связи с чем на первый план выходит исследование их обобщенных решений. В рамках проекта основное внимание будет уделяться развитию вязкостного подхода к понятию обобщенного решения рассматриваемого уравнения Гамильтона – Якоби. Будет дано определение вязкостного решения, исследованы вопросы существования и единственности такого решения, его непрерывной зависимости от параметров уравнения. Будет изучена связь вязкостных решений с минимаксными решениями, введенными ранее в работах участников проекта. Будут найдены условия, при которых вязкостные решения могут быть охарактеризованы парой неравенств для подходящим образом определенных суб- и супердифференциалов дробного порядка неупреждающих функционалов, согласующихся с техникой дробного коинвариантного дифференцирования. Полученные результаты будут применены для исследования свойств функционала цены исходной дифференциальной игры и построения оптимальных позиционных стратегий. Кроме того, на последнем этапе выполнения работ по проекту планируется вывести и начать исследование наследственных уравнений Гамильтона – Якоби – Беллмана, отвечающих задачам оптимального управления стохастическими системами дробного порядка. Также вязкостный подход к понятию обобщенного решения планируется развить для наследственных уравнений Гамильтона – Якоби с коинвариантными производными (первого порядка), которые возникают в задачах оптимального управления и дифференциальных играх для систем нейтрального типа. При этом в качестве функционального пространства историй движений планируется вместо множества липшицевых функций, которое использовалось ранее при развитии минимаксного подхода, взять более широкое множество функций, допускающих разрывы первого рода. Для неупреждающих функционалов, определенных на таком пространстве, будут введены понятия верхних и нижних производных по направлениям, а также суб- и супердифференциалов, согласующихся, с одной стороны, с техникой коинвариантного дифференцирования (первого порядка), а с другой – с аналогичными конструкциями для обыкновенных дифференциальных систем и систем запаздывающего типа. На этой основе планируется дать определение вязкостного решения рассматриваемого уравнения Гамильтона – Якоби. При различных группах предположений будут исследованы вопросы существования и единственности такого решения и его связи с функционалом оптимального результата (функционалом цены игры), будет установлено совпадение вязкостного и минимаксного решений. При этом внимание будет также уделяться построению оптимальных позиционных стратегий. Будет проведено исследование различных классов задач преследования группой преследователей одного или нескольких убегающих в случае, когда динамика каждого из игроков описывается дифференциальными уравнениями с производными дробного порядка. Акцент будет сделан на получение достаточных условий разрешимости таких задач в различных классах позиционных стратегий. При этом разрешающие стратегии управления будут построены в явном виде, допускающем эффективную численную реализацию. Будут рассмотрены задачи с фазовыми ограничениями, задачи о многократной поимке, задачи о поимке заданного числа скоординированных убегающих. Отдельно будет изучен вопрос о влиянии на результат игры преследователей, возможности которых "слабее" возможностей каждого из убегающих. Будут изучены задачи восстановления переменного возмущения и неизвестных характеристик для динамических систем, описываемых дифференциальными уравнениями с дробными производными. Будут разработаны ориентированные на работу в реальном времени устойчивые к информационным помехам и погрешностям вычислений алгоритмы решения таких задач. Построенные алгоритмы будут обеспечивать наперед заданное качество управляемого процесса, а также решение задачи реконструкции в стесненных информационных условиях, когда для наблюдения доступна не вся целиком позиция системы, а только ее часть, и время функционирования процесса не фиксировано. Данная задача является обобщением рассмотренных в теории динамического обращения задач на новый, более широкий класс динамических систем и информационных условий. Будет проведена модификация современных алгоритмов обучения с подкреплением, использующих нейронные сети, в приложении к рассматриваемым в проекте задачам позиционного управления для систем дробного порядка, для систем запаздывающего и нейтрального типов. Таким образом, научная и общественная значимость заявленных результатов обуславливается выбором в качестве объектов исследования важных для приложений классов наследственных динамических систем (системы дробного порядка, системы нейтрального типа); новыми и актуальными постановками задач управления такими системами (задачи управления в условиях помех, дифференциальные игры со многими участниками, задачи динамической реконструкции), в том числе в свете формализма наследственных уравнений Гамильтона – Якоби, привлекающих в настоящее время интерес многих исследователей; нацеленностью на разработку эффективных методов решения рассматриваемых задач на базе единого универсального подхода, основанного на конструкциях теории позиционного управления; наконец, привлечением для проведения исследований современных алгоритмов теории машинного обучения. Ожидаемые результаты работ по проекту будут соответствовать передовому мировому уровню исследований.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2021 году
Для динамической системы, описываемой дифференциальными уравнениями с дробными производными Капуто, рассмотрена дифференциальная игра на минимакс-максимин заданного показателя качества типа Больца. Дифференциальной игре поставлена в соответствие задача Коши для наследственного уравнения Гамильтона-Якоби-Айзекса-Беллмана с дробными коинвариантными производными при краевом условии на правом конце. В отчетном периоде работа по этому направлению была направлена на развитие вязкостного подхода к понятию обобщенного решения такой задачи Коши. Было дано определение вязкостного решения задачи Коши в терминах дробно коинвариантно гладких тестовых функционалов, являющееся аналогом определения вязкостного решения задач Коши для классических уравнений Гамильтона-Якоби с частными производными. При этом данное определение включает в себя вспомогательную последовательность компактных подмножеств функционального пространства историй движений рассматриваемой динамической системы, а также требование локальной липшицевости вязкостного решения по функциональной переменной. Основной результат работы заключается в том, что при весьма общих предположениях функционал цены исследуемой дифференциальной игры может быть охарактеризован как единственное вязкостное решение соответствующей задачи Коши. Для доказательства единственности вязкостного решения был построен оригинальный функционал Ляпунова-Красовского, позволяющий учесть отличительные особенности систем дробного порядка. Полученная характеризация функционала цены открывает новые возможности для разработки методов оптимального позиционного управления игроков в рассматриваемой дифференциальной игре. В частности, построенный функционал Ляпунова-Красовского может использоваться в конструкциях метода экстремального прицеливания Н.Н. Красовского. В конечномерном евклидовом пространстве рассмотрена задача преследования группой преследователей одного убегающего, описываемая линейной системой дифференциальных уравнений с дробными производными Капуто и простой матрицей. Предполагается, что множеством допустимых управлений для всех игроков является один и тот же выпуклый компакт. Целью группы преследователей является поимка убегающего заданным числом преследователей (многократная поимка). Получены достаточные условия разрешимости задачи преследования в классе квазистратегий. На базе данного результата для преследователей построены позиционные стратегии управления с поводырем, гарантирующие разрешимость задачи преследования. В конечномерном евклидовом пространстве рассмотрена задача преследования группой преследователей группы убегающих, в которой взаимодействие каждой пары убегающий-преследователь описывается линейной системой дифференциальных уравнений дробного порядка с производными Капуто и простой матрицей. Предполагается, что все убегающие используют одно и то же управление (жестко скоординированы). Целью группы преследователей является поимка хотя бы одного убегающего. В классе квазистратегий преследователей получены достаточные условия разрешимости задачи преследования. Исследована задача восстановления неизвестного возмущения в системе нелинейных дифференциальных уравнений, содержащих дробные производные Капуто. Предложен алгоритм восстановления возмущения устойчивый к информационным помехам и погрешностям вычислений, который использует в качестве входа неточные измерения части координат фазового вектора системы, поступающие непрерывно в режиме онлайн. В основу алгоритма положен метод динамического обращения, сочетающий в себе конструкции метода экстремального прицеливания Н.Н. Красовского из теории позиционного управления и метод регуляризации А.Н. Тихонова из теории некорректных задач. Для случая дефицита информации о положении системы алгоритм представлен двумя работающими параллельно и в режиме онлайн блоками восстановления. Работа одного из них направлена на восстановление ненаблюдаемых координат системы, тогда как работа другого – на получение некоторой аппроксимации внешнего воздействия. Были получены оценки для погрешности аппроксимации внешнего воздействия как в случае измерения всех координат системы, так и при измерении их части. Приложение разработанной техники аппроксимации было показано на примере нелинейной модели дробного порядка для ВИЧ заболевания, в которой одна из характеристик организма была принята за неизвестное внешнее управляющее воздействие. При использовании разработанного алгоритма была получена аппроксимация этого возмущения в режиме онлайн. Рассмотрены уравнения Гамильтона-Якоби с коинвариантными производными, возникающие в задачах оптимального управления и дифференциальных играх для систем нейтрального типа в форме Дж. Хейла. Введено понятие вязкостного (обобщенного) решения таких уравнений. Доказаны теоремы существования и единственности вязкостного решения. Установлены различные критерии этого решения, использующие понятия обобщенного решения в минимаксном смысле, верхних и нижних производных по направлениям, а также суб- и супердифференциалов функционалов. Для получения этих результатов в качестве функционального пространства историй движения было взято пространство функций, допускающих конечное число точек разрыва первого рода и липшицевых на промежутках непрерывности. В качестве следствия этих результатов доказано, что, во-первых, коинвариантно дифференцируемый функционал, удовлетворяющий рассматриваемому уравнению Гамильтона-Якоби, является вязкостным решение этого уравнения, а во-вторых, вязкостное решение удовлетворяет уравнению Гамильтона-Якоби в точках коинвариантной дифференцируемости.

 

Публикации

1. Петров Н.Н., Мачтакова А.И. Групповое преследование в задаче с дробными производными в классе позиционных стратегий с поводырем Вестник Удмуртского университета. Математика. Механика. Компьютерные науки, Т. 32. Вып. 1. С. 94-106. (год публикации - 2022) https://doi.org/10.35634/vm220107

2. Сурков П.Г. Dynamical estimation of a noisy input in a system with a Caputo fractional derivative. The case of continuous measurements of a part of phase coordinates Mathematical Control and Related Fields, DOI: 10.3934/mcrf.2022020 (год публикации - 2022) https://doi.org/10.3934/mcrf.2022020

3. Гомоюнов М.И. Минимаксные и вязкостные решения уравнений Гамильтона - Якоби - Беллмана для систем с дробными производными Капуто Материалы VI Международной научной конференции "Нелокальные краевые задачи и родственные проблемы математической биологии, информатики и физики". Нальчик, 2021., С. 64 (год публикации - 2021)

4. Мачтакова А.И. Об одной линейной задаче группового преследования с дробными производными Современные проблемы математики и её приложений: тезисы Международной (53-й Всероссийской) молодёжной школы-конференции. Екатеринбург: ИММ УрО РАН, УрФУ., С. 96 (год публикации - 2022)

5. Петров Н.Н., Мачтакова А.И. О некоторых задачах группового преследования с дробными производными Материалы VI Международной научной конференции "Нелокальные краевые задачи и родственные проблемы математической биологии, информатики и физики". Нальчик, 2021., С. 158 (год публикации - 2021)


Аннотация результатов, полученных в 2022 году
Было продолжено исследование антагонистических дифференциальных игр, в которых движение динамической системы описывается нелинейными дифференциальными уравнениями с дробными производными Капуто. Особое внимание уделялось приложению и развитию полученных на первом этапе работ по проекту результатов по характеризации функционала цены такой игры как вязкостного решения соответствующего наследственного уравнения Гамильтона – Якоби – Айзекса – Беллмана с дробными коинвариантными производными. Был предложен и обоснован новый метод построения оптимальных позиционных стратегий управления игроков. Основу метода составляет функционал Ляпунова – Красовского, найденный на первом этапе выполнения работ по проекту. По сравнению с известными конструкциями оптимальных позиционных стратегий преимущество нового метода заключается в том, что используемый функционал Ляпунова – Красовского является относительно простым и непрерывно дифференцируемым (в смысле дробной коинвариантной гладкости). Кроме того, метод представляется достаточно универсальным, и на третьем этапе выполнения работ по проекту планируется его дальнейшее развитие для задач, в которых движение динамической системы описывается слабо-сингулярными интегральными уравнениями Вольтерра общего вида. В качестве иллюстрации эффективности развиваемого в рамках проекта подхода была рассмотрена линейно-квадратичная дифференциальная игра для системы дробного порядка. Найдены условия существования цены игры, получены формулы для оптимальных позиционных стратегий управления игроков. В частности, в явном виде выписан функционал цены игры, и доказано, что он является дробно коинвариантно гладким решением соответствующего наследственного уравнения Гамильтона – Якоби – Айзекса – Беллмана с дробными коинвариантными производными. Проведен анализ возможности расширения функционального пространства историй движений в дифференциальных играх для систем дробного порядка с целью получения инфинитезимальных характеризаций (в терминах подходящих суб- и супердифференциалов) негладкого функционала цены и разработки новых методов построения оптимальных позиционных стратегий управления игроков. Исследование показало, что, в отличие от случая функционально-дифференциальных систем запаздывающего и нейтрального типов, подходящее расширение должно охватывать функции, имеющие разрывы второго рода с бесконечным пределом справа. В рамках этого подхода была проведена формализация дифференциальной игры, были введены понятия дробных коинвариантных производных функционалов над расширенным пространством историй движения, и было формально выписано соответствующее наследственное уравнение Гамильтона – Якоби – Айзекса – Беллмана. Однако, при попытках доказательства теоремы о связи решения этого уравнения и функционала цены выяснилось, что важную роль играет специальное свойство непрерывности этого функционала, которое практически никогда не выполняется. Как следствие, был сделан вывод о том, что развитие теории наследственных уравнений Гамильтона – Якоби над таким образом расширенным пространством историй движения не является перспективным направлением исследований в том смысле, что полученные результаты будут справедливы при очень ограничительных предположениях. Проблема такого же сорта возникла при попытках разработать в рамках расширенной постановки задачи конечномерный вариант метода экстремального сдвига на сопутствующие точки для построения оптимальных позиционных стратегий управления игроков. В конечномерном евклидовом пространстве была рассмотрена задача преследования группой преследователей одного убегающего, описываемая линейной системой дифференциальных уравнений с дробными производными Капуто. Множество допустимых управлений для каждого из игроков является выпуклым компактом. Терминальные множества являются цилиндрическими. Получены новые достаточные условия разрешимости задачи преследования в классе квазистратегий. Введены матричные разрешающие функции, используя которые в классе квазистратегий преследователей получены новые достаточные условия разрешимости задачи о поимке убегающего заданным числом попарно различных преследователей. Была исследована задача он-лайн идентификации внешнего воздействия (помехи) на систему, описываемую дифференциальными уравнениями с дробной производной Капуто, и ее траектории на бесконечном временном горизонте. Так называемый режим он-лайн подразумевает, что информация о позиции системы доступна только во время ее функционирования. Были рассмотрены два случая: измеряются все координаты фазового вектора, и только их часть. Измерения проводятся в дискретные достаточно частые моменты времени с некоторой погрешностью. Бесконечный временной горизонт также осложняет рассматриваемую задачу ввиду неминуемого неограниченного накопления различного вида погрешностей, например, вычислительной, по сравнению с конечным отрезком функционирования системы. Для решения задачи предложен адаптивный алгоритм он-лайн идентификации, в основу которого положен подход динамического обращения. Этот подход представляет собой сочетание методов регуляризации из теории некорректных задач и конструкций из теории позиционного управления. В частности, использовался метод регуляризации А.Н. Тихонова, в котором был специальным образом модифицирован сглаживающий функционал, и метод экстремального прицеливания Н.Н. Красовского. В общих чертах, адаптивный алгоритм он-лайн идентификации представляет собой выбор подходящей вспомогательной управляемой системы (модели) и закон управления в ней по принципу обратной связи. Предложенный алгоритм дает аппроксимацию внешнего возмущения и устойчив к информационным помехам и погрешности вычислений. Применение разработанного алгоритма проиллюстрировано на модельном примере. Была рассмотрена антагонистическая дифференциальная игра, в которой движения описываются системой нейтрального типа в форме Дж. Хейла, а начальные условия выбираются из пространства кусочно-непрерывных функций. Доказано, что игра имеет цену, совпадающую с единственным вязкостным решением соответствующей задачи Коши для наследственного уравнения Гамильтона – Якоби – Айзекса – Беллмана с коинвариантными производными. Построены оптимальные позиционные стратегии управления игроков, которые в случае определенной гладкости функционала цены определяются на базе его градиента, а в общем случае – его квазиградиентов. При этом, в отличие от предыдущих работ по данной тематике, вычисление квазиградиентов осуществляется путем решения задачи конечномерной, а не бесконечномерной оптимизации.

 

Публикации

1. Гомоюнов М.И. On optimal positional strategies in fractional optimal control problems Mathematical Optimization Theory and Operations Research. MOTOR 2023. Lecture Notes in Computer Science, Vol 13930. P. 255-265. (год публикации - 2023) https://doi.org/10.1007/978-3-031-35305-5_17

2. Гомоюнов М.И., Лукоянов Н.Ю. О линейно-квадратичных дифференциальных играх для систем дробного порядка Математическая теория игр и ее приложения (с переводом в Doklady Mathematics), Математическая теория игр и её приложения. 2023. Т. 15, вып. 2. С. 18-32; Doklady Mathematics. 2023. Vol. 108, Suppl. 1. P. S122-S127. (год публикации - 2023) https://doi.org/10.1134/S1064562423600689

3. Мачтакова А.И., Петров Н.Н. Matrix resolving functions in the linear group pursuit problem with fractional derivatives Ural Mathematical Journal, Vol. 8, No. 1, P. 76-89 (год публикации - 2022) https://doi.org/10.15826/umj.2022.1.008

4. Мачтакова А.И., Петров Н.Н. К линейной задаче группового преследования с дробными производными Труды Института математики и механики УрО РАН, Т. 28, № 3, С. 129-141 (год публикации - 2022) https://doi.org/10.21538/0134-4889-2022-28-3-129-141

5. Плаксин А.Р. Viscosity solutions of Hamilton - Jacobi equations for neutral-type systems Applied Mathematics and Optimization, Vol. 88, issue 1, paper no. 6, 29 p. (год публикации - 2023) https://doi.org/10.1007/s00245-023-09980-6

6. Сурков П.Г. Адаптивный алгоритм устойчивой он-лайн идентификации помехи в системе дробного порядка на бесконечном временном горизонте Труды Института математики и механики УрО РАН, Т. 29, № 2. С. 172-188. (год публикации - 2023) https://doi.org/10.21538/0134-4889-2023-29-2-172-188

7. Гомоюнов М.И. Задачи оптимального управления системами с дробными производными: принцип динамического программирования и уравнения Гамильтона - Якоби Материалы Международной конференции "Дифференциальные уравнения и оптимальное управление", посвященной 100-летию со дня рождения академика Евгения Фроловича Мищенко, 7 - 9 июня 2022 г., Москва, С. 48-50 (год публикации - 2022)

8. Гомоюнов М.И. Теорема единственности для вязкостных решений уравнений Гамильтона - Якоби с дробными коинвариантными производными Материалы Международной конференции "Теория оптимального управления и приложения (ОСТА-2022)", 27 июня - 1 июля 2022 г., Екатеринбург, С. 45-49 (год публикации - 2022)

9. Петров Н.Н., Мачтакова А.И. Об одной задаче группового преследования с дробными производными Материалы международной научной конференции "Уфимская осенняя математическая школа - 2022", 28 сентября - 1 октября 2022 г., Уфа, Т. 2, С. 225-227 (год публикации - 2022) https://doi.org/10.33184/mnkuomsh2t-2022-09-28.83

10. Петров Н.Н., Мачтакова А.И. Многократная поимка убегающего в задаче с дробными производными в классе позиционных стратегий с поводырем Материалы XVI Международной конференции "Устойчивость и колебания нелинейных систем управления (конференция Пятницкого)", 1 - 3 июня 2022 г., Москва, С. 329-332 (год публикации - 2022)

11. Петров Н.Н., Мачтакова А.И. К линейной задаче группового преследования с дробными производными Материалы Международной конференции "Теория оптимального управления и приложения (ОСТА-2022)", 27 июня - 1 июля 2022 г., Екатеринбург, С. 165-169 (год публикации - 2022)

12. Плаксин А.Р. Вязкостные решения уравнений Гамильтона - Якоби - Беллмана для систем нейтрального типа Материалы Международной конференции "Дифференциальные уравнения и оптимальное управление", посвященной 100-летию со дня рождения академика Евгения Фроловича Мищенко, 7 - 9 июня 2022 г., Москва, С. 111-114 (год публикации - 2022)

13. Плаксин А.Р. Субградиенты функционала оптимального результата в задачах оптимального управления системами нейтрального типа Материалы Всероссийской конференции с международным участием "Теория управления и математическое моделирование", посвященной памяти профессора Н.В. Азбелева и профессора Е.Л. Тонкова, 13 - 17 июня 2022 г., Ижевск, С. 210-214 (год публикации - 2022)


Аннотация результатов, полученных в 2023 году
Была рассмотрена игра, в которой движение динамической системы описывается нелинейным интегральным уравнением Вольтерра – Гаммерштейна второго рода с ядром K, имеющим интегрируемую особенность степенного типа, а целью управления первого (соответственно, второго) игрока является минимизация (соответственно, максимизация) заданного показателя качества типа Больца. При дополнительном предположении о невырожденности линейного интегрального оператора Вольтерра с ядром K была проведена формализация конструкций динамического программирования. При этом было введено специальное функциональное пространство позиций системы – пар, состоящих из текущего момента времени и функции, играющей роль сложившейся к этому моменту времени истории движения системы. Для функционалов над таким пространством позиций было определено новое понятие коинвариантной дифференцируемости, зависящее от ядра K, и в терминах соответствующих коинвариантных производных исходной игре было сопоставлено наследственное уравнение Гамильтона – Якоби. Было дано определение обобщенного в вязкостном смысле решения задачи Коши для данного уравнения и естественного краевого условия на правом конце и было показано, что верхний и нижний функционалы цены игры являются такими вязкостными решениями. Кроме того, была доказана теорема о единственности вязкостного решения. В качестве следствия было установлено существование цены исходной игры. Более того, были введены понятия позиционных стратегий управления игроков и был предложен метод построения соответствующих оптимальных стратегий. Основу результатов составило использование функционала Ляпунова – Красовского, построенного на первом этапе работ по проекту, и дальнейшее исследование его свойств. Для ключевого предположения на ядро K были получены два достаточных условия, позволяющих охватить в том числе системы, в которых каждое из уравнений является дифференциальным уравнением с дробной производной Капуто своего порядка либо обыкновенным дифференциальным уравнением. В конечномерном евклидовом пространстве была рассмотрена задача преследования группой преследователей одного убегающего, описываемая линейной системой дифференциальных уравнений с дробными производными Капуто. Множество допустимых управлений для каждого из игроков является выпуклым компактом. Терминальные множества являются выпуклыми компактами. Получены новые достаточные условия разрешимости задач преследования и убегания в задаче как с равными, так и различными динамическими возможностями игроков. В конечномерном евклидовом пространстве была рассмотрена задача преследования группой преследователей группы убегающих в дифференциальной игре, описываемой линейной системой дифференциальных уравнений дробного порядка с производными Капуто. Предполагается, что все убегающие используют одно и то же управление (жестко скоординированы). Целью группы преследователей является поимка хотя бы одного убегающего или заданного числа убегающих. В классе квазистратегий преследователей получены достаточные условия разрешимости задачи преследования в игре как с равными, так и различными динамическими возможностями игроков. Для линейной управляемой динамической системы, описываемой дифференциальными уравнениями с дробной производной Капуто, рассмотрена задача гарантированного позиционного наведения на заданное множество в заданный момент времени. Начальное состояние управляющей стороне априори неизвестно, но известно конечное множество, которому оно принадлежит. Управляющая сторона строит позиционную стратегию управления для наведения системы на заданное множество в заданный момент времени по информация о положении системы, поступающей в режиме онлайн, в виде линейного сигнала наблюдения. Анализ разрешимости задачи наведения для рассматриваемой управляемой системы дробного порядка проводится с использованием метода пакетов программ Осипова – Кряжимского. В основе данного метода лежат неупреждающие программные конструкции и расширение управляемой системы путем параметризации по начальным состояниям. Этот метод позволяет связать условие разрешимости задачи гарантированного позиционного наведения с условиями разрешимости задачи уже программного наведения для расширенной системы. На основе конструкций метода пакетов программ Осипова – Кряжимского предложен критерий разрешимости поставленной задачи наведения для системы дробного порядка и процедура построения наводящего пакета программ (программных управлений). Разработанная техника анализа задачи гарантированного позиционного наведения апробирована на задаче управления конкретной линейной механической системой с дробной производной Капуто. При сравнительном анализе алгоритмов обучения с подкреплением в задачах оптимального управления системами дробного порядка были получены следующие результаты. Среди рассмотренных алгоритмов наилучшим образом показали себя Proximal Policy Optimization (PPO) и Soft Actor Critic (SAC), обеспечивающие достаточно близкие к оптимальным результаты во всех рассмотренных задачах. Было установлено, что с точки зрения информации, доступной агенту, во-первых, информации только о текущем времени недостаточно для приемлемого обучения, а во-вторых, что дополнительная информация об истории движения системы по существу не улучшает результаты обучения по сравнению со случаем, когда агенту доступна информация только о текущем времени и о текущем состоянии системы. Подходы, опирающиеся на использование рекуррентных нейронных сетей и специальных аппроксимирующих систем обыкновенных дифференциальных уравнений, оказались значительно менее работоспособными по сравнению с использованием полносвязной нейронной сети. Таким образом, можно заключить, что базовые алгоритмы обучения с подкреплением в целом являются достаточно эффективным инструментом для решения задач оптимального управления системами дробного порядка и, по-видимому, для достаточно широкого круга задач они способных находить стратегии обратной связи, обеспечивающие близкий к оптимальному результат, опираясь лишь на информацию о текущем времени и о текущем состоянии системы.

 

Публикации

1. Гомоюнов М.И. On viscosity solutions of path-dependent Hamilton–Jacobi–Bellman–Isaacs equations for fractional-order systems Journal of Differential Equations, Vol. 399. P. 335-362. (год публикации - 2024) https://doi.org/10.1016/j.jde.2024.04.001

2. Мачтакова А.И. Линейная задача группового преследования с дробными производными и разными возможностями игроков Известия Института математики и информатики Удмуртского государственного университета, Т. 62. С. 43-55. (год публикации - 2023) https://doi.org/10.35634/2226-3594-2023-62-04

3. Мачтакова А.И., Петров Н.Н. О двух задачах преследования группы убегающих в дифференциальных играх с дробными производными Вестник Удмуртского университета. Математика. Механика. Компьютерные науки, Т. 34, вып. 1. С. 65-79. (год публикации - 2024) https://doi.org/10.35634/vm240105

4. Петров Н.Н., Мачтакова А.И. Линейная задача группового преследования с дробными производными, простыми матрицами и разными возможностями игроков Дифференциальные уравнения, Т. 59, № 7. С. 933-943 (год публикации - 2023) https://doi.org/10.31857/S0374064123070075

5. Плаксин А.Р. Optimal positional strategies in differential games for neutral-type systems Dynamic Games and Applications, - (год публикации - 2024)

6. Сурков П.Г. Задача пакетного наведения для системы дробного порядка Труды Института математики и механики УрО РАН, - (год публикации - 2024)

7. Гомоюнов М.И. Оптимальные позиционные стратегии в антагонистических играх для интегральных уравнений Вольтерра Международная конференция «Системный анализ: моделирование и управление», посвященная памяти академика А.В. Кряжимского, Москва, 23-24 января 2024 г.: Тезисы докладов. Москва: МГУ имени М.В. Ломоносова; МАКС Пресс, 2024., С. 46. (год публикации - 2024)

8. Мачтакова А.И., Петров Н.Н. К задаче группового преследования с дробными производными Математика в современном мире. Материалы II Всероссийской научно-практической конференции, посвященной 160-летию со дня рождения видного российского математика Д.А. Граве. Вологда, 19 - 23 сентября 2023 г., С. 71-74. (год публикации - 2023)

9. Мачтакова А.И., Петров Н.Н. О некоторых задачах преследования в дифференциальных играх с дробными производными Международная конференция «Системный анализ: моделирование и управление», посвященная памяти академика А.В. Кряжимского, Москва, 23-24 января 2024 г.: Тезисы докладов. Москва: МГУ имени М.В. Ломоносова; МАКС Пресс, 2024., С. 79-81. (год публикации - 2024)

10. Сурков П.Г. О задаче онлайн идентификации помехи в системе дробного порядка при использовании негладкого стбилизатора Сборник тезисов Международной научной конференции "Современные проблемы обратных задач", посвященной 85-летию академика РАН В.Г. Романова. Новосибирск, Академгородок, 6 - 9 ноября 2023 г., С. 31 (год публикации - 2023)


Возможность практического использования результатов
не указано