КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

ОБЩИЕ СВЕДЕНИЯ

Номер 19-71-00073

НазваниеУравнения Гамильтона-Якоби в задачах управления системами дробного порядка

РуководительГомоюнов Михаил Игоревич, Кандидат физико-математических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт математики и механики им.Н.Н.Красовского Уральского отделения Российской академии наук, Свердловская обл

Период выполнения при поддержке РНФ

07.2019 - 06.2021

Конкурс№40 - Конкурс 2019 года «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-112 - Обыкновенные дифференциальные уравнения и теория динамических систем

Ключевые словаУравнение Гамильтона-Якоби, динамическое программирование, производная дробного порядка, система дробного порядка, управление, дифференциальная игра, функционал цены, оптимальная стратегия управления

Код ГРНТИ27.37.17

СтатусУспешно завершен

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ

Аннотация
Теория дифференциальных уравнений с производными дробного порядка представляет собой современный, интенсивно развивающийся раздел математики. К настоящему времени такие уравнения проявили себя как полезный и удобный в использовании аппарат для математического моделирования ряда сложных процессов и явлений в различных областях знаний. Одним из важных направлений исследований в рамках этой теории является изучение качественного поведения динамических систем, эволюция которых описывается при помощи дифференциальных уравнений дробного порядка. Большинство работ в этом направлении сосредоточены на задачах устойчивости и оптимального управления. В частности, активно развивается аппарат функций Ляпунова, изучаются необходимые условия оптимальности в форме принципа максимума Л.С. Понтрягина, разрабатываются численные методы построения оптимальных программных управлений. Однако задачи оптимального синтеза управлений, задачи об управлении по принципу обратной связи в условиях помех и неопределенностей, вопросы адекватной формализации принципов динамического программирования в таких задачах до сих пор практически не исследовались. Анализ публикаций последних лет позволяет заключить, что в настоящий момент эта важная для приложений тематика, являющаяся предметом настоящего проекта, находится лишь в стадии становления. Присутствие в системе динамических помех и неопределенностей, которые не предполагаются малыми, существенно осложняет задачу управления. С другой стороны, эти факторы зачастую являются неотъемлемой частью системы, могут быть вызваны, например, неточностью моделирования, и должны быть приняты во внимание для эффективного решения задачи. В проекте, следуя теоретико-игровому подходу Н.Н. Красовского и А.И. Субботина, такие задачи рассматриваются как задачи об оптимизации гарантированного результата управления и формализуются в рамках теории дифференциальных игр. Имеющиеся работы по дифференциальным играм в системах дробного порядка в основном посвящены отдельным классам линейных игр преследования-уклонения. В достаточно общей нелинейной постановке дифференциальные игры в системах дробного порядка на минимакс-максимин заданного показателя качества процесса управления рассматривались в работах автора проекта 2018 и 2019 годов. В частности, было показано, что в силу наследственного характера оператора дробного дифференцирования системы дробного порядка по своей сути являются системами с полной памятью, и в контексте задач управления по принципу обратной связи их эволюцию следует рассматривать в функциональном пространстве историй движения. Именно в этом пространстве выполняется принцип динамического программирования в таких задачах, когда цена игры (величина оптимального гарантированного результата) рассматривается как функционал от истории движения. При этом оптимальные стратегии управления, составляющие седловую точку игры, по существу являются стратегиями с памятью истории движения. Это обстоятельство качественно отличает системы дробного порядка от обыкновенных систем целого порядка и связывает их с функционально-дифференциальными системами. Настоящий проект продолжает эти работы автора и направлен на дальнейшую формализацию принципов динамического программирования в системах дробного порядка. Внимание будет уделено изучению нелокальных и инфинитезимальных характеристических свойства функционала цены в дифференциальных играх для систем дробного порядка в свете формализма уравнений Гамильтона-Якоби. Основу предполагаемого исследования составит новая техника так называемого дробного коинвариантного дифференцирования функционалов от истории движения, которая базируется на естественном обобщении для систем дробного порядка аппарата коинвариантного дифференцирования, развитого при изучении уравнений Гамильтона-Якоби для функционально-дифференциальных систем запаздывающего и нейтрального типов. В терминах дробных коинвариантных производных будет выписано уравнение Гамильтона-Якоби в подходящем функциональном пространстве историй движения. Будет показано, что при определенных условиях гладкости функционал цены дифференциальной игры для системы дробного порядка может быть описан как классическое решение задачи Коши для этого уравнения и естественного краевого условия. При этом методом экстремального сдвига в направлении дробного коинвариантного градиента функционала цены будут построены оптимальные позиционные стратегии управления. Эти результаты будут обосновывать тот факт, что выписанное уравнение выражает в инфинитезимальной форме принцип динамического программирования для систем дробного порядка и является для таких систем уравнением Гамильтона-Якоби-Айзекса-Беллмана. Как известно, функционал цены (функционал оптимального гарантированного результата) может не обладать свойствами гладкости, требуемыми в описанных выше результатах. Для изучения характеристических свойств функционала цены и построения оптимальных стратегий управления в общем негладком случае будут введены и исследованы обобщенные (минимаксные, вязкостные) решения полученного нового класса уравнений Гамильтона-Якоби с дробными коинвариантными производными. При этом для функционалов от истории движения получат развитие соответствующие конструкции негладкого анализа, включая аппарат производных по направлению, суб- и супер-градиентов, согласованных с техникой дробного коинвариантного дифференцирования. Результаты работ по проекту будут применены для разработки и обоснования численных методов решения задач управления и дифференциальных игр в системах дробного порядка.

Ожидаемые результаты
В проекте изучается задача об управлении в условиях помех динамической системой, движение которой описывается обыкновенным дифференциальным уравнением с дробной производной Капуто. Целью управления является минимизация заданного показателя качества, оценивающего процесс управления на фиксированном конечном промежутке времени. Следуя теоретико-игровому подходу Н.Н. Красовского и А.И. Субботина, эта задача рассматривается как задача об оптимизации гарантированного результата управления и формализуется в рамках теории дифференциальных игр. Первая часть работ по проекту будет направлена на адекватную формализацию принципа динамического программирования в рассматриваемой задаче в свете формализма уравнений Гамильтона-Якоби. В отличие от имеющихся в данном направлении исследований, в проекте цена игры (величина оптимального гарантированного результата) рассматривается как функционал от истории движения. При этом оптимальные стратегии управления, составляющие седловую точку игры, являются стратегиями с памятью истории движения. В рамках этого направления будут введены понятия дробных коинвариантных производных функционалов, развита соответствующая техника дробного коинвариантного дифференцирования. Исходной дифференциальной игре в системе дробного порядка будет поставлено в соответствие уравнение Гамильтона-Якоби с дробными коинвариантными производными. Будет доказано, что достаточно гладкое решение задачи Коши для этого уравнения и естественного краевого условия совпадает с функционалом цены, а стратегии экстремального сдвига в направлении дробного коинвариантного градиента функционала цены являются оптимальными. Будут приведены примеры задач, в которых функционал цены (функционал оптимального гарантированного результата) удовлетворяет требуемым условиям гладкости. С другой стороны, будет показано, что функционал цены дифференциальной игры в точках дробной коинвариантной дифференцируемости удовлетворяет соответствующему уравнению Гамильтона-Якоби. Данные результаты представляются важными, поскольку обосновывают тот факт, что рассматриваемое уравнение Гамильтона-Якоби с дробными коинвариантными производными выражает принцип динамического программирования для задач оптимизации систем дробного порядка с производной Капуто и, в частности, для задач управления является уравнением Гамильтона-Якоби-Айзекса-Беллмана. Во многих задачах функционал оптимального гарантированного результата (функционал цены) не является гладким, и его нельзя трактовать как классическое решение уравнения Гамильтона-Якоби. Это приводит к необходимости изучения обобщённых решений соответствующих уравнений Гамильтона-Якоби и, в том числе, развития негладких конструкций экстремального сдвига для построения оптимальных стратегий. Поэтому во второй части работ по проекту для полученного нового класса уравнений Гамильтона-Якоби с дробными коинвариантными производными будет введено понятие обобщенного (минимаксного) решения, изучены вопросы существования такого решения, его единственности и непрерывной зависимости от параметров уравнения и краевого функционала. Будет установлена согласованность минимаксного и классического решений. Будет показано, что в достаточно общем негладком случае функционал цены дифференциальной игры для системы дробного порядка совпадает с минимаксным решением соответствующего уравнения Гамильтона-Якоби-Айзекса-Беллмана. Будет дана инфинитезимальная характеризация минимаксного решения в форме неравенств для подходящих производных по направлению, суб- и супер-градиентов, согласованных с техникой дробного коинвариантного дифференцирования. Это позволит проанализировать для рассматриваемого класса уравнений Гамильтона-Якоби связь минимаксного и вязкостного подходов к понятию обобщенного решения. На этой основе будут разработаны соответствующие негладкие конструкции экстремального сдвига для построения оптимальных стратегий управления. Данные результаты представляются важными, поскольку дают необходимый теоретический фундамент для разработки и обоснования численных методов решения задач управления и дифференциальных игр для систем дробного порядка с производной Капуто в общем негладком случае. Полученные в рамках работ по проекту результаты будут проиллюстрированы при решении ряда типичных задач управления и дифференциальных игр в системах дробного порядка. Как уже отмечалось в аннотации проекта, в последнее время наблюдается большой интерес исследователей к задачам управления системами дробного порядка. Тем не менее, вопросы, связанные с формализацией принципов динамического программирования в таких системах, и задачи управления по принципу обратной связи в условиях помех и неопределенностей начинают активно изучаться только сейчас. Поэтому ожидаемые результаты будут соответствовать передовому мировому уровню исследований в данной области.

ОТЧЁТНЫЕ МАТЕРИАЛЫ

Аннотация результатов, полученных в 2019 году
Рассмотрена задача оптимального управления динамической системой, движение которой описывается обыкновенным дифференциальным уравнением с дробной производной Капуто. Целью управления является минимизация заданного показателя качества, оценивающего процесс управления на фиксированном конечном промежутке времени. Доказано, что величина оптимального результата управления, определяемая как функционал в подходящем пространстве историй движения, удовлетворяет принципу динамического программирования. Введены новые понятия дробных коинвариантных производных таких функционалов, развита соответствующая техника дробного коинвариантного дифференцирования. На этой основе рассматриваемой задаче оптимального управления поставлено в соответствие уравнение Гамильтона-Якоби с дробными коинвариантными производными. Показано, что если функционал оптимального результата является гладким (коинвариантно гладким дробного порядка), то он удовлетворяет выписанному уравнению Гамильтона-Якоби. С другой стороны, доказано, что если задача Коши для этого уравнения и естественного краевого условия имеет гладкое решение, то это решение совпадает с функционалом оптимального результата. При этом установлена оптимальность стратегии управления по принципу обратной связи, построенной методом экстремального сдвига в направлении дробного коинвариантного градиента функционала оптимального результата. Приведены иллюстрирующие примеры. Полученные результаты позволяют заключить, что выписанное уравнение Гамильтона-Якоби выражает в инфинитезимальной форме принцип динамического программирования для систем дробного порядка и является для рассматриваемой задачи оптимального управления уравнением Гамильтона-Якоби-Беллмана. Разработанная техника получила развитие применительно к дифференциальной игре в системе дробного порядка. В согласии с результатами, полученными для задачи оптимального управления, формализация игры проведена в классах стратегий управления с памятью истории движения, а величина цены игры определена как функционал в подходящем пространстве историй движения. Дифференциальной игре поставлено в соответствие уравнение Гамильтона-Якоби с дробными коинвариантными производными. С опорой на установленные ранее в работах автора проекта нелокальные характеристические свойства функционала цены игры (так называемые свойства u- и v-стабильности) доказаны следующие утверждения. Если задача Коши для выписанного уравнения Гамильтона-Якоби и естественного краевого условия имеет гладкое решение, то, во-первых, дифференциальная игра имеет цену, во-вторых, это решение совпадает с функционалом цены игры, и в-третьих, стратегии управления игроков, построенные методом экстремального сдвига в направлении дробного коинвариантного градиента этого решения, являются оптимальными. С другой стороны, функционал цены игры в точках дробной коинвариантной дифференцируемости удовлетворяет уравнению Гамильтона-Якоби. Таким образом, для рассматриваемой дифференциальной игры это уравнение является уравнением Гамильтона-Якоби-Айзекса-Беллмана. С целью дальнейшего развития теории обобщенных в минимаксном смысле решений уравнений Гамильтона-Якоби с дробными коинвариантными производными проведено исследование свойств множества решений задачи Коши для дифференциального включения с дробной производной Капуто. Предполагается, что многозначное отображение, задающее правую часть включения, имеет непустые, выпуклые и компактные значения, полунепрерывно сверху и удовлетворяет условию подлинейного роста. Доказано, что множество решений задачи Коши непусто и компактно. Установлена полунепрерывная сверху зависимость множества решений от начальных данных, правой части включения и порядка дифференцирования. Приведено полугрупповое свойство множеств решений.

Публикации

1. Гомоюнов М.И. К теории дифференциальных включений с дробными производными Капуто Дифференциальные уравнения, - (год публикации - 2020)

2. Гомоюнов М.И. Об уравнении Гамильтона-Якоби для дифференциальных игр в системах с дробными производными Капуто Устойчивость, управление, дифференциальные игры (SCDG2019): материалы Междунар. конф., посвящ. 95-летию со дня рождения акад. Н.Н. Красовского, Екатеринбург, 16–20 сентября 2019. Екатеринбург: ИММ УрО РАН, 2019., С. 95-99. (год публикации - 2019)

Аннотация результатов, полученных в 2020 году
Было проведено исследование выведенной на первом этапе выполнения работ по проекту задачи Коши для уравнения Гамильтона – Якоби с коинвариантными производными дробного порядка и краевого условия, заданного на правом конце. Было дано определение минимаксного (обобщенного) решения такой задачи Коши, выраженное в терминах нелокальных свойств стабильности этого решения относительно характеристических дифференциальных включений с дробными производными Капуто. Были найдены условия, при которых минимаксное решение существует, единственно и непрерывно меняется с изменением порядка дифференцирования, гамильтониана и краевого функционала. Был получен инфинитезимальный критерий минимаксного решения в виде пары неравенств для подходящим образом определенных нижних и верхних дробных производных этого решения по многозначным направлениям. В частности, на этой основе была установлена согласованность минимаксного и классического решений рассматриваемой задачи Коши, а также было показано, что минимаксное решение удовлетворяет уравнению Гамильтона – Якоби в каждой точке, в которой оно дробно коинвариантно дифференцируемо. Указанные результаты были получены сначала в частном случае, когда гамильтониан уравнения удовлетворяет дополнительному условию положительной однородности по импульсной переменной, а затем – в общем неоднородном случае (за исключением результатов о непрерывной зависимости минимаксного решения от параметров задачи). Подчеркнем, что основную сложность при доказательстве существования и единственности минимаксного решения в неоднородном случае составило построение подходящего функционала типа Ляпунова – Красовского. При этом ввиду специфических свойств операций дробного интегро-дифференцирования предложенная конструкция такого функционала по существу отличается от конструкций, используемых при доказательстве аналогичных утверждений для уравнений Гамильтона – Якоби с частными производными и с коинвариантными производными первого порядка. Было продолжено исследование дифференциальной игры на минимакс-максимин заданного показателя качества типа Больца для динамической системы, движение которой описывается дифференциальными уравнениями с дробными производными Капуто. В согласии с результатами, полученными на первом этапе выполнения работ по проекту, дифференциальной игре была поставлена в соответствие задача Коши для уравнения Гамильтона – Якоби – Айзекса – Беллмана с коинвариантными производными дробного порядка и естественного краевого условия, заданного на правом конце. В достаточно общем негладком случае было показано, что функционал цены дифференциальной игры совпадает с минимаксным решением рассматриваемой задачи Коши, при этом на базе этого решения были построены оптимальные позиционные стратегии управления игроков. Для этого была предложена оригинальная процедура «сглаживания» минимаксного решения, позволяющая определять подходящие экстремальные направления и использовать их в конструкциях экстремального сдвига. Ключевым элементом данной процедуры является функционал Ляпунова – Красовского, построенный ранее при доказательстве существования и единственности минимаксного решения.

Публикации

1. Гомоюнов М.И. Dynamic programming principle and Hamilton-Jacobi-Bellman equations for fractional-order systems SIAM Journal on Control and Optimization, Vol. 58, issue 6, pp. 3185-3211. (год публикации - 2020) https://doi.org/10.1137/19M1279368

2. Гомоюнов М.И. Минимаксные решения однородных уравнений Гамильтона-Якоби с коинвариантными производными дробного порядка Труды Института математики и механики УрО РАН, Т. 26, № 4, с. 106-125. (год публикации - 2020) https://doi.org/10.21538/0134-4889-2020-26-4-106-125

3. Гомоюнов М.И. Minimax solutions of Hamilton-Jacobi equations with fractional coinvariant derivatives ESAIM: Control, Optimisation and Calculus of Variations, - (год публикации - 2021)

4. Гомоюнов М.И. Differential games for fractional-order systems: Hamilton - Jacobi - Bellman - Isaacs equation and optimal feedback strategies Mathematics, Vol. 9, Issue 14. Article no. 1667. 16 p. (год публикации - 2021) https://doi.org/10.3390/math9141667

5. Гомоюнов М.И. О критериях минимаксных решений уравнений Гамильтона - Якоби с коинвариантными производными дробного порядка Труды Института математики и механики УрО РАН, Т. 27, № 3. С. 25-42 (год публикации - 2021) https://doi.org/10.21538/0134-4889-2021-27-3-25-42

6. Гомоюнов М.И. Минимаксные решения уравнений Гамильтона-Якоби с коинвариантными производными дробного порядка Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби (CGS’2020): материалы III Междунар. семинара, посвященного 75-летию акад. А.И. Субботина, Екатеринбург, 26-30 окт. 2020. Екатеринбург: ИММ УрО РАН., С. 126-128. (год публикации - 2020)

7. Гомоюнов М.И. О минимаксном решении уравнений Гамильтона-Якоби с дробными коинвариантными производными Теория управления и математическое моделирование: Всерос. конф. с междунар. участием, посв. памяти проф. Н.В. Азбелева и проф. Е.Л. Тонкова (Ижевск, Россия, 15–19 июня 2020): материалы. Ижевск: Изд. центр «Удмурт. ун-т»., С. 158-160. (год публикации - 2020)

Возможность практического использования результатов
В настоящее время дифференциальные уравнения с дробными производными широко применяются при математическом моделировании различных процессов в физике, механике, материаловедении, химии, биологии, медицине, экономике и других областях знаний. Использование таких уравнений, с одной стороны, позволяет обеспечить необходимую близость модели к имеющимся экспериментальным данным, а с другой стороны, дает возможность учесть ряд специфических свойств процесса, в том числе эффект последействия. Представляется, что полученные в рамках работ по проекту фундаментальные научные результаты и развиваемый математический аппарат найдут приложение при исследовании задач оптимизации таких процессов, в том числе в условиях помех, дефицита информации, противодействий. В частности, формализация принципов динамического программирования и соответствующие уравнения Гамильтона - Якоби могут составить основу для решения таких задач методами машинного обучения. Результаты проекта могут быть полезными при разработке новых цифровых производственных технологий, роботизированных систем и материалов.