КАРТОЧКА
ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер 19-11-00105
НазваниеУправление нелинейными системами с изменяющейся динамикой
РуководительУшаков Владимир Николаевич, Доктор физико-математических наук
Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт математики и механики им.Н.Н.Красовского Уральского отделения Российской академии наук, Свердловская обл
Период выполнения при поддержке РНФ | 2019 г. - 2021 г. | , продлен на 2022 - 2023. Карточка проекта продления (ссылка) |
Конкурс№35 - Конкурс 2019 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».
Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-204 - Математические проблемы теории управления
Ключевые словаоптимальное управление, неопределенность, помеха, постоянный неопределённый параметр, терминальное множество, нелинейная управляемая система, стабильный мост, дифференциальные игры, уравнение Гамильтона-Якоби, оптимальное покрытие, поломка
Код ГРНТИ27.37.17
СтатусУспешно завершен
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Проект посвящен исследованию проблем и задач управления динамическими системами. Для решения этих проблем и задач коллектив проекта обладает солидным теоретическим фундаментом, сформировавшимся в рамках Уральской научной школы по математической теории управлении. Большинство задач проекта в идейном плане объединяет тот факт, что управляемые системы в этих задачах имеют изменяющуюся динамику или в том или ином виде неизвестную помеху (параметр), влияющую на динамику системы. Таких задач динамической оптимизации много, в особенности, в механике, экономике и физике. Так, в ряде задач механики и робототехники одной из важных проблем является проблема стабилизации управляемых систем, рассматриваемая в проекте. Результаты проекта по стабилизации динамических систем найдут свое приложение при рассмотрении конкретных прикладных моделей экономического роста. Некоторые из входящих в проект задач актуальны в сфере военных приложений. К ним относятся, например, задачи дифференциальных игр, такие, как задачи о наведении управляемых систем на целевые множества и задачи о преследовании. Важными в этой сфере являются также новые задачи об оптимальных покрытиях компактных областей в конечномерных евклидовых пространствах множествами достижимости управляемых систем. Кроме того, задачи об оптимальных покрытиях находят многочисленные приложения при исследовании расположения объектов на плоскости и в пространстве, имеющих различное назначение (например, станции сотовой связи, скорой помощи, беспроводного интернета и т. д.). Существующая в настоящее время потребность в решении задач, представленных в проекте, стимулирует дальнейшее развитие математической теории управления, теории дифференциальных игр, теории дифференциальных уравнений с дробными производными и теории уравнений в частных производных.
Возможности коллектива проекта по решению упомянутых задач частично представлены в пункте 4.7 заявки.
Ожидаемые результаты
1. Планируется разработать алгоритмы построения управлений системами с возможными поломками. В случае, когда цель управления определяется значением линейной функции фазовых переменных в заданный момент времени, будет найден явный вид управления с импульсным, интегральным и смешанным ограничениями. Найденные управления могут быть применены в задачах управления механическими системами переменного состава, а также в задачах управления суставом, используемом в роботизированных системах.
2. Планируется разработать аналитические и численные процедуры построения множеств, разрешающих задачи управления по быстродействию для систем с кусочно-постоянной динамикой. Особенностями указанного класса задач является зависимость ресурса управления от разбиения фазового пространства, а также невыпуклость (в общем случае) и несвязность (в частной ситуации) целевого множества. Указанные факторы определяют задачи как сингулярные. Практическое применение планируемых результатов не ограничивается потребностями теории оптимального управления. Создаваемые процедуры и их модификации могут быть использованы для решения краевых задач уравнений в частных производных первого порядка, в частности, при моделировании эволюции волновых фронтов в геометрической оптике для случая плоскослоистой среды. В экономике разрабатываемые процедуры применимы в моделях оптимизации расположения логистических центров или пунктов продаж.
3. Будет исследована задача о построении оптимальных покрытий плоских компактных множеств наборами кругов различного радиуса. Радиус каждого круга равен положительной константе, умноженной, на общий для всех элементов покрытия параметр r. Критерием оптимальности принимается минимум величины r . Будут предложены алгоритмы построения обобщений диаграммы Вороного и областей Дирихле, а также разработаны итерационные алгоритмы, использующие конструкции производных по направлению и субдифференциала для минимизации r. Созданные алгоритмы планируется использовать для аппроксимации разрешающих множеств в задачах управления и дифференциальных играх. Оптимальные покрытия с различным размером элементов широко используются при построении сетей датчиков и измерительных приборов.
4. В развитие тематики об оптимальных покрытиях будет сформулирована и изучена задача динамической оптимизации. Задача заключается в нахождении в стартовом множестве минимального числа начальных точек и их расположения, из которых множества достижимости управляемых систем покрывают заданную целевую область в конечномерном евклидовом пространстве. Задачу предполагается рассмотреть в двух вариантах: как задачу об оптимальном покрытии в фиксированный момент времени и как задачу об оптимальном покрытии по быстродействию. В случае нелинейных управляемых систем в двумерном евклидовом пространстве будет разработан алгоритм вычисления минимального набора точек и их расположения, из которых осуществляет покрытие цели. Будет проведено математическое моделирование. Задача об оптимальном динамическом покрытии является важной задачей, имеющей очевидные применения в военной сфере.
5. Будет продолжено развитие теории позиционных дифференциальных игр. В частности, будет дана новая формулировка ключевого в дифференциальных играх свойства стабильности. Для широкого класса конфликтно управляемых систем эта формулировка будет выражена в терминах исходной конфликтно управляемой системы, записанной в так называемом «обратном» времени. Это позволит дать наиболее рациональное и естественное определение системы множеств, аппроксимирующей множество разрешимости дифференциальной игры – максимальный стабильный мост, что является исключительно важным моментом для создания алгоритмов приближенного вычисления решений дифференциальных игр. В дальнейшем алгоритмы приближенного вычисления множеств разрешимости дифференциальных игр будут реализованы именно в соответствии с этим определением аппроксимирующей системы множеств.
6. Особое внимание в проекте уделено решению конкретных задач теории дифференциальных игр на конечном промежутке времени. Будут рассмотрены некоторые задачи из механики, экономики и экологии достаточно высокой размерности (4, 6 и выше). Из-за их сложности можно дать лишь в очень редких случаях аналитическое описание их решений. Поэтому будет сделан акцент на разработке алгоритмов конструирования приближенных решений. Алгоритмы построения решений включают в себя два последовательно реализуемых основных этапа. На первом этапе будет вычисляться аппроксимирующая система множеств, при этом каждое из множеств системы представляет собой конечное множеств точек (т.е. множество, состоящее из конечного числа точек) в фазовом пространстве; на втором этапе для реализации разрешающего позиционного управления будет применен принцип экстремального прицеливания Н.Н. Красовского на стабильные мосты. Эта часть проекта важна, на наш взгляд, тем, что она открывает этап систематического решения конкретных нелинейных задач теории позиционных дифференциальных игр с применением классических принципов построения разрешающих позиционных стратегий.
7. В дополнение к предыдущему пункту планируется в рамках проекта изучить обширный класс задач не менее важных, чем задачи позиционных дифференциальных игр. Здесь мы имеем в виду задачи управления динамическими системами, содержащими неопределенный постоянный параметр. Этот параметр, вшитый в управляемую систему, предполагается восстановить на малом начальном промежутке времени. Важность изучения такой задачи обусловлена тем, что математические модели многих физических процессов, механических и экологических систем содержат в себе неопределенный постоянный параметр, относительно которого управляющему субъекту известно лишь множество его возможных значений. Будут разработаны соответствующие схемы и алгоритмы конструирования решений этой задачи управления с неопределенным параметром. На основе разработанных алгоритмов предполагается моделирование конкретных задач. В частности, будет проведено моделирование задачи по управлению пружинным маятником в условиях колебания маятника при наличии трения, коэффициент которого неизвестен управляющему субъекту, а измерения реакции маятника на пробные управления проводятся с погрешностью.
8. Предполагается также изучение динамических игр на бесконечном интервале времени. Будет проведено построение равновесных траекторий и анализ их асимптотических свойств в динамических играх на бесконечном интервале времени с интегральными показателями качества различного типа. Будут разработаны динамические процедуры сдвига равновесных траекторий в динамических играх от статических нэшевских равновесий к паретовским точкам максимума векторного критерия. Будут даны приложения алгоритмов построения равновесных и оптимальных траекторий к моделям экономического роста, стабилизации динамических систем и моделям инвестиций. Будут даны интерпретации динамических равновесных решений в моделях инвестиций на финансовых рынках облигаций и акций.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Аннотация результатов, полученных в 2019 году
Для линейной задачи управления при наличии помехи и возможной поломке (с неизвестным моментом наступления) в случаях терминальной и смешанной платы найдены необходимые и достаточные условия окончания. В качестве примера рассмотрена модельная задача управления механической системой с возможной поломкой электродвигателя.
Для одномерной дифференциальной игры, в которой терминальным множеством является объединение бесконечного числа непересекающихся отрезков равной длины, найдены необходимые и достаточные условия окончания и построены соответствующие управления игроков. В качестве примера рассмотрена игровая задача управления вращательной механической системой.
В дискретной игровой задаче с терминальным множеством в форме кольца построены оптимальные управления игроков. Используя построенные управления, проведено компьютерное моделирование игрового процесса. Найден вид множества разрешимости для модификации исходной задачи, в которой у первого игрока в неизвестный момент времени происходит изменение в динамике.
Разработаны алгоритмы построения рассеивающих (сингулярных) кривых и функции оптимального результата в плоской задаче управления по быстродействию с круговой вектограммой скоростей на основе выделения псевдовершин – характеристических точек границы целевого множества, определяющих геометрию сингулярности решения задачи. Исследован случай, когда имеет место нарушение гладкости производной кривизны границы цели. Получены необходимые условия существования числового маркера псевдовершины в случае разрывов производных третьего порядка координатных функций, задающих границу целевого множества. Установлено, что маркер совпадает с корнем кубического уравнения, коэффициенты которого определяются односторонними производным кривизны границы целевого множества в псевдовершине. Эффективность развиваемых теоретических методов и вычислительных алгоритмов иллюстрируется результатами численного моделирования решений задач управления по быстродействию.
Изучена задача о сближении для нелинейных управляемых систем с правой частью, распадающейся по управлениям первого и второго игроков и при наличии нестационарных фазовых ограничений на систему. Приведена новая формулировка свойства u-стабильности в терминах «обратного» времени и определена система множеств, аппроксимирующая максимальный u-стабильный мост – множество разрешимости в задаче о сближении. Для конфликтно управляемой системы более общего вида исследовано понятие дефекта стабильности множества в пространстве позиций системы. Для этого исследования в проекте привлечена унификационная схема стабильности, введённая Н.Н. Красовским. При её замене схемой, более приспособленной для выделения множества разрешимости, возникает множество в пространстве позиций, более широкое, чем само множество разрешимости задачи о сближении. Для такого множества в проекте получена оценка сверху дефекта стабильности.
Были рассмотрены задачи управления в программной и позиционной постановках, включая задачи управления в условиях помех и/или противодействия, динамическими системами, движение которых описывается линейными дифференциальными уравнениями с дробными производными Капуто. Были предложены два подхода к исследованию и решению таких задач. Первый подход основан на схемах аппроксимации систем дробного порядка при помощи функционально-дифференциальных систем первого порядка с конечным числом сосредоточенных запаздываний. В рамках второго подхода дана редукция задач управления линейными системами дробного порядка к задачам управления обыкновенными системами первого порядка. Полученные результаты позволяют применять для решения задач управления линейными системами дробного порядка методы из теории управления обыкновенными дифференциальными и функционально-дифференциальными системами, что проиллюстрировано на модельных примерах.
Разработан метод восстановления неопределённого параметра на коротком начальном промежутке времени путём наблюдения за управляемой системой после воздействия на неё пробного управления в случае неточно измеряемого движения системы. Получена оценка максимальной погрешности наведения движения системы в этих условиях на целевое множество в терминальный момент времени. Оценка улучшена с помощью применения метода управления, в котором часть ресурсов управления тратится на увеличение точности.
На пути создания унификационных процедур аппроксимации множеств сложной геометрии разработаны алгоритмы построения оптимальных упаковок кругов в невыпуклые фигуры. Алгоритмы используют конструкции рассеивающих кривых задач управления по быстродействию. Касательные к рассеивающим кривым позволяют определять направления максимального роста радиуса кругов упаковки. Проведено численное моделирование ряда примеров построения упаковок для фигур нетривиальной геометрии, в частности, для невыпуклых множеств, ограниченных овалами Кассини и гипотрохоидами.
Разработана модель по снижению выбросов в атмосферу эмиссий углекислого газа для трех стран участников международных переговоров. Построен декомпозиционный алгоритм аукционного типа для поиска рыночного равновесия. Выведены формулы для конкурентного равновесия по Нэшу. Построено множество точек максимума Парето для кооперативных действий игроков. На множестве Парето выделена точка рыночного равновесия и решена задача перевода игроков из конкурентного равновесия по Нэшу в эту точку рыночного равновесия. Предложен алгоритм аукционного типа, основанный на аналитическом представлении поверхностей наилучших ответов игроков.
Получены достаточные условия стабилизируемости гамильтоновых систем в задачах управления на бесконечным промежутке времени с аффинной по управлению динамикой, проведены эксперименты для задач управления различной размерности.
Публикации
1. Изместьев И.В. Дискретная игровая задача с терминальным множеством в форме кольца Известия Института математики и информатики УдГУ, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 30:1 (2020), 18-30 (год публикации - 2020)
2. Казаков А.Л., Лебедев П.Д. Об алгоритмах построения покрытий и упаковок наборами кругов различного радиуса Динамические системы, оптимальное управление и математическое моделирование: материалы междунар. симп., 7-12 октября 2019, Иркутск, С. 389-392 (год публикации - 2019)
3. Красовский Н.А., Тарасьев А.М. Анализ равновесных решений в трехмерной динамической аукционной игре Материалы Международной конференции, посвященной 95-летию со дня рождения академика Н.Н. Красовского. 2019, С. 193-196 (год публикации - 2019)
4. Лебедев П.Д., Успенский А.А. Построение решения задачи управления по быстродействию при нарушении гладкости кривизны границы целевого множества Известия Института математики и механики Удмуртского государственного университета, Том 53, с. 98-114 (год публикации - 2019) https://doi.org/10.20537/2226-3594-2019-53-09
5. Лебедев П.Д., Успенский А.А., Ушаков В.Н. Итерационная процедура построения оптимальных упаковок в невыпуклые плоские фигуры Материалы Международной конференции, посвященной 95-летию со дня рождения академика Н.Н. Красовского. 2019, С. 214-218 (год публикации - 2019)
6. Тарасьев А.М., Усова А.А. Estimate of a Smooth Approximation to the Production Function for Integrating Hamiltonian Systems Automation and Remote Control, vol. 82, pp. 911-925 (год публикации - 2021) https://doi.org/10.1134/S0005117921050143
7. Тарасьев А.М., Усова А.А. Оценка гладкой аппроксимации производственной функции для интегрирования гамильтоновых систем Математическая теория игр и её приложения, Т. 12, вып. 1. С. 91-115 (год публикации - 2020)
8. Усова А.А., Тарасьев А.М. Стабилизация гамильтоновых систем на основе решения уравнения Риккати В сборнике: Устойчивость, управление, дифференциальные игры (SCDG2019) Материалы Международной конференции, посвященной 95-летию со дня рождения академика Н.Н. Красовского., С. 323-326 (год публикации - 2019)
9. Усова А.А., Тарасьев А.М. Structure of a stabilizer for the Hamiltonian systems Lecture Notes in Control and Information Sciences - Proceedings, pp 357-366 (год публикации - 2020) https://doi.org/10.1007/978-3-030-42831-0_32
10. Ухоботов В.И. On a Control Problem under Disturbance and Possible Breakdown Proceedings of the Steklov Institute of Mathematics, Vol. 307, Suppl. 1, pp. S159–S171 (год публикации - 2019) https://doi.org/10.1134/S0081543819070137
11. Ухоботов В.И., Изместьев И.В. Control Problem with Disturbance and Unknown Moment of Change of Dynamics Lecture Notes in Control and Information Sciences - Proceedings, pp 335-344 (год публикации - 2020) https://doi.org/10.1007/978-3-030-42831-0_30
12. Ушаков В.Н., Ершов А.А. Application of Correcting Controlinthe Problem with Unknown Parameter Lecture Notes in Control and Information Sciences - Proceedings, pp 225-237 (год публикации - 2020) https://doi.org/10.1007/978-3-030-42831-0_20
13. Ушаков В.Н., Малёв А.Г. Оценка дефекта стабильности множества в игровой задаче о сближении в фиксированный момент времени Доклады Академии наук, том 489, № 2, с.136-141 (год публикации - 2019) https://doi.org/10.31857/S0869-56524892136-141
14. Ушаков В.Н., Ершов А.А., Ушаков А.В. An Approach Problem with an Unknown Parameter and Inaccurate Motion Measurement Collected abstracts of papers presented on the international conference ISDG12-GTM2019. SPb.: St. Petersburg State University, 2019., С. 110 (год публикации - 2019)
Аннотация результатов, полученных в 2020 году
Для однотипной дифференциальной игры с невыпуклой терминальной платой, которая определяется как модуль отклонения нормы фазового вектора в фиксированный момент времени от заданного значения, вычислена цена игры.
Для одномерной дифференциальной игры, в которой плата определяется модулем отклонения фазовой переменной в фиксированный момент времени от заданного значения с учетом периодичности, вычислена цена игры и построены оптимальные управления игроков. В качестве примера рассмотрена задача управления вращательной механической системой, в которой цель первого игрока приобретает смысл минимизации модуля отклонения угла от желаемого состояния.
В задаче управления с помехой и вектограммами, зависящими линейно от заданных множеств, получены явные формулы, которые определяют стабильный мост в рассматриваемой задаче. Найдены условия, при выполнении которых построенный стабильный мост будет максимальным. Приведена процедура, которая строит по заданной многозначной функции, являющейся стабильным мостом, управление, которое решает поставленную задачу. Полученные результаты применены к решению одной задачи группового преследования.
Для однотипной задачи импульсного управления при наличии помехи, когда в неизвестный момент времени происходит изменение в динамике (поломка), найдены необходимые и достаточные условия окончания и построено соответствующее управление.
Разработаны методы построения сингулярных множеств в одном классе задач управления по быстродействию для случая, когда граница целевого множества имеет конечное число точек с разрывной кривизной. Сингулярное множество в задачах указанного класса совпадает с биссектрисой – множеством симметрии целевого множества. Биссектриса является объединением рассеивающих кривых. Найдены предельные, дифференциальные и алгебраические соотношения для координат псевдовершин – особых точек границы краевого множества, порождающих рассеивающие кривые. Разработаны и доведены до численных реализаций процедуры построения гладких участков сингулярного множества на основе интегральных кривых для специально подобранного обыкновенного дифференциального уравнения первого порядка.
Изучена игровая задача о сближении для нелинейных конфликтно управляемых систем с геометрическими ограничениями на управление на конечном промежутке времени и нестационарными фазовыми ограничениями на систему. На основе модифицированного определения u-стабильности введена система множеств в фазовом пространстве, аппроксимирующая множество разрешимости задачи о сближении – максимальный u-стабильный мост. Обоснована корректность определения аппроксимирующей системы множеств в этой задаче, т.е. доказана ее сходимость (в хаусдорфовой метрике) к множеству разрешимости при диаметре разбиения (которому соответствует эта система), сходящемся к нулю. Приведены две игровые задачи о сближении конкретных нелинейных механических систем, иллюстрирующие возможности метода приближенного решения в задаче о сближении.
Рассмотрена нелинейная конфликтно управляемая система в конечномерном евклидовом пространстве и на конечном промежутке времени с правой частью, распадающейся по управлениям. Для этой системы изучены две взаимосвязанные задачи о сближении в конечный момент времени. Эти задачи, трактуемые как дуальные (с одной и той же управляемой системой и альтернативными целевыми множествами – компактами в фазовом пространстве системы) обладают той особенностью, что множество разрешимости (максимальный v-стабильный мост) одной из задач плотно прилегает в пространстве позиций снаружи к множеству разрешимости (максимальному u-стабильному мосту) другой задачи. Оказывается, что при этом граница множества разрешимости одной из задач есть одна из двух компонент связности границы множества разрешимости другой задачи. В качестве метода приближённого вычисления множеств разрешимости был использован метод локализации их границ в соответствующих достаточно тонких слоях фазового пространства. Для иллюстрации предложенного метода локализации рассмотрена конкретная конфликтно управляемая система на плоскости и для нее в двух вариантах две игровые задачи о сближении.
Для задач управления в условиях помех и/или противодействия нелинейными динамическими системами, описываемыми дифференциальными уравнениями с дробными производными Капуто, проведено исследование свойств величины оптимального гарантированного результата управления (функционала цены). Доказано, что функционал цены может быть охарактеризована в терминах нелокального свойства стабильности относительно специальным образом определенных дифференциальных включений с дробными производными Капуто. Получены более удобные для проверки инфинитезимальные критерии свойства стабильности функционала цены в виде дифференциальных неравенств для подходящих производных по многозначным и однозначным направлениям. Полученные результаты открывают новые перспективы для разработки эффективных методов нахождения функционала цены и построения оптимальных позиционных стратегий управления в рассматриваемых задачах.
Разработаны два алгоритма (различающиеся число необходимых измерений фазовой переменной) для восстановления неопределённого векторного постоянного параметра в управляемой системе с помощью применения нескольких пробных кратковременных управлений, представляющих собой постоянные управляющие векторы. Получены и доказаны оценки погрешности сконструированных алгоритмов в виде двух теорем. В качестве примера рассмотрена задача управления пружинным маятником с неизвестными коэффициентом трения и коэффициентом упругости пружины.
Разработаны новые алгоритмы аппроксимации наборами однотипных объектов множеств различной геометрии, в том числе для невыпуклых множеств. Развиты и модернизированы алгоритмы, основанные на имитации физического отталкивания или притягивания центров элементов аппроксимации друг относительно друга и относительно границы фигуры. Изучены аппроксимации, содержащие шары различного радиуса. Критерием оптимальности выбрана минимизация или максимизация параметра R, которому пропорциональны радиусы шаров (каждый со своим положительным коэффициентом). Разработан и применён для решения ряда задач программный комплекс, который даёт возможность с помощью итерационных алгоритмов строить аппроксимации оптимальных покрытий и упаковок, используя по существу сингулярные множества в соответствующей задаче быстродействия с шаровой вектограммой скоростей.
Для задач на бесконечном промежутке времени получены необходимые и достаточные условия существования нелинейного регулятора. По существу, удалось показать, что существование для гамильтоновой системы стационарной точки обеспечивает возможность по разработанному алгоритму построить регулятор, порождающий нелинейную систему, вдвое меньшей размерности и являющуюся асимптотически устойчивой по первому приближению. Данный факт оказался следствием (1) представления матрицы Якоби исходной гамильтоновой системы в виде суммы гамильтоновой и диагональной матрицы, и (2) свойств гамильтоновых матриц, а именно симметричности их собственных значений относительно мнимой оси. Важно отметить, что данное свойство выполнено при почти всех значениях параметров модели, при которых существует стационарная точка.
В задачах с фазовыми ограничениями предложены аппроксимирующие управления, позволяющие достигнуть стационарных уровней, определенных гамильтоновой динамикой задачи управления, исследование которой проводится в рамках принципа максимума Понтрягина для задач на бесконечном промежутке времени.
Для динамической биматричной игры размерности 2×3 построены множества приемлемых ситуаций для игроков в статической постановке. На основе этих конструкций разработан алгоритм нахождения функции цены для первого игрока в дифференциальной игре на бесконечном интервале времени. Свойства стабильности функции цены проверены с использованием аппарата сопряженных производных в рамках теории обобщенных минимаксных (вязкостных) решений уравнений Гамильтона-Якоби. Представлен иллюстрационный пример построения функции цены для динамической биматричной игры размерности 2×3.
Публикации
1. Гомоюнов М.И. Optimal control problems with a fixed terminal time in linear fractional-order systems Archives of Control Sciences, Vol. 30, № 4, pp 721-744 (год публикации - 2021) https://doi.org/10.24425/acs.2020.135849
2. Гомоюнов М.И. On representation formulas for solutions of linear differential equations with Caputo fractional derivatives Fractional Calculus and Applied Analysis, Vol. 23, No. 4. P. 1141-1160. (год публикации - 2020) https://doi.org/10.1515/fca-2020-0058
3. Гомоюнов М.И., Лукоянов Н.Ю. Построение решений задач управления линейными системами дробного порядка на основе аппроксимационных моделей Труды Института математики и механики, Т. 26, № 1. С. 39-50. (год публикации - 2020) https://doi.org/10.21538/0134-4889-2020-26-1-39-50
4. Ершов А.А., Ушаков А.В., Ушаков В.Н. О двух игровых задачах о сближении Математический сборник, Т. 212, № 9 С. 40-74 (год публикации - 2021) https://doi.org/10.4213/sm9496
5. Изместьев И.В., Ухоботов В.И. On a One-Dimensional Differential Game with a Non-convex Terminal Payoff Lecture Notes in Computer Science, Vol. 2095, pp. 200–211. (год публикации - 2020) https://doi.org/10.1007/978-3-030-49988-4_14
6. Казаков А.Л., Лебедев П.Д., Лемперт А.А. On Covering Bounded Sets by Collections of Circles of Various Radii ИЗВЕСТИЯ ИРКУТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА. Cерия Математика., Т. 31. С. 18-33. (год публикации - 2020) https://doi.org/10.26516/1997-7670.2020.31.18
7. Красовский Н.А., Тарасьев А.М. Minimax generalized solutions of Hamilton-Jacobi equations in dynamic bimatrix games Frontiers of Dynamic Games. Static & Dynamic Game Theory: Foundations & Applications. Birkhäuser, Cham., Part of the Static & Dynamic Game Theory: Foundations & Applications book series (SDGTFA). P. 99-119 (год публикации - 2020) https://doi.org/10.1007/978-3-030-51941-4_8
8. Лебедев П. Д., Казаков А.Л., Лемперт А. А. Численные методы построения упаковок из различных шаров в выпуклые компакты Труды Института математики и механики., Т. 26, № 2. С.173-187 (год публикации - 2020) https://doi.org/10.21538/0134-4889-2020-26-2-173-187
9. Лебедев П. Д., Успенский А. А., Ушаков В. Н. Численные методы построения субоптимальных упаковок в невыпуклых фигурах с криволинейной границей Дискретный анализ и исследование операций, Т. 27, № 4. С. 58-79 (год публикации - 2020) https://doi.org/10.33048/daio.2020.27.678
10. Лебедев П.Д., Успенский А.А. Differential and Algebraical Relations in Singular Sets Construction for a One Class of Time-Optimal Control Problems In: Smirnov, N., Golovkina, A. (eds) Stability and Control Processes. SCP 2020 Lecture Notes in Control and Information Sciences - Proceedings, Springer, Cham. pp 427-435 (год публикации - 2022) https://doi.org/10.1007/978-3-030-87966-2_47
11. Усова А.А., Тарасьев А.М. Approximate Optimal Control in the Infinite Time Horizon Problem with Phase Constraints Minimax Theory and its Applications, Vol. 5, no. 2. P. 455-470 (год публикации - 2020)
12. Ухоботов В.И., Ушаков В.Н. Об одной задаче управления с помехой и вектограммами, зависящими линейно от заданных множеств Вестник Удмуртского университета. Математика. Механика. Компьютерные науки., T. 30, вып. 3. C. 429-443 (год публикации - 2020) https://doi.org/10.35634/vm200306
13. Ушаков В.Н., Ершов А.А. О восстановлении неопределенного параметра несколькими пробными управлениями Уфимский математический журнал, Т. 12, № 4. С. 101-116 (год публикации - 2020) https://doi.org/10.13108/2020-12-4-101
14. Ершов А.А.,Ушаков А.В., Ушаков В.Н. О двух игровых задачах сближения "Теория управления и теория обобщенных уравнений Гамильтона-Якоби" (CGS'2020): Материалы III международного семинара, посвященного 75-летию акад. А.И. Субботина, Екатеринбург, 26-30 октября 2020 г. Екатеринбург: ИММ УрО РАН, С. 156-157 (год публикации - 2020)
15. Изместьев И.В., Ухоботов В.И. Об одной дифференциальной игре с невыпуклой терминальной платой Материалы Всероссийской конференции с международным участием "Теория управления и математическое моделирование", посвященной памяти профессора Н. В. Азбелева и профессора Е. Л. Тонкова, С. 179-180 (год публикации - 2020)
16. Изместьев И.В., Ушаков В.Н. Параллельная реализация одного алгоритма решения задачи быстродействия для нелинейной управляемой системы "Теория управления и теория обобщенных решений уравнений Гамильтона – Якоби" (CGS’2020): Материалы III Международного семинара, посвященного 75-летию акад. А.И. Субботина, Екатеринбург, 26–30 октября 2020 г. Екатеринбург: ИММ УрО РАН, С. 171-174 (год публикации - 2020)
17. Ухоботов В.И,, Ушаков В.Н., Изместьев И.В. Об одной импульсной задаче управления с помехой и возможной поломкой в динамике "Теория управления и теория обобщенных решений уравнений Гамильтона – Якоби" (CGS’2020): Материалы III Международного семинара, посвященного 75-летию акад. А.И. Субботина, Екатеринбург, 26–30 октября 2020 г. Екатеринбург: ИММ УрО РАН, С. 313-315 (год публикации - 2020)
18. Ушаков В.Н., Ершов А.А. Оптимальный выбор пробных управлений для восстановления неопределённых параметров в управляемой системе "Теория управления и теория обобщенных уравнений Гамильтона-Якоби" (CGS'2020): Материалы III международного семинара, посвященного 75-летию акад. А.И. Субботина, Екатеринбург, 26-30 октября 2020 г. Екатеринбург: ИММ УрО РАН, С. 315-318 (год публикации - 2020)
Аннотация результатов, полученных в 2021 году
Для одномерной дискретной игровой задачи с поломкой, в которой терминальным множеством является объединение бесконечного числа непересекающихся отрезков равной длины, найдены необходимые и достаточные условия окончания и построены соответствующие оптимальные управления игроков. В качестве примера рассмотрена задача управления вращательной механической системой с возможной поломкой.
Для дискретной игровой задачи, в которой терминальное множество и вектограммы управлений первого игрока имеют форму кольца, найдены необходимые и достаточные условия окончания и построены соответствующие оптимальные управления игроков.
Для однотипной дифференциальной игры с невыпуклой терминальной платой, которая определяется как модуль отклонения нормы фазового вектора в фиксированный момент времени от заданного значения, найдены оптимальные управления игроков.
Разработан алгоритм сведения задачи управления движущейся тележкой с находящимся на нем упругим стержнем к одномерной дифференциальной игре. Это позволило найти необходимые и достаточные условия окончания в данной задаче.
Развиты конструктивные методы построения минимаксных решений уравнений Гамильтона-Якоби и отвечающих им решений задач оптимального управления по быстродействию для случая целевых невыпуклых множеств, у которых часть границы совпадает с отрезком прямой. В рамках исследования выделены условия, позволяющие строить ветви сингулярных (рассеивающих) кривых в аналитической форме. Получены в явном виде формулы для псевдовершин – особых точек границы краевого множества. Найдена связь псевдовершин с конструкциями теории неподвижных точек отображений. Выявлена аналитическая зависимость между концевыми точками различных оптимальных траекторий, имеющих общие начальные условия на сингулярном множестве и попадающих на целевое множество в окрестности псевдовершины. Получены формулы для крайних точек ветвей сингулярного множества. Приведены примеры построения в аналитической форме негладких решений динамических задач управления, демонстрирующие эффективность предложенных методов.
Исследованы конфликтно управляемые системы общего вида на конечном промежутке времени. Для них изучена игровая задача о сближении в минимаксной постановке, предполагающей информационную дискриминацию игрока. решающего задачу о сближении. К изучению задачи привлечены унификационное свойство стабильности и унификационные конструкции Н.Н. Красовского, В.Н. Ушакова и его коллег. На базе этих конструкций введены понятия u-стабильного и максимального (по включению) u-стабильного трактов и аппроксимирующих их систем множеств в фазовом пространстве, отвечающих дискретизации промежутка времени, на котором происходит игра. В.Н. Ушаковым описан метод Н.Н. Красовского экстремального прицеливания в минимаксной дифференциальной игре и обоснована его корректность с помощью применения унификационной схемы.
Рассмотрена нелинейная управляемая система с изменяемой структурой на конечном промежутке времени. Система варьируется на меньшем промежутке времени: дифференциальное уравнение, описывающее систему, подменяется другим дифференциальным уравнением, в результате чего возникает новая управляемая система на исходном промежутке времени. Изучено, насколько существенно это варьирование системы изменяется её интегральную воронку. Получена верхняя оценка хаусдорфова расстояния между интегральными воронками дифференциальных включений, соответствующих исходной и проварьированной системам.
Продолжена разработка алгоритмов приближённого конструирования множеств разрешимости и границ этих множеств, обоснована корректность алгоритмов. Проведено моделирование конкретных игровых задач с фазовыми ограничениями.
Рассмотрена задача оптимального управления нелинейной динамической системой, движение которой описывается дифференциальными уравнениями с дробными производными Капуто. Целью управления является минимизация заданного терминального показателя качества. Проведено исследование инфинитезимальных свойств функционала цены (функционала оптимального результата) в этой задаче. Найдены достаточные условия, при которых функционал цены является равномерно дифференцируемым дробного порядка по (однозначным) направлениям. Установлено, что при дополнительном условии выпуклости вектограммы функционал цены характеризуется равенством для производных дробного порядка по направлениям, которое естественным образом обобщает соответствующее уравнение Гамильтона – Якоби – Беллмана с дробными коинвариантными производными на негладкий случай. В качестве одного из возможных приложений получена эффективная процедура построения универсальной оптимальной позиционной стратегии управления. Для обоснования данных результатов была доказана теорема о дробной коинвариантной дифференцируемости решений дифференциальных уравнений с дробными производными Капуто по начальным данным.
Рассмотрена задача о сближении для управляемой системы, содержащей постоянный параметр, который становится известным только в момент начала движения. Для возможности её решения в реальном времени применён метод использования предварительно сконструированных разрешающих управлений. Для компактного хранения этих заготовленных управлений разработан метод их восстановления с помощью выпуклой комбинации небольшого количества "узловых" управлений, соответствующих значениям параметра в узлах сетки, накрывающей множество возможных значений неопределённого на момент начала движения постоянного параметра. Для возможности такого восстановления и уменьшения погрешности для решения рассматриваемой задачи был также использован метод разделения управления на основное и компенсирующее с некоторым вынужденным уменьшением области практической разрешимости задачи.
Развиты алгоритмы построения оптимальных покрытий множества M в трехмерном евклидовом пространстве наборами шаров различного радиуса. Радиус каждого шара считается равным произведению индивидуального положительного коэффициента на общий для всех параметр r. Критерием оптимальности выбрана минимизация r, В такой постановке задача может рассматриваться как задача о построении покрытия множества M объединением множеств достижимости динамических систем с шаровыми вектограммами скоростей за наименьшее время. Разработаны процедуры стохастической генерации начального массива точек S, координаты которых вычисляются как сумма векторов, лежащих в узлах гранецентрированной кубической решетки и случайных векторов, взятых из ограниченного компакта. Модернизирована процедура итерационного улучшения покрытия путем разбиения множества M на области влияния точек из S и вычисления чебышевских центров этих зон. Доказана теорема, позволяющая оценить сходимость процедуры к локально-оптимальному решению. Приведены примеры построения аппроксимаций оптимальных покрытий выпуклых многогранников.
Изучены условия стабилизируемости гамильтоновых систем, возникающих в принципе максимума Понтрягина применительно к задачам управления на неограниченном промежутке времени. Основу таким задачам составляют модели роста, используемые для описания процессов во многих прикладных областях. Доказано, что при почти всех значениях параметров модели в условиях существования стационарной точки, гамильтонова система асимптотически устойчива по первому приближению. Разработаны, оформлены и зарегистрированы программные средства для расчеты стабилизированных решений.
Кроме заявленной тематики, была проведена аналитическая работа, связанная с математическими моделями механики и теории электрических цепей с целью выявления в них подобной динамической структуры. Основываясь на базовых аналогиях между механическими и электрическими понятиями и законами рассмотрены примеры приведения модели цепи механических пружин к эквивалентному электрическому аналогу. Двойственность механических и электрических моделей позволяет заимствовать методы, например, стабилизации систем, о чем было изложено в подготовленной обзорной статье.
Проведен анализ поведения равновесных траекторий игровых динамических систем, возникающих при решении биматричных игр. На первом этапе рассматривался подход, основанный на идеях гарантированных стратегий в понимании Н. Н. Красовского. В рамках гарантированных решений предложены алгоритмы построения функций цены, позиционных стратегий и равновесных траекторий с использованием определения динамического равновесия по Нэшу. На втором этапе проанализированы равновесные траектории динамики репликатора, относящиеся к теории эволюционных игр. На третьем этапе исследована динамическая система, порожденная стратегиями наилучших ответов, аналогичная модели Курно. Проведено сравнение для объективных показателей равновесных траекторий всех трех динамических систем. Показано, что характеристики траекторий динамического равновесия по Нэшу лучше свойств траекторий динамики репликатора или динамики наилучшего ответа. Кроме того, для, так называемой, смешанной динамики проведены численные эксперименты, в которой первый игрок использует гарантированную стратегию, а стратегия второго игрока формируется либо по формулам репликатора, либо по динамике наилучшего ответа. Результаты моделирования для смешанной динамики показали, что значения функционалов выигрыша игроков в конечных точках траекторий лучше по сравнению с показателями траекторий динамики репликатора и динамики наилучшего ответа и даже лучше, чем в конечной точке динамического равновесия по Нэшу.
Публикации
1. Гомоюнов М.И. On differentiability of solutions of fractional differential equations with respect to initial data Fractional Calculus and Applied Analysis, vol. 25, pp.1484–1506 (год публикации - 2022) https://doi.org/10.1007/s13540-022-00072-w
2. Гомоюнов М.И., Лукоянов Н.Ю. Дифференциальные игры в системах дробного порядка: неравенства для производных функционала цены по направлениям Труды Математического института им. В.А. Стеклова, Т. 315, С. 74-94 (год публикации - 2021) https://doi.org/10.4213/tm4227
3. Ершов А.А. Linear parameter interpolation of a program control in the approach problem / Интерполяция программного управления по параметру в задаче о сближении Journal of Mathematical Sciences / Проблемы математического анализа, Vol. 260, № 6, P. 725-737 / Вып. 113 С. 17-27 (год публикации - 2022) https://doi.org/10.1007/s10958-022-05724-z
4. Зимовец А.А., Матвийчук А.Р., Ушаков А.В., Ушаков В.Н. Свойство стабильности в игровой задаче о сближении при наличии фазовых ограничений Известия ран. Теория и системы управления., № 4. С. 27-45. (год публикации - 2021) https://doi.org/10.31857/S0002338821040132
5. Изместьев И.В., Ухоботов В.И. Об одной дискретной игровой задаче с невыпуклыми вектограммами управлений Известия Института математики и информатики Удмуртского государственного университета, Т. 58, С. 48-58 (год публикации - 2021) https://doi.org/10.35634/2226-3594-2021-58-03
6. Изместьев И.В., Ухоботов В.И. A Discrete Game Problem with a Non-convex Terminal Set and a Possible Breakdown in Dynamics International Conference on Mathematical Optimization Theory and Operations Research. Part of the Lecture Notes in Computer Science book series (LNCS), Vol. 12755, pp. 314-325. (год публикации - 2021) https://doi.org/10.1007/978-3-030-77876-7_2
7. Изместьев И.В., Ухоботов В.И. Об однотипной дифференциальной игре с невыпуклой терминальной платой Челябинский физико-математический журнал, Т. 6, № 4 С. 417-426 (год публикации - 2021) https://doi.org/10.47475/2500-0101-2021-16402
8. Красовский Н.А., Тарасьев А.М. Analysis of equilibrium trajectories in dynamic bimatrix games Frontiers of Dynamic Games. (L.A. Petrosyan, V.V. Mazalov, N.A. Zenkevich, eds.). Series “Static & Dynamic Game Theory: Foundations & Applications”, Birkhauser, Springer International Publishing, St. Petersburg, - (год публикации - 2022)
9. Куржанский А.Б., Усова А.А. О дуальности математических моделей проблем механики и теории электрических цепей Труды Института математики и механики УрО РАН, Т. 27, № 3. С. 115-127 (год публикации - 2021) https://doi.org/10.21538/0134-4889-2021-27-3-115-127
10. Лебедев П.Д., Казаков А.Л. Итерационные алгоритмы построения наилучших покрытий выпуклых многогранников наборами различных шаров Труды Института математики и механики УрО РАН, Т. 27, № 1. C. 116-129. (год публикации - 2021) https://doi.org/10.21538/0134-4889-2021-27-1-116-129
11. Лебедев П.Д., Успенский А.А. Об аналитическом построении решений в одном классе задач управления по быстродействию с невыпуклым целевым множеством ТРУДЫ ИНСТИТУТА МАТЕМАТИКИ И МЕХАНИКИ УрО РАН, Т. 27, № 3. С. 128-140 (год публикации - 2021) https://doi.org/10.21538/0134-4889-2021-27-3-128-140
12. Ухоботов В.И., Ливанов Н.Д. Об одной задаче управления движущейся тележкой с находящимся на ней упругим стержнем Вестник Южно-Уральского государственного университета. Серия «Математика. Механика. Физика», Т. 13, вып. 1, С. 22–28 (год публикации - 2021) https://doi.org/10.14529/mmph210103
13. Ушаков В.Н. Унификация в игровой задаче о сближении и свойство стабильности Челябинский физико-математический журнал, - (год публикации - 2022)
14. Ушаков В.Н., Ершов А.А., Ушаков А.В., Кувшинов О.А. Control system depending on a parameter Ural Mathematical Journal, Ushakov V.N., Ershov A.A., Ushakov A.V., Kuvshinov O.A. Control system depending on a parameter // Ural Mathematical Journal. – 2021. – Vol. 7, No. 1. – P. 120-159. DOI: 10.15826/umj.2021.1.011 (год публикации - 2021) https://doi.org/10.15826/umj.2021.1.011
15. Ушаков В.Н., Ухоботов В.И., Изместьев И.В. Об одной задаче импульсного управления при наличии помехи и возможной поломке Труды Института математики и механики УрО РАН, Т. 27, № 2. С. 249–263 (год публикации - 2021) https://doi.org/10.21538/0134-4889-2021-27-2-249-263
16. Ушаков В.Н., Ухоботов В.И., Ушаков А.В., Изместьев И.В. Control Systems of Variable Structure. Attainability Sets and Integral Funnels / Управляемые системы с переменной структурой. Множества достижимости и интегральные воронки. Journal of Mathematical Sciences / Проблемы математического анализа, Vol. 260, № 6, pages 820-832 / Вып. 113 С. 101-112 (год публикации - 2022) https://doi.org/10.1007/s10958-022-05730-1
17. Гомоюнов М.И. Производные по направлениям функционала цены в задачах оптимального управления системами дробного порядка Динамические системы: устойчивость, управление, оптимизация: материалы Междунар. науч. конф. памяти профессора Р.Ф. Габасова, Минск, 5-10 октября 2021 г. Минск: Изд. центр БГУ, 2021, С. 77-79 (год публикации - 2021)
Возможность практического использования результатов
Разработаны алгоритмы построения управлений системами с возможными поломками. В случае, когда цель управления определяется значением линейной функции фазовых переменных в заданный момент времени, найден явный вид управления с импульсными, интегральными и геометрическими ограничениями. Найденные управления могут быть применены в задачах управления механическими системами переменного состава, а также в задачах управления суставом, используемом в роботизированных системах.
Разработаны аналитические и численные процедуры построения разрешающих множеств в задачах управления по быстродействию с круговой вектограммой скоростей и невыпуклой геометрией целевых множеств. Процедуры могут быть использованы для решения краевых задач уравнений в частных производных первого порядка, в частности, при моделировании эволюции волновых фронтов в геометрической оптике, а также в сейсмологии. В экономике модификации предложенных алгоритмов приложимы при анализе моделей оптимизации расположения логистических центров или пунктов продаж.
Дифференциальные уравнения с дробными производными широко используются при математическом моделировании ряда сложных процессов и явлений в различных областях знаний. В том числе активно изучаются задачи управления системами дробного порядка, имеющие приложения, например, в медицине, химии, экономике, инженерии, биологии и др. Таким образом, полученные в проекте результаты по исследованию задач управления в условиях помех и/или противодействия системами дробного порядка могут оказаться полезными при разработке конструктивных методов решения задач управления конкретными динамическими системами.
Разработанная в проекте технология хранения разрешающих программных управлений с помощью их
выпуклой комбинации обеспечивает возможность быстрого автоматизированного ответа-управления
на случай любого значения заранее неопределённого параметра в постановке задачи управления.
Заметим, что в качестве неопределённого параметра также могут выступать положение целевого множества
или точка начала движения. Тем самым создан научный задел для расширения возможностей
применения устройств с примитивным вычислительным комплексом на борту, так как предложенный подход снимает необходимость вычисления разрешающих управлений в режиме реального времени.
Проведено построение равновесных траекторий и анализ их асимптотических свойств в динамических играх на бесконечном интервале времени с интегральными показателями качества различного типа. Разработаны динамические процедуры сдвига равновесных траекторий в динамических играх от статических нэшевских равновесий к паретовским точкам максимума векторного критерия. В проекте даны приложения алгоритмов построения равновесных и оптимальных траекторий к моделям экономического роста, стабилизации динамических систем и моделям инвестиций. Рассмотренные интерпретации динамических равновесных решений в моделях инвестиций на финансовых рынках облигаций и акций могут быть полезны для совершения оптимальных инвестиций.