Soha Kanso et William Jussiau

Séminaire jeunes chercheurs Diapro – 21 novembre 2024 – Saint-Jérôme

William Jussiau, jeune docteur de l’ONERA

Titre : Lois de commande pour le contrôle des écoulements oscillateurs

Résumé : Cette thèse porte sur la synthèse de lois de commande pour les écoulements oscillateurs à faible nombre de Reynolds. Nous y étudions deux configurations canoniques en 2D : l’écoulement autour d’un cylindre, et l’écoulement au-dessus d’une cavité ouverte. Ces deux cas d’étude présentent un équilibre stationnaire instable, et un régime d’oscillations auto-entretenues – respectivement, un cycle limite et un attracteur torique. L’objectif principal est la synthèse de lois de commande pour supprimer complètement le régime oscillatoire, pour réduire la traînée moyenne, les vibrations structurelles ou le rayonnement acoustique tonal. En pratique, la synthèse de lois de commande pour ces systèmes est rendue difficile par la diversité des phénomènes dynamiques émergeant des équations de Navier-Stokes, non-linéaires et de dimension infinie. Nous proposons trois méthodes distinctes pour réaliser cette tâche, utilisant respectivement une paramétrisation des correcteurs stabilisants, la continuation numérique et le formalisme de la résolvante moyenne.

Soha KANSO, doctorante, CRAN, Université de Lorraine, Nancy. ATER Polytech Nancy

Titre : Safe Reinforcement Learning and Degradation Tolerant Control Design

Résumé : Safety-critical dynamical systems are essential in various industries, such as aerospace domain, autonomous systems, robots in healthcare area etc., where violating safety constraints and structural or functional failure may lead to catastrophic consequences. A significant challenge in these systems is the degradation of components and actuators, which can compromise safety and stability of systems. As such, incorporating system’s health state within the control design framework is essential to ensure tolerance to functional degradation. Moreover, such system models often involve uncertainties and incomplete knowledge, especially as components degrade, altering system dynamics in a nonlinear manner. This underscores the necessity for the development of learning approaches that incorporate the available data within the control learning paradigm.
In this context, Reinforcement Learning (RL) emerges as a powerful approach, capable of learning optimal control laws for partially or fully unknown dynamic systems, in the presence of input-output data (without the exact knowledge of system models). However, a major challenge in applying RL methods to safety-critical systems lies in ensuring safety during both the exploration and exploitation phases. Exploration involves introducing probing noise to the policy in order to collect informative data across the state space, while exploitation refers to applying the learned policy to optimize performance in real operations.

To this end, this presentation will first explore an off-policy safe RL approach for the regulation and the tracking problem in continuous-time nonlinear systems affine in control input. A novel approach will be presented that ensures system stability and safety during all phases: initialization, exploration, and exploitation. By using quadratic programming with control Lyapunov function (CLF) and control barrier function (CBF), the proposed approach ensures stability and safety of the system during initialization and exploration phases. Furthermore, during exploitation, the safety of the learned policy is ensured by augmenting the cost function with reciprocal CBFs, thus balancing performance optimization and safety. The second part of the talk will focus on addressing actuator degradation, which poses a critical threat to system performance and stability. A degradation-tolerant controller based on RL is introduced for continuous-time nonlinear systems affine in control input. The objectives are twofold: ensuring system stability despite degradation, and decelerating the degradation rate to complete missions and extend actuator life. This is achieved by imposing constraints on degradation rates using CBFs. Furthermore, a cyclic off-policy algorithm is presented, enabling iterative exploration and exploitation across multiple learning cycles. This allows for continuous updates of neural network weights with recent information on degradation levels, ensuring that the learned policy effectively stabilizes the system while accounting for degradation effects.

In the developed approaches, neural networks are used to approximate both the value function and the control policy, thereby enabling efficient learning. Simulation results will be presented to demonstrate the efficiency of the proposed approaches.

Salim Zekraoui et Anes Lazri

Vendredi 8 novembre 9h, Saint-Jérôme

Anes Lazri, L2S, Université Paris Saclay, lien Scholar

Titre : Analyse et contrôle de la synchronisation dans les réseaux de systèmes complexes

Résumé :
Les réseaux complexes sont omniprésents dans notre quotidien, qu’il
s’agisse de réseaux électriques, de réseaux sociaux ou encore de
réseaux biologiques. Ces réseaux interconnectent de nombreux systèmes
individuels, créant ainsi des interactions qui influencent leur
comportement collectif. En plus de la dynamique propre à chaque
système, une dynamique collective émerge, donnant lieu à des
phénomènes tels que la synchronisation ou le regroupement en clusters.

Lors de ce séminaire, nous aborderons deux aspects majeurs influençant
la synchronisation : la force des interconnexions et la topologie du
réseau. Nous explorerons comment ces facteurs impactent la dynamique
des réseaux de systèmes complexes, notamment dans des scénarios où :

  • Le réseau est partitionné en plusieurs groupes capables de communiquer entre eux, permettant à ces groupes de former des « macro-noeuds » qui peuvent atteindre un comportement commun ou un consensus ;
  • Les couplages entre nœuds ne sont pas suffisamment forts pour garantir une synchronisation complète, entraînant l’émergence de clusters distincts au sein du réseau.

Nous examinerons ces phénomènes avec un certain degré de
généralité, mais aussi à travers des exemples concrets tels que les
réseaux d’oscillateurs. Le but de cette présentation est de discuter
des algorithmes de contrôle et des outils d’analyse permettant
d’assurer la synchronisation et le consensus dans ces réseaux. Nous
mettrons également en lumière des cas particuliers où le
multi-consensus émerge, et nous analyserons différents types de
topologies et de connexions dans ce contexte.

Salim Zekraoui, LAGEPP, Université Lyon 1, lien Scholar

Titre : Finite-time control of LTI/PDE systems with input delay using a PDE-based approach.

Abstract :
Time-delay systems are ubiquitous in control engineering. As time delays may cause performance degradation or instability of the closed-loop system, control design becomes a central issue; however, due to the infinite-dimensional nature of those systems, control continues to be challenging. Moreover, in many applications, like rendezvous and missile guidance, the transient process must occur within a given time while also managing the effect of the delay. The need to meet these time constraints and to increase temporal performance has motivated non-asymptotic stabilization (stabilization + convergence in finite time). In this talk, we will focus on the non-asymptotic stabilization of some classes of infinite-dimensional systems, namely LTI systems with input delays and reaction-diffusion PDEs with boundary input delays, utilizing a PDE backstepping-based approach. The approach consists mainly of rewriting the initial delayed LTI/PDE system as an ODE/PDE-PDE cascade system; and then transforming the resulting cascaded system, using an invertible transformation, into a well-chosen non-asymptotically stable target system. We show that the inverse transformation transfers the non-asymptotic stability property back to the initial ODE/PDE-PDE cascade system. 

In addition, we consider the problem of boundary state-dependent finite/fixed-time stabilization of reaction-diffusion PDEs. To the best of our knowledge, this problem has remained open in the literature for a considerable long time. We tackled this challenging problem using classical methods related to Control Lyapunov functions.