Open this publication in new window or tab >>2026 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
Autonomous bicycles constitute challenging benchmark systems for control, due to their nonlinear, non-holonomic, and in general, underactuated, open-loop unstable dynamics. Traditional model-based controllers such as proportional-integral-derivative (PID) controllers and linear quadratic regulators (LQRs) can stabilize the bicycle, but rely on simplified models that may not capture unmodelled and time-varying effects. In contrast, recent direct data-driven control methods based on Willems’ fundamental lemma bypass explicit modelling, yet typically assume linear time-invariant dynamic systems and require persistently exciting inputs that are difficult to apply safely on unstable systems.
This thesis investigates how traditional model-based and direct data-driven control methods can be used, and combined, to balance and guide an autonomous bicycle using mainly steering actuation as input. First, PID, LQR, fuzzy controller, feedback linearization (FL), and direct data-driven controllers are designed and compared in high-fidelity simulations and experiments on an autonomous bicycle. The results show that classical model-based controllers provide strong baselines, while direct data-driven controllers can enhance performance when combined with classical controllers. Second, a unified framework is proposed in which an inner-loop FL controller stabilizes and partially linearizes the bicycle, and an outer-loop direct data-driven controller operates on the FL-stabilized system. Two different types of direct data-driven methods are evaluated in this setting: a static, nonlinear controller and the Data-enabled Policy Optimization (DeePO) algorithm. Third, the DeePO algorithm is analysed and modified to mitigate state perturbations, leading to a perturbation-free variant studied on LTI systems. Finally, a model-based PID–MPC trajectory tracking scheme is compared with a data-driven framework relying on Data-enabled Predictive Control (DeePC) for trajectory tracking, combined in a cascade architecture with the FL-DeePO setup. Simulations show that while PID–MPC achieves better tracking accuracy, the data-driven cascade attains successful trajectory tracking without relying on an explicit dynamic model.
Abstract [sv]
Autonoma cyklar utgör utmanande riktmärkessystem för reglering, på grund av sin icke-linjära, icke-holonoma och i allmänhet underaktuerade, öppen-slinga-instabila dynamik. Traditionella modellbaserade regulatorer, såsom proportional–integral–derivata-regulatorer (PID) och linjärt kvadratiska regulatorer (LQR), kan stabilisera cykeln, men bygger på förenklade modeller som inte nödvändigtvis fångar omodellerade och tidsvarierande effekter. I kontrast till detta kringgår nyare direkta data-drivna regleringsmetoder baserade på Willems fundamentallemma explicit modellering, men antar typiskt linjära tidsinvarianta dynamiska system och kräver ständigt exciterande insignaler som är svåra att tillämpa på ett säkert sätt på instabila system.
Denna avhandling undersöker hur traditionella modellbaserade och direkta data-drivna regleringsmetoder kan användas, och kombineras, för att balansera och guida en autonom cykel med huvudsakligen styraktuering som indata. För det första konstrueras PID-, LQR-, fuzzyregulatorer, feedbacklineariseringsregulatorer (FL) samt direkta data-drivna regulatorer, vilka jämförs i högfidelitets-simuleringar och experiment på en autonom cykel. Resultaten visar att klassiska modellbaserade regulatorer utgör starka riktmärken, medan direkta data-drivna regulatorer kan förbättra prestandan när de kombineras med klassiska regulatorer.
För det andra föreslås ett enhetligt ramverk där en innerloop-FL-regulator stabiliserar och delvis lineariserar cykeln, medan en ytterloop-regulator baserad på direkt data-driven reglering verkar på det FL-stabiliserade systemet. Två olika typer av direkta data-drivna metoder utvärderas i denna konfiguration: en statisk, icke-linjär regulator och algoritmen Data-enabled Policy Optimization (DeePO). För det tredje analyseras DeePO-algoritmen och modifieras för att motverka tillståndsstörningar, vilket leder till en perturbationsfri variant som studeras på linjära tidsinvarianta (LTI) system.
Slutligen jämförs ett modellbaserat PID–MPC-upplägg för banföljning med ett data-drivet ramverk som bygger på Data-enabled Predictive Control (DeePC) för banföljning, kombinerat i en kaskadarkitektur med FL–DeePO-strukturen. Simuleringar visar att PID–MPC uppnår bättre uppföljningsnoggrannhet, medan den data-drivna kaskaden uppnår lyckad banföljning utan att förlita sig på en explicit dynamisk modell.
Place, publisher, year, edition, pages
Västerås: Mälardalen University, 2026
Series
Mälardalen University Press Dissertations, ISSN 1651-4238 ; 453
National Category
Control Engineering
Research subject
Electronics
Identifiers
urn:nbn:se:mdh:diva-74479 (URN)978-91-7485-737-5 (ISBN)
Public defence
2026-01-28, Kappa, Mälardalens universitet, Västerås, 09:15 (English)
Opponent
Supervisors
2025-11-252025-11-242026-01-07Bibliographically approved