Go to the content. | Move to the navigation | Go to the site search | Go to the menu | Contacts | Accessibility

| Create Account

Romeres, Diego (2017) Advances in System Identification: Gaussian Regression and Robot Inverse Dynamics Learning. [Ph.D. thesis]

Full text disponibile come:

PDF Document - Accepted Version

Abstract (english)

Nonparametric Gaussian regression models are powerful tools for supervised learning problems. Recently they have been introduced in the field of system identification as an alternative to classical parametric models used in prediction error methods. The focus of this thesis is the analysis and the extension of linear Gaussian regression models and their applications to the identification of the inverse dynamics of robotic platforms.

When Gaussian processes are applied to linear systems identification, according to the Bayesian paradigm the impulse response is modeled a priori with a Gaussian distribution encoding the desired structural properties of the dynamical system (e.g. smoothness, BIBO stability, sparsity, etc.). The inference on the impulse response estimate is obtained through the posterior distribution which combines the information of the a priori distribution together with the information given by the data.

The Bayesian framework naturally allows the adaptation of the model class and its complexity while also accounting for uncertainty and noise, thus providing a robust mean to trade bias versus variance. On the other hand, one disadvantage of these nonparametric methods is that their aim to identify directly the impulse response of the predictor model does not guarantee the stability of the forward model.

These general advantages and disadvantages inspired the research on this manuscript.

A COMPARISON BETWEEN GAUSSIAN REGRESSION AND PARAMETRIC PEM. The term of comparison for these Gaussian regression models will be the classical parametric technique. In addition to an analysis of the two approaches in terms of error in fitting the impulse response estimates, we are interested in comparing the confidence intervals around these estimates. A new definition of the confidence intervals is proposed in order to pave the way for a fair comparison between the two approaches. Numerical simulations show that the Bayesian estimates have higher prediction performance.

ONLINE GAUSSIAN REGRESSION. In an on-line system identification setting, new data become available at given time steps and real-time estimation requirements have to be satisfied. The goal is to compute the model estimate with low and fixed computational complexity and a reduced memory storage. We developed a tailored Bayesian procedure which updates the quantities to compute the marginal likelihood and the impulse response estimate iteratively and performs the estimation of the hyperparameters by computing only one iteration of a suitable optimization algorithm to maximize the marginal likelihood. Both quasi-Newton methods and EM algorithm are adopted as optimization algorithms. When time-varying systems are considered, the property of ‘forgetting the past data’ is required. Accordingly we propose two schemes: the usage of a temporal window which slides over the data and the usage of a forgetting factor which is a variable that exponentially decreases the weight of the old data. In particular, we propose to consider the forgetting factor both as a fixed constant or as an estimating variable. The proposed nonparametric procedures have satisfactory performances compared to the batch algorithm and outperform the classical parametric approaches both in terms of computational time and adherence of the model estimate to the true one.

ENFORCING MODEL STABILITY IN NONPARAMETRIC GAUSSIAN REGRESSION. The main idea of the Bayesian approach is to frame linear system identification as predictor estimation in an infinite dimensional space with the aid of regularization techniques. This approach is based on the prediction error minimization and can guarantee the identification of stable predictors. Unfortunately, the stability of the predictors does not guarantee the stability of the impulse response of the forward model in general. Various techniques are successfully proposed to guarantee the stability of this model.

ONLINE SEMIPARAMETRIC LEARNING FOR INVERSE DYNAMICS MODELING. Dynamic models can be obtained from the first principles of mechanics, using the so called Rigid Body Dynamics. This approach results in a parametric model in which the values of physically meaningful parameters must be provided in order to complete the fixed structure of the model. Alternatively, the nonparametric Gaussian regression modeling can be employed extrapolating the dynamics directly from the experimental data, without making any unrealistic approximation on the physical system (e.g. assuming linear frictions models, ignoring the dynamics of the hydraulic actuators, etc.). Nevertheless, nonparametric models deteriorate their performance when predicting unseen data that are not in the ``neighbourhood'' of the training dataset. In order to exploit the advantages of both techniques, semiparametric models which combine the parametric and the nonparametric models are analyzed.

Abstract (italian)

I modelli nonparametrici basati su regressione Gaussiana sono strumenti ampiamenti utilizzati per la risoluzione di problemi di supervised learning. Recentemente, questi modelli sono stati introdotti come alternativa ai classici modelli parametrici per affrontare problemi di identificazione di sistemi dinamici. Lo scopo di questa tesi è duplice l'analisi e l'estensione dei metodi di regressione Gaussiana per sistemi lineari e l'utilizzo della regressione Gaussiana in modelli nonlineari per la stima della dinamica inversa di robot.

Quando il problema di identificazione di sistemi lineari è affrontato con processi Gaussiani, la risposta impulsiva viene modellata a priori come una distribuzione Gaussiana in cui vengono codificate le caratteristiche desiderate nel sistema da identificare come la liscezza, la BIBO stabilità e la sparsità. La stima della risposta impulsiva è ottenuta dalla distribuzione a posteriori che unisce sia le informazioni a priori sul modello, sia le informazioni che si possono estrarre dai dati.

L'approccio Bayesiano consente di adattare la classe di modelli e la loro complessità in modo naturale e continuo, tenendo conto anche dell'incertezza e dell'errore presenti nel sistema, fornendo così un' efficace metodo per affrontare il bias-variance dilemma. Tuttavia, uno degli svantaggi di questi metodi non parametrici è che identificando direttamente la stima del predittore non garantiscono che anche la stima del sistema diretto sia stabile.

Questi vantaggi e svantaggi hanno inspirato il lavoro di ricerca riportato in questa tesi, che vengono di seguito sintetizzati.

E' stato effettuato un confronto tra modelli di regressione Gaussiana e modelli parametrici sia a livello di accuratezza nella stima della risposta impulsiva, sia a livello di intervalli di confidenza.

L' approccio 'batch' per i modelli di regressione Gaussiana è stato esteso ad uno scenario 'online', in cui la stima deve essere aggiornata in real-time quando sopraggiungono nuovi dati.

L' approccio Bayesiano è basato sull' identificazione del modello predittore garantendone proprietà di stabilità. Sfortunatamente, questo non garantisce la stabilità anche del modello diretto. Diverse tecniche sono state proposte per garantire la stabilità di entrambi i modelli.

Infine, i modelli di regressione Gaussiana sono stati utilizzati per l'apprendimento della dinamica inversa di robot. In particolare, sono stati utilizzati dei modelli semiparametrici che permettono di sfruttare le proprietà sia dei modelli Gaussiani sia dei modelli parametrici.

Statistiche Download - Aggiungi a RefWorks
EPrint type:Ph.D. thesis
Tutor:Chiuso, Alessandro
Supervisor:Gianluigi, Pillonetto
Ph.D. course:Ciclo 29 > Corsi 29 > INGEGNERIA DELL'INFORMAZIONE
Data di deposito della tesi:31 January 2017
Anno di Pubblicazione:31 January 2017
Key Words:Gaussian regression, Bayesian system identification, confidence set, online, stability, inverse dynamic learning
Settori scientifico-disciplinari MIUR:Area 09 - Ingegneria industriale e dell'informazione > ING-INF/04 Automatica
Struttura di riferimento:Dipartimenti > Dipartimento di Ingegneria dell'Informazione
Codice ID:10342
Depositato il:24 Nov 2017 10:17
Simple Metadata
Full Metadata
EndNote Format

Download statistics

Solo per lo Staff dell Archivio: Modifica questo record