Vai ai contenuti. | Spostati sulla navigazione | Spostati sulla ricerca | Vai al menu | Contatti | Accessibilità

| Crea un account

Durante, Daniele (2016) Bayesian Nonparametric Modeling of Network Data. [Tesi di dottorato]

Full text disponibile come:

[img]
Anteprima
Documento PDF
11Mb

Abstract (inglese)

Network data representing relationship structures among a set of nodes are available in many fields of applications covering social science, neuroscience, business intelligence and broader relational settings. Although early probability models for networks date back almost sixty years, this field of research is still an object of intense and dynamic interest. A primary reason for the recent growth of statistical methodologies in modeling of networks is that the routine collection of such data is a recent development. Online social networks, novel neuroimaging technologies, improved business intelligence analyses and sophisticated computer algorithms monitoring world news media, currently provide increasingly complex network data sets along with novel motivating applications and new methodological questions. A challenging issue in such settings is that data are available via multiple network observations and hence the rich literature in modeling of a single network falls far short of the goal of providing flexible inference in this scenario.
Statistical modeling of replicated network data is still on its infancy and several questions remain about coherence of inference, flexibility, computational tractability and other key issues. Motivated by complex applications from different domains, this thesis aims to take a sizable step towards addressing these issues via Bayesian nonparametric modeling. The thesis is organized in two main frameworks, further divided in different topics. The first thread develops flexible and computationally tractable stochastic processes for modeling dynamic networks, which incorporate temporal dependence and exploit latent network structures. The second focuses on defining a provably flexible representation for the probabilistic generative mechanism underlying a network-valued random variable, which is able to provide valuable insights both on shared and subject -- or phenotype -- specific sources of variability in the network structure

Abstract (italiano)

I dati di rete misurano connessioni tra un insieme di nodi e ricorrono in molti campi di studio, tra cui le scienze sociali, le neuroscienze, il marketing ed altre discipline. Sebbene i primi modelli probabilistici per dati di rete risalgano a circa sessant'anni fa, questo campo di ricerca è tuttora oggetto di vivace ed intenso interesse. La principale motivazione per la recente crescita di metodologie statistiche per la modellazione di reti è legata alla sempre più massiccia accessibilità a dati di questo tipo. Le reti sociali online, i recenti sviluppi tecnologici nel monitoraggio di reti cerebrali e la disponibilità di algoritmi sofisticati per catalogare informazioni dai mezzi di comunicazione, forniscono dati di rete caratterizzati da una progressiva complessità e contribuiscono a nuovi interrogativi applicativi e metodologici. Un aspetto comune a queste nuove basi di dati è legato alla disponibilità di misure ripetute di reti, anziché di una sola rete. Di conseguenza, l'ampia letteratura nello studio di una singola rete richiede generalizzazioni sostanziali per fornire adeguati strumenti inferenziali in questi nuovi scenari.
Le tecniche statistiche di modellazione per misure ripetute di reti sono ancora agli albori e diversi interrogativi rimangono ancora irrisolti in merito alla coerenza dei metodi inferenziali, alla maneggevolezza degli strumenti computazionali ed altre importanti questioni. Questa tesi è motivata da applicazioni complesse in diversi ambiti di studio e si pone l'obiettivo di compiere un passo considerevole nella risponda alle precedenti tematiche attraverso modelli Bayesiani non parametrici. Il lavoro è organizzato in due macro aree, a loro volta suddivise in diverse tematiche. La prima si pone l'obiettivo di sviluppare processi stocastici flessibili per la modellazione di reti dinamiche, capaci di incorporare sia la dipendenza temporale che quella di rete. La seconda macro area cerca invece di definire tecniche di rappresentazione flessibili per definire meccanismi probabilistici associati a variabili aleatorie di rete, con il fine di fornire informazioni chiave su strutture comuni di connessione e comprendere se e come queste si modifichino in funzione di altre variabili

Statistiche Download - Aggiungi a RefWorks
Tipo di EPrint:Tesi di dottorato
Relatore:Scarpa, Bruno
Correlatore:Dunson, David
Dottorato (corsi e scuole):Ciclo 28 > Scuole 28 > SCIENZE STATISTICHE
Data di deposito della tesi:29 Gennaio 2016
Anno di Pubblicazione:29 Gennaio 2016
Parole chiave (italiano / inglese):Network-valued data, matrix factorization, state space model, Pòlya-Gamma data augmentation, Bayesian nonparametrics, mixture models
Settori scientifico-disciplinari MIUR:Area 13 - Scienze economiche e statistiche > SECS-S/01 Statistica
Struttura di riferimento:Dipartimenti > Dipartimento di Scienze Statistiche
Codice ID:9333
Depositato il:06 Ott 2016 16:35
Simple Metadata
Full Metadata
EndNote Format

Bibliografia

I riferimenti della bibliografia possono essere cercati con Cerca la citazione di AIRE, copiando il titolo dell'articolo (o del libro) e la rivista (se presente) nei campi appositi di "Cerca la Citazione di AIRE".
Le url contenute in alcuni riferimenti sono raggiungibili cliccando sul link alla fine della citazione (Vai!) e tramite Google (Ricerca con Google). Il risultato dipende dalla formattazione della citazione.

Airoldi, E. M., Blei, D. M., Fienberg, S. E. and Xing, E. P. (2008). Mixed membership stochastic blockmodels. Journal of Machine Learning Research, 9:1981-2014 Cerca con Google

Bassett, D. S. and Bullmore, E. (2006). Small-world brain networks. The Neuroscientist, 12(6):512-523. Cerca con Google

Bhattacharya, A. and Dunson, D. B. (2011). Sparse Bayesian infinite factor models. Biometrika, 98(2):291-306. Cerca con Google

Bullmore, E. and Sporns, O. (2012). The economy of brain network organization. Nature Reviews Neuroscience, 77(3):586-595. Cerca con Google

Dunson, D. B. and Xing, C. (2009). Nonparametric Bayes modeling of multivariate categorical data. Journal of the American Statistical Association, 104(487):1042-1051 Cerca con Google

Durbin, J. and Koopman, S. J. (2012). Time Series Analysis by State Space Methods. Oxford University Press. Cerca con Google

Frank, O. and Strauss, D. (1986). Markov graphs. Journal of the American Statistical Association, 81(395):832-842. Cerca con Google

Hjort, N. L., Holmes, C., Muller, P. and Walker, S. G. (2010). Bayesian nonparametrics. Cambridge University Press. Cerca con Google

Hoff, P. D., Raftery, A. E. and Handcock, M. S. (2002). Latent space approaches to social network analysis. Journal of the American Statistical Association, 97(460):1090-1098. Cerca con Google

Nowicki, K. and Snijders, T. A. B. (2001). Estimation and prediction for stochastic blockstructures. Journal of the American Statistical Association, 96(455):1077-1087. Cerca con Google

Polson, N. G., Scott, J. G. and Windle, J. (2013). Bayesian inference for logistic models using Pòlya-gamma latent variables. Journal of the American Statistical Association, 108(504):1339- Cerca con Google

1349. Cerca con Google

Zhu, B. and Dunson, D. B. (2013). Locally adaptive Bayes nonparametric regression via nested Gaussian processes. Journal of the American Statistical Association, 108(504):1445-1456. Cerca con Google

Download statistics

Solo per lo Staff dell Archivio: Modifica questo record