Vai ai contenuti. | Spostati sulla navigazione | Spostati sulla ricerca | Vai al menu | Contatti | Accessibilità

| Crea un account

Maragoni, Lorenzo (2014) Quantile Inference In Genomic Studies. [Tesi di dottorato]

Full text disponibile come:

[img]
Anteprima
Documento PDF (PHD THESIS MARAGONI LORENZO) - Versione sottomessa
3255Kb

Abstract (inglese)

Genomic studies aim at identifying genes’ location and function across the genome of living organisms of interest. In the last decades, this field of research has been the object of lively interest, motivated by the introduction of microarray and sequencing technologies, capable of providing huge amounts of data concern- ing several aspects of the genome. Statistical tools have proven to be necessary in this context, to support and sometimes lead biological investigation, impractical or impossible to be conducted over the whole set of data provided by the above men- tioned technologies. In this Thesis, we introduce novel statistical tools for dealing with well-known problems in the genomic field, such as identifying differential expression in microarray data, and evaluating differential binding in the context of ChIP-Seq data. Our specific interest will be inference on quantiles, motivated by their interpretability, even for irregularly shaped distributions of the data, and by the fact that they allow to compare different aspects of the whole distribution of the data. We propose Studentized and pseudo-Studentized statistics, whose struc- ture resembles closely that of a classic t-test, and evaluate their performances via simulated studies and application to real data.

Abstract (italiano)

Gli studi di genomica hanno l’obiettivo di identificare posizione e funzione dei geni all’interno del genoma di organismi oggetto di interesse. Negli ultimi vent’anni, questo campo di ricerca e` stato oggetto di vivace interesse, motivato dall’introduzione di microarray e tecnologie di sequenziamento, capaci di produrre enormi quantità di dati riguardanti diversi aspetti del genoma. In questo contesto, gli strumenti statistici si sono dimostrati necessari per supportare e in alcuni casi guidare la ricerca biologica, poco pratica o impossibile da condurre sull’intero insieme di dati prodotto dalle tecnologie di cui sopra. In questa Tesi, si introdurranno nuovi strumenti statistici per affrontare problemi noti nell’ambito genomico, come l’identificazione di geni differenzialmente espressi tramite dati di microarray, e l’analisi dei siti di legame nel contesto dei dati di ChIP-Seq. L’interesse specifico sara` l’inferenza sui quantili, motivato dalla loro interpretabilità, anche per distribuzioni dei dati dalle forme irregolari, e dal fatto che permettono di confrontare differenti aspetti della distribuzione dei dati. Si proporranno statistiche Studentizzate e pseudo-Studentizzate, la cui struttura richiama da vicino quella di un t-test classico, e si valuterà il loro comportamento attraverso studi di simulazione e applicazione su dati reali.

Statistiche Download - Aggiungi a RefWorks
Tipo di EPrint:Tesi di dottorato
Relatore:Chiogna, Monica
Dottorato (corsi e scuole):Ciclo 26 > Scuole 26 > SCIENZE STATISTICHE
Data di deposito della tesi:30 Luglio 2014
Anno di Pubblicazione:31 Luglio 2014
Parole chiave (italiano / inglese):quantile inference, hypothesis testing, microarray, chip-seq
Settori scientifico-disciplinari MIUR:Area 13 - Scienze economiche e statistiche > SECS-S/01 Statistica
Area 13 - Scienze economiche e statistiche > SECS-S/02 Statistica per la ricerca sperimentale e tecnologica
Struttura di riferimento:Dipartimenti > Dipartimento di Scienze Statistiche
Codice ID:7011
Depositato il:29 Lug 2015 12:38
Simple Metadata
Full Metadata
EndNote Format

Download statistics

Solo per lo Staff dell Archivio: Modifica questo record