Vai ai contenuti. | Spostati sulla navigazione | Spostati sulla ricerca | Vai al menu | Contatti | Accessibilità

| Crea un account

Risso, Davide (2012) Simultaneous inference for RNA-Seq data. [Tesi di dottorato]

Full text disponibile come:

[img]
Anteprima
Documento PDF
Available under License Creative Commons Attribution Non-commercial Share Alike.

4024Kb

Abstract (inglese)

In the last few years, RNA-Seq has become a popular choice for high-throughput studies of gene expression, revealing its potential to overcome microarrays and become the new standard for transcriptional profiling. At a gene-level, RNA-Seq yields counts rather than continuous measures of expression, leading to the need for novel methods to deal with count data in high-dimensional problems.
In this Thesis, we aim at shedding light on the problems related to the exploration and modeling of RNA-Seq data. In particular, we introduce simple and effective ways to summarize and visualize the data; we define a novel algorithm for the clustering of RNA-Seq data and we implement simple normalization strategies to deal with technology-related biases. Finally, we present a hierarchical Bayesian approach to the modeling of RNA-Seq data. The model accounts for the difference in sequencing depth, as well as for overdispersion, automatically accounting for different types of normalization.

Abstract (italiano)

Negli ultimi anni il sequenziamento massivo di RNA (RNA-Seq) è diventato una scelta frequente per gli studi di espressione genica. Questa tecnica ha il potenziale di superare i microarray come tecnica standard per lo studio dei profili trascrizionali. A livello genico, i dati di RNA-Seq si presentano sotto forma di conteggi, al contrario dei microarray che stimano l’espressione su una scala continua. Questo porta alla necessità di sviluppare nuovi metodi e modelli per l'analisi di dati di conteggio in problemi con dimensionalità elevata.
In questa tesi verranno affrontati alcuni problemi relativi all'esplorazione e alla modellazione dei dati di RNA-Seq. In particolare, verranno introdotti metodi per la visualizzazione e il riassunto numerico dei dati. Inoltre si definirà un nuovo algoritmo per il raggruppamento dei dati e alcune strategie per la normalizzazione, volte a eliminare le distorsioni specifiche di questa tecnologia. Infine, verrà definito un modello gerarchico Bayesiano per modellare l'espressione di dati RNA-Seq e verificarne le eventuali differenze in diverse condizioni sperimentali. Il modello tiene in considerazione la profondità di sequenziamento e la sovra-dispersione e automaticamente sviluppa diversi tipi di normalizzazione.

Statistiche Download - Aggiungi a RefWorks
Tipo di EPrint:Tesi di dottorato
Relatore:Chiogna, Monica
Correlatore:Dudoit, Sandrine - Romualdi, Chiara
Dottorato (corsi e scuole):Ciclo 24 > Scuole 24 > SCIENZE STATISTICHE
Data di deposito della tesi:17 Gennaio 2012
Anno di Pubblicazione:17 Gennaio 2012
Parole chiave (italiano / inglese):RNA-Seq, gene expression, differential expression, Bayesian modeling, normalization, deep sequencing, next-generation sequencing RNA-Seq, espressione genica, espressione differenziale, modello Bayesiano, normalizzazione, sequenziamento di nuova generazione
Settori scientifico-disciplinari MIUR:Area 13 - Scienze economiche e statistiche > SECS-S/01 Statistica
Area 13 - Scienze economiche e statistiche > SECS-S/02 Statistica per la ricerca sperimentale e tecnologica
Struttura di riferimento:Dipartimenti > Dipartimento di Scienze Statistiche
Codice ID:4376
Depositato il:17 Dic 2012 08:15
Simple Metadata
Full Metadata
EndNote Format

Download statistics

Solo per lo Staff dell Archivio: Modifica questo record