Go to the content. | Move to the navigation | Go to the site search | Go to the menu | Contacts | Accessibility

| Create Account

Risso, Davide (2012) Simultaneous inference for RNA-Seq data. [Ph.D. thesis]

Full text disponibile come:

[img]
Preview
PDF Document
Available under License Creative Commons Attribution Non-commercial Share Alike.

4024Kb

Abstract (english)

In the last few years, RNA-Seq has become a popular choice for high-throughput studies of gene expression, revealing its potential to overcome microarrays and become the new standard for transcriptional profiling. At a gene-level, RNA-Seq yields counts rather than continuous measures of expression, leading to the need for novel methods to deal with count data in high-dimensional problems.
In this Thesis, we aim at shedding light on the problems related to the exploration and modeling of RNA-Seq data. In particular, we introduce simple and effective ways to summarize and visualize the data; we define a novel algorithm for the clustering of RNA-Seq data and we implement simple normalization strategies to deal with technology-related biases. Finally, we present a hierarchical Bayesian approach to the modeling of RNA-Seq data. The model accounts for the difference in sequencing depth, as well as for overdispersion, automatically accounting for different types of normalization.

Abstract (italian)

Negli ultimi anni il sequenziamento massivo di RNA (RNA-Seq) è diventato una scelta frequente per gli studi di espressione genica. Questa tecnica ha il potenziale di superare i microarray come tecnica standard per lo studio dei profili trascrizionali. A livello genico, i dati di RNA-Seq si presentano sotto forma di conteggi, al contrario dei microarray che stimano l’espressione su una scala continua. Questo porta alla necessità di sviluppare nuovi metodi e modelli per l'analisi di dati di conteggio in problemi con dimensionalità elevata.
In questa tesi verranno affrontati alcuni problemi relativi all'esplorazione e alla modellazione dei dati di RNA-Seq. In particolare, verranno introdotti metodi per la visualizzazione e il riassunto numerico dei dati. Inoltre si definirà un nuovo algoritmo per il raggruppamento dei dati e alcune strategie per la normalizzazione, volte a eliminare le distorsioni specifiche di questa tecnologia. Infine, verrà definito un modello gerarchico Bayesiano per modellare l'espressione di dati RNA-Seq e verificarne le eventuali differenze in diverse condizioni sperimentali. Il modello tiene in considerazione la profondità di sequenziamento e la sovra-dispersione e automaticamente sviluppa diversi tipi di normalizzazione.

Statistiche Download - Aggiungi a RefWorks
EPrint type:Ph.D. thesis
Tutor:Chiogna, Monica
Supervisor:Dudoit, Sandrine and Romualdi, Chiara
Ph.D. course:Ciclo 24 > Scuole 24 > SCIENZE STATISTICHE
Data di deposito della tesi:17 January 2012
Anno di Pubblicazione:17 January 2012
Key Words:RNA-Seq, gene expression, differential expression, Bayesian modeling, normalization, deep sequencing, next-generation sequencing RNA-Seq, espressione genica, espressione differenziale, modello Bayesiano, normalizzazione, sequenziamento di nuova generazione
Settori scientifico-disciplinari MIUR:Area 13 - Scienze economiche e statistiche > SECS-S/01 Statistica
Area 13 - Scienze economiche e statistiche > SECS-S/02 Statistica per la ricerca sperimentale e tecnologica
Struttura di riferimento:Dipartimenti > Dipartimento di Scienze Statistiche
Codice ID:4376
Depositato il:17 Dec 2012 08:15
Simple Metadata
Full Metadata
EndNote Format

Download statistics

Solo per lo Staff dell Archivio: Modifica questo record