Vai ai contenuti. | Spostati sulla navigazione | Spostati sulla ricerca | Vai al menu | Contatti | Accessibilità

| Crea un account

Fanton, Marco (2013) Chemoinformatics approaches for new drugs discovery. [Tesi di dottorato]

Full text disponibile come:

[img]
Anteprima
Documento PDF
54Mb

Abstract (inglese)

Chemoinformatics uses computational methods and technologies to solve chemical problems. It works on molecular structures, their representations, properties and related data. The first and most important phase in this field is the translation of interconnected atomic systems into in-silico models, ensuring complete and correct chemical information transfer. In the last 20 years the chemical databases evolved from the state of molecular repositories to research tools for new drugs identification, while the modern high-throughput technologies allow for continuous chemical libraries size increase as highlighted by publicly available repository like PubChem [http://pubchem.ncbi.nlm.nih.gov/], ZINC [http://zinc.docking.org/], ChemSpider[http://www.chemspider.
com/]. Chemical libraries fundamental requirements are molecular uniqueness, absence of ambiguity, chemical correctness (related to atoms, bonds, chemical orthography), standardized storage and registration formats. The aim of this work is the development of chemoinformatics tools and data for drug discovery process. The first part of the research project was focused on accessible commercial chemical space analysis; looking for molecular redundancy and in-silico models correctness in order to identify a unique and univocal molecular descriptor for chemical libraries indexing. This allows for the 0%-redundancy achievement on a 42 millions compounds library. The protocol was implemented as MMsDusty, a web based tool for molecular databases cleaning. The major protocol developed is MMsINC, a chemoinformatics platform based on a starting number of 4 millions non-redundant high-quality annotated and biomedically relevant chemical structures; the library is now being expanded up to 460 millions compounds. MMsINC is able to perform various types of queries, like substructure or similarity search and descriptors filtering. MMsINC is interfaced with PDB(Protein Data Bank)[http://www.rcsb.org/pdb/home/home.do] and related to approved drugs. The second developed protocol is called pepMMsMIMIC, a peptidomimetic screening tool based on multiconformational chemical libraries; the screening process uses pharmacophoric fingerprints similarity to identify small molecules able to geometrically and chemically mimic endogenous peptides or proteins. The last part of this project lead to the implementation of an optimized and exhaustive conformational space analysis protocol for small molecules libraries; this is crucial for high quality 3D molecular models prediction as requested in chemoinformatics applications. The torsional exploration was optimized in the range of most frequent dihedral angles seen in X-ray solved small molecules structures of CSD(Cambridge Structural Database); by appling this on a 89 millions structures library was generated a library of 2.6 x 10 exp 7 high quality conformers. Tools, protocols and platforms developed in this work allow for chemoinformatics analysis and screening on large size chemical libraries achieving high quality, correct and unique chemical data and in-silico models

Abstract (italiano)

Il termine chemoinformatica si riferisce all’uso di metodi informatici per risolvere problemi chimici ed ha come oggetto strutture molecolari e loro rappresentazioni, proprietà e dati collegati; passaggio cruciale è la traduzione di sistemi atomici interconnessi in rappresentazioni e modelli in silico, garantendo il completo e corretto trasferimento dell’ informazione chimica. Negli ultimi 20 anni i database chimici sono evoluti da semplici archivi molecolari a strumenti di ricerca per l’ identificazione di nuovi candidati farmaci, grazie allo sviluppo di tecnologie di high-throughput che permettono una continua e costante
espansione delle librerie chimiche come testimoniato da database pubblici quali PubChem[http://pubchem.ncbi.nlm.nih.gov/], ZINC[http://zinc.docking.org/], ChemSpider[http://www.chemspider.com/]. Requisiti fondamentali per qualsiasi libreria chimica sono l’ unicità e disambiguità molecolare, la correttezza chimica (relativa ad atomi, legami, ortografia chimica), la standardizzazione dei formati di archiviazione e registrazione molecolare. Lo scopo di questo lavoro è lo sviluppo di strumenti e masse dati chemoinformatici applicabili al processo di identificazione di nuovi farmaci.
La prima fase del progetto si è focalizzata sull’ analisi dello spazio chimico commerciale in termini di ridondanza molecolare e correttezza dei modelli in-silico, allo scopo di identificare un descrittore molecolare univoco e non ambiguo utilizzabile nella indicizzazione di librerie molecolari; questo ha permesso di unicare una libreria di 42 milioni di composti commercialmente disponibili e di implementare MMsDusty, un’ applicativo web per l’ unicazione di librerie chemoinformatiche. Uno dei prodotti principali del progetto è MMsINC, una piattaforma chemoinformatica basata su una libreria iniziale di 4 milioni di modelli molecolari di elevata qualità e priva di ridondanza, espansa poi a circa 460 milioni di strutture. La piattaforma permette di effettuare analisi chemoinformatiche tramite funzioni appositamente sviluppate (ricerca per similarità, sottostruttura, descrittori molecolari) oltre ad essere interfacciata col PDB(Protein Data Bank)[http://www.rcsb.org/pdb/home/home.do] e correlata ai farmaci attualmente in commercio. La seconda piattaforma sviluppata è pepMMsMIMIC, un protocollo di analisi ed identificazione di peptidomimetici basato su screening di librerie chimiche multiconformero tramite FP(fingerprints) farmacoforici, allo scopo di identificare piccole molecole organiche in grado di mimare geometricamente e chimicamente peptidi o proteine endogeni. Infine è stato sviluppato un protocollo di analisi conformazionale esaustiva di librerie chimiche, fondamentale per la predizione di modelli molecolari tridimensionali di alta qualità, richiesti nelle applicazioni chemoinformatiche; ottimizzando l’ esplorazione torsionale all’ interno degli intervalli degli angoli diedri più frequenti rilevati nelle strutture organiche risolte ai raggi X del CSD (Cambridge Structural Database) su 89 milioni di grafi molecolari, sono stati generati 2.6 x 10 exp 7 conformeri di alta qualità. Nel complesso la piattaforma ed i protocolli sviluppati permettono di effettuare analisi chemoinformatiche su librerie molecolari di grosse dimensioni, garantendo elevata qualità, correttezza ed unicità del dato chimico e della sua rappresentazione in silico tramite modelli tridimensionali

Statistiche Download - Aggiungi a RefWorks
Tipo di EPrint:Tesi di dottorato
Relatore:Moro , Stefano
Dottorato (corsi e scuole):Ciclo 25 > Scuole 25 > SCIENZE MOLECOLARI > SCIENZE FARMACEUTICHE
Data di deposito della tesi:22 Gennaio 2013
Anno di Pubblicazione:22 Gennaio 2013
Parole chiave (italiano / inglese):chemoinformatics, peptidomimetics, screening, redundancy, library, conformers, conformational analysis, database, similarity, pharmacophoric, pharmacophore, fingerprint, SMILES, InChI, connection tables, substructure, shape similarity
Settori scientifico-disciplinari MIUR:Area 03 - Scienze chimiche > CHIM/08 Chimica farmaceutica
Struttura di riferimento:Dipartimenti > Dipartimento di Scienze del Farmaco
Codice ID:5421
Depositato il:15 Ott 2013 09:14
Simple Metadata
Full Metadata
EndNote Format

Bibliografia

I riferimenti della bibliografia possono essere cercati con Cerca la citazione di AIRE, copiando il titolo dell'articolo (o del libro) e la rivista (se presente) nei campi appositi di "Cerca la Citazione di AIRE".
Le url contenute in alcuni riferimenti sono raggiungibili cliccando sul link alla fine della citazione (Vai!) e tramite Google (Ricerca con Google). Il risultato dipende dalla formattazione della citazione.

[1] William J. Wiswesser. How the wln began in 1949 and how it might be in 1999. J. Chem. Inf. Comput. Sci., 1982, 22 (2), pp 88–93, 1982. Cerca con Google

[2] William J. Wiswesser. 25, 258-263. J. Chem. Inf. Comput. Sci., 1985. Cerca con Google

[3] William J. Wiswesser. 22, 88-93. J. Chem. Inf. Comput. Sci., 1982. Cerca con Google

[4] IUPAC. International chemical identifier. http://www.iupac.org/inchi/, 2000-2011. Vai! Cerca con Google

[5] S.M. Welford J.M. Barnard, C.J. Jochum. Rosdal: A universal structure/substructure representation for pc-host communication, in chemical structure information systems: Interfaces communication and standards. Cerca con Google

W.A. Warr (Ed.), ACS Symposium Series No. 400, American Chemical Society, Washington, DC, 1989, pp. 76-81., 1989. Cerca con Google

[6] D. Weininger. 30(3), 237-243. J. Chem. Inf. Comput. Sci., 1990. Cerca con Google

[7] D. Weininger. 28(1), 31-36. J. Chem. Inf. Comput. Sci., 1988. Cerca con Google

[8] R.W. Homer T. Hurst G.B. Smith S. Ash, M.A. Cline. 37, 71-79. J. Chem. Inf. Comput. Sci., 1997. Cerca con Google

[9] A.T. Balaban. 35(3), 339-350. J. Chem. Inf. Comput. Sci., 1995. Cerca con Google

[10] H.P. Schultz. 29(3), 227-228. J. Chem. Inf. Comput. Sci., 1989. Cerca con Google

[11] O. Ivanciuc. Coding the constitution-graph theory in chemistry. Handbook of Chemoinformatics, J. Gasteiger (Ed.), Wiley-VCH, Weinheim,Chapter II, Section 4., 2003. Cerca con Google

[12] L. Spialter. 85(13), 2012-2013. J. Am. Chem. Soc., 1963. Cerca con Google

[13] I. Ugi J. Dugundji. 39, 19-64. Topics Curr. Chem., 1973. Cerca con Google

[14] MDL. Mdl molfile format. http://www.mdli.com/downloads, 1998. Vai! Cerca con Google

[15] W.D. Hounshell A.K.I. Gushurst D.L. Grier B.A. Leland J. Laufer A. Dalby, J.G. Nourse. 32, 244-255. J. Chem. Inf. Comput.Sci., 1992. Cerca con Google

[16] H. L. Morgan. The generation of a unique machine description for chemical structures-a technique developed at chemical abstracts service. J. Chem. Doc., 1965. Cerca con Google

[17] W.C. Herndon. Canonical labelling and linear notation for chemical graphs, in chemical applications of topology and graph theory. R.B. King (Ed.), Elsevier, Amsterdam, pp. 231-242., 1983. Cerca con Google

[18] M.E. Munk X. Liu, K. Balasubramanian. 30, 263-269. J. Chem. Inf. Compu. Sci., 1990. Cerca con Google

[19] V.J.van Geerestein D.M. Bayada, H. Hamersma. 39, 1-10. J. Chem. Inf. Compu. Sci., 1999. Cerca con Google

[20] C.J. Blankley D. Wild. 40, 155-162. J. Chem. Inf. Compu. Sci., 2000. Cerca con Google

[21] D.E. Clark R.A. Lewis, S.D. Pickett. Computer-aided molecular diversity analysis and combinatorial library design. Reviews in Computational Chemistry, Vol. 16, K.B. Lipkowitz, D.B. Boyd (Eds.), Wiley-VCH, New York, pp. 8-51, 2000. Cerca con Google

[22] P. Willett. Similarity and clustering in chemical information systems. Research Studies Press, Letchworth, UK,, 1982. Cerca con Google

[23] G.I. Ouchi W.T. Wipke, S.K. Krishnan. 18, 32-37. J. Chem. Inf. Comput. Sci, 1978. Cerca con Google

[24] L.J. O’Korn G.A. Wilson R.G. Freeland, S.A. Funk. 19, 94-97. J. Chem. Inf. Comput. Sci., 1979. Cerca con Google

[25] J. Lederberg D.H. Smith L.M. Masinter, N.S. Sridharan. 96(25), 7703-7723. J. Am. Chem.Soc., 1976. Cerca con Google

[26] G. Helmchen V. Prelog. 21, 567-654. Angew.Chem. Int. Ed. Engl., 1982. Cerca con Google

[27] V. Prelog R.S. Cahn, C. Ingold. 5, 385-419. Angew.Chem. Int. Ed. Engl., 1966. Cerca con Google

[28] C. Marshall A.P.Johnson P. Mata, A.M. Lobo. 4(4), 657-668. Tetrahedron: Asymmetry, 1993. Cerca con Google

[29] C. Marshall A.P.Johnson P. Mata, A.M. Lobo. 34, 491-504. J. Chem. Inf. Comput. Sci., 1994. Cerca con Google

[30] G. Gagnon D. Laramee B. Larouche S. Hanessian, J. Franco. 30, 413-425. J. Chem. Inf. Comput. Sci., 1990. Cerca con Google

[31] J. Gasteiger W.-D. Ihlenfeldt. 35, 663-674. J. Chem. Inf. Comput. Sci., 1995. Cerca con Google

[32] B. Rohde J.M. Barnard, A.P.F. Cook. Storage and searching of stereochemistry in substructure search systems, in chemical information systems beyond the structure diagram. D. Bawden, E.M. Mitchell (Eds.), Ellis Horwood, Chichester, UK, pp. 29-41, 1990. Cerca con Google

[33] J.M. Barnard. 30, 81-97. J. Chem. Inf. Comput. Sci., 1990. Cerca con Google

[34] Dmitrii V. Tchekhovskoi Stephen E. Stein, Stephen R. Heller. The iupac chemical identifier – technical manual. Physical and Chemical Properties Division National Institute of Standards and Technology Gaithersburg, Maryland, U.S. 20899-8380, 2006. Cerca con Google

[35] B. D. McKay. Practical graph isomorphism, vol. 30, pp. 45-87. Congressus Numerantium, 1981. Cerca con Google

[36] Masciocchi J Frau G Sturlese M Palla P Cedrati F Rodriguez-Tomé P Moro S Fanton M, Floris M. Mmsinc: a large-scale chemoinformatics database. Nucleic Acids Res. 37:284-290, 2009. Cerca con Google

[37] Guido van Rossum. Python language. http://www.python.org/, 1999-2013. Vai! Cerca con Google

[38] Chemical Computing Group. Molecular operating environment. Cerca con Google

http://www.chemcomp.com/, 2012. Vai! Cerca con Google

[39] Armbruster B.N. Ernsberger P. Irwin J.J. Kaiser M.J., Roth B.L. and Shoichet B.K. Relating protein pharmacology by ligand chemistry. Nat. Biotechnol., 25, 197–206., 2007. Cerca con Google

[40] Thomas A. Halgren. Merck molecular force field. i. basis, form, scope, parameterization, and performance of mmff94. Journal of Computational Chemistry, 1996. Cerca con Google

[41] Dominy B.W. Lipinski C.A., Lombardo F. and Feeney P.J. Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Adv. Drug Deliv. Rev., 23, 3–25, 1997. Cerca con Google

[42] Oprea T.I. Property distribution of drug-related chemical databases. J. Comp. Aid. Mol. Des., 14, 251–264., 2000. Cerca con Google

[43] Benson D.A. Bryant S.H. Canese K. Chetvernin V. Church D.M. Dicuccio M. Edgar R. Federhen S. Wheeler D.L., Barrett T. Database resources of the national center for biotechnology information. Nucleic Acids Res., 36, D13–D21, 2008. Cerca con Google

[44] Baldi P. Swamidass S.J. Bounds and algorithms for fast exact searches of chemical fingerprints in linear and sublinear time. J. Chem. Inf. Model., 47, 302–317., 2007. Cerca con Google

[45] Fanton M. Moro S. Floris M., Masciocchi J. Swimming into peptidomimetic chemical space using pepmmsmimic. Nucl. Acids Res. 39, 261-269, 2011. Cerca con Google

[46] Menard P.R. Cheney D.L. Hulme C. Labaudiniere R.F. Mason J.S., Morize I. New 4-point pharmacophore method for molecular similarity and diversity applications: overview of the method and applications, including a novel approach to the design of combinatorial libraries containing privileged substructures. J. Med. Chem., 42, 3251–3264., 1999. Cerca con Google

[47] Kulkarni A. Karnachi P. Application of pharmacophore engerprints to structure-based design and data mining. In Langer,T. and Hoffmannn,R.D. (eds), Pharmacophores and Pharmacophore Searches. Wiley-VCH, Weinheim, Germany, pp. 193–206., 2006. Cerca con Google

[48] Kuhn S. Horlacher O. Luttmann E. Willighagen E.L. Steinbeck C., Han Y.Q. The chemistry development kit (cdk): an open-source java library for chemo- and bioinformatics. J. Chem. Inf. Comp. Sci., 43, 493–500., 2003. Cerca con Google

[49] Kuhn S. Floris M. Guha R. Willighagen E.L. Steinbeck C., Hoppe C. Recent developments of the chemistry development kit (cdk) - an open-source java library for chemo- and bioinformatics. Curr. Pharma. Design, 12, 2111–2120, 2006. Cerca con Google

[50] Weill N. and Rognan D. Alignment-free ultra-high-throughput comparison of druggable protein-ligand binding sites. J. Chem. Inf. Model., 50, 123–135., 2010. Cerca con Google

[51] Richards W.G. Ballester P.J. Ultrafast shape recognition to search compound databases for similar molecular shapes. J. Comput. Chem., 28, 1711–1723., 2007. Cerca con Google

[52] Kuhn S. Horlacher O. Luttmann E. Willighagen E.L. Steinbeck C., Han Y.Q. The chemistry development kit (cdk): an open-source java library for chemo- and bioinformatics. J. Chem. Inf. Comp. Sci., 43, 493–500., 2003. Cerca con Google

[53] P. Murray-Rust. How useful are x-ray studies of conformation? Molecular Structure and Biological Activity; Griffin, J. F. and Duax, W. L., Ed.; Elsevier Biomed.:New York; pp 117-133., 1982. Cerca con Google

All images in chapters 2, 3, 4, 5 labeled as "#" were taken from : "Chemoinformatics: Cerca con Google

A Textbook". Edited by Johann Gasteiger and Thomas Engel, 2003, Wiley-VCH Verlag GmbH Co. KGaA. Cerca con Google

All images in chapter 5 and 6 labeled as "§" were taken from : InChI_UserGuide and InChI_TechMan (http://www.iupac.org/home/publications/e-resources/inchi/download.html). Vai! Cerca con Google

All images in chapter 9 labeled as "" were taken from: Rotate program manual (http://www.molecular-networks.com/files/docs/rotate/rotate_manual.pdf, http://www.molecular-networks.com/products/rotate) and Corina program manual (http://www.molecular-networks.com/products/corina, http://www.molecularnetworks.com/files/docs/corina/corina_manual.pdf). Vai! Cerca con Google

Download statistics

Solo per lo Staff dell Archivio: Modifica questo record