Bioinformatica e biologia computazionale

A.A. 2023/2024
12
Crediti massimi
96
Ore totali
SSD
BIO/10 BIO/11 INF/01
Lingua
Italiano
Obiettivi formativi
Lo studente viene introdotto ai diversi approcci computazionali che sono stati recentemente sviluppati per lo studio di sistemi biologici, con particolare attenzione alle applicazioni biotecnologiche: metodi di identificazione di geni essenziali (Tn-Seq e network analysis) o coinvolti in processi di interesse (Tn-Seq), metodi per esplorare la regolazione genica (ChIP-Seq, small RNAs). Su tali basi si innesta una parte relativa alle tecniche di ingegnerizzazione dei sistemi biologici, e che verte sulle comunità microbiche e sull'ottimizzazione del metabolismo di singoli ceppi microbici a fini industriali (metabolic engineering).
Lo studente viene introdotto alle metodiche computazionali che stanno alla base dell'analisi strutturale delle proteine, con basi biochimiche.
Risultati apprendimento attesi
Alla fine del corso lo studente conoscerà le basi delle tecniche computazionali necessarie ad identificare i geni essenziali partendo dai sequenziamenti relativi ad un esperimento di mutagenesi per inserzione di trasposoni (Tn-Seq) come anche applicare tecniche di analisi delle reti complesse in modo da identificare geni di particolare interesse. Esso conoscerà inoltre le tecniche sperimentali che permettono di studiare la regolazione genica, come il ChIP-Seq o tecniche di studio degli sRNA. Alla fine della prima parte del corso lo studente affronterà l'argomento relativo alla manipolazione dei sistemi biologici, con particolare interesse alle tecniche usate per l'ottimizzazione della produzione biologica di composti di interesse industriale come gli amino acidi.
Nella parte relativa allo studio della struttura delle proteine, lo studente apprenderà le basi biochimiche del legame peptidico e del folding proteico, come anche le tecniche che ne permettono la ricostruzione.
Corso singolo

Questo insegnamento può essere seguito come corso singolo.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
annuale

Prerequisiti
Nozioni di base di genetica, biologia molecolare e biochimica.
Modalità di verifica dell’apprendimento e criteri di valutazione
Modulo Bioinformatica: gli studenti eseguiranno analisi bioinformatiche seguendo le metodologie spiegate , descrivendo procedure e risultati in un quaderno di laboratorio. L'esame consiste nella presentazione e discussione dei quaderni, sia per quanto riguarda la conoscenza dei metodi utilizzati, sia per la capacità di interpretare i risultati ottenuti.

Modulo Biologia Computazionale: esame scritto e orale.
Modulo: Bioinformatica
Programma
Introduzione alla bioinformatica. Sequenziamento genomico e "next generation sequencing". Annotazione di geni e genomi. La struttura genica: introni, esoni, promotori, splicing alternativi. La struttura degli mRNA maturi eucariotici. Database biologici primari e specializzati. Browser genomici. Definizioni di similarità di sequenza, omologia, ortologia e paralogia. Allineamenti di sequenza locali e globali. Matrici di sostituzione per allineamenti di sequenze (PAM, BLOSUM). Ricerca per similarità in banche dati di sequenze (BLAST). Allineamenti multipli di sequenza. Dati di espressione e RNA-Seq. Annotazione funzionale dei geni e gene ontology.
Metodi didattici
Spiegazioni teoriche alternate a esercitazioni pratiche al computer.
Materiale di riferimento
Slide e appunti messi a disposizione dal docente.
Libro di testo consigliato:
M. Helmer Citterich, F. Ferrè, G. Pavesi, C. Romualdi, G. Pesole, Fondamenti di bioinformatica, Zanichelli editore 2018
Modulo: Biologia computazionale
Programma
1. Esplorando funzioni e regolazioni cellulari
a. Mutagenesi mediante inserzione di trasposoni per l'identificazione di geni essenziali o importanti in altri processi;
b. ChIP-Seq, siti di legame di fattori di trascrizione e reti di regolazione;
c. Metagenomica e metatrascrittomica;
2. Gli small RNA nei batteri, funzionamento e comportamento dinamico, a modeling primer
3. Introduzione alla teoria delle reti e applicazioni in Biologia (+Pratica con R)
4. La struttura delle proteine e la loro analisi
a. Principali proprieta' chimiche e geometriche delle strutture proteiche: strutture secondarie (alfa eliche, foglietti beta e coil) e strutture terziarie. La struttura a TIM barrel verra' usata come esempio di struttura proteica duttile.
b. I legami covalenti e non-covalenti e la struttura delle proteine: legame peptidico, ponti salini, interazioni di van der Waals e legami ad idrogeno. Il ruolo dell'acqua nel folding proteico.
c. Analisi al computer di strutture proteiche per verificare svariate proprieta' e caratteristiche trattate a lezione.
d. L'evoluzione della struttura delle proteine globulari, delle proteine di membrana e delle proteine intrinsecamente disordinate, con predizione di strutture.
e. Predizione delle strutture proteiche mediante homology modeling
f. Simulazioni di dinamiche molecolari
g. Predizione di strutture e rifinitura mediante homology modeling.
Metodi didattici
Modalità di erogazione dell'insegnamento basata su lezioni frontali supportate da materiale proiettato oltre a lezioni interattive al computer. Gli studenti saranno stimolati a partecipare attivamente alla lezione/discussione per migliorare le proprie capacità critiche, analizzando la letteratura citata. Modalità di frequenza: fortemente consigliata
Materiale di riferimento
Per l'esame faremo riferimento alle slide che verranno caricate sul sito ariel dopo ogni lezione.

Qui di seguito una lista di paper citati nel programma, relativi ad argomenti specifici che lo studente puo' approfondire o usare per chiarire alcuni aspetti non chiari nelle slides.

Alouev A, Johnson DS, Sidow Sundquist A, Medina C, Anton E, Batzoglou S, Myers RM, Anton Valouev, David S Ds David S Johnson, Andreas Sundquist, Catherine Medina, Elizabeth Anton, Serafim Batzoglou, Richard M Myers, Arend Sidow, Elizabeth Anton, Serafim Batzoglou, Richard M Myers, and Arend Sidow. Genome-wide analysis of transcription factor binding sites based on ChIP-Seq data. Nature Methods, 5(9):829-834, 2008. ISSN 1548-7091. doi: 10.1038/nmeth.1246.Genome-Wide. URL http://www.nature.com/nmeth/journal/vaop/ncurrent/full/nmeth.1246.html.

Sumeet Agarwal, Charlotte M Deane, Mason a. Porter, and Nick S Jones. Revisiting Date and Party Hubs: Novel Approaches to Role Assignment in Protein Interaction Networks. PLoS Computational Biology, 6(6):e1000817, jun 2010. ISSN 1553-7358. doi: 10.1371/journal.pcbi.1000817. URL http://dx.plos.org/10.1371/journal.pcbi.1000817.

R 'eka Albert. General Network Theory R 'eka Albert. Technical report, 2006.

R 'eka Albert, H Jeong, and Albert-Laszlo Barabasi. Error and attack tolerance of complex networks. Nature, 406(6794): 378-382, jul 2000. ISSN 1476-4687. doi: 10.1038/35019019. URL http://www.ncbi.nlm.nih.gov/pubmed/10935628.

Manuel Allhoff, Kristin Ser 'e, Heike Chauvistr 'e, Qiong Lin, Martin Zenke, Ivan G. Costa, H. Chauvistre, Ivan G. Costa, Qiong Lin, Manuel Allhoff, and K. Sere. Detecting differential peaks in ChIP-seq signals with ODIN. Bioinformatics, 30(24):3467-3475, 2014. ISSN 14602059. doi: 10.1093/bioinformatics/btu722.



Albert-Laszlo Barabasi. Linked: The New Science of Everything, 2002.

Albert-Laszlo Barabasi and Zolt 'an N Oltvai. Network biology: understanding the cell's functional organization. Nature Reviews Genetics, 5(2):101-113, feb 2004. ISSN 1471-0056. doi: 10.1038/nrg1272. URL http://www.ncbi.nlm.nih.gov/ pubmed/14735121.



Michael A. DeJesus, Subhalaxmi Nambi, Clare M. Smith, Richard E. Baker, Christopher M. Sassetti, and Thomas R. Ioerger. Statistical analysis of genetic interactions in Tn-Seq data. Nucleic Acids Research, 45(11):1-11, 2017. ISSN 13624962. doi: 10.1093/nar/gkx128.


Diana Ekman, Sara Light, Asa K Bj ̈orklund, and Arne Elofsson. What properties characterize the hub proteins of the protein-protein interaction network of Saccharomyces cerevisiae? Genome Biology, 7(6):R45, jan 2006. ISSN 1465-6914. doi: 10.1186/gb-2006-7-6-r45. URL http://www.ncbi.nlm.nih.gov/pubmed/16780599.


Santo Fortunato and Marc Barthelemy. Resolution limit in community detection. Proceedings of the Na- tional Academy of Sciences, 104(1):36-41, jan 2007. ISSN 0027-8424. doi: 10.1073/pnas.0605965104. URL http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=1765466{\&}tool=pmcentrez{\&}rendertype=abstracthttp:// www.pnas.org/cgi/doi/10.1073/pnas.0605965104.



Bratati Kahali, Shandar Ahmad, and Tapash Chandra Ghosh. Exploring the evolutionary rate differences of party hub and date hub proteins in Saccharomyces cerevisiae protein-protein interaction network. Gene, 429(1-2):18-22, jan 2009. ISSN 1879-0038. doi: 10.1016/j.gene.2008.09.032. URL http://dx.doi.org/10.1016/j.gene.2008.09.032 http://www.ncbi.nlm.nih.gov/pubmed/18973798

Byoungjin Kim, Robert Binkley, Hyun Uk Kim, and Sang Yup Lee. Metabolic engineering of Escherichia coli for the enhanced production of l-tyrosine. Biotechnology and Bioengineering, 115(10):2554-2564, 2018. ISSN 10970290. doi: 10.1002/bit.26797.

C. Klein, A. Marino, M.-F. Sagot, P.V. Milreu, and M. Brilli. Structural and dynamical analysis of biological networks. Briefings in Functional Genomics, 11(6), 2012. ISSN 20412649. doi: 10.1093/bfgp/els030.

Young Min Kwon, Steven C. Ricke, and Rabindra K. Mandal. Transposon sequencing: methods and expanding applica- tions. Applied Microbiology and Biotechnology, 100(1):31-43, 2016. ISSN 14320614. doi: 10.1007/s00253-015-7037-8.


Shmoolik Mangan and Uri Alon. Structure and function of the feed-forward loop network motif. Proceedings of the national Academy of Sciences, 100(21):11980-11985, oct 2003. ISSN 0027-8424. doi: 10.1073/pnas.2133841100. URL http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=218699{\&}tool=pmcentrez{\&}rendertype=abstract.

Shmoolik Mangan, A Zaslaver, and Uri Alon. The Coherent Feedforward Loop Serves as a Sign- sensitive Delay Element in Transcription Networks. Journal of molecular biology, 334:197-204, 2003. doi: 10.1016/j.jmb.2003.09.049. URL http://www.ncbi.nlm.nih.gov/pubmed/14607112.


Jason E McDermott, Ronald C Taylor, Hyunjin Yoon, and Fred Heffron. Bottlenecks and hubs in inferred networks are important for virulence in Salmonella typhimurium. Journal of Computational Biology, 16(2):169-180, feb 2009. ISSN 1557-8666. doi: 10.1089/cmb.2008.04TT. URL http://www.ncbi.nlm.nih.gov/pubmed/19178137http://www.liebertpub.com/ doi/10.1089/cmb.2008.04TT.

Ben O. Oyserman, Marnix H. Medema, and Jos M. Raaijmakers. Road MAPs to engineer host microbiomes. Current Opinion in Microbiology, 43:46-54, 2018. ISSN 18790364. doi: 10.1016/j.mib.2017.11.023. URL https://doi.org/10.1016/j.mib.2017.11.023

Maria Concetta Palumbo, Sara Zenoni, Marianna Fasoli, M 'elanie Massonnet, Lorenzo Farina, Filippo Castiglione, Mario Pezzotti, and Paola Paci. Integrated network analysis identifies fight-club nodes as a class of hubs encompassing key putative switch genes that induce ma jor transcriptome reprogramming during grapevine development. The Plant Cell, 26(12):4617-4635, 2014. ISSN 1532-298X. doi: 10.1105/tpc.114.133710.

Seon Young Park, Robert M. Binkley, Won Jun Kim, Mun Hee Lee, and Sang Yup Lee. Metabolic engineering of Escherichia coli for high-level astaxanthin production with high productivity. Metabolic Engineering, 49(August):105-115, 2018. ISSN 10967184. doi: 10.1016/j.ymben.2018.08.002. URL https://doi.org/10.1016/j.ymben.2018.08.002.

Romualdo Pastor-Satorras and Alessandro Vespignani. Epidemic Spreading in Scale-Free Networks. Physical Review Letters, 86(14):3200-3203, apr 2001. ISSN 0031-9007. doi: 10.1103/PhysRevLett.86.3200. URL http://link.aps.org/ doi/10.1103/PhysRevLett.86.3200.




Carlotta Ronda, Sway P. Chen, Vitor Cabral, Stephanie J. Yaung, and Harris H. Wang. Metagenomic engineer- ing of the mammalian gut microbiome in situ. Nature Methods, 16(2):167-170, 2019. ISSN 15487105. doi: 10.1038/s41592-018-0301-y. URL http://dx.doi.org/10.1038/s41592-018-0301-y.

Shai S Shen-Orr, Ron Milo, Shmoolik Mangan, and Uri Alon. Network motifs in the transcriptional regulation network of Escherichia coli. Nature Genetics, 31(1):64-68, may 2002. ISSN 1061-4036. doi: 10.1038/ng881. URL http: //www.ncbi.nlm.nih.gov/pubmed/11967538.

Tim Van Opijnen and Andrew Camilli. Transposon insertion sequencing: A new tool for systems-level analysis of mi- croorganisms. Nature Reviews Microbiology, 11(7):435-442, 2013. ISSN 17401526. doi: 10.1038/nrmicro3033. URL http://dx.doi.org/10.1038/nrmicro3033.

Tim van Opijnen, David W. Lazinski, and Andrew Camilli. Genome-wide fitness and genetic interactions determined by Tn-seq, a high-throughput massively parallel sequencing method for microorganisms. Current Protocols in Microbiology, 2015(April):1E.3.1-1E.3.24, 2015. ISSN 19348533. doi: 10.1002/9780471729259.mc01e03s36.



Haiyuan Yu, Philip M Kim, Emmett Sprecher, Valery Trifonov, and Mark B Gerstein. The importance of bottlenecks in protein networks: correlation with gene essentiality and expression dynamics. PLoS Computational Biology, 3(4):e59, apr 2007. ISSN 1553-7358. doi: 10.1371/journal.pcbi.0030059. URL http://www.ncbi.nlm.nih.gov/pubmed/17447836.

Tao Yu, Yasaman Dabirian, Quanli Liu, Verena Siewers, and Jens Nielsen. Strategies and challenges for metabolic rewiring. Current Opinion in Systems Biology, 15:30-38, 2019. ISSN 24523100. doi: 10.1016/j.coisb.2019.03.004. URL https://doi.org/10.1016/j.coisb.2019.03.004.
Moduli o unità didattiche
Modulo: Bioinformatica
INF/01 - INFORMATICA - CFU: 6
Lezioni: 48 ore
Docente: Pavesi Giulio

Modulo: Biologia computazionale
BIO/10 - BIOCHIMICA
BIO/11 - BIOLOGIA MOLECOLARE
INF/01 - INFORMATICA
Lezioni: 48 ore

Docente/i
Ricevimento:
Su appuntamento per email
Dept. Bioscience, Tower B, Fifth floor
Ricevimento:
Da concordare tramite email
Dipartimento di Bioscienze
Ricevimento:
Martedì o Venerdì, 15.00- 17.00
Via Celoria 26 (Dip. BioScienze) - 2B (Torre B - secondo piano)
Ricevimento:
su appuntamento per email
dipartimento bioscienze via celoria 26, piano 5 torre b