In schooljaar 2018-2019 is dit voor Thema 9 (jaar 3) de module Theorie van Bio-informatica 2!
Gegevensveld | Waarde |
---|---|
Osiriscode | OSIRISCODE |
ECTS | 3 |
Toetsvorm | Schriftelijk tentamen |
Minimum cijfer | 5,5 |
Docent(en) | HEMI |
Contactpersoon | HEMI |
Voertaal | Nederlands |
- De gebruikte software voor NGS expressieanalyse kennen, en weten hoe deze in pipelines te plaatsen om statistisch verantwoord expressiestudies te doen
- Het algoritme van mapping software (Burroughs-Wheeler Transform) kennen en begrijpen wat de afwegingen zijn die het zo snel maken maar ook False Negatives veroorzaken
- Begrijpen hoe een expressie (RNAseq) experiment opgezet moet worden om statistisch valide biologische conclusies te trekken
- Weten hoe het Assemblyproces werkt om "nieuwe" genomen uit NGS DNAseq data te maken en wat de belangrijkste typen software en hun settings zijn, en hoe deze het resultaat beinvloeden.
- Het process van Variant Calling (SNP's, indels) gebaseerd op een mappingpipeline begrijpen
Dit vak gaat over twee belangrijke NGS technieken: RNAseq (expressiestudies) en DNAseq t.b.v. genoomassembly
Dit vak behandelt de geavanceerde algoritmen die nodig zijn om de grote hoeveelheden data die Next Generation Sequencing produceert te kunnen verwerken. Eerst wordt er gekeken naar de overtreffende trap van alignment algoritmen: mapping software zoals BWA, Bowtie2 en STAR. Er wordt ingegaan op het algoritme van Bowtie2 als voorbeeld van de keuzes die afgewogen worden om mapping software snel genoeg te maken om honderden miljoenen NGS reads snel genoeg te verwerken. Ook wordt er ingegaan op de "pipelines" die meestal gebruikt worden om expressiedata te verwerken. Preprocessing Quality Control (PHRED scores en trimming) worden uitgelegd, daarna de mapping en variant-call stappen en hoofdtypen van de gebruikte bestanden (fastq, SAM, BAM, vcf) . Er wordt ingegaan op de statistiek van expressie-experimenten en van variant calling. Tenslotte wordt ook assembleren besproken; het proces waarmee nieuw-gesequenced organismen hun genoom wordt bepaald. Het algoritme wordt vluchtig besproken, de nadruk ligt op praktische aspecten zoals het optimaliseren van de genoomgrootte, en de experimentele (lab) opzet die gebruikt kan worden om de assembly te verbeteren. De nadruk ligt weer op het ontwikkelen van praktisch toepasbare kennis, pipelines die gebruikt kunnen worden en de voor- en nadelen van verschillende software pakketten zoals Velvet, BamBus, Arachne, SPADEs.
Literatuur
- Bioinformatics and Functional Genomics 3rd ed (2015). Jonathan Pevsner. ISBN 978-1-118-58178-0
Web
- Blackboard course thema 5
-
- Hoorcollege
-
-
-
-
-
- Boek, collegesheets
- Achtergrondartikelen Blackboard