Metagenomics

De studie van een collectie genomen van een gemixte gemeenschap.

Dit zijn meestal microbiële gemeenschappen.

Monsters uit een “omgeving”:

  • Milieu
  • Organisme

Transcriptonomics

  • RNA-seq: sequencing van RNA moleculen
    • Vaak zijn dit mRNA moleculen
    • Transcriptomen
    • Dan weet je welke genen een functioneel product (eiwit) worden.

Het genoom

  • Wat is een genoom?

    • “In modern molecular biology, the genome is the entirety of an organism’s hereditary information. It is encoded either in DNA or, for many types of virus, in RNA.”
    • Betreft coderende (genen) en niet coderende onderdelen.
    • Inclusief mitochondriaal DNA (alle eukaryoten) en chloroplast DNA (in planten en algen).
  • Waar bestaat het humane genoom uit?

    • 46 Chromosomen
    • Mitochondriaal DNA
    • +- 25000 genen
    • +- 3.200.000.000 bp

Opbouw van DNA

  • Euchromatine is minder compact. Hier bevinden zich de meest actieve genen.
    • Los DNA
    • Genen “aan”, hier bevinden zich dus actieve genen
  • Heterochromatine is veel compacter en is voornamelijk inactief.
    • Strak DNA
    • Genen “uit”, hier bevinden zich dus inactieve genen.

DNA en GC content

DNA met een hoger GC content is stabieler dan DNA met een lager GC content.

Doordat de nucleotiden op bepaalde manieren op elkaar stapelen krijg je hele stukken stabiel en andere minder stabiel DNA, dit komt voornamelijk door de gunstige stapeling is tussen GC paren.

Van DNA naar genen

Een gen is de basis eenheid van erfelijkheid en een sequentie van nucleotiden in het DNA die coderen voor (functionele) producten, zoals eiwitten en RNA.

Door alternative splicing kan een gen voor meerdere producten (RNA en eiwit) coderen.

Een gen kan:

  • Coding zijn: codeert voor een eiwit.
  • Non-coding zijn: voor bijvoorbeeld RNAs die niet voor een eiwit coderen of DNA met andere regulatuoire functies.
    • tRNAs
    • rRNAs
    • regulatuoire RNAs
    • Centromeren
    • telomeren
    • origin of replication
## Genoom grootte - Genomen van de meeste *bacteriën* en *archaea* - tussen 1 tot 12 miljoen base paren (Mb) - *Eukaryoten* genomen groter - tussen 10 tot > 100.000 Mb - *Virussen* - 3 base paren tot 1 Mb - Er lijkt niet echt een *relatie* te zijn tussen: - genoom grootte en fenotype

Aantal genen

  • Vrij levende (free-living) bacteriën en archaea hebben rond de 1.500 tot 7.500 genen.

  • Uni cellulaire eukaryoten (schimmels) hebben rond de 5.000 genen.

  • Multi cellulaire eukaryoten hebben rond de 40.000 genen.

  • Prokaryoten:

    • Kleiner genoom
    • Genoomgrootte relatief aan aantal genen
  • Eukaryoten:

    • Groter genoom
    • Genoomgrootte niet relatief aan aantal genen

Genen niet altijd gecorreleerd aan genoom grootte

  • Wetenschappers hadden voorspeld dat de mens rond de 50.000 tot 100.000 genen zou hebben. Maar we hebben maar rond de 21.300.
  • Vertebraten produceren meer producten per gen door alternative splicing.
  • Mens en andere zoogdieren hebben de laagste gen dichtheid (aantal genen per lengte DNA).
  • Multi cellulaire eukaryoten hebben veel intronen in de genen en grote hoeveelheden non-coding DNA tussen genen.

Eukaryoten vs prokaryoten

  • Wat hebben eukaryoten dat prokaryoten niet hebben?

  • Non-coding DNA tussen genen:

    • Pseudogenen: genen die (teveel) mutaties hebben gekregen en niet meer functioneel zijn
    • Repeterend DNA: meerdere kopieën.
    • Hoge conservatie van deze non-coding sequenties suggereert dat ze wel een belangrijke functie hebben.
  • Sequencen van menselijk genoom liet zien dat 98.5% niet voor eiwitten, rRNA or tRNA codeert.

  • Gen regulatie sequenties (5%) en intronen (20%).

  • Heel groot deel bestaat uit transposable elementen en gerelateerde sequenties

    • Ook springende genen genoemd.
    • Transposonen en retrotransposonen.

Transposabele elementen

  • Transposon
    • Hebben een cut-and-paste of copy-and-paste mechanisme
    • Bewegen door een DNA intermediaire en hebben een enzym transposase nodig
  • Retrontransposon
    • Meest dominante vorm van eukaryoten
    • Bewegen door een RNA intermediaire en gebruiken hierbij een reverse transcriptase.
    • Retrovirussen geëvolueerd uit dit systeem of andersom.

Wat we observeren

  • GC% van de DNA sequentie varieert:
    • Tussen genomen (organismen)
    • Coderende sequenties
      • Genen hogere GC ratio
    • Op het genoom
      • Mozaïek-achtige formatie:
        • regio’s op het genoom van GC-rijke en niet rijke regio’s die we isochores noemen

Isochores:

  • Een groot gebied van genomisch DNA (meer dan 300 kilo basen) met een hoge hoeveelheid van uniformiteit in GC%.

Isochores en GC-ratio’s

  • GC-rijke isochores hebben vaak veel eiwit coderende genen.
  • GC ratios van deze isochores berekenen helpt bij het vinden/mappen van gen-rijke regio’s op het genoom.

Human isochores

L1 en L2

  • Arm in GC (~40%)
  • Gen armm
  • 85% van weefsel specifieke genen.

H1, H2 en H3

  • rijk in GC (~50%)
  • Gen rijk
  • 80% huishoudgenen
  • Promoter dichtbij transcriptie
  • Kortere intronen en genen
  • Andere codon bias
    • Meer G+C
  • Less long repeated sequences
    • LINEs