Mutatie vs. Variant

Definities van een mutatie:

  • “The changing of the structure of a gene, resulting in a variant form that may be transmitted to subsequent generations, caused by the alteration of single base units in DNA, or the deletion, insertion or rearrangement of larger sections of genes on chromosomes.”
  • “A change in the nucleotide sequence of an organism’s DNA or in the DNA or RNA of a virus.”

Definitie van een Variant

  • “An alteration in the most common DNA nucleotide sequence. The term variant can be used to describe an alteration that may be benign, pathogenic or of unknown significance. The term variant is increasingly being used in place of the term mutation”
  • “Differences among individuals in the composition of their genes or other DNA sequences.”

Verschillende typen genetische variatie

  • Single Nucleotide Variants (SNVs) & Single Nucleotide Polymorphisms (SNPs)
  • Insertions & deletions (indels)
  • Structural variation

Single Nucleotide Variant (SNV)

Purines (G&A)

Bindings tabel nucleotide

PurinesPyrimidines
GC
AT of U (in RNA)

Pyrimidines (C&T)

Bindings tabel nucleotide

PurinesPyrimidines
GC
AT of U (in RNA)
  • Verschillende types substituties:
    • Transitions
    • transversions

Single Nucleotide Polymoorphism (SNP)

  • Uit gesproken als snip (SNP)
  • Subtype van SNV
  • een SNP is een SNV die in minstens 1% van de populatie voorkomt

Synonymous vs Non-Synonymous SNV

Synonymous SNVs: aminozuur verandert niet

  • ref CTT codeert voor een leucine
  • alt CTC codeert voor een leucine Non-synonymous SNV: aminozuur verandert wel
  • ref CTT codeert voor een leucine
  • alt ATT codeert voor een isoleucine

Insertions & Deletion - INDEL

  • Insertie of deletie van een aantal Nucleotiden in het DNA
  • kunnen 1 tot enkele honderden bp lang zijn
  • kunnen frameshift veroorzaken
    • maar kunnen ook in-frame zijn
  • Inserties en deleties in het DNA noemen we INDELS

Insertie

  • Ref ACTGACGCATGCATCATGCATGC
  • Alt ACTGACGCATGGTACATCATGCATGC

Deletie

  • Ref ACTGACGCATGCATCATGCATGC
  • Alt ACTGACG - - TGCATCATGCATGC

Structural variation

Genetische variatie betreft een groter stuk DNA

5 Types

  1. inversion
  2. translocation
  3. Duplication
  4. Insertion
  5. Deletion

Genetische variatie

Hoe kom je er achter?

Stappen

  1. sequencen van DNA
  2. Map de reads tegen het referentiegenoom
  3. zoek naar verschillen tussen de reads en het referentiegenoom
  4. annoteer de genetische variatie

Homozygoot vs heterozygoot

Homozygoot

De frequentie van een positie = 100%

Heterozygoot

Een positie wordt gezien als heterozygoot als

  • de frequentie van de niet-referentie allel tussen 20%-80% ligt.
    • dit komen door foutjes met de reads
    • en hoevaak het gerepliceerd wordt (random)

Variant annotatie

Varriant annotatie:

  • het toewijzen van informatie aan DNA varianten
  • Helpt om de genetische variatie te interpreteren.

Voorbeelden

  • Positie in gen of intergene regio
  • Effect van een variant op eiwit
  • Sequentie conservatie
  • Minor Allele Frequency (MAF)

Positie in gen of intergene regio

  • Intron
  • Coderend exon
    • kan pathogeen zijn
  • Niet-coderend exon
  • Splice site
    • kan pathogeen zijn
  • UTR
  • Promotor regio
  • Niet-coderende regio (intergenic DNA)

Canonical Splice sites

  • Splice sites:
    • regios aan de 5’ en 3’ kant van intronen waar het spliceosome de introns spliced
  • Meest voorkomende splice site sequenties
    • (> 99% van de splice sites):
    • Donor site: GT
    • Acceptor site: AG

Effect van een variant op eiwit

Voorspellen van effect van het variant

SIFT, PolyPhen en Mutpred voorspellen:

  • Het effect van een variant op de structuur van een eiwit
  • het effev van een variant op de functie van een eiwit
  • Eventuele pathogeniciteit

Sequentie Conservatie

Tool om conservatie te voorspellen : PhyloP

  • Positieve score:
    • meet conservatie
    • langzamere evolutie dan verwacht
    • van deze plekken in het DNA is voorspeld dat ze geconserveerd zijn
  • Negatieve score:
    • meet acceleratie
    • snellere evolutie dan verwacht
    • van deze plekken in het DNA is voorspeld dat ze snel evolueren

Minor Allele frequency (MAF)

MAF: De frequentie van de tweede meest voorkomende allel in een populatie.

frequentie = allel met bepaalde variant / alle gescreende varianten

Pathogeniciteit van een variant

al deze vormen van annotatie helpen om iets te kunnen zuggen over de pathogeniciteit van een variant Een variant kan:

  • goedaardig (benign) zijn
  • ziekteverwekkend (pathogenic) zijn
  • of er is nog niks over bekend (unknown significance)

Databases met genetische variatie

WAAR ZIJN GENETISCHE VARIANTEN TE VINDEN? Databases om genetische varianten te zoeken:

  • OMIM – allelic variants
  • NCBI dbSNP
  • NCBI ClinVar
  • NCBI Gene – genomic regions, transcripts, products

Genetische markers

  • Genetische markers zijn variabele DNA-sequenties
    • deze dienen als herkenningspunten in het genoom
  • Bevinden zich meestal op bekende posities
    • kunnen worden gebruikt om genetische eigenschappen te traceren
  • Kan gebruikt worden om een individu of soort te identificeren
  • Kan beschreven worden als de variatie die wordt geobserveerd

Voorbeelden van genetische markers

  • SNPs
  • Microsatellieten

Markers kunnen gebruikt worden om bijvoorbeeld:

  • Humane evolutie te bestuderen
  • Ziektegenen te identificeren\
  • Genen te identificeren die onze gevoeligheid voor ziekten, toxins of medicijnen beïnvloeden

SNP als genetische marker (voorbeeld)

  • Een specifieke SNP is geïdentificeerd in alle mensen met een bepaalde ziekte
  • SNP draagt zelf niet bij aan de ziekte, maar de nabijheid van de SNP naast het ziekteverwekkende gen is een indicatie voor het hebben van de ziekte
  • Deze SNP kan bijvoorbeeld als marker worden gebruikt wanneer de SNP en het ziekteverwekkende gen altijd samen overerven (ze zijn “linked”)

Microsatelliet

  • DNA sequentie bestaande uit simpele repeat units
  • Bestaan ui 5-50 repeat units
  • Repeat units Kunnen 1- bp lang zijn
  • worden ook wel genoemd
    • STR ( Short Tandem Repeats)
    • SSR (Siple Sequence repeats)
  • Komen veel voor in het niet coderende delen van het DNA