Mutatie vs Variant

Mutatie:

  • “The changing of the structure of a gene, resulting in a variant form that may be transmitted to subsequent generations, caused by the alteration of single base units in DNA, or the deletion, insertion or rearrangement of larger sections of genes on chromosomes.”
  • “A change in the nucleotide sequence of an organism’s DNA or in the DNA or RNA of a virus.”

Variant:

  • “An alteration in the most common DNA nucleotide sequence. The term variant can be used to describe an alteration that may be benign, pathogenic or of unknown significance. The term variant is increasingly being used in place of the term mutation.”
  • “Differences among individuals in the composition of their genes or other DNA sequences.”

Verschillende typen genetische variatie

  • Single nucleotide variants (SNVs) & single nucleotide polymorphisms (SNPs)
  • Insertion & deletion (indels)
  • Structural variation

Single Nucleotide variant (SNV)

  • Één enkele nucleotide in het DNA verandert

  • Ref: ATCGGGGCCATG

  • Alt: ATCGAGGGCATG

  • Purine: A & G

  • Pyridine: T & C

  • Verschillende typen substituties:

    • Transitions
    • Transversions

Single nucleotide polymorphism (SNP)

Subtype van een SNV

Een SNP is een SNV die in minstens 1% van een populatie voorkomt

Synonymous vs non-synonymous SNV

Synonymous SNVs: aminozuur verandert niet

ref CTT codeert voor een leucine alt CTC codeert voor een leucine

Non-synonymous SNV: aminozuur verandert wel

ref CTT codeert voor een leucine alt ATT codeert voor een isoleucine

Insertion & Deletion - Indel

  • Insertie of deletie van een aantal nucleotiden in het DNA
  • Kunnen 1 tot enkele honderden bp lang zijn
  • Kunnen frameshift veroorzaken, maar kunnen ook in-frame zijn
  • Inserties en deleties in het DNA noemen we “indels”

Insertie

Ref ACTGACGCATGCATCATGCATGC Alt ACTGACGCATGGTACATCATGCATGC

Deletie Ref ACTGACGCATGCATCATGCATGC Alt ACTGACG - - TGCATCATGCATGC

Structural Variation/genetische variatie

Genetische variatie gaat over een groter stuk DNA

Er zijn 5 typen:

  • Inversion
  • Translocation
  • Duplication
  • Insertion
  • Deletion

Hoe kom je achter genetische variatie?

Stappen:

Grijs: Referentie genoom Rood: Reads

Homozygoot vs Heterozygoot

Homozygoot: De frequentie van een positie = 100%

Heterozygoot:

  • De frequente van de niet-referentie allel tussen 20-80% ligt
    • Dit komen door foutjes met reads
    • en hoe vaak het gerepliceerd wordt

Variant annotatie

Variant annotatie: het toewijzen van informatie aan DNA varianten.

Het helpt om de genetische variatie te interpreteren.

Voorbeelden:

  • Positie in gen of intergene regio
  • Effect van een variant op eiwit
  • Sequentie conservatie
  • Minor Allele Frequency (MAF)

Voorbeelden

Positie in gen of intergene regio

  • Intron
  • Coderend exon
  • Niet-coderend exon
  • Splice site
  • UTR
  • Promotor regio
  • Niet-coderende regio (intergenic DNA)

Splice sites: regios aan de 5’ en 3’ kant van intronen waar het spliceosome de introns spliced

Meest voorkomende splice site sequenties (> 99% van de splice sites):

  • Donor site: GT
  • Acceptor site: AG

Effect van een variant op eiwit

Het is mogelijk om het effect van een variant te voorspellen, daar zijn namelijk tools voor:

  • SIFT
  • PolyPhen
  • Mutpred

Deze tools voorspellen het volgende:

  • Het effect van een variant op de structuur van een eiwit
  • Het effect van een variant op de functie van een eiwit
  • Eventuele pathogeniciteit van de variant

Sequentie conservatie

Waarom is het interessant om naar sequentie conservatie te kijken wanneer we varianten annoteren?

Wanneer een sequentie over de tijd goed geconserveerd is gebleven, is het waarschijnlijk belangrijk voor de functie van het DNA/eiwit

Wanneer er een mutatie plaatsvindt in een geconserveerde sequentie, is de kans groter dat het effect heeft op de functie van het DNA/eiwit

Er is een tool om conservatie te voorspellen: phyloP

Positieve score: meet conservatie

  • langzamere evolutie dan verwacht
  • van deze plekken in het DNA is voorspeld dat ze geconserveerd zijn

Negatieve score: meet acceleratie

  • snellere evolutie dan verwacht
  • van deze plekken in het DNA is voorspeld dat ze snel evolueren

Minor Allele Frequence (MAF)

MAF: De frequentie van de tweede meest voorkomende allel in een populatie.

De formule voor het berekenen van de frequentie: allel met bepaalde varianten / alle gescreende varianten

Pathogeniciteit van een variant

Al deze vormen van annotatie helpen om iets te kunnen zeggen over de pathogeniciteit van een variant.

Een variant kan:

  • goedaardig (benign) zijn
  • ziekteverwekkend (pathogenic) zijn
  • of er is nog niks over bekend (unknown significance)

Waar zijn genetische varianten te vinden?

Databases om genetische varianten te zoeken:

  • OMIM – allelic variants
  • NCBI dbSNP
  • NCBI ClinVar
  • NCBI Gene – genomic regions, transcripts, products

Genetische Markers

Genetische markers zijn variabele DNA-sequenties die dienen als herkenningspunten in het genoom

Ze bevinden zich meestal op bekende posities en kunnen worden gebruikt om genetische eigenschappen te traceren

Het kan gebruikt worden om een individu of soort te identificeren

Het kan beschreven worden als de variatie die wordt geobserveerd

Voorbeelden van genetische markers:

  • SNPs
  • Microsatellieten

Markers kunnen gebruikt worden om bijvoorbeeld:

  • Humane evolutie te bestuderen
  • Ziektegenen te identificeren
  • Genen te identificeren die onze gevoeligheid voor ziekten, toxins of medicijnen beïnvloeden

Hoe analyseer je microsatelliet markers?

Stappen:

  1. Amplicifeer m.b.v. PCR het aantal repeats in het DNA
  2. Gebruik primers (~ 20 nt elk) op het DNA naast de repeat regio
  3. Scheidt vervolgens de PCR producten met gel electroforese

Voorbeelden

SNP als genetische marker

Een specifieke SNP is geïdentificeerd in alle mensen met een bepaalde ziekte

SNP draagt zelf niet bij aan de ziekte, maar de nabijheid van de SNP naast het ziekteverwekkende gen is een indicatie voor het hebben van de ziekte

Deze SNP kan bijvoorbeeld als marker worden gebruikt wanneer de SNP en het ziekteverwekkende gen altijd samen overerven (ze zijn “linked”)

Microsatelliet in forensisch onderzoek

In 1984 was Earl Washington ter dood veroordeeld voor de moord op Rebecca Williams

In 2000 microsatelliet marker analyse gedaan om zijn onschuld te bewijzen

Uit de analyse kwam dat de markers overeen kwamen met Kenneth Tinsley (die al in de gevangenis zat voor een ander vergrijp)