Alignment

  • Vergelijken van twee of meer DNA, RNA of eiwit sequenties.
  • Dit doen we voor het identificeren van vergelijkbare regios als gevolg van een functionele, structurele of evolutionaire relatie

de sequenties worden zo ingedeeld zodat vergelijkbare gedeeltes van de sequenties met vergelijkbare eigenschappen worden uitgelijnd

Gaps en mismatches

  • Gaps (-) zijn belangrijk voor het beter alignen.
  • ze stimuleren indel events
  • Een mismatch simuleert een substitutie

Gaps

Graag hebben we een alignment die evolutionair logisch is

Alignment score

  • De som van alle matches van een alignment met gap penalties daarvan afgehaald

Scoring systemenen

PAM250

Bij het vergelijken van eiwitsequenties

  • Sommige eiwitsequenties lijken meer op elkaar dan andere

Pairwise alignment

  • Snel en simpel
  • Niet altijd betrouwbaar
  • score berekenen aan de hand van identities en similarities van aminozuren
    • Identity
      • Exacte matches
    • similarity
      • vergelijkbare match
      • (bv. R en K. deze zijn beide positief geladen)
      • (bv. D en E. deze zijn beide negatief geladen)

Multiple Sequence Alignment

  • Zwaar voor de computer
    • Iedere sequentie met ieder andere sequentie alignen/vergelijken
    • Scores kunnen gebruikt worden voor een fylogenetische boom
  • Betrouwbaarder
    • Meer informatie beschikbaar

Waarom alignen?

  • Homologen vinden:
  • Extrapoleren van kennis over de ene sequentie naar een andere sequentie
  • Structuur en functie van een eiwit ontrafelen
  • identificatie van geconserveerde sequentie
  • Fylogenie
  • Identificeren van homologen, orthologen en paralogen
    • Orthologen
      • verschillende organismes met dezelfde genen

Homologen, Paralogen en orthologen

Homologe sequentie

  • hebben een gemeenschappelijk vooroudersequentie
  • een sequentie is waarschijnlijk homoloog als:
    • 2 eiwitsequenties (>100 aminozuren) > 25% identiteit
    • 2 DNA sequenties (>100 nt) >70% identiteit
    • MAAR Bij een lagere identiteit kan er nog steeds sprake zijn van homologie.

Orthologs en Paralogs

Blast

Onderzoeker kan een query sequentie vergelijken met een andere database van sequentie, en daarmee vergelijkbare sequenties identificeren Identificeren van paralogen en orthologen