Eén van de belangrijkste factoren voor succesvolle geautomatiseerde DNA-sequencing is het juiste primerontwerp. Dit document beschrijft de stappen in dit proces en de belangrijkste valkuilen die moeten worden vermeden.
**** Gebruik een computer om primers te ontwerpen ****
Wij raden ten zeerste aan tijdens het primerontwerp een computer te gebruiken om te controleren op bepaalde fatale ontwerpfouten. Er zijn talloze programma’s die deze analyse kunnen uitvoeren. Zoek bijvoorbeeld op het web naar ‘Primer3’.
Enkele basisbegrippen: Als u in de war bent door de strengen en de oriëntatie van de primer, lees dan dit.
Sequencingprimers moeten op een voorspelbare plaats en op een voorspelbare streng aan het doel-DNA kunnen annealiseren. Bovendien moeten ze door Taq DNA Polymerase kunnen worden geëxtensieerd.
Sommigen zijn in de war over hoe ze een DNA-sequentie moeten onderzoeken om een geschikte primersequentie te kiezen. Hier zijn een paar dingen voor nieuwelingen om te onthouden:
- Sequenties worden altijd geschreven van 5′ tot 3′. Dit omvat de sequentie van uw template-DNA (indien bekend), de sequentie van het vector-DNA waarin het wordt ingevoegd, en de sequentie van de voorgestelde primers. Schrijf een primersequentie nooit omgekeerd, of u zult uzelf en anderen alleen maar in verwarring brengen.
- Polymerase verlengt altijd het 3′-uiteinde van de primer, en de sequentie die u zult aflezen zal dezelfde streng zijn (sense of anti-sense) als de primer zelf.
- Als u dus een primersequentie kiest die u in uw bronsequentie kunt lezen (bijvoorbeeld in de vector), zal de sequentie die u verkrijgt zich uitstrekken vanaf het rechter (3′) uiteinde van de primer.
- Omgekeerd, als u een primer kiest van de streng die tegenovergesteld is aan wat uw ‘bronsequentie’ leest, zal de resulterende sequentie zich naar links uitstrekken.
Hier volgen een paar voorbeelden:
Stel dat u een vector hebt met de volgende sequentie rond de Multiple Cloning Site (de ‘MCS’):
TTAGCTACTGCTTGATGCTAGTACTACATCTAGTGCTAGATGGATCCGAATTCGCTGATGCTCATATGTTAATAAAGAC ^ ^ | | BamHI EcoRI
Als u uw DNA tussen de BamHI- en EcoRI-locaties hebt gekloond, kunt u de sequentie bepalen met de primer ‘CTTGATGCTAGTACTACATC’ (denk eraan – dat is van 5′ tot 3′ geschreven) en krijgt u de volgende sequentie uit de kern:
TAGTGCTAGATGAATTCGCTGATGC...(etc.)
Wat als u in plaats daarvan een sequentie van de andere streng – Eco tot Bam – wilt? In dat geval moet u een sequentie aan de rechterkant selecteren en deze vervolgens reverse-complementeren alvorens de oligo aan te vragen. Kies een sequentie uit de bovenstaande figuur:
CTGATGCTCATATGTTAATA
Dit is NIET de primer sequentie – deze is letterlijk gekopieerd uit de bovenstaande sequentie. Als u deze sequentie voor een primer zou gebruiken, zou de sequencing naar rechts gaan, weg van uw insert. In plaats daarvan moet u deze sequentie omgekeerd aanvullen:
TATTAACATATGAGCATCAG
Nu zou dit de sequentie van de tegenoverliggende streng moeten opleveren:
CGAATTCATCTAGCACTA...(etc.)
Een paar kleine lettertjes: Slechts zelden toont sequencing de nucleotiden onmiddellijk stroomafwaarts van de primer. In bovenstaande voorbeelden ben ik didactisch vrij geweest.
Meer geavanceerde concepten: Hoe ontwerpt u een primer die werkt?
In het algemeen begint u met een kleine hoeveelheid bekende sequentie die u wilt uitbreiden. Dit is hoe je te werk gaat:
I. Ontwerp primers alleen op basis van nauwkeurige sequentiegegevens. Geautomatiseerde sequencing (en in feite elke sequencing) heeft een eindige waarschijnlijkheid van het produceren van fouten. De sequentie die te ver van de primer wordt verkregen, moet als twijfelachtig worden beschouwd. Om te bepalen wat ’te ver’ is, raden wij onze klanten ten zeerste aan de memo Interpretation of Sequencing Chromatograms te lezen, waarin wordt beschreven hoe de geldigheid van gegevens verkregen met de ABI-sequencers kan worden beoordeeld. Kies een gebied voor primerplaatsing waar de kans op sequentiefouten gering is. II. Beperk uw zoektocht tot regio’s die het beste aansluiten bij uw doelstellingen.
U bent misschien geïnteresseerd in het maximaliseren van de verkregen sequentiegegevens, of u hoeft alleen de sequentie op een zeer specifieke plaats in het sjabloon te onderzoeken. Dergelijke behoeften dicteren zeer verschillende primer plaatsingen.
- Maximaliseer verkregen sequentie terwijl het minimaliseren van de kans op fouten:
Over het algemeen moet u de primer ontwerpen zo ver naar de 3′ als je kunt beheren, zolang je vertrouwen hebt in de juistheid van de volgorde waaruit de primer wordt getrokken. Primers op tegenovergestelde strengen moeten zoveel mogelijk verspringend worden geplaatst. - Gerichte sequencing van een specifiek gebied:
Plaats de primer zo dat de gewenste sequentie in het meest nauwkeurige gebied van het chromatogram valt. Sequentiegegevens zijn vaak het nauwkeurigst op ongeveer 80-150 nucleotiden afstand van de primer. Reken er niet op dat u goede sequentie ziet op minder dan 50 nucleotiden van de primer of op meer dan 300 nt afstand (hoewel we vaak sequentie krijgen die onmiddellijk na de primer begint, en we vaak 700 nt nauwkeurige sequentie terugkrijgen).
III. Zoek kandidaat-primers:
Identificeer potentiële sequencing-primers die stabiele baseparing produceren met het template-DNA onder omstandigheden die geschikt zijn voor cyclus-sequencing. Het wordt sterk aangeraden bij deze stap een computer te gebruiken. Voorgestelde kenmerken van de primers:
- De lengte moet tussen 18 en 30 nt liggen, met een optimale lengte van 20-25 nt. (Hoewel we enkele successen hebben geboekt met primers langer dan 30 en korter dan 18).
- G-C-gehalte van 40-60% is wenselijk.
- De Tm moet tussen 55 C en 75 C liggen. Waarschuwing: de oude “4 graden voor elke G-C, 2 graden voor elke A-T”-regel werkt slecht, vooral voor oligo’s korter dan 20 of langer dan 25 nt. Probeer in plaats daarvan:
Tm = 81.5 + 16.6* log + 0.41*(%GC) - 675/length - 0.65*(%formamide) - (%mismatch)
Er is een webgebaseerde Tm-calculator die u zou kunnen proberen op http://www.rnature.com/oligonucleotide.html.
IV. Gooi kandidaat-primers weg die ongewenste zelfhybridisatie vertonen.
Primers die zelfhybridisatie kunnen vertonen, zullen niet beschikbaar zijn voor hybridisatie aan het sjabloon. Vermijd in het algemeen primers die 4 of meer opeenvolgende bindingen met zichzelf kunnen vormen, of 8 of meer bindingen in totaal. Voorbeeld van een marginaal problematische primer:
5'-ACGATTCATCGGACAAAGC-3' |||| |||| 3'-CGAAACAGGCTACTTAGCA-5'
Deze oligo vormt een substantieel stabiel dimeer met zichzelf, met vier opeenvolgende bindingen op twee plaatsen en een totaal van acht interstrengbindingen.
Primers met 3′-uiteinden die zelfs maar tijdelijk hybridiseren, zullen door polymerasewerking verlengd worden, waardoor de primer vervalt en valse banden ontstaan. Wees iets strenger bij het vermijden van 3′ dimers. Bijvoorbeeld, de volgende primer zelf-dimeriseert met een perfecte 3′ hybridisatie op zichzelf:
5'-CGATAGTGGGATCTAGATCCC-3' |||||||||||||| 3'-CCCTAGATCTAGGGTGATACG-5'
De bovenstaande oligo is vrij slecht, en bijna gegarandeerd om problemen te veroorzaken. Merk op dat het polymerase het 3′-uiteinde zal verlengen tijdens de sequencing-reactie, wat een zeer sterke sequentie ACTATGC oplevert. Deze banden verschijnen aan het begin van uw ‘echte’ data als immense pieken, waardoor de juiste sequentie wordt verborgen. De meeste primerontwerpprogramma’s herkennen zulke zelfdimmerende primers en waarschuwen u ze te vermijden.
Merk echter op dat geen enkel computerprogramma of vuistregel het succes of falen van een primer nauwkeurig kan voorspellen. Een primer die marginaal lijkt, kan goed presteren, terwijl een andere die foutloos lijkt, helemaal niet kan werken. Vermijd voor de hand liggende problemen, ontwerp de beste primers die u kunt, maar probeer in noodgevallen als u weinig opties hebt gewoon een paar kandidaat-primers, ongeacht mogelijke gebreken.
V. Verifieer de plaatsspecificiteit van de primer. Voer een sequentiehomologie-zoekopdracht uit (bijv. dot-plot homologievergelijking) door alle bekende template-sequentie om te controleren op alternatieve primerplaatsen. Gooi primers weg die een “significante” neiging vertonen om aan dergelijke plaatsen te binden. We kunnen slechts ruwe richtlijnen geven voor wat ‘significant’ is. Vermijd primers waarin alternatieve sites aanwezig zijn met (1) meer dan 90% homologie met de primaire site of (2) meer dan 7 opeenvolgende homologe nucleotiden aan het 3′-uiteinde of (3) een abundantie die meer dan 5-maal zo groot is als de beoogde priming-site. VI. Kiezen tussen kandidaat-primers.
Als u op dit punt verscheidene kandidaat-primers hebt, kunt u een of enkele kiezen die aan het 3′-uiteinde rijker zijn aan A-T. Deze hebben de neiging iets specifieker te werken, volgens sommige onderzoekers. Misschien wilt u meer dan één primer gebruiken, om de kans op succes zo groot mogelijk te maken.
Als u geen kandidaten hebt die aan bovenstaande criteria voldoen, bent u misschien gedwongen de strengheid van de selectie-eisen te versoepelen. Uiteindelijk is de test van een goede primer alleen in zijn gebruik, en kan niet nauwkeurig worden voorspeld door deze simplistische rules-of-thumb.
Met geluk, hoewel, heb je genoeg opties voor primers. Voor een sequentie-assemblageproject moet u meer primers ontwerpen dan u denkt echt nodig te hebben, zodat u, als de sequentie niet zo lang is als u hoopte, toch voldoende overlappende gegevens krijgt om u van een goede sequentie-consensus te verzekeren. Voor een betere bevestiging raden we u aan beide strengen te sequencen. Plaats op de ene streng de primers 500 tot 700 nt uit elkaar (kortere afstanden zijn veiliger!). Op de tegenoverliggende streng plaatst u de primers versprongen ten opzichte van de primers van de eerste streng, zoals hieronder afgebeeld: