En av de viktigaste faktorerna för att lyckas med automatiserad DNA-sekvensering är korrekt utformning av primers. I det här dokumentet beskrivs de steg som ingår i denna process och de viktigaste fallgroparna att undvika.
**** Use a Computer to Design Primers ****
Vi rekommenderar starkt att en dator används under primerdesignen för att kontrollera om det finns vissa ödesdigra designfel. Många program kan utföra denna analys. Sök till exempel efter ”Primer3” på webben.
Några grundläggande begrepp: Om du är förvirrad av strängar och primerorientering kan du läsa detta.
Sekvenseringsprimers måste kunna annealera till mål-DNA:t på en förutsägbar plats och på en förutsägbar sträng. De måste dessutom kunna förlängas av Taq DNA-polymeras.
Vissa personer är förvirrade över hur de ska undersöka en DNA-sekvens för att välja en lämplig primersekvens. Här är några saker för nybörjare att komma ihåg:
- Sekvenser skrivs alltid från 5′ till 3′. Detta inkluderar sekvensen för ditt mall-DNA (om den är känd), sekvensen för det vektor-DNA i vilket det sätts in och sekvensen för de föreslagna primrarna. Skriv aldrig en primersekvens omvänt, annars kommer du bara att förvirra dig själv och andra.
- Polymeraset förlänger alltid primerns 3′-ända, och den sekvens som du kommer att läsa kommer att vara samma sträng (sense eller anti-sense) som själva primern.
- Om du alltså väljer en primersekvens som du kan läsa i din källsekvens (t.ex. i vektorn) kommer den sekvens som du får fram att sträcka sig från primerns högra (3′) ände.
- Omvänt, om du väljer en primer från den sträng som är motsatt till den som din ”källsekvens” läser, kommer den resulterande sekvensen att läsas åt vänster.
Här är ett par exempel:
Antag att du har en vektor med följande sekvens runt Multiple Cloning Site (MCS):
TTAGCTACTGCTTGATGCTAGTACTACATCTAGTGCTAGATGGATCCGAATTCGCTGATGCTCATATGTTAATAAAGAC ^ ^ | | BamHI EcoRI
Om du klonat ditt DNA av intresse mellan BamHI- och EcoRI-platserna kan du sekvensera med hjälp av primern ”CTTGATGCTAGTACTACTACATC” (kom ihåg – det är skrivet 5′ till 3′) och du får följande sekvens från kärnan:
TAGTGCTAGATGAATTCGCTGATGC...(etc.)
Hur skulle det vara om du ville ha en sekvens från den andra strängen – från Eco till Bam – istället? I det fallet måste du välja en sekvens till höger och sedan omvänt komplettera den innan du begär oligon. Välj ut någon sekvens från figuren ovan:
CTGATGCTCATATGTTAATA
Detta är INTE primersekvensen – den är ordagrant kopierad från sekvensen ovan. Om du använde denna sekvens som primer skulle sekvenseringen faktiskt fortsätta åt höger, bort från din insättning. Istället ska du omvänt komplettera denna sekvens:
TATTAACATATGAGCATCAG
Nu ska detta ge sekvensen för den motsatta strängen:
CGAATTCATCTAGCACTA...(etc.)
En del finstilt text: Endast sällan visar sekvenseringen faktiskt nukleotiderna omedelbart nedströms från primern. Jag har tagit viss didaktisk frihet i exemplen ovan.
Mer avancerade begrepp:
I allmänhet börjar du med en liten mängd känd sekvens som du vill förlänga. Så här går du tillväga:
I. Utforma primers endast utifrån korrekta sekvensdata. Automatiserad sekvensering (och i själva verket all sekvensering) har en begränsad sannolikhet att producera fel. Den sekvens som erhålls för långt bort från primern måste betraktas som tvivelaktig. För att avgöra vad som är ”för långt” rekommenderar vi starkt att våra kunder läser memot Interpretation of Sequencing Chromatograms (Tolkning av sekvenseringskromatogram), där det beskrivs hur man bedömer giltigheten av de data som erhålls från ABI-sekvenseringarna. Välj ett område för primerplacering där risken för sekvensfel är liten. II. Begränsa din sökning till regioner som bäst återspeglar dina mål.
Du kanske är intresserad av att maximera de sekvensdata som erhålls, eller så behöver du bara undersöka sekvensen på en mycket specifik plats i mallen. Sådana behov dikterar mycket olika primerplaceringar.
- Maximera den erhållna sekvensen samtidigt som du minimerar risken för fel:
Generellt sett bör du designa primern så långt till 3′ som möjligt så länge du har förtroende för noggrannheten hos den sekvens från vilken primern är hämtad. Primers på motsatta strängar bör så långt som möjligt placeras på ett förskjutet sätt. - Targeted sequencing of a specific region:
Positionera primern så att den önskade sekvensen faller i den mest exakta regionen av kromatogrammet. Sekvensdata är ofta mest exakta cirka 80-150 nukleotider från primern. Räkna inte med att se en bra sekvens mindre än 50 nukleotider från primern eller mer än 300 nt från primern (även om vi ofta får en sekvens som börjar omedelbart efter primern, och vi returnerar ofta 700 nt korrekt sekvens).
III. Lokalisera kandidatprimer:
Identifiera potentiella sekvenseringsprimrar som ger stabil basparning med mall-DNA:t under förhållanden som är lämpliga för cykelsekvensering. Det rekommenderas starkt att du använder en dator i detta steg. Föreslagna primeregenskaper:
- Längden bör vara mellan 18 och 30 nt, med optimalt 20-25 nt. (Även om vi har haft vissa framgångar med primer som är längre än 30 och kortare än 18).
- G-C-innehåll på 40-60 % är önskvärt.
- Tm bör ligga mellan 55 C och 75 C. Varning: Den gamla regeln ”4 grader för varje G-C, 2 grader för varje A-T” fungerar dåligt, särskilt för oligos som är kortare än 20 eller längre än 25 nt. Prova istället:
Tm = 81.5 + 16.6* log + 0.41*(%GC) - 675/length - 0.65*(%formamide) - (%mismatch)
Det finns en webbaserad Tm-kalkylator som du kan prova på http://www.rnature.com/oligonucleotide.html.
IV. Kassera kandidatprimer som visar oönskad självhybridisering.
Primers som kan självhybridisera kommer att vara otillgängliga för hybridisering mot mallen. Undvik generellt primers som kan bilda 4 eller fler på varandra följande bindningar med sig själv, eller 8 eller fler bindningar totalt. Exempel på en marginellt problematisk primer:
5'-ACGATTCATCGGACAAAGC-3' |||| |||| 3'-CGAAACAGGCTACTTAGCA-5'
Denna oligo bildar en väsentligt stabil dimer med sig själv, med fyra på varandra följande bindningar på två ställen och totalt åtta bindningar mellan strängarna.
Primers med 3′-ändar som hybridiserar ens övergående kommer att förlängas på grund av polymerasets verkan, vilket förstör primern och genererar falska band. Var något strängare när det gäller att undvika 3′-dimerer. Följande primer självdimerer till exempel med en perfekt 3′-hybridisering på sig själv:
5'-CGATAGTGGGATCTAGATCCC-3' |||||||||||||| 3'-CCCTAGATCTAGGGTGATACG-5'
Oligo ovan är ganska dålig och kommer nästan garanterat att orsaka problem. Observera att polymeraset kommer att förlänga 3′-änden under sekvenseringsreaktionen, vilket ger en mycket stark sekvens ACTATGC. Dessa band kommer att dyka upp i början av dina ”riktiga” data som enorma toppar, vilket täcker den korrekta sekvensen. De flesta program för primerdesign upptäcker korrekt sådana självdimererande primers och varnar dig för att undvika dem.
Bemärk dock att inget datorprogram eller någon tumregelbedömning exakt kan förutsäga vare sig framgång eller misslyckande för en primer. En primer som verkar marginell kan fungera bra, medan en annan som verkar vara felfri kanske inte fungerar alls. Undvik uppenbara problem, konstruera de bästa primers du kan, men i en nödsituation om du har få alternativ, prova bara några kandidatprimers, oavsett potentiella brister.
V. Kontrollera primerns platsspecificitet. Utför en sekvenshomologisökning (t.ex. dot-plot homologi jämförelse) genom alla kända mallsekvenser för att kontrollera om det finns alternativa primerplatser. Kassera alla primers som uppvisar en ”betydande” tendens att binda till sådana platser. Vi kan bara ge grova riktlinjer för vad som är ”betydande”. Undvik primers där det finns alternativa platser med (1) mer än 90 % homologi med den primära platsen eller (2) mer än 7 på varandra följande homologa nukleotider i 3′-änden eller (3) en abundans som är mer än 5 gånger högre än den avsedda primingplatsen. VI. Val av kandidatprimer.
Om du vid denna tidpunkt har flera kandidatprimer kan du välja en eller några som är mer A-T-rika i 3′-änden. Dessa tenderar att vara något mer specifika i sin verkan, enligt vissa forskare. Du kanske vill använda mer än en primer för att maximera sannolikheten för framgång.
Om du inte har några kandidater som överlevt kriterierna ovan, kan du bli tvungen att lätta på strängheten i urvalskraven. I slutändan är testet av en bra primer endast i dess användning, och kan inte exakt förutsägas av dessa förenklade tumregler.
Med lite tur har du dock gott om alternativ för primers. För ett sekvenssammanställningsprojekt bör du designa fler primers än du tror att du verkligen behöver, så att om sekvensen inte är så lång som du hoppades kan du ändå få tillräckligt med överlappande data för att försäkra dig om en bra sekvenskonsensus. Vi rekommenderar att du sekvenserar båda strängarna, för bättre bekräftelse. På den ena strängen ska du placera primrarna med 500 till 700 nt mellanrum (kortare avstånd är säkrare!). På den motsatta strängen placerar du primrarna på ett förskjutet sätt bort från primrarna i den första strängen, enligt bilden nedan: