Jedním z nejdůležitějších faktorů úspěšného automatizovaného sekvenování DNA je správný návrh primerů. Tento dokument popisuje kroky spojené s tímto procesem a hlavní úskalí, kterým je třeba se vyhnout.
**** Use a Computer to Design Primers ****
Důrazně doporučujeme používat při návrhu primerů počítač, aby bylo možné zkontrolovat, zda nedochází k určitým fatálním chybám v návrhu. Tuto analýzu je schopna provádět řada programů. Na internetu vyhledejte například „Primer3“.
Několik základních pojmů: Pokud jste zmateni orientací vláken a primerů, přečtěte si toto:
Sekvenační primery musí být schopny anneal na cílovou DNA v předvídatelném místě a na předvídatelném vlákně. Dále musí být schopny extenze pomocí Taq DNA polymerázy.
Někteří lidé jsou zmateni tím, jak zkoumat sekvenci DNA, aby vybrali vhodnou sekvenci primerů. Zde je několik věcí, které by si nováčci měli zapamatovat:
- Sekvence se vždy zapisují od 5′ do 3′. To zahrnuje sekvenci vaší templátové DNA (pokud je známa), sekvenci DNA vektoru, do kterého je vložena, a sekvenci navrhovaných primerů. Nikdy nepište sekvenci primeru obráceně, jinak jen zmatete sebe i ostatní.
- Polymeráza vždy prodlužuje 3′ konec primeru a sekvence, kterou budete číst, bude stejné vlákno (sense nebo anti-sense) jako samotný primer.
- Pokud tedy zvolíte sekvenci primeru, kterou můžete číst ve své zdrojové sekvenci (například ve vektoru), sekvence, kterou získáte, se bude prodlužovat od pravého (3′) konce primeru.
- Proti tomu, pokud zvolíte primer z opačného vlákna, než jaké čte vaše „zdrojová“ sekvence, výsledná sekvence se bude číst směrem doleva.
Uveďme si několik příkladů:
Předpokládejme, že máte vektor s následující sekvencí kolem místa vícenásobného klonování („MCS“):
TTAGCTACTGCTTGATGCTAGTACTACATCTAGTGCTAGATGGATCCGAATTCGCTGATGCTCATATGTTAATAAAGAC ^ ^ | | BamHI EcoRI
Pokud byste svou zájmovou DNA klonovali mezi místa BamHI a EcoRI, mohli byste sekvenovat pomocí primeru ‚CTTGATGCTAGTACTACATC‘ (nezapomeňte – píše se to od 5′ do 3′) a z jádra získáte následující sekvenci:
TAGTGCTAGATGAATTCGCTGATGC...(etc.)
Co kdybyste místo toho chtěli sekvenci z druhého vlákna – od Eco k Bam? V takovém případě musíte vybrat nějakou sekvenci vpravo a pak ji před vyžádáním oliga reverzně doplnit. Výběr nějaké sekvence z obrázku výše:
CTGATGCTCATATGTTAATA
Toto NENÍ sekvence primeru – je doslovně zkopírována z výše uvedené sekvence. Ve skutečnosti, pokud byste tuto sekvenci použili pro primer, sekvenování by probíhalo směrem doprava, od vašeho inzertu. Místo toho tuto sekvenci reverzně doplňte:
TATTAACATATGAGCATCAG
Tímto by měla vzniknout sekvence opačného vlákna:
CGAATTCATCTAGCACTA...(etc.)
Něco drobného: Jen výjimečně se při sekvenování skutečně zobrazí nukleotidy bezprostředně za primerem. Ve výše uvedených příkladech jsem si dovolil jistou didaktickou licenci.
Další pokročilé koncepty:
Obvykle začínáte s nějakým malým množstvím známé sekvence, kterou chcete rozšířit. Zde je návod, jak postupovat:
I. Navrhujte primery pouze z přesných sekvenčních dat. Automatické sekvenování (a vlastně jakékoli sekvenování) má konečnou pravděpodobnost vzniku chyb. Sekvenci získanou příliš daleko od primeru je třeba považovat za pochybnou. Pro určení toho, co je „příliš daleko“, důrazně doporučujeme našim klientům, aby si přečetli memorandum Interpretace sekvenačních chromatogramů, které popisuje, jak posoudit platnost dat získaných ze sekvenátorů ABI. Pro umístění primerů vyberte oblast, kde je možnost sekvenační chyby nízká. II. Omezte vyhledávání na oblasti, které nejlépe odrážejí vaše cíle.
Můžete mít zájem na maximalizaci získaných sekvenčních dat nebo můžete potřebovat prozkoumat sekvenci pouze na velmi specifickém místě v šabloně. Takové potřeby diktují velmi odlišné umístění primerů.
- Maximalizujte získanou sekvenci a zároveň minimalizujte možnost vzniku chyb:
Všeobecně byste měli navrhnout primer co nejdále k 3′, jak jen to zvládnete, pokud máte důvěru v přesnost sekvence, ze které je primer čerpán. Primery na protilehlých vláknech by měly být umístěny pokud možno odstupňovaně. - Cílené sekvenování specifické oblasti:
Umístěte primer tak, aby požadovaná sekvence spadala do nejpřesnější oblasti chromatogramu. Sekvenční data jsou často nejpřesnější asi 80-150 nukleotidů od primeru. Nepočítejte s tím, že uvidíte dobrou sekvenci ve vzdálenosti menší než 50 nukleotidů od primeru nebo ve vzdálenosti větší než 300 nt (ačkoli často získáme sekvenci začínající hned za primerem a často se nám vrátí 700 nt přesné sekvence).
III. Vyhledání kandidátních primerů:
Identifikujte potenciální sekvenační primery, které vytvářejí stabilní párování bází s templátovou DNA za podmínek vhodných pro cyklické sekvenování. Důrazně se doporučuje, abyste v tomto kroku použili počítač. Navrhované charakteristiky primerů:
- Délka by se měla pohybovat mezi 18 a 30 nt, přičemž optimální je 20-25 nt. (I když jsme měli několik úspěchů s primery delšími než 30 a kratšími než 18).
- Obsah G-C 40-60 % je žádoucí.
- Tm by mělo být mezi 55 C a 75 C. Upozornění: staré pravidlo „4 stupně pro každé G-C, 2 stupně pro každé A-T“ funguje špatně, zejména u olig kratších než 20 nebo delších než 25 nt. Místo toho zkuste:
Tm = 81.5 + 16.6* log + 0.41*(%GC) - 675/length - 0.65*(%formamide) - (%mismatch)
Na adrese http://www.rnature.com/oligonucleotide.html existuje webová kalkulačka Tm, kterou můžete vyzkoušet.
IV. Vyřazení kandidátních primerů, které vykazují nežádoucí self-hybridizaci.
Primery, které se mohou samohybridizovat, nebudou k dispozici pro hybridizaci s templátem. Obecně se vyhněte primerům, které mohou vytvářet 4 nebo více po sobě jdoucích vazeb se sebou samým nebo celkem 8 nebo více vazeb. Příklad okrajově problematického primeru:
5'-ACGATTCATCGGACAAAGC-3' |||| |||| 3'-CGAAACAGGCTACTTAGCA-5'
Toto oligo tvoří samo se sebou v podstatě stabilní dimer se čtyřmi po sobě jdoucími vazbami na dvou místech a celkem osmi mezivláknovými vazbami.
Primery, jejichž 3′ konce hybridizují i přechodně, se působením polymerázy prodlouží, čímž se primer zničí a vzniknou falešné pásy. Buďte poněkud přísnější, abyste se vyhnuli 3′ dimerům. Například následující primer se samodimerizuje s dokonalou 3′ hybridizací na sebe:
5'-CGATAGTGGGATCTAGATCCC-3' |||||||||||||| 3'-CCCTAGATCTAGGGTGATACG-5'
Výše uvedené oligo je dost špatné a téměř zaručeně způsobí problémy. Všimněte si, že polymeráza během sekvenační reakce prodlouží 3′ konec, čímž vznikne velmi silná sekvence ACTATGC. Tyto pásy se objeví na začátku vašich „skutečných“ dat jako obrovské píky a zakryjí správnou sekvenci. Většina programů pro návrh primerů takové samodimerizující primery správně odhalí a upozorní vás, abyste se jim vyhnuli.
Všimněte si však, že žádný počítačový program ani posouzení podle pravidla palce nedokáže přesně předpovědět úspěch ani neúspěch primeru. Primer, který se zdá být okrajový, může fungovat dobře, zatímco jiný, který se zdá být bezchybný, nemusí fungovat vůbec. Vyhněte se zjevným problémům, navrhněte co nejlepší primery, ale v nouzi, pokud máte málo možností, prostě vyzkoušejte několik kandidátních primerů bez ohledu na potenciální nedostatky.
V. Ověřte specifičnost primeru pro dané místo. Proveďte hledání homologie sekvence (např. bodové homologické srovnání) přes všechny známé sekvence templátu, abyste zkontrolovali alternativní místa primerů. Vyřaďte všechny primery, které vykazují „výraznou“ tendenci vázat se na taková místa. Můžeme poskytnout pouze hrubé pokyny ohledně toho, co je „významné“. Vyhněte se primerům, u nichž jsou přítomna alternativní místa s (1) více než 90% homologií s primárním místem nebo (2) více než 7 po sobě jdoucích homologních nukleotidů na 3′ konci nebo (3) množstvím více než 5krát větším než zamýšlené primingové místo. VI. Výběr mezi kandidátními primery.
Pokud v tomto okamžiku máte několik kandidátních primerů, můžete vybrat jeden nebo několik, které jsou na 3′ konci bohatší na A-T. Ty mají podle některých badatelů tendenci působit o něco specifičtěji. Možná budete chtít použít více než jeden primer, čímž maximalizujete pravděpodobnost úspěchu.
Pokud nemáte žádné kandidáty, kteří by vyhověli výše uvedeným kritériím, budete možná nuceni zmírnit přísnost požadavků na výběr. Nakonec test dobrého primeru spočívá pouze v jeho použití a nelze jej přesně předpovědět pomocí těchto zjednodušených pravidel palce.
Při troše štěstí však máte spoustu možností primerů. Pro projekt sestavování sekvence navrhněte více primerů, než si myslíte, že skutečně potřebujete, abyste v případě, že sekvence nebude tak dlouhá, jak jste doufali, mohli stále získat dostatek překrývajících se dat, která vám zajistí dobrý konsensus sekvence. Pro lepší potvrzení doporučujeme sekvenovat obě vlákna. Na jednom vlákně rozdělte primery na 500 až 700 nt (kratší rozestupy jsou bezpečnější!). Na opačném vlákně umístěte primery odstupňovaně od primerů prvního vlákna, jak je znázorněno níže: