Yksi tärkeimmistä tekijöistä onnistuneessa automatisoidussa DNA-sekvensoinnissa on oikea alukkeiden suunnittelu. Tässä asiakirjassa kuvataan prosessin vaiheet ja tärkeimmät sudenkuopat, joita on syytä välttää.
**** Käytä tietokonetta alukkeiden suunnitteluun ****
Suositamme lämpimästi tietokoneen käyttämistä alukkeiden suunnittelussa, jotta voidaan tarkistaa tietyt kohtalokkaat suunnitteluvirheet. Lukuisat ohjelmat pystyvät suorittamaan tämän analyysin. Etsi esimerkiksi ”Primer3” Internetistä.
Joitakin peruskäsitteitä: Jos säikeet ja alukkeiden suuntautuminen hämmentävät sinua, lue tämä.
Sekvensointialukkeiden on kyettävä kiinnittymään kohde-DNA:han ennustettavassa paikassa ja ennustettavalla säikeellä. Lisäksi niiden on kyettävä pidentymään Taq-DNA-polymeraasilla.
Jotkut ihmiset ovat hämmentyneitä siitä, miten DNA-sekvenssiä tutkitaan sopivan alukesekvenssin valitsemiseksi. Seuraavassa on muutamia asioita, jotka aloittelijoiden on hyvä muistaa:
- Sekvenssit kirjoitetaan aina 5′:stä 3′:een. Tämä sisältää templaatti-DNA:n sekvenssin (jos se on tiedossa), sen vektori-DNA:n sekvenssin, johon se lisätään, ja ehdotettujen alukkeiden sekvenssin. Älä koskaan kirjoita alukesekvenssiä väärinpäin, tai saat vain itsesi ja muut sekaisin.
- Polymeraasi pidentää aina alukkeen 3′-päätä, ja lukemasi sekvenssi on samaa säiettä (sense tai anti-sense) kuin itse aluke.
- Jos siis valitset alukesekvenssin, jonka voit lukea lähdesekvenssissäsi (esimerkiksi vektorissa), saamasi sekvenssi ulottuu alukkeen oikeasta (3′) päästä.
- Kääntäen, jos valitset alukkeen vastakkaiselta säikeeltä kuin mitä ”lähdesekvenssi” lukee, tuloksena oleva sekvenssi lukee vasemmalle.
Tässä on pari esimerkkiä:
Asettele, että sinulla on vektori, jonka monikloonauskohdan (Multiple Cloning Site, ’MCS’) ympärillä on seuraava sekvenssi:
TTAGCTACTGCTTGATGCTAGTACTACATCTAGTGCTAGATGGATCCGAATTCGCTGATGCTCATATGTTAATAAAGAC ^ ^ | | BamHI EcoRI
Jos kloonasit kiinnostavan DNA:n BamHI- ja EcoRI-kohtien väliin, voisit sekvensoida käyttämällä aluketta ’CTTGATGCTAGTAGTACTACTACATC’ (muista – se kirjoitetaan 5′:stä 3′:iin), ja saisit ytimestä seuraavan sekvenssin:
TAGTGCTAGATGAATTCGCTGATGC...(etc.)
Entä jos haluaisit sekvenssin toiselta säikeeltä – Eco:n ja Bam:in väliseltä säikeeltä – sen sijaan? Siinä tapauksessa sinun on valittava jokin oikeanpuoleinen sekvenssi ja käänteiskomplementoitava se ennen oligon pyytämistä. Valitse jokin sekvenssi yllä olevasta kuvasta:
CTGATGCTCATATGTTAATA
Tämä EI ole alukesekvenssi – se on kopioitu sanatarkasti yllä olevasta sekvenssistä. Itse asiassa, jos käyttäisit tätä sekvenssiä alukkeena, sekvensointi etenisi oikealle, poispäin insertistäsi. Sen sijaan käänteiskomplementoi tämä sekvenssi:
TATTAACATATGAGCATCAG
Nyt tämän pitäisi tuottaa vastakkaisen säikeen sekvenssi:
CGAATTCATCTAGCACTA...(etc.)
Jotain hienoa: Vain harvoin sekvensointi todella näyttää nukleotidit välittömästi alukkeen jälkeen. Olen ottanut yllä olevissa esimerkeissä hieman didaktista vapaata kättä.
Muutamia edistyneempiä käsitteitä: How to Design a Primer that Works.
Yleensä aloitat jonkin pienen määrän tunnettua sekvenssiä, jota haluat laajentaa. Näin menetellään:
I. Suunnittele alukkeet vain tarkasta sekvenssidatasta. Automaattisessa sekvensoinnissa (ja itse asiassa missä tahansa sekvensoinnissa) on äärellinen todennäköisyys tuottaa virheitä. Liian kaukana alukkeesta saatua sekvenssiä on pidettävä kyseenalaisena. Sen määrittämiseksi, mikä on ”liian kaukana”, suosittelemme asiakkaitamme lukemaan muistion Interpretation of Sequencing Chromatograms (Sekvenssikromatogrammien tulkinta), jossa kuvataan, miten ABI:n sekvenssilaitteilla saatujen tietojen paikkansapitävyyttä voidaan arvioida. Valitse alukkeen sijoittamista varten alue, jossa sekvenssivirheen mahdollisuus on pieni. II. Rajoita haku alueisiin, jotka vastaavat parhaiten tavoitteitasi.
Olet ehkä kiinnostunut maksimoimaan saadun sekvenssidatan, tai sinun on ehkä tutkittava sekvenssiä vain hyvin tietyssä kohdassa templaattia. Tällaiset tarpeet sanelevat hyvin erilaisia alukkeiden sijoitteluja.
- Maksimoi saatu sekvenssi ja minimoi samalla virheiden mahdollisuus:
Yleisesti sinun tulisi suunnitella alukkeet niin pitkälle 3′:iin kuin pystyt, niin kauan kuin voit luottaa sen sekvenssin tarkkuuteen, josta alukkeet on otettu. Vastakkaisilla säikeillä olevat alukkeet tulisi sijoittaa mahdollisimman paljon porrastetusti. - Kohdennettu sekvensointi tietylle alueelle:
Sijoittelet alukkeen niin, että haluttu sekvenssi osuu kromatogrammin tarkimmalle alueelle. Sekvenssidata on usein tarkinta noin 80-150 nukleotidin päässä alukkeesta. Älä luota siihen, että näet hyvän sekvenssin alle 50 nukleotidin etäisyydellä alukkeesta tai yli 300 nt:n etäisyydellä (vaikka saamme usein sekvenssin, joka alkaa heti alukkeen jälkeen, ja palautamme usein 700 nt:n tarkan sekvenssin).
III. Paikannetaan ehdolla olevat alukkeet:
Tunnista potentiaaliset sekvensointialukkeet, jotka tuottavat vakaan emäsparin templaatti-DNA:n kanssa syklisekvensointiin soveltuvissa olosuhteissa. On erittäin suositeltavaa käyttää tietokonetta tässä vaiheessa. Ehdotetut alukkeen ominaisuudet:
- Pituuden tulisi olla 18-30 nt, optimaalisen pituuden ollessa 20-25 nt. (Tosin olemme onnistuneet joissakin tapauksissa käyttämään alukkeita, jotka ovat pidempiä kuin 30 ja lyhyempiä kuin 18).
- G-C-pitoisuus 40-60 % on suotavaa.
- Tm:n tulisi olla 55 C ja 75 C välillä. Varoitus: vanha ”4 astetta jokaista G-C:tä kohti, 2 astetta jokaista A-T:tä kohti” -sääntö toimii huonosti, erityisesti oligojen ollessa lyhyempiä kuin 20 tai pidempiä kuin 25 nt. Kokeile sen sijaan:
Tm = 81.5 + 16.6* log + 0.41*(%GC) - 675/length - 0.65*(%formamide) - (%mismatch)
Internetissä on Tm-laskuri, jota voit kokeilla osoitteessa http://www.rnature.com/oligonucleotide.html.
IV. Hylkää alukkeet, jotka osoittavat ei-toivottua itsehybridisaatiota.
Alukkeet, jotka voivat itsehybridisoitua, eivät ole käytettävissä hybridisaatiota varten templaattiin. Vältä yleensä alukkeita, jotka voivat muodostaa itsensä kanssa 4 tai useampia peräkkäisiä sidoksia tai yhteensä 8 tai useampia sidoksia. Esimerkki marginaalisesti ongelmallisesta alukkeesta:
5'-ACGATTCATCGGACAAAGC-3' |||| |||| 3'-CGAAACAGGCTACTTAGCA-5'
Tämä oligo muodostaa itsensä kanssa huomattavan stabiilin dimeerin, jossa on neljä peräkkäistä sidosta kahdessa paikassa ja yhteensä kahdeksan säikeiden välistä sidosta.
Alukkeet, joiden 3′-päät hybridisoituvat edes ohimenevästi, pidentyvät polymeraasin vaikutuksesta, jolloin alukkeet menevät pilalle ja synnyttävät vääriä kaistoja. Ole hieman tiukempi 3′-dimeerien välttämisessä. Esimerkiksi seuraava alukke itsedimeroituu täydellisellä 3′ hybridisaatiolla itseensä:
5'-CGATAGTGGGATCTAGATCCC-3' |||||||||||||| 3'-CCCTAGATCTAGGGTGATACG-5'
Yllä oleva oligo on melko huono ja aiheuttaa lähes taatusti ongelmia. Huomaa, että polymeraasi pidentää 3′-päätä sekvensointireaktion aikana, jolloin saadaan hyvin vahva sekvenssi ACTATGC. Nämä kaistat näkyvät ”oikean” datan alussa valtavina piikkeinä, jotka peittävät oikean sekvenssin. Useimmat alukkeiden suunnitteluohjelmat havaitsevat tällaiset itsedimeroituvat alukkeet oikein ja varoittavat sinua välttämään niitä.
Huomaa kuitenkin, että mikään tietokoneohjelma tai nyrkkisääntöarvio ei pysty tarkasti ennustamaan alukkeen onnistumista tai epäonnistumista. Marginaaliselta vaikuttava pohjamaali saattaa toimia hyvin, kun taas toinen virheettömältä vaikuttava pohjamaali ei välttämättä toimi lainkaan. Vältä ilmeisiä ongelmia, suunnittele parhaat mahdolliset alukkeet, mutta jos sinulla on vain vähän vaihtoehtoja, kokeile muutamaa ehdolla olevaa aluketta mahdollisista puutteista riippumatta.
V. Tarkista alukkeen paikkaspesifisyys. Suorita sekvenssihomologiahaku (esim. piste-plot-homologiavertailu) kaikkien tunnettujen templaattisekvenssien läpi vaihtoehtoisten alukekohtien tarkistamiseksi. Hävitä kaikki alukkeet, joilla on ”merkittävä” taipumus sitoutua tällaisiin paikkoihin. Voimme antaa vain summittaisia ohjeita siitä, mikä on ”merkittävää”. Vältä alukkeita, joissa on vaihtoehtoisia kohtia, joilla on 1) yli 90 prosentin homologia ensisijaisen kohdan kanssa tai 2) yli 7 peräkkäistä homologista nukleotidia 3′-päässä tai 3) joiden runsaus on yli 5-kertainen aiottuun alukekohtaan verrattuna. VI. Valinta ehdolla olevien alukkeiden joukosta.
Jos tässä vaiheessa sinulla on useita alukkeitaehdokkaita, voit valita yhden tai muutaman, joiden 3′-päässä on enemmän A-T:tä. Näillä on joidenkin tutkijoiden mukaan taipumus olla hieman spesifisempiä toiminnaltaan. Saatat haluta käyttää useampaa kuin yhtä aluketta, jolloin onnistumisen todennäköisyys maksimoituu.
Jos sinulla ei ole yhtään ehdokasta, joka selviytyisi edellä mainituista kriteereistä, joudut ehkä lieventämään valintavaatimusten tiukkuutta. Viime kädessä hyvän alukkeen testi on vasta sen käytössä, eikä sitä voida ennustaa tarkasti näillä yksinkertaistetuilla nyrkkisäännöillä.
Onneksi sinulla on kuitenkin runsaasti vaihtoehtoja alukkeiksi. Suunnittele sekvenssin kokoamisprojektia varten enemmän alukkeita kuin uskot todella tarvitsevasi, jotta jos sekvenssi ei olekaan niin pitkä kuin toivoit, saattaisit silti saada riittävästi päällekkäistä dataa, joka takaa sinulle hyvän sekvenssikonsensuksen. Suosittelemme, että sekvensoit molemmat säikeet paremman varmistuksen saamiseksi. Toisessa säikeessä alukkeiden väli on 500-700 nt (lyhyempi väli on turvallisempi!). Aseta vastakkaisella säikeellä alukkeet porrastetusti etäälle ensimmäisen säikeen alukkeista, kuten alla on kuvattu: