GenetiikkaTerveys

Mitä tietoa shiban toistojaksoista voi saada irti?

Viikonlopun bonuksena pieni genetiikka-annos. Tutkitaan VGL-geenilaboratorion monimuotoisuustestin toistojaksoja.

Koiralla on arviolta 19 000 geeniä, joten on epätodennäköistä, että juuri nämä testiin valitut toistojaksot olisivat markkereita geenialueelle, jolla sijaitsee jokin samanperintäinen geenivirhe. Silti. Kun tällainen geenitason tutkimustulos nyt on olemassa, niin katotaan sitä tarkemmin.

Jos Entsyymin geenitestipaneelista poimitaan sukusolujen geeniloton takia samanperintäisiksi muuttuneet toistojaksot, jää jäljelle rinkuloidut:

…mikä on hieman creepyä, koska tuossa olisi mun vakiolottorivillä 4 oikein.

Sitten mennään geenilabran shibatietokannasta katsomaan, miten yleisiä tai harvinaisia rodussa on nuo Tsyymin versiot. Tällä hetkellä versioiden yleisyydet perustuvat 159 testattuun shibaan. Testissä ei muuten mitenkään varmennettu sitä, että lähetetty näyte on puhdasrotuisesta shiba inusta. On käynyt mielessä, että mahtaako ne kaikkein heterotsygoottisimmat yksilöt olla jenkkien takapihakasvatuksen koiria, joissa on ollut mukana ns. uutta verta. Statsisivu löytyy täältä: https://vgl.ucdavis.edu/canine-genetic-diversity/shiba-inu/stats

2 (AHT137) 145/145 0.101
6 (AHTk211) 91/91 0.343
7 (AHTk253) 292/292 0.097
8 (C22.279) 120/120 0.217
18 (REN162C04) 210/210 0.352
21 (REN247M23) 270/270 0.531
22 (REN54P11) 238/238 0.198
29 (VGL2009) 15/15 0.085

Suluissa on toistojaksojen viralliset nimet, joita tarvitaan kohta. Perässä on kunkin version yleisyyslukema tutkituissa shiboissa. Maksimi olisi 1.000, jolloin kaikilla shiboilla olisi kyseinen versio tuplana, eikä muita versioita olisi lainkaan. Koska shiboja on mukana 159 ja jokaisella on 2 kpl jokaista toistojaksoa, tarkottaisi yhdestä shibasta vain yhtenä kopiona löytynyt versio yleisyyttä 1 (159 x 2) = 0.003. Muutamia tuollaisia taulukossa todella näkyy. Jos yleisyyslukema on 0.1:n pintaan, niin versiota on löytynyt 8-16 shibalta. Koska Tsyymin harvinaisimmat markkerit kiinnostaa (joskin näidenkin yleisyys on mielestäni liiallinen), niin valitaan jatkoon nuo kolme boldattua toistojaksoa:

AHT137

AHTk253

VGL2009

Missä te sijaitsette koiran genomissa ja onko aivan naapurissanne jotain tunnettuja geenejä? Kirjoitan tätä on the go, joten en itekään vielä tiedä, miten juttu etenee.

No niin, löytyi taustatietoa geenitestin markkereille. Kyseessä on International Society for Animal Geneticsin (ISAG) suosittelema testipaneeli koirien polveutumismäärityksiin. Lisäksi VGL-nimiset markkerit on labran omia, uudempia markkereita. Tsyymin kaks kiinnostavaa ahtimarkkeria on listattu. Nyt selvisi, että ne sijaitsevat koiran kromosomeissa (Canis FAmiliaris) numero 23 ja 11. Mutta löytyykö tarkempaa sijaintia…

PubMedin alaosioista löytyi koiran genomi interaktiivisessa muodossa. Nyt kun tiietään, mistä kromosomeista hakea, niin…

Niin ei löydy vielä mitään. Joko markkereiden lokuksia ei ole merkitty tuonne tai ne on siellä jollain muulla nimellä. Katsotaan saataisiinko muualta selville tarkempi numerollinen ”osoite” noille markkereille. Tuo genomihäkkyrä näyttää kauhistuttavan sekavalta.

Vaihdetaan lähestymistapaa. Aikasemmassa taulukossa oli muutakin arvokasta tietoa kuin kromosomien nimet. Nimittäin alukesekvenssit. Markkerin lähellä DNA:n kirjaimet on nuo, mitä forward sequence -sarakkeessa lukee. Netistä löytyy hauska työkalu nimeltä BLAST, jota kuka tahansa voi käyttää. Jos löydät jostain pätkän DNA:ta tai proteiinia ja haluat tietää, mistä eliöstä se on peräisin, niin heität sekvenssin tänne ja painat ”Blast!”

Käskin sen etsiä koiran geeneistä, ettei haku kestäisi liian pitkään. Ja mitä löytyi…

Täydellinen mätsi kromosomista 11 kuten pitikin! Nyt tiiämme markkerin summittaisen sijainnin kromosomissa: 2743998. Tätä pitäisi voida hakea äskeisessä genomiselaimessa. Samalla paikkatiedolla löytyy kuitenkin ihan eri sekvenssi. Genomiselaimen DNA on vissiin Tasha-bokserin referenssigenomi, ja tämä on ollut labbis. MUTTA, selvisi samalla, että referenssigenomistakin voi hakea DNA:n kirjaimilla. Täältä löytyi AHT137-markkerin aluke, eli markkerin pitäisi sijaita jompaan kumpaan suuntaan tuosta. Mä en tiedä, että kumpaan, joten huomioidaan molemmat suunnat.

Zoomataan etemmäs ja katotaan, asuuko naapurustossa tunnettuja geenejä.

Onhan niitä. En tiiä, miten kaukana markkerista joku geeni voi vielä sijaita, että se periytyy sukusolujen muodostuessa yhessä markkerin kanssa eikä crossing over -ilmiö erota niitä toisistaan. Varmaan ainakin tuon alarivillä sijaitsevan PROP1-geenin etäisyydellä, koska siitä on tutkimus, jossa mainitaan AHT137-markkerin läheisyys: https://pubmed.ncbi.nlm.nih.gov/10773688/ . Naapurigeenejä:

  • Sammuneita pseudogeenejä.
  • Tuntematonta proteiinia tuottavia tuntemattomia geenejä.
  • Hajureseptorigeeni.
  • CLK4. Aktivaattoriproteiini, saattaa liittyä geeninsäätelyyn. Yhdistetty Fanconin anemiaan.
  • COL23A1. Kollageenin alayksikkö.
  • Äskeinen PROP1. Hormonitoimintaan vaikuttava geeninsäätelyproteiini.
  • Neljä eri sinkkisormiproteiinia. Niissä kaikissa sojottaa sormen näkönen uloke, jossa on aktiivisessa kohdassa sinkkiatomi. Geeninsäätelyproteiineja. Yhdistetään mm. hämäräsokeuteen ja selkärankareumaan.
  • PHYKPL eli 5-fosfohydroksyyli-L-lysiinifosfolyaasi. Kuulostaa hyvältä ja tekee jotain mitokondrioissa.
  • GRM6. Glutamaattireseptori. Liittyy keskushermoston toimintaan.
  • ADAMTS2. Liittyy kollageenin muodostumiseen.

Sama toiselle markkerille AHTk253, välivaiheet skipattu

Naapurigeenejä:

  • EXOG. Proteiini, joka pystyy katkaisemaan DNA:n.
  • ACVR2B. Kasvutekijäreseptori.
  • XYLB. Perusmetabolian entsyymi.
  • Kaksi kanavaproteiinia, joiden kautta aineet pääsevät kalvon läpi.
  • SCN5A. Sydänlihaksen supistumiseen liittyvä ionikanavaproteiini.
  • OXSR1. Hapetusvaurioihin reagoiva säätelyproteiini.
  • MYD88. Immuunijärjestelmän toimintaan liittyvä proteiini.

Ja vielä kolmannelle markkerille VGL2009

Tämän primeri ccatttaccagaatttgaagctg oli kehitetty paperissa Developmental validation of DogFiler, a novel multiplex for canine DNA profiling in forensic casework. Primeri sijaitsee tarkotuksella etempänä varsinaisesta toistojaksosta. Toistojakson sijainniksi on suoraan merkitty 20: 9290711, joten katsotaan, mitä tuon kohdan ympäriltä löytyy.

  • Oksitosiinireseptori.
  • RAD18. Liittyy DNA-vaurioiden korjaamiseen.
  • Mitokondrion energiantuotantokoneiston proteiini.
  • Kaveoliini. Solukalvoproteiini, joka liittyy siihen, miten solu ottaa tavaraa sisäänsä.

Siinä viikonlopun genetiikkabonus. Idea ja mahdollisuudet tuli toivon mukaan esille, analyysistä en mee niin takuuseen.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *