Ennen kuin se alkaa:
On 5 lokakuun, 2021 by adminAbstract
Translaation säätelyllä on tärkeä rooli sekä normaaleissa fysiologisissa olosuhteissa että sairaustiloissa. Tämä säätely edellyttää cis-säätelyelementtejä, jotka sijaitsevat enimmäkseen 5′ ja 3′ UTR:ssä, ja trans-säätelytekijöitä (esim. RNA:ta sitovia proteiineja (RBP)), jotka tunnistavat RNA:n erityispiirteitä ja ovat vuorovaikutuksessa translaatiokoneiston kanssa muokatakseen sen toimintaa. Tässä artikkelissa käsittelemme 5′ UTR-välitteisen säätelyn tärkeitä näkökohtia antamalla yleiskatsauksen tällä alueella esiintyvien tärkeimpien elementtien, kuten uORF:n (ylävirran avoin lukukehys), sekundäärirakenteiden ja RBP:itä sitovien motiivien ominaispiirteisiin ja toimintaan sekä translaation säätelyn erilaisiin mekanismeihin ja vaikutukseen, joka niillä on geenien ilmentymiseen ja ihmisen terveyteen, kun ne ovat dereguloituja.
1. Translaation säätely
Geeniekspressiota voidaan moduloida useilla tasoilla kromatiinin modifikaatiosta mRNA:n translaatioon. Transkriptionaalisen säätelyn merkityksestä huolimatta on tässä vaiheessa selvää, että mRNA-tasoja ei voida käyttää ainoana parametrina solun proteiinipitoisuuden perustelemiseksi. Itse asiassa laboratoriomme äskettäisessä tutkimuksessa totesimme, että suora korrelaatio mRNA:n ja proteiinin välillä on olemassa alle kolmanneksella analysoiduista geeneistä ihmisen solulinjassa. Lisäksi analyysimme osoitti, että translaation säätely vaikuttaa merkittävästi proteiinivaihteluun, sillä useat translaatioon liittyvät parametrit, kuten 5′ UTR, 3′ UTR, koodaavan sekvenssin pituus, uORF:ien ja aminohappokoostumuksen esiintyminen osoittivat hyviä korrelaatioita saatujen mRNA/proteiinisuhteiden kanssa. Translaation säätely toimii tärkeänä kytkimenä, kun tarvitaan nopeita muutoksia geenien ilmentymisessä vastauksena sisäisiin ja ulkoisiin ärsykkeisiin (PDGF2, VEGF, TGFβ ovat esimerkkejä näin ohjatuista geeneistä). Translaation säätelyllä on myös merkittävä rooli kehityksen ja solujen erilaistumisen aikana, sillä se muuttaa tiettyjen mRNA:n osajoukkojen ilmentymistasoja tietyn aikaikkunan aikana, kun taas suurin osa transkripteistä pysyy muuttumattomana (katsaus artikkelissa ).
Tässä artikkelissa keskitymme 5′ UTR:n välityksellä tapahtuvan säätelyn merkitykseen ja eri toiminnallisiin elementteihin, joita tällä alueella on, lukuun ottamatta IRES:ää, jota käsitellään tämän numeron eri artikkelissa. Tärkeimmät 5′ UTR:n säätelyelementit ovat sekundaarirakenteet (mukaan lukien IRES), RNA:ta sitovien proteiinien sitoutumiskohdat, uAUG:t ja uORF:t (kuva 1).
5′ UTR:ssä esiintyvät säätelyelementit.
2. 5′ UTR
Keskimääräinen 5′ UTR:n pituus on ~100 – ~220 nukleotidia eri lajeissa . Selkärankaisilla 5′ UTR on yleensä pidempi transkriptioissa, jotka koodaavat transkriptiotekijöitä, protoonkogeenejä, kasvutekijöitä ja niiden reseptoreita sekä proteiineja, jotka translatoituvat huonosti normaalioloissa . Korkea GC-pitoisuus on myös konservoitunut piirre, ja lämminveristen selkärankaisten kohdalla se ylittää 60 prosenttia. Hiusnauharakenteiden yhteydessä GC-pitoisuus voi vaikuttaa proteiinien translaatiotehokkuuteen riippumatta hiusnauhan lämpöstabiilisuudesta ja hiusnauhan sijainnista . Eukaryoottisten mRNA:iden UTR:ssä on myös erilaisia toistoja, joihin kuuluvat lyhyet ja pitkät interspersed elementit (SINE:t ja LINE:t), yksinkertaiset sekvenssitoistot (SSR:t), minisatelliitit ja makrosatelliitit .
Translaation initiaatio eukaryooteissa edellyttää ribosomaalisten alayksiköiden rekrytoitumista jompaan kumpaan niistä, jotka sijaitsevat 5′:ssä, eli 5′:n ja 5′:n m7G:n korkkirakenteessa. Aloituskodoni sijaitsee yleensä kaukana alavirtaan, mikä edellyttää ribosomien siirtymistä tähän paikkaan. Tämä liike näyttää olevan epälineaarista joidenkin mRNA:iden kohdalla (eli ribosomaaliset alayksiköt näyttävät ohittavan (shunttaavan) 5′ UTR:n segmenttejä, kun ne liikkuvat AUG:n suuntaan). Shunttaaminen voisi mahdollistaa sen, että mRNA:t, jotka sisältävät uAUG:ia tai hiusneularakenteita, voidaan kääntää tehokkaasti. Tärkeitä esimerkkejä ovat kukkakaalimosaiikkiviruksen ja adenoviruksen mRNA:t. Ribosomaalisen shunttauksen mekanismi on melko monimutkainen ja edellyttää mRNA-rRNA:n emäsparin muodostamista.
Geenit, joiden transkriptien 5′ UTR:ssä on eroja, ovat suhteellisen yleisiä. 10-18 % geeneistä ilmentää vaihtoehtoista 5′ UTR:ää käyttämällä useita promoottoreita, kun taas UTR:n sisällä tapahtuvan vaihtoehtoisen pilkkomisen arvioidaan vaikuttavan 13 %:iin nisäkkäiden transkriptomin geeneistä . Nämä 5′ UTR:n vaihtelut voivat toimia tärkeinä kytkiminä geenien ilmentymisen säätelyssä. Kaksi tärkeää esimerkkiä ovat syöpään liittyvät geenit BRCA1 (rintasyöpä 1) ja TGF-β (transformoiva kasvutekijä β). BRCA1 on kasvainsuppressori, joka mutatoituu usein rintasyövässä ja jolla on tehtäviä solusyklissä, apoptoosissa ja DNA-vaurioiden korjauksessa. BRAC1 tuottaa kahta erilaista transkriptiä, jotka ovat peräisin kahdesta eri promoottorista ja joiden 5′ UTR:ssä on siksi eroja. Lyhyempi transkripti ilmentyy sekä syöpäkudoksessa että muussa rintakudoksessa ja translatoituu tehokkaasti, kun taas pidempi transkripti ilmentyy pääasiassa rintasyövässä. Useiden uAUG:ien esiintyminen ja monimutkaisempi rakenne vaikuttavat dramaattisesti tämän pidemmän transkriptin translaatioon. Tämä aiheuttaa BRAC1:n kokonaismäärän vähenemisen kasvainsoluissa, mikä johtaa kasvun eston helpottumiseen . TGF-β on osallisena monissa prosesseissa, joihin kuuluvat solujen proliferaatio, migraatio, haavojen korjaus, kehitys, kasvainten synty ja immunosuppressio. Tunnettuja isomuotoja on kolme: β1, β2 ja β3. TGF-β3 tuottaa kaksi vaihtoehtoista transkriptiä: 3,5 kb:n transkripti, jolla on hyvin pitkä 5′ UTR (1,1 kb), ja 2,6 kb:n transkripti, jolla on lyhyempi 5′ UTR (0,23 kb). Pidemmässä transkriptissa olevat 11 uORF:ää estävät dramaattisesti sen translaatiota, kun taas lyhyempi transkripti translatoituu tehokkaasti .
3. Säätely sekundaarirakenteiden avulla
Sekundaarirakenteet voivat toimia tärkeinä säätelyvälineinä 5′ UTR:ssä. Sekundaarirakenteiden on todettu olevan erityisen yleisiä transkriptiotekijöitä, protoonkogeenejä, kasvutekijöitä ja niiden reseptoreita koodaavissa mRNA:issa sekä proteiineissa, jotka translatoituvat huonosti normaalioloissa. >90 %:lla näiden luokkien transkripteista on 5′ UTR, joka sisältää stabiileja sekundäärirakenteita, joiden keskimääräiset vapaat energiat ovat alle -50 kcal/mol. 60 % näistä stabiileista sekundäärirakenteista on sijoitettu hyvin lähelle cap-rakennetta . Nämä rakenteet estävät hyvin tehokkaasti translaatiota. Itse asiassa lähellä korkkia sijaitseva hiusnauha, jonka vapaa energia on -30 kcal/mol, riittäisi estämään preinitiokompleksin pääsyn mRNA:han. Kun hiusneulat sijaitsevat kauempana 5′ UTR:ssä, vapaan energian on oltava yli -50 kcal/mol, jotta ne voisivat estää translaation. Vakaa sekundaarirakenne voi vastustaa helikaasi elF4A:n purkautumisaktiivisuutta. Tämä vaikutus voidaan osittain voittaa yli-ilmentämällä elF4A:ta yhdessä elF4B:n kanssa . mRNA:t, joilla on hyvin strukturoitu 5′ UTR, kuten proto-onkogeenit ja muut kasvutekijät, käyttävät korkki-riippuvaista translaation aloitusta. Ei ole yllättävää, että translaation initiaatiokoneiston komponenttien, kuten elf4E:n, yliekspressio on yhdistetty kasvainten syntyyn (tarkasteltu artikkelissa ).
Geeni TGF-β1 on hyvä esimerkki sekundaarirakenteen välittämästä translaation estosta . Evoluutiossa konservoitunut motiivi 5′ UTR:ssä muodostaa vakaan kantasilmukan. Tämä rakenne ei kuitenkaan yksinään riitä estämään translaatiota. TGF-β1:n translaation esto riippuu RNA:ta sitovan proteiinin YB-1:n lisääntyneestä sitoutumisesta TGF-β1-transkriptiin . Tämän jälkeen ehdotettiin, että YB-1 sitoutuu TGF-β1:n 5′ UTR:ään suurella affiniteetilla sen GC-pitoisuuden ansiosta ja tekee yhteistyötä kantasilmukan kanssa estääkseen TGF-β1:n translaation helpottamalla dupleksin muodostumista .
4. RNA:ta sitovien proteiinien harjoittama säätely
Ihmisen perimän ennustetaan koodaavan noin 1000 RNA:ta sitovaa proteiiniä (RNA Binding Proteins, RBPs), joista suuri osa osallistuu translaatioon. Ne voidaan luokitella kahteen pääryhmään: RBP:t, jotka ovat osa translaation peruskoneistoa ja joita tarvitaan kaikkien ekspressoitujen mRNA:iden translaatioon (esimerkkejä: PABPI, elf4E), ja RBP:t, jotka toimivat valikoivammin kontrolloimalla joko positiivisesti tai negatiivisesti tiettyjen kohde-mRNA:iden translaatiotasoja (esimerkkejä: HuR, Musashi1). Jälkimmäisen ryhmän osalta on havaittu, että RBP:t voivat käyttää erilaisia mekanismeja translaation lisäämiseksi tai estämiseksi. Vaikka tiedetään useita poikkeuksia, voidaan sanoa, että RBP:t tunnistavat usein tiettyjä motiiveja UTR:ssä ja ovat vuorovaikutuksessa translaatiokoneiston kanssa ekspression kontrolloimiseksi. Translaation häirintä tapahtuu tavallisesti initiaatiovaiheen aikana (tarkasteltu teoksessa ).
Parhaiten karakterisoitu esimerkki RBP-välitteisestä säätelystä, jossa 5′ UTR:t ovat osallisena, ovat raudan säätelyproteiinit (IRP 1 ja 2). Nämä proteiinit tunnistavat erittäin konservoituneen, noin 30 nukleotidin pituisen kantasilmukkarakenteen, joka tunnetaan nimellä rautavaste-elementti (iron response element, IRE). Tärkeimpiin ominaisuuksiin kuuluu kuusinukleotidisilmukka, jonka sekvenssi on CAGYCX (Y = U tai A; X = U, C tai A), ja 5 bp:n pituinen ylempi varsi, joka on erotettu vaihtelevan pituisesta alemmasta varresta parittomalla sytosiinilla. Tämä säätely on ratkaisevan tärkeää solujen rautahomeostaasin ylläpitämisessä, sillä tämä järjestelmä säätelee useiden raudan varastointiin ja aineenvaihduntaan liittyvien mRNA:iden, kuten ferritiinin, mitokondriaalisen aconitaasin, sukkinaattidehydrogenaasi-rautaproteiinin, erytroidi-5-amino-olevulinaattisyntetaasin (eALAS) ja rautaa eksportoivan molekyylin nimeltä ferroportiini (FPN1) ilmentymistä. Kun solujen rautapitoisuudet ovat alhaiset, IRP1 ja IRP2 sitoutuvat IRE:hen ja estävät translaation myöhemmän ORF:n. Kun solunsisäiset rautapitoisuudet ovat korkeat, molempien IRP:iden RNA:ta sitova aktiivisuus vähenee (kuva 2(a)). IRE:t pyrkivät sijoittumaan lähelle korkkia, mikä aiheuttaa 40S-ribosomaalisten alayksiköiden transkriptiin sitoutumisen steerisen estymisen. Kun IRE-IRP-kompleksi sijaitsee kauempana korkista, se ei vaikuta 40S:n rekrytoitumiseen, vaan estää ribosomien skannauksen (ks. kohta ). Mielenkiintoinen IRE/IRP-mekanismin ohitus voidaan havaita rautaa nälkiintyneissä duodenaali- ja erytroidien esiasteiden soluissa. Ylävirran promoottoria käytetään tuottamaan FPN1-pre-mRNA:ta, joka sisältää vielä yhden eksonin, joka on vaihtoehtoisella splikoinnilla liitetty IRE:n 3′:ssä olevaan splikointiakseptoriin. Syntyy kypsä FPN1-transkripti, joka sisältää saman avoimen lukukehyksen; 5′ UTR ei kuitenkaan sisällä IRE:tä. Siksi nämä solut ilmentävät vaihtoehtoista FPN1-isoformia raudasta riippumattomalla tavalla . IRE:hen vaikuttavat mutaatiot voivat johtaa sairauksiin. Tällainen on perinnöllinen hyperferritinemia-kataraktin oireyhtymä (HHCS), geneettinen autosomaalinen dominantti sairaus, jossa ferritiinin aggregoituminen ja kiteytyminen linssissä johtaa molemminpuoliseen kaihiin . (a) Raudanpuutteisissa soluissa IRP:t sitoutuvat ferritiini-mRNA:n 5′ UTR:ään lokalisoituneeseen IRE:hen ja estävät sen translaation. Kun solun rautapitoisuus nousee, Fe:tä sisältävä kompleksi sitoutuu IRP:iin. Näin nämä proteiinit muuttuvat allosterisesti, mikä vähentää IRP-IRE-sitoutumista ja mahdollistaa ferritiini-mRNA:n translaation. (b) msl-2 -geenin säätely naaraskärpäsillä. Transkription jälkeen ytimessä SXL sitoutuu spesifisesti msl-2 pre-mRNA:n U-rikkaisiin intronialueisiin ja estää intronin poistumisen (1). Sytoplasmassa SXL sitoutuu samoihin elementteihin, jotka sijaitsevat nyt kypsän msl-2-mRNA:n 5′ UTR:ssä, tehostaa translaation käynnistymistä ylävirran ORF:ssä (2) ja estää pää-ORF:n translaation (3). msl-2-mRNA:n 3′ UTR:ssä olevat säätelyelementit eivät olleet edustettuina.
RBP-välitteinen säätely voi olla hyvin monimutkaista ja sisältää useita vaiheita. Yksi hyvä esimerkki, joka osoittaa tekijöiden ja erilaisten säätelyprosessien ristikkäisvaikutuksen, on Drosophilan uros-spesifinen-letaalinen 2 (msl-2) -geeni, joka on keskeinen toimija annoskompensaatiossa. Naaraspesifinen RNA:ta sitova proteiini sex lethal (SXL) osallistuu msl-2:n säätelyn moniin osa-alueisiin, joissa msl-2:n ilmentyminen on estettävä (kuva 2 b). Sääntely alkaa splikointitasolta; SXL sitoutuu kahteen polyU-jaksoon, jotka sijaitsevat intronissa, joka on osa 5′ UTR:ää. Tämä prosessi aiheuttaa intronin retention ja säilyttää kriittiset sekvenssit, joita käytetään myöhemmin translaation säätelyssä . Sytoplasmassa sama SXL-proteiini toimii msl-2:n translaation repressorina kahdella eri mekanismilla, jotka tapahtuvat 3′ ja 5′ UTR:ssä . SXL sitoutuu U-rikkaisiin sekvensseihin 3′ UTR:ssä ja rekrytoi corepressoriproteiini UNR:n (N-ras:n ylävirtaan) ja PABP:n, jotka estävät pre-initiaatiokompleksin rekrytoitumisen mRNA:n 5′ päähän . Jotta msl-2:n täydellinen tukahduttaminen voidaan varmistaa, 5′ UTR:ssä tapahtuu toinen, myös SXL:n välittämä säätelyvaihe. Tähän repressioon liittyy uusi säätelymekanismi, jossa SXL:n ja uORF:n välinen ristikkäisviestintä repressoi tehokkaasti translaatiota . msl-2:n 5′ UTR sisältää kolme uORF:ää, mutta vain kolmas niistä osallistuu repressioon. Mielenkiintoista on, että tämä repressio on hyvin heikko SXL:n puuttuessa (~2-kertainen), mutta kun SXL on läsnä, SXL sitoutuu poly U-jaksoon muutaman nukleotidin päässä uAUG:stä ja lisää tämän repression yli 14-kertaiseksi. SXL vaikuttaa tehostamalla translaation käynnistymistä uAUG:n kohdalla eikä toimimalla pelkkänä skannaavien ribosomien steriittisenä pidättäjänä. Tämä vaikutus voi tapahtua SXL:n ja translaation initiaatiotekijöiden välisen vuorovaikutuksen kautta; mahdollisesti elF3-komponentin jäsenten, kuten kaksihybridiseulonta osoittaa. Tämä mekanismi vaikuttaa mahdollisesti suureen määrään mRNA:ita; 268 Drosophilan transkriptin todettiin sisältävän SXL:n sitoutumismotiiveja, jotka liittyvät uAUG:hen sopivalla etäisyydellä toisistaan. Esimerkiksi reportterikonstruktio, joka sisälsi geenin Irr47 5′UTR:n, repressoitui ~4-kertaisesti SXL-proteiinilla .
RBP:illä voi olla antagonistisia tehtäviä translaation säätelyssä. Mielenkiintoinen esimerkki on p21:n säätely replikatiivisen senesenssin yhteydessä, joka on solutila, jossa solut siirtyvät peruuttamattomaan kasvupysähdykseen. Prosessin käynnistäminen edellyttää p21:n induktiota ja cdk2-sykliini-E-kompleksien estämistä. P21:n 5′ UTR sisältää GC-rikkaan sekvenssin, joka muodostaa kantasilmukan. Tämän elementin tunnistaa kaksi RBP:tä, joilla on erilaiset ominaisuudet: CUGBP1 ja kalretikuliini (CRT). Näiden kahden proteiinin välinen kilpailu määrittää p21:n lopullisen ilmentymistason ja ratkaisee, lisääntyvätkö solut vai joutuvatko ne kasvupysähdykseen ja vanhenemiseen. CUGBP1:n sitoutuminen p21-mRNA:han lisääntyy dramaattisesti senesenssissä verrattuna nuoriin fibroblastisoluihin. Proteiinitasot eivät muutu prosessin aikana, ja aktiivisuuden lisääntyminen johtuu fosforylaatiosta. Toisaalta CRT:n IP:t osoittivat aktiivisuuden vähenevän neljä-viisinkertaiseksi senesenssisoluissa, mikä johtuu ilmentymisen vähenemisestä. Molempien proteiinien osoitettiin vaikuttavan p21:n translaatioon. CUGBP1 toimii kuitenkin aktivaattorina, kun taas CRT toimii repressorina. Koska näillä kahdella proteiinilla on vastakkainen aktiivisuus senesenssisoluissa, tutkittiin, kilpailevatko ne vuorovaikutuksesta p21:n mRNA:n kanssa ja kontrolloivatko ne sen translaatiota. Yhden proteiinin lisääntyvät määrät pystyivät kumoamaan toisen proteiinin sitoutumisen p21 mRNA:han ja sen vaikutuksen translaatioon; affiniteetti sitoutumiskohtaan on melko erilainen, sillä CUGBP1:n oli oltava sitoutumisreaktioissa neljä-kahdeksankertainen molaarinen ylijäämä CRT:hen nähden, jotta se voisi vastustaa sen sitoutumista p21 mRNA:han ja vaikuttaa sen translaatioon .
5. Säätely uORF:ien ja ylävirran AUG:ien avulla
uORF:t ja uAUG:t ovat tärkeitä säätelyelementtejä 5′ UTR:ssä. Nimensä mukaisesti uORF:t ovat sekvenssejä, jotka on määritelty alku- ja lopetuskoodoneilla pääkoodausalueen ylävirtaan, kun taas uAUG:t ovat pääkoodausalueen ylävirtaan sijaitsevia alku- ja lopetuskoodoneja, joilla ei ole ruudun alajuoksulla olevaa lopetuskoodonia. Suuri osa ihmisen transkriptomista sisältää uORF- ja/tai uAUG-sekvenssejä, joiden osuus vaihtelee 44-49 prosentin välillä. Hiiren transkriptomissa on samansuuruisia määriä. Vaikka nämä luvut saattavat kuulostaa suurilta, sekä uORF:ien että uAUG:ien esiintyvyys on harvinaisempi kuin sattuman perusteella voitaisiin olettaa, mikä viittaa siihen, että niihin kohdistuu valikoivaa painetta. uORF:t ja uAUG:t ovat yliedustettuina tietyissä alaryhmissä, kuten transkriptiotekijöissä, kasvutekijöissä ja niiden reseptoreissa sekä proto-onkogeeneissä . Sekä uORF:t että uAUG:t ovat erittäin monimuotoisia ja vaihtelevat sijainniltaan suhteessa capiin ja pää-AUG:hen, lukumäärältään transkriptiota kohti ja pituudeltaan (uORF:ien tapauksessa). Täydentävässä taulukossa 1 (lisäaineistossa, joka on saatavilla verkossa osoitteessa http://dx.doi.org/10.1155/2012/475731) on kattava luettelo ihmisen transkriptomissa esiintyvistä uORF:istä ja uAUG:ista. uORF:ien ja uAUG:ien säilymistä ei ole analysoitu laajasti. Pilottitutkimus, joka tehtiin osajoukolla ihmisen, hiiren ja rotan transkriptejä, osoitti, että molemmat elementit ovat kohtalaisen konservoituneita, sillä 38 prosenttia uORF:istä ja 24 prosenttia uAUG:ista todettiin konservoituneiksi kolmen lajin välillä. uORF:ien kohtalainen säilyvyys yhdistettynä siihen, että niiden keskipituus (20 nukleotidia) on sattumalta odotettu ja että uAUG:t tukahduttavat voimakkaammin kuin uORF:t, viittaa siihen, että monet uAUG:t on neutralisoitu evoluutiossa hankkimalla alajuoksulla oleva lopetuskodoni. Tämän jälkeen on ehdotettu, että vain muutamat uORF:t, hyvin todennäköisesti konservoituneet uORF:t, on rekrytoitu ekspression säätelyyn. Hiivassa on osoitettu, että uORF:t ovat tilastollisesti aliedustettuina 5′ UTR:ssä ja että ne on poistettu valikoivalla paineella, mikä viittaa vastaavasti siihen, että jäljelle jäävät uORF:t voivat olla osallisina translaation säätelyssä .
Vaikka kaiken kaikkiaan on ehdotettu, että uORF:t korreloivat negatiivisesti proteiinien tuotantoon tähän asti, funktionaalista aktiivisuutta on pystytty osoittamaan vain rajoitetulle määrälle uORF:eja ja uAUG:ita. Kuvassa 3 esitetään esimerkkejä siitä, miten uAUG:t voivat vaikuttaa translaatiotehokkuuteen. Merkittävimpiä ominaisuuksia, jotka voivat vaikuttaa toiminnallisuuteen, ovat mm. pitkä 5′ korkin ja uORF:n välinen etäisyys, sekvenssin säilyminen, konteksti, jossa AUG sijaitsee, ORF:n aloituskohdan vahvuus, uORF:n pituus ja AUG:ien lukumäärä 5′ UTR:ssä . On havaittu erilaisia tuloksia, kun ribosomi kohtaa uAUG:n tai uORF:n . Koska karakterisoitujen tapahtumien määrä on vielä pieni, on vaikea määritellä yleisiä mekanismeja; kuvaamme sitten muutamia hyvin karakterisoituja ja merkityksellisiä tapahtumia. Vuotava skannaus määritellään, kun osa skannauskomplekseista ohittaa uAUG:n tai uORF:n ja jatkaa seuraavan AUG:n etsimistä. Tällöin ylävirran AUG toimii ”houkutuslintuna” ORF:n AUG:sta ja toimii negatiivisena translaation säätelijänä ainakin osalla ribosomeista. Cis-vaikutteisten peptidien tuottaminen uORF:ien avulla voi vähentää translaation käynnistymistä alavirtaan sijaitsevan ORF:n kohdalla pysäyttämällä ribosomin uORF:n lopussa . Klassinen esimerkki on evolutiivisesti konservoitunut eukaryoottinen arginiini-vaimennuspeptidi (AAP), joka kontrolloi negatiivisesti sellaisten proteiinien translaatiota, jotka osallistuvat de novo -sienten arginiinin biosynteesiin korkeissa arginiinipitoisuuksissa . Tässä skenaariossa arginiini muuttaa AAP:n konformaatiota ja/tai P-kohdan ympäristöä aiheuttaen ribosomaalisen pysähtymisen AAP:n uORF:n terminaatiokodonin kohdalla . AAP vähentää myös translaation pidentymistä ribosomin pysähtymisellä, kun uORF on sijoitettu koodaavaan sekvenssiin . Toinen klassinen esimerkki uORF-välitteisestä säätelystä on peräisin hiivasta. Transkriptiotekijä GCN4:n 5′ UTR:ssä on neljä uORF:ää. Ensimmäinen neljästä uORF:stä käännetään aina tehokkaasti ravitsemusolosuhteista riippumatta. Häiriöttömässä solussa ribosomien ja initiaatiokofaktoreiden nopea uudelleenlataus mahdollistaa uORF:ien 2-4 translaation samalla kun se estää pää-ORF:n translaation. Aminohappojen niukkuuden vallitessa initiaatiotekijöitä on vähän, mikä johtaa ribosomien hidastuneeseen uudelleenlatautumiseen ja uORF:t sisältävien sekvenssien skannaamiseen. Toimiva initiaatiokompleksi kootaan uudelleen vain pääkoodaavan sekvenssin kohdalla ja GCN4-ekspressoituu. Tämä mekanismi mahdollistaa nopean reagoinnin ravitsemukselliseen stressiin . Toinen samanlainen esimerkki uORF:n kautta säädellystä ilmentymisestä on karnitiinipalmitoyylitransferaasi 1C (CPT1C) -geeni. CPT1C säätelee aivojen aineenvaihduntaa energiaylijäämätilanteissa. UORF:n läsnäolo 5′ UTR:ssä tukahduttaa ORF:n ilmentymistä. Tämä repressio kuitenkin lievittyy vasteena erityisiin stressiärsykkeisiin, kuten glukoosin puutteeseen ja palmitaatti-BSA-hoitoon . On esitetty, että uORF:t voivat myös indusoida mRNA:n hajoamista. Hiivassa testattiin sarjaa 5′ UTR-konstruktioita, jotka sisälsivät reportterina bakteeritransposonin Tn9 kissageenin. Yhden nukleotidin substituution avulla luotiin 7-kodoninen ORF kissa-geenin yläjuoksulle. uORF käännettiin tehokkaasti ja aiheutti kissan ORF:n translaation estymisen ja kissan mRNA:n destabiloitumisen. UORF:ien ja mRNA:n hajoamisen välistä yhteyttä ehdotettiin myös uORF:ia sisältävien ja ei-uORF:ia sisältävien transkriptien keskimääräisten ekspressiotasojen vertailun perusteella .
(a)
(b)
(a)
(b)
uAUG-sekvenssien vaikutus translaation säätelyyn . (a) Luciferaasitasojen vertailu, joka on saatu konstruktioista, joissa on ACT-geenin 5′ UTR (kontrolli), ja geeneistä, joissa on uAUG: WBSCR16, MFSD5 ja BCL2L13. (b) Geeneissä WBSCR16, MFSD5 ja BCL2L13 esiintyvän uAUG-sekvenssin poistaminen tai mutaatio kumoaa translaation repression, mikä näkyy luciferaasiaktiivisuuden lisääntymisenä.
Useat mutaatiot, jotka eliminoivat tai synnyttävät uAUG-sekvenssejä, jotka lopulta muuttavat proteiinien tasoja, on yhdistetty ihmisen sairauksiin. Niiden merkityksestä keskusteltiin hiljattain . Melanooman alttius voi johtua mutaatiosta, joka tuo uORF:n geenin sykliini-riippuvaisen kinaasi-inhibiittoriproteiinin (CDKN2A) 5′ UTR:ään . Perinnöllinen trombosytemia johtuu mutaatiosta, joka synnyttää liitosmuunnoksen, joka poistaa uORF:n, mikä johtaa trombopoietiinigeenin proteiinituotannon lisääntymiseen . Marie Unnan perinnöllinen hypotrikoosi johtuu mutaatiosta, joka katkaisee geenin hairless homologin 5′ UTR:ssä olevan uORF:n ja siten lisää sen ilmentymistä . Yhdessä TGF-β3-transkriptin 5′ UTR:ssä esiintyvässä uORF:ssä tapahtuvan siirtymän G:stä A:han todettiin olevan yhteydessä arytmogeeniseen oikean kammion kardiomyopatiaan/dysplasiaan (ARVC) . Toinen viiden uORF:n ryhmä, joka liittyy sairauksiin, on hiljattain testattu reportteritesteillä; niihin kuuluvat gonadien dysgeneesi (SRY) , Van der Wouden oireyhtymä (IRF6) , Carneyn kompleksi tyyppi 1 (PRKAR1A) , perinnöllinen haimatulehdus (SPINK1) ja talassaemia-β (HBB) . Luettelo tulee varmasti laajenemaan, sillä yli 500 uORF:ia luovaa tai poistavaa yksinukleotidipolymorfismia (SNP) on raportoitu.
6. Uusien säätelyelementtien etsiminen 5′ UTR:stä
Vain pieni osa ihmisen 5′ UTR:ssä sijaitsevista transkription jälkeisistä säätelyelementeistä on karakterisoitu. Nämä tunnistetut UTR-elementit on luetteloitu Graziano Pesolen ryhmän ylläpitämään UTRdb-verkkolähteeseen (http://utrdb.ba.itb.cnr.it/) . In vivo -menetelmät UTR:n posttranskriptionaalisten säätelyelementtien, erityisesti RBP:hen liittyvien elementtien, tunnistamiseksi ovat kehittyneet huomattavasti viimeisten viiden vuoden aikana syväsekvensointiteknologian ansiosta. CLIP ja RIP-Seq ovat menetelmiä, jotka perustuvat RNA-proteiinimolekyylien (RNP) eristämiseen immunoprecipitaation avulla, jota seuraa RNaasin pilkkominen ja RBP:n sitoutumiskohtien tarkka tunnistaminen syväsekvensoinnin avulla . Vaikka näillä menetelmillä toistaiseksi analysoitujen RBP:iden määrä on todella pieni (katsaus artikkelissa ), syväsekvensointitekniikan saatavuuden lisääntyessä ja menetelmien yksinkertaistuessa voidaan odottaa, että hyvin pian kartoitetaan suuri osa ihmisen RBP:n sitoutumiskohdista UTR:ssä.
Toinen vaihtoehto translaatiota säätelevien UTR-elementtien kartoittamiselle on käyttää puhtaasti laskennallisia menetelmiä, jotka pohjautuvat UTR:n sekvenssien analysointiin. Nämä menetelmät perustuvat sellaisten degeneroituneiden ribonukleotidikuvioiden tunnistamiseen, joilla on RBP:n sitoutumiskohtien odotetut ominaisuudet. Vastaavia menetelmiä on sovellettu lähes 30 vuoden ajan transkriptiota säätelevien promoottorisekvenssien tunnistamiseen. Nämä menetelmät ovat kehittymässä, niitä käytetään hyvin laajalti ja ne ovat auttaneet suuresti transkriptionaalista säätelyä koskevien tietokantojen kokoamisessa (esim. TRANSFAC). Vaikka suuri osa työstä, joka on suunnattu säätelysekvenssien analyysialgoritmien suunnitteluun ja parantamiseen transkriptionaalisen säätelyn yhteydessä, voidaan mukauttaa vastaaviin analyysiongelmiin transkriptionaalisen säätelyn jälkeisten säätelyelementtien yhteydessä, RBP:n sitoutumiskohtiin liittyy lisäkomplikaatioita. Näistä ilmeisin on se, että RBP:llä on sekundäärirakenteellisia mieltymyksiä, ja vain harvat nykyiset analyysityökalut voivat sisällyttää tietoa RNA:n taittumisesta. Samoin RNA:n taittumisen vuoksi säätelyelementit voivat helpommin toimia synergistisesti tai sitoutua koordinoidusti sellaisiin sekvenssielementteihin, jotka ovat etäällä primaarisekvenssissä mutta hyvin lähellä toisiaan taittuneessa molekyylissä. Toinen vaikeus on se, että analyysin harjoittelua varten ei ole esimerkkejä translaation säätelyelementeistä. Kourallisen hyvin tutkittujen esimerkkien perusteella vallitsee usein käsitys, että RBP:n sitoutumiskohdat ovat keskimäärin lyhyempiä kuin transkriptiotekijöiden (TF) sitoutumiskohdat, mutta tämä käsitys voi johtua siitä, että RBP:t ovat eniten tutkimuskohteita. Yksi tehokkaimmista menetelmistä säätelyelementtien tunnistamiseksi on fylogeneettinen jalanjälki, jossa hyödynnetään paikallisesti korkeaa evolutiivista säilymistä toiminnallisten elementtien paljastamiseksi . Tämä logiikka toimii yhtä hyvin transkription jälkeisten säätelyelementtien osalta. Valitettavasti TF:n sitoutumiskohdat ovat myös merkittävä este laskennallisen sekvenssianalyysin suoralle soveltamiselle translaatioon osallistuvien 5′ UTR-elementtien tunnistamiseksi. Transkription säätelyyn osallistuvat elementit sijaitsevat sekä transkription aloituskohtien ylä- että alapuolella, ja kun 5′ UTR:t ovat riittävän lyhyitä, transkription jälkeiset säätelyelementit ovat todennäköisesti lomittuneet TF:n sitoutumiskohtien kanssa.
Viime kädessä parhaat menetelmät transkription jälkeisten säätelyelementtien identifioimiseksi löytyvät kokeellisten ja laskennallisten tekniikoiden täydentävästä soveltamisesta.
Kiitokset
Penalvan laboratorion tutkimusta ovat tukeneet Voelcker-säätiö, Lasten aivokasvainsäätiö sekä 5R21HG004664-02 ja 1R01HG006015-01A1.
Lisäaineistot
Keräsimme yhteen ihmisen transkriptomissa olevien uORF:ien perustilastot (NCBI:n build37.3). Taulukossa 1.a esitetään sellaisten uORF:n kaltaisten sekvenssien esiintymien määrä, jotka sisältävät AUG:n 5′ UTR:ssä, mRNA:n ja geenien osalta. Lisäksi erotimme kaksi erilaista uORF:n kaltaista sekvenssiä, joilla on 5′ UTR:ssä yhteensopiva terminaatiokodoni tai joilla ei ole 5′ UTR:ssä yhteensopivaa terminaatiokodonia. Yksityiskohtaiset tiedot näistä kahdesta tapauksesta on lueteltu taulukossa 1.b. Lopuksi taulukossa 1.c esitetään, kuinka monta uORF:n kaltaista sekvenssiä esiintyy kunkin mRNA:n yksittäisessä 5′ UTR:ssä.
- Lisätaulukko
Vastaa