Before It Gets Started: Regulating Translation at the 5′ UTR
On 5 października, 2021 by adminAbstract
Regulacja translacji odgrywa ważną rolę zarówno w prawidłowych warunkach fizjologicznych, jak i w stanach chorobowych. Regulacja ta wymaga elementów cis-regulacyjnych zlokalizowanych głównie w 5′ i 3′ UTR oraz czynników trans-regulacyjnych (np. białek wiążących RNA (RBPs)), które rozpoznają specyficzne cechy RNA i oddziałują z maszynerią translacyjną modulując jej aktywność. W niniejszej pracy omawiamy ważne aspekty regulacji 5′ UTR poprzez przegląd cech i funkcji głównych elementów obecnych w tym regionie, takich jak uORF (upstream open reading frame), struktury drugorzędowe i motywy wiążące RBPs, a także różne mechanizmy regulacji translacji oraz wpływ, jaki wywierają one na ekspresję genów i zdrowie człowieka, gdy są rozregulowane.
1. Regulacja translacji
Ekspresja genów może być modulowana na wielu poziomach, od modyfikacji chromatyny do translacji mRNA. Pomimo znaczenia regulacji transkrypcyjnej, jest jasne w tym momencie, że poziomy mRNA nie mogą być używane jako jedyny parametr do uzasadnienia zawartości białka w komórce. W rzeczywistości, w ostatnim badaniu przeprowadzonym w naszym laboratorium ustaliliśmy, że bezpośrednia korelacja pomiędzy mRNA a białkiem istnieje dla mniej niż jednej trzeciej analizowanych genów w ludzkiej linii komórkowej. Co więcej, nasza analiza sugeruje, że regulacja translacji w znacznym stopniu przyczynia się do zmienności białek, ponieważ kilka parametrów związanych z translacją, takich jak 5′ UTR, 3′ UTR, długość sekwencji kodującej, obecność uORF, skład aminokwasowy i tak dalej, wykazało dobre korelacje z uzyskanymi stosunkami mRNA/białko. Regulacja translacji funkcjonuje jako ważny przełącznik, gdy wymagane są szybkie zmiany w ekspresji genów w odpowiedzi na bodźce wewnętrzne i zewnętrzne (PDGF2, VEGF, TGFβ są przykładami genów kontrolowanych w ten sposób). Regulacja translacji odgrywa również istotn± rolę podczas rozwoju i różnicowania się komórek poprzez zmianę poziomu ekspresji okre¶lonych podzbiorów mRNA w okre¶lonym oknie czasowym, podczas gdy większo¶ć transkryptów pozostaje niezmieniona (przegląd w ).
W niniejszej pracy skupimy się na znaczeniu regulacji zapośredniczonej przez 5′ UTR i różnych elementach funkcjonalnych obecnych w tym regionie z wyj±tkiem IRES, który jest omówiony w innym artykule tego wydania. Główne elementy regulacyjne w 5′ UTR to struktury drugorzędowe (w tym IRES), miejsca wi±ż±ce dla białek wi±ż±cych RNA, uAUGs i uORFs (Rycina 1).
Elementy regulatorowe obecne w 5′ UTR.
2. 5′ UTR
Średnia długość 5′ UTR wynosi od ~100 do ~220 nukleotydów u różnych gatunków. U kręgowców, 5′ UTR mają tendencję do bycia dłuższymi w transkryptach kodujących czynniki transkrypcyjne, protoonkogeny, czynniki wzrostu i ich receptory oraz białka, które są słabo tłumaczone w normalnych warunkach. Konserwatywną cechą jest również wysoka zawartość GC, która u ciepłokrwistych kręgowców przekracza 60%. W kontekście struktur szpilki do włosów, zawartość GC może wpływać na wydajność translacji białek niezależnie od stabilności termicznej szpilki do włosów i jej położenia. UTR eukariotycznych mRNA również wykazują różnorodność powtórzeń, które obejmują krótkie i długie elementy interspersyjne (SINE i LINE, resp.), proste powtórzenia sekwencji (SSR), minisatelity i makrosatelity .
Inicjacja translacji u eukariotów wymaga rekrutacji podjednostek rybosomalnych przy albo strukturze czapeczki 5′ m7G. Kodon inicjacji jest zazwyczaj zlokalizowany daleko w dół rzeki, co wymaga ruchu rybosomalnego do tego miejsca. Ruch ten wydaje się być nieliniowy w przypadku niektórych mRNA (tzn. podjednostki rybosomalne wydają się omijać (shunt) segmenty 5′ UTR, gdy poruszają się w kierunku AUG). Dzięki temu mRNA zawierające uAUG lub struktury spinki do włosów może być wydajnie translowane. Ważnych przykładów dostarczaj± mRNA wirusa mozaiki kalafiora i adenowirusów. Mechanizm shuntingu rybosomalnego jest dość złożony i wymaga parowania zasad mRNA-rRNA.
Geny wykazujące różnice w 5′ UTR swoich transkryptów są stosunkowo powszechne. 10-18% genów wyraża alternatywne 5′ UTR poprzez wykorzystanie wielu promotorów, podczas gdy szacuje się, że alternatywny splicing w obrębie UTR dotyczy 13% genów w transkryptomie ssaków. Te różnice w 5′ UTR mogą funkcjonować jako ważne przełączniki regulujące ekspresję genów. Dwa ważne przykłady to związane z nowotworami geny BRCA1 (breast cancer 1) i TGF-β (transforming growth factor β). BRCA1 jest supresorem nowotworów, często zmutowanym w raku piersi, pełni±cym funkcje w cyklu komórkowym, apoptozie i naprawie uszkodzeń DNA. BRAC1 produkuje dwa różne transkrypty, które pochodzą z dwóch różnych promotorów i dlatego wykazują różnice w ich 5′ UTR. Krótszy transkrypt ulega ekspresji zarówno w nowotworowej, jak i nienowotworowej tkance piersi i jest wydajnie translokowany, podczas gdy dłuższy transkrypt ulega ekspresji głównie w rakach piersi. Obecność kilku uAUG i bardziej złożona struktura dramatycznie wpływają na translację tego dłuższego transkryptu. Powoduje to ogólne obniżenie poziomu BRAC1 w komórkach nowotworowych, co prowadzi do zwolnienia hamowania wzrostu. TGF-β jest zaangażowany w wiele procesów, które obejmują proliferację komórek, migrację, naprawę ran, rozwój, nowotworzenie i immunosupresję. Istnieją trzy znane izoformy: β1, β2 i β3. TGF-β3 tworzy dwa alternatywne transkrypty: transkrypt o długości 3,5 kb z bardzo długim 5′ UTR (1,1 kb) oraz transkrypt o długości 2,6 kb z krótszym 5′ UTR (0,23 kb). Obecność 11 uORF-ów w dłuższym transkrypcie dramatycznie hamuje jego translację, podczas gdy krótszy transkrypt jest wydajnie translowany .
3. Regulacja przez struktury drugorzędowe
Struktury drugorzędowe mogą funkcjonować jako główne narzędzia regulacyjne w 5′ UTR. Zasugerowano korelację z funkcją genu; ustalono, że struktury drugorzędowe są szczególnie rozpowszechnione wśród mRNA kodującego czynniki transkrypcyjne, protoonkogeny, czynniki wzrostu i ich receptory oraz białka słabo translokowane w normalnych warunkach. >90% transkryptów w tych klasach ma 5′ UTR zawierające stabilne struktury drugorzędowe o średniej energii swobodnej mniejszej niż -50 kcal/mol. 60% tych stabilnych struktur drugorzędowych jest umiejscowionych bardzo blisko struktury czapeczki. Struktury te są bardzo skuteczne w hamowaniu translacji. W rzeczywistości, spinka do włosów położona blisko czapeczki o energii swobodnej -30 kcal/mol wystarczyłaby do zablokowania dostępu kompleksu preinicjacyjnego do mRNA. Gdy znajdują się dalej w 5′ UTR, spinki do włosów wymagają energii swobodnej większej niż -50 kcal/mol, aby móc zablokować translację. Stabilna struktura drugorzędowa może oprzeć się aktywności odwijania helikazy elF4A. Efekt ten można częściowo przezwyciężyć poprzez nadekspresję elF4A we współpracy z elF4B. mRNA o wysoce ustrukturyzowanym 5′ UTR, takie jak proto-onkogeny i inne czynniki wzrostu, wykorzystują zależną od czapeczki inicjację translacji. Nie dziwi więc, że nadekspresja składników maszynerii inicjacji translacji, w tym elf4E, jest związana z nowotworzeniem (przegląd w ).
Gen TGF-β1 stanowi dobry przykład hamowania translacji pośredniczonego przez strukturę drugorzędową. Zachowany ewolucyjnie motyw w 5′ UTR tworzy stabilną pętlę łodygową. Jednak struktura ta sama w sobie nie jest wystarczająca do blokowania translacji. Represja translacji TGF-β1 zależy od zwiększonego wiązania białka wiążącego RNA YB-1 do transkryptu TGF-β1. Następnie zaproponowano, że YB-1 wiąże 5′ UTR TGF-β1 z wysokim powinowactwem dzięki zawartości GC i współpracuje z pętlą macierzystą w celu zahamowania translacji TGF-β1 poprzez ułatwienie tworzenia dupleksu .
4. Regulacja przez białka wiążące RNA
Przewiduje się, że ludzki genom koduje około 1000 białek wiążących RNA (RBPs), z których duży odsetek jest zaangażowany w translację. Można je sklasyfikować na dwie główne grupy: RBPs, które są częścią podstawowej maszynerii translacyjnej i są wymagane do translacji wszystkich ekspresjonowanych mRNA (przykłady: PABPI, elf4E) oraz RBPs, które funkcjonują w bardziej selektywny sposób, kontrolując pozytywnie lub negatywnie poziom translacji specyficznych docelowych mRNA (przykłady: HuR, Musashi1). W odniesieniu do tej ostatniej grupy zaobserwowano, że RBPs mogą wykorzystywać różne mechanizmy w celu zwiększenia lub zahamowania translacji. Chociaż znanych jest kilka wyjątków, można powiedzieć, że RBPs często rozpoznają specyficzne motywy w UTR i oddziałują z maszynerią translacyjną w celu kontroli ekspresji. Interferencja z translacją zazwyczaj ma miejsce podczas etapu inicjacji (przegląd w ).
Najlepiej scharakteryzowany przykład regulacji za pośrednictwem RBP z udziałem 5′ UTR jest dostarczany przez białka regulacyjne żelaza (IRP 1 i 2). Białka te rozpoznają wysoce konserwowaną strukturę pętli łodygi z circa 30 nukleotydami, znaną jako element odpowiedzi na żelazo (IRE). Do najważniejszych cech należy heksanukleotydowa pętla o sekwencji CAGYCX (Y = U lub A; X = U, C lub A) oraz górny rdzeń o długości 5 bp, oddzielony od dolnego o zmiennej długości niesparowaną cytozyną. Regulacja ta jest kluczowa dla utrzymania homeostazy żelaza w komórce, ponieważ duża liczba mRNA zwi±zanych z magazynowaniem i metabolizmem żelaza, w tym ferrytyna, mitochondrialna akonitaza, dehydrogenaza bursztynianowa – białko żelazowe, erytroidalna syntaza 5-aminolewulinowa (eALAS) i cz±steczka ferroportyny (FPN1), ma ekspresję modulowan± przez ten system. Gdy poziom żelaza w komórce jest niski, IRP1 i IRP2 wiążą się z IRE i blokują translację ORF. Gdy poziom żelaza wewnątrzkomórkowego jest wysoki, aktywność wiązania RNA obu IRP jest zmniejszona (Rysunek 2(a)). IRE mają tendencję do umiejscawiania się blisko czapeczki, co powoduje steryczne zahamowanie wiązania podjednostek rybosomalnych 40S do transkryptu. W przypadku lokalizacji odległej od czapeczki, zamiast wpływać na rekrutację 40S, kompleks IRE-IRP blokuje skanowanie rybosomalne (przegląd w ). Interesujące obejście mechanizmu IRE/IRP można zaobserwować w prekursorowych komórkach dwunastnicy i erytroidów poddanych działaniu żelaza. Promotor upstreamowy jest wykorzystywany do generowania pre-mRNA FPN1 zawierającego jeden ekson, który jest połączony przez alternatywny splicing z akceptorem splicingu w 3′ IRE. Generowany jest dojrzały transkrypt FPN1 zawierający tę samą otwartą ramkę odczytu; jednakże 5′ UTR nie zawiera IRE . Dlatego też komórki te wyrażają alternatywną izoformę FPN1 w sposób niezależny od żelaza. Mutacje wpływające na IRE mogą prowadzić do chorób. Tak jest w przypadku zespołu dziedzicznej hiperferrytynemii z zaćmą (HHCS), genetycznego zaburzenia dziedziczonego autosomalnie dominująco, w którym agregacja i krystalizacja ferrytyny w soczewce prowadzi do obustronnej zaćmy.
(a)
(b)
(a)
(b)
Regulacja translacyjna przez białka wiążące RNA. (a) W komórkach z niedoborem żelaza, IRP wiążą się z IRE zlokalizowanym w 5′ UTR mRNA ferrytyny, blokując jego translację. Kiedy poziom żelaza w komórce wzrasta, kompleks zawierający Fe wiąże się z IRPs. W ten sposób białka te są modyfikowane allosterycznie, co zmniejsza wiązanie IRP-IRE i umożliwia translację mRNA ferrytyny. (b) Regulacja genu msl-2 u samic muszki. Po transkrypcji w jądrze, SXL wiąże się specyficznie do intronowych regionów bogatych w literę U pre-mRNA msl-2 i hamuje usuwanie intronów (1). W cytoplazmie SXL wiąże się do tych samych elementów zlokalizowanych obecnie w 5′ UTR dojrzałego msl-2 mRNA, zwiększa inicjację translacji upstream ORF (2) i zapobiega translacji głównego ORF (3). Elementy regulacyjne w 3′ UTR mRNA msl-2 nie były reprezentowane.
Regulacja pośredniczona przez RBP może być bardzo rozbudowana i obejmować wiele etapów. Dobrym przykładem ukazującym wzajemne oddziaływanie czynników i odrębnych procesów regulacyjnych jest gen male-specific-lethal 2 (msl-2) w Drosophila, główny gracz w kompensacji dawki. Specyficzne dla samic białko wiążące RNA – sex lethal (SXL) uczestniczy w wielu aspektach regulacji msl-2, gdzie ekspresja msl-2 musi być uniemożliwiona (Rysunek 2(b)). Regulacja rozpoczyna się na poziomie splicingu; SXL wiąże się do dwóch odcinków polyU zlokalizowanych w intronie, który jest częścią 5′ UTR. Proces ten powoduje zatrzymanie intronu i zachowanie krytycznych sekwencji, które później zostaną wykorzystane w regulacji translacji. W cytoplazmie, to samo białko SXL będzie funkcjonować jako represor translacji msl-2 w dwóch różnych mechanizmach zachodzących na 3′ i 5′ UTR. SXL wiąże sekwencje bogate w U w 3′ UTR i rekrutuje białko rdzeniowe UNR (upstream of N-ras) oraz PABP blokując rekrutację kompleksu inicjującego do 5′ końca mRNA. Aby zapewnić pełną represję msl-2, na 5′ UTR zachodzi drugi etap regulacyjny, w którym również pośredniczy SXL. Represja ta obejmuje nowy mechanizm regulacyjny, w którym dochodzi do wzajemnego oddziaływania między SXL i uORF w celu skutecznej represji translacji. 5′ UTR msl-2 zawiera 3 uORF-y, ale tylko trzeci z nich jest zaangażowany w represję. Co ciekawe, represja ta jest bardzo słaba przy braku SXL (~2-krotna), ale gdy jest obecna, SXL wiąże odcinek poli U oddalony o kilka nukleotydów od uAUG i zwiększa represję do ponad 14-krotnej wartości. SXL działa poprzez zwiększenie inicjacji translacji przy uAUG, a nie poprzez proste zatrzymanie steryczne skanujących rybosomów. Efekt ten może zachodzić poprzez interakcję pomiędzy SXL a czynnikami inicjacji translacji; być może członkami komponentu elF3, na co wskazuje badanie metodą dwuhybrydową. Mechanizm ten potencjalnie dotyczy dużej liczby mRNA; 268 transkryptów w Drosophila zawiera motywy wi±ż±ce SXL zwi±zane z uAUG rozmieszczone w odpowiedniej odległo¶ci. Na przykład, konstrukt reporterowy zawierający 5′UTR genu Irr47 był represjonowany ~4-krotnie przez białko SXL .
RBPs mogą pełnić antagonistyczne funkcje w regulacji translacji. Interesującym przykładem jest regulacja p21 w kontekście replikacyjnej senescencji, stanu komórkowego, w którym komórki wchodzą w nieodwracalne zatrzymanie wzrostu. Indukcja p21 jest wymagana do zainicjowania tego procesu oraz do zahamowania kompleksów cdk2-cyklina E. 5′ UTR p21 zawiera sekwencję bogatą w GC, która tworzy pętlę łodygową. Element ten jest rozpoznawany przez dwa RBPs o odmiennych właściwościach: CUGBP1 i kalretikulinę (CRT). Rywalizacja pomiędzy tymi dwoma białkami determinuje ostateczny poziom ekspresji p21 i decyduje o tym, czy komórki będą proliferować, czy też ulegną zatrzymaniu wzrostu i starzeniu. Wiązanie CUGBP1 do mRNA p21 jest dramatycznie zwiększone w komórkach starzejących się w porównaniu do młodych komórek fibroblastów. Poziom białka nie ulega zmianie w trakcie tego procesu, a wzrost aktywności jest wynikiem fosforylacji. Z drugiej strony, CRT IPs wykazały cztero- do pięciokrotne obniżenie aktywności w komórkach starzejących się, spowodowane spadkiem ekspresji. Wykazano, że oba białka wpływają na translację p21. Jednakże, podczas gdy CUGBP1 funkcjonuje jako aktywator, CRT działa jako represor. Ponieważ oba białka wykazują przeciwstawną aktywność w komórkach starzejących się, sprawdzono, czy konkurują o oddziaływanie z mRNA p21 i kontrolę jego translacji. Zwiększające się ilości jednego białka były w stanie odwrócić wiązanie drugiego białka do p21 mRNA i jego wpływ na translację; powinowactwo do miejsca wiązania jest raczej inne, ponieważ CUGBP1 musiał być obecny w reakcjach wiązania w cztero- do ośmiokrotnym nadmiarze molowym do CRT, aby antagonizować jego wiązanie do p21 mRNA i wpływać na jego translację .
5. Regulacja przez uORFs i Upstream AUGs
uORFs i uAUGs są głównymi elementami regulacyjnymi w 5′ UTRs. Jak sugeruje ich nazwa, uORFs są sekwencjami zdefiniowanymi przez kodon startu i kodon stopu przed głównym regionem kodującym, podczas gdy uAUGs są kodonami startu bez kodonu stopu in-frame downstream znajdującego się przed głównym regionem kodującym. Duży odsetek transkryptomu ludzkiego zawiera uORF i/lub uAUG, wartości te wahają się między 44 a 49%. Podobna liczba znajduje się w transkryptomie myszy. Chociaż liczby te mogą wydawać się wysokie, zarówno uORF-y jak i uAUG-y występują rzadziej niż można by się tego spodziewać, co sugeruje, że są one pod presją selektywną. uORF-y i uAUG-y są nadreprezentowane w poszczególnych podgrupach, takich jak czynniki transkrypcyjne, czynniki wzrostu i ich receptory oraz proto-onkogeny. Zarówno uORFs jak i uAUGs są niezwykle zróżnicowane pod względem położenia w stosunku do czapeczki i głównego AUG, liczby na transkrypt i długości (w przypadku uORFs). Tabela 1 (w Materiałach Uzupełniających dostępnych online pod adresem http://dx.doi.org/10.1155/2012/475731) zawiera wyczerpującą listę uORF-ów i uAUG-ów obecnych w ludzkim transkryptomie. uORF-y i uAUG-i nie były szeroko analizowane pod względem zachowania. Pilotażowe badanie przeprowadzone na podzbiorze transkryptów ludzkich, mysich i szczurzych wykazało, że oba elementy są umiarkowanie konserwowane, ponieważ 38% uORF i 24% uAUG zostało uznanych za konserwowane pomiędzy trzema gatunkami. Umiarkowana konserwacja uORF w połączeniu z faktem, że ich średnia długość (20 nukleotydów) jest oczekiwana przez przypadek, a uAUG zapewniają silniejszą supresję w porównaniu z uORF, sugeruje, że wiele uAUG zostało zneutralizowanych w procesie ewolucji poprzez nabycie kodonu stop. Zaproponowano więc, że tylko nieliczne uORF, najprawdopodobniej te konserwatywne, zostały zrekrutowane do regulacji ekspresji. W drożdżach wykazano, że uORFs są statystycznie niedoreprezentowane w 5′ UTRs i zostały usunięte przez presję selekcyjną, wskazując podobnie, że pozostałe uORFs mogą być zaangażowane w regulację translacji .
Chociaż ogólnie sugerowano, że uORFs są negatywnie skorelowane z produkcją białka, do tej pory aktywność funkcjonalna została wykazana tylko dla ograniczonej liczby uORFs i uAUGs. Na Rysunku 3 pokazujemy przykłady wpływu uAUG na wydajność translacji. Wśród najistotniejszych cech, które mogą przyczynić się do funkcjonalności są: odległość od 5′ cap do uORF, konserwacja sekwencji, kontekst, w którym znajduje się AUG, siła miejsca inicjacji ORF, długość uORF oraz liczba AUG w 5′ UTR. Zaobserwowano różne wyniki, gdy rybosom napotyka uAUG lub uORF. Ponieważ liczba scharakteryzowanych zdarzeń jest wciąż niewielka, trudno jest zdefiniować ogólne mechanizmy; opisujemy zatem kilka dobrze scharakteryzowanych i istotnych zdarzeń. O nieszczelnym skanowaniu mówimy wtedy, gdy część kompleksów skanujących omija uAUG lub uORF i kontynuuje skanowanie do następnego AUG. W tym przypadku, AUG upstream działa jako „wabik” na AUG ORF, funkcjonując jako negatywny regulator translacji przynajmniej dla pewnej części rybosomów. Wytwarzanie cis-aktywnych peptydów przez uORF może ograniczać inicjację translacji downstream ORF poprzez zatrzymanie rybosomu na końcu uORF. Klasycznym przykładem jest ewolucyjnie konserwowany eukariotyczny peptyd atenuujący argininę (AAP), który negatywnie kontroluje translację białek zaangażowanych w biosyntezę argininy de novo u grzybów w warunkach wysokiego stężenia argininy. W tym scenariuszu arginina zmienia konformację AAP i/lub środowisko miejsca P, powodując zahamowanie rybosomalne przy kodonie terminacji AAP uORF. AAP ogranicza również elongację translacji poprzez przeciąganie rybosomów, gdy uORF jest wstawiony w obrębie sekwencji kodującej. Inny klasyczny przykład regulacji za pomocą uORF pochodzi z drożdży. Cztery uORFs są obecne w 5′ UTR czynnika transkrypcyjnego GCN4. Pierwszy z czterech uORF-ów jest zawsze wydajnie tłumaczony niezależnie od warunków odżywczych. W niezakłóconych komórkach, szybkie ładowanie rybosomów i kofaktorów inicjuj±cych umożliwia translację uORF-ów 2-4, hamuj±c jednocze¶nie translację głównego ORF. W sytuacji głodu aminokwasowego, czynniki inicjuj±ce s± niewystarczaj±ce, co prowadzi do spowolnionego przeładunku rybosomów i skanowania sekwencji zawieraj±cych uORF. Dopiero przy głównej sekwencji koduj±cej następuje ponowne złożenie funkcjonalnego kompleksu inicjuj±cego i ekspresja GCN4. Mechanizm ten umożliwia szybk± reakcję na stres żywieniowy. Innym podobnym przykładem regulowanej ekspresji poprzez uORF jest gen karnitynowej palmitoilotransferazy 1C (CPT1C). CPT1C reguluje metabolizm w mózgu w sytuacjach nadmiaru energii. Obecność uORF w 5′ UTR powoduje represję ekspresji ORF. Jednakże, represja ta zostaje zniesiona w odpowiedzi na specyficzne bodźce stresowe, takie jak deprywacja glukozy i traktowanie palmitynianem-BSA. Zasugerowano, że uORF mogą również indukować degradację mRNA. Seria konstruktów 5′ UTR zawierających jako reporter gen kota z bakteryjnego transpozonu Tn9 była testowana w drożdżach. Pojedyncza substytucja nukleotydowa została użyta do utworzenia 7-kodonowego ORF upstream genu kota. UORF był translokowany wydajnie i powodował zahamowanie translacji ORF kota oraz destabilizację mRNA kota. Związek między uORF a rozpadem mRNA został również zasugerowany na podstawie porównania średnich poziomów ekspresji transkryptów zawierających uORF i nie zawierających uORF.
(a)
(b)
(a)
(b)
Wpływ sekwencji uAUG na regulację translacji. (a) Porównanie poziomów lucyferazy uzyskanych dla konstruktów posiadających 5′ UTR genu ACT (kontrola) i genów zawierających uAUG: WBSCR16, MFSD5, i BCL2L13. (b) Delecja lub mutacja sekwencji uAUG obecnej w genach WBSCR16, MFSD5 i BCL2L13 odwraca represję translacji, co widać jako wzrost aktywności lucyferazy.
Kilka mutacji eliminujących lub tworzących uORF-y, które kończą się zmianą poziomu białka, zostało powiązanych z chorobami człowieka. Ich znaczenie zostało niedawno omówione. Predyspozycja do czerniaka może być spowodowana przez mutację, która wprowadza uORF do 5′ UTR genu białka inhibitora cykliny-zależnej-kinazy (CDKN2A). Dziedziczna trombocytemia jest spowodowana mutacją, która tworzy wariant splicingu, który eliminuje uORF, co prowadzi do zwiększenia produkcji białka genu trombopoetyny . Dziedziczna hipotrichoza Marie Unna jest spowodowana mutacją, która zakłóca uORF obecny w 5′ UTR genu hairless homolog i w konsekwencji zwiększa jego ekspresję. Stwierdzono, że przejście z G na A w jednym z uORF obecnych w 5′ UTR transkryptu TGF-β3 jest związane z arytmogenną kardiomiopatią/dysplazją prawej komory (ARVC). Kolejna grupa pięciu uORF związanych z chorobami została ostatnio przebadana przy użyciu testów reporterowych; są to: dysgenezja gonad (SRY), zespół Van der Woudego (IRF6), zespół Carneya typu 1 (PRKAR1A), dziedziczne zapalenie trzustki (SPINK1) oraz talasemia-β (HBB). Lista ta z pewnością będzie się wydłużać, ponieważ zgłoszono ponad 500 polimorfizmów pojedynczego nukleotydu (SNPs) tworzących lub usuwających uORFs.
6. Poszukiwanie nowych elementów regulacyjnych w 5′ UTR
Charakteryzowano jedynie niewielką część potranskrypcyjnych elementów regulacyjnych zlokalizowanych w ludzkich 5′ UTRs. Te zidentyfikowane elementy UTR są skatalogowane w źródle internetowym prowadzonym przez grupę Graziano Pesole o nazwie UTRdb (http://utrdb.ba.itb.cnr.it/). Metody in vivo do identyfikacji posttranskrypcyjnych elementów regulatorowych w UTR, szczególnie tych związanych z RBPs, rozwinęły się radykalnie w ciągu ostatnich pięciu lat dzięki technologii głębokiego sekwencjonowania. CLIP i RIP-Seq są metodami opartymi na izolacji cząsteczek białek RNA (RNP) poprzez immunoprecypitację, a następnie trawienie RNazą i precyzyjną identyfikację miejsc wiązania RBP za pomocą głębokiego sekwencjonowania. Chociaż liczba RBP analizowanych do tej pory tymi metodami jest naprawdę niewielka (przegląd w ), w miarę jak technologia głębokiego sekwencjonowania staje się bardziej dostępna, a metody uproszczone, można oczekiwać, że bardzo szybko duża część ludzkich miejsc wiążących RBP w UTR zostanie zmapowana.
Innym wyborem do mapowania elementów UTR regulujących translację jest zastosowanie czysto obliczeniowych metod opartych na analizie sekwencji UTR. Metody te opierają się na identyfikacji zdegenerowanych wzorców rybonukleotydowych, które mają oczekiwane właściwości miejsc wiązania RBP. Podobne metody są stosowane od blisko 30 lat do identyfikacji regulacji transkrypcji w sekwencjach promotorowych. Metody te osiągają dojrzałość, są bardzo szeroko stosowane i w znacznym stopniu pomogły w tworzeniu baz danych dotyczących regulacji transkrypcji (np. TRANSFAC). Chociaż znaczna część pracy skierowanej na projektowanie i udoskonalanie algorytmów analizy sekwencji regulatorowych w kontekście regulacji transkrypcyjnej może być zaadaptowana do odpowiednich problemów analizy w kontekście posttranskrypcyjnych elementów regulatorowych, istnieją dodatkowe komplikacje związane z miejscami wiązania RBP. Najbardziej oczywistym z nich jest fakt, że RBP będą miały preferencje dotyczące struktury drugorzędowej, a niewiele istniejących narzędzi analitycznych może uwzględniać informacje o składaniu RNA. Podobnie, z powodu fałdowania RNA elementy regulatorowe mogą łatwiej działać synergistycznie lub wykazywać zgodne wiązanie do elementów sekwencji, które są odległe w sekwencji pierwotnej, ale bardzo bliskie w złożonej cząsteczce. Kolejną trudnością jest brak przykładowych translacyjnych elementów regulatorowych do treningu analizy. Na podstawie kilku dobrze zbadanych przykładów, często istnieje przekonanie, że miejsca wiązania RBP są średnio krótsze niż miejsca wiązania czynników transkrypcyjnych (TF), ale to przekonanie może wynikać z uprzedzeń w zbiorze RBP, na których skupiają się badania. Jedną z najpotężniejszych metod identyfikacji elementów regulacyjnych jest filogenetyczny foot-printing, który wykorzystuje lokalnie podwyższoną konserwację ewolucyjną do ujawnienia elementów funkcjonalnych. Ta logika działa równie dobrze w przypadku posttranskrypcyjnych elementów regulacyjnych. Niestety, miejsca wiązania TF stanowią również poważną przeszkodę w bezpośrednim zastosowaniu obliczeniowej analizy sekwencji do identyfikacji elementów 5′ UTR zaangażowanych w translację. Elementy zaangażowane w regulację transkrypcji rezydują zarówno w górę, jak i w dół od miejsc startu transkrypcji, a gdy 5′ UTR są wystarczająco krótkie, posttranskrypcyjne elementy regulacyjne prawdopodobnie przeplatają się z miejscami wiązania TF.
Ostatecznie najlepsze metody identyfikacji posttranskrypcyjnych elementów regulacyjnych wyłonią się z komplementarnego zastosowania technik eksperymentalnych i obliczeniowych.
Podziękowania
Badania w laboratorium Penalvy są wspierane przez Voelcker Foundation, Children’s Brain Tumor foundation oraz 5R21HG004664-02 i 1R01HG006015-01A1.
Materiały uzupełniające
Podsumowaliśmy podstawowe statystyki dla uORF-ów w ludzkim transkryptomie (NCBI build37.3). Tabela 1.a przedstawia liczbę wystąpień sekwencji uORF-podobnych zawierających AUG w 5′ UTR w odniesieniu do mRNA i genów. Wyodrębniliśmy również dwie charakterystyczne sekwencje uORF-podobne z pasującym kodonem terminacji w 5′ UTR lub bez pasującego kodonu terminacji w 5′ UTR. Szczegółowe informacje dla tych dwóch przypadków są wymienione w Tabeli 1.b. Wreszcie, Tabela 1.c pokazuje, ile sekwencji uORF-podobnych pojawia się na indywidualnym 5′ UTR każdego mRNA.
- Tabela uzupełniająca
.
Dodaj komentarz