Hvor det går i gang: Regulering af translation ved 5′ UTR
On oktober 5, 2021 by adminAbstract
Translationsregulering spiller vigtige roller i både normale fysiologiske forhold og sygdomstilstande. Denne regulering kræver cis-regulerende elementer, der hovedsagelig er placeret i 5′ og 3′ UTR’er, og trans-regulerende faktorer (f.eks. RNA-bindingsproteiner (RBP’er)), som genkender specifikke RNA-funktioner og interagerer med oversættelsesmaskineriet for at modulere dets aktivitet. I denne artikel diskuterer vi vigtige aspekter af 5′ UTR-medieret regulering ved at give et overblik over karakteristika og funktionen af de vigtigste elementer i denne region, såsom uORF (upstream open reading frame), sekundære strukturer og RBPs-bindingsmotiver samt forskellige mekanismer for translationsregulering og den indvirkning, de har på genekspression og menneskers sundhed, når de er dereguleret.
1. Translationsregulering
Genekspression kan moduleres på flere niveauer fra kromatinmodifikation til mRNA-translation. På trods af betydningen af transkriptionel regulering er det på nuværende tidspunkt klart, at mRNA-niveauer ikke kan bruges som eneste parameter til at retfærdiggøre en celles proteinindhold. Faktisk har vi i en nylig undersøgelse fra vores laboratorium fastslået, at der findes en direkte korrelation mellem mRNA og protein for mindre end en tredjedel af de analyserede gener i en menneskelig cellelinje. Desuden tyder vores analyse på, at translationsregulering bidrager betydeligt til proteinvariationen, da flere parametre relateret til translation som 5′ UTR, 3′ UTR, kodningssekvenslængde, tilstedeværelse af uORF’er og aminosyresammensætning osv. viste gode korrelationer med de opnåede mRNA/protein-forhold. Oversættelsesregulering fungerer som en vigtig kontakt, når der er behov for hurtige ændringer i genekspressionen som reaktion på interne og eksterne stimuli (PDGF2, VEGF, TGFβ er eksempler på gener, der kontrolleres på denne måde). Translationsregulering spiller også en væsentlig rolle under udvikling og celledifferentiering ved at ændre ekspressionsniveauet for specifikke mRNA-undergrupper i et bestemt tidsvindue, mens størstedelen af transskriptionerne forbliver uændret (gennemgået i ).
I denne artikel vil vi fokusere på betydningen af 5′ UTR-medieret regulering og de forskellige funktionelle elementer, der findes i denne region, med undtagelse af IRES, som behandles i en anden artikel i dette nummer. De vigtigste regulerende elementer i 5′ UTR er sekundære strukturer (herunder IRES), bindingssteder for RNA-bindingsproteiner, uAUG’er og uORF’er (figur 1).
Regulerende elementer, der er til stede i 5′ UTR.
2. 5′ UTR
Den gennemsnitlige længde af 5′ UTR’er er ~100 til ~220 nukleotider på tværs af arter . Hos hvirveldyr har 5′ UTR’er en tendens til at være længere i transkriptioner, der koder for transkriptionsfaktorer, protoonkogener, vækstfaktorer og deres receptorer og proteiner, der oversættes dårligt under normale forhold . Et højt GC-indhold er også et bevaret træk, med værdier på over 60 % hos varmblodede hvirveldyr. I forbindelse med hårnålsstrukturer kan GC-indholdet påvirke proteintranslationseffektiviteten uafhængigt af hårnålens termiske stabilitet og hårnålens position . UTR’er af eukaryote mRNA’er viser også en række gentagelser, der omfatter korte og lange interspredte elementer (SINE’er og LINE’er, hhv.), simple sekvensgentagelser (SSR’er), minisatellitter og makrosatellitter .
Translationsinitiering i eukaryoter kræver rekruttering af ribosomale underenheder ved enten 5′ m7G cap-strukturen. Initiationskodonet er generelt placeret langt nedstrøms, hvilket kræver ribosomal bevægelse til dette sted. Denne bevægelse synes at være ikke-lineær for nogle mRNA’er (dvs. at ribosomale underenheder synes at omgå (shunt) segmenter af 5′ UTR’en, når de bevæger sig i retning af AUG). Shuntning kan gøre det muligt at oversætte mRNA’er, der indeholder uAUG’er eller hårnåle strukturer, effektivt. Vigtige eksempler herpå er mRNA’erne fra blomkålsmosaikvirus og adenovirus. Mekanismen for ribosomal shunting er ret kompleks og kræver basisparring af mRNA-rRNA-baseparring.
Gener med forskelle i 5′ UTR’en i deres transkript er relativt almindelige. 10-18% af generne udtrykker alternative 5′ UTR ved hjælp af flere promotorer, mens alternativ splejsning inden for UTR’er skønnes at påvirke 13% af generne i pattedyrs transkriptom . Disse variationer i 5′ UTR kan fungere som vigtige omskiftere til regulering af genekspression. To vigtige eksempler findes i de kræftrelaterede gener BRCA1 (brystkræft 1) og TGF-β (transformerende vækstfaktor β). BRCA1 er en tumorsuppressor, der hyppigt er muteret i brystkræft og har funktioner i cellecyklus, apoptose og reparation af DNA-skader. BRAC1 producerer to forskellige transskriptioner, der stammer fra to forskellige promotorer og derfor viser forskelle i deres 5′ UTR. Et kortere transkript udtrykkes i både kræft- og ikke-kræftramt brystvæv og oversættes effektivt, mens et længere transkript fortrinsvis udtrykkes i brystkræft. Tilstedeværelsen af flere uAUG’er og en mere kompleks struktur påvirker oversættelsen af dette længere transkript dramatisk. Dette medfører et generelt fald i BRAC1-niveauerne i tumorceller, hvilket fører til en lindring af væksthæmningen . TGF-β er involveret i en lang række processer, der omfatter celleproliferation, migration, sårreparation, udvikling, tumorigenese og immunosuppression. Der er tre kendte isoformer: β1, β2 og β3. TGF-β3 producerer to alternative transkript: et 3,5 kb-transkript med et meget langt 5′ UTR (1,1 kb) og et 2,6 kb-transkript med et kortere 5′ UTR (0,23 kb). Tilstedeværelsen af 11 uORF’er i det længere transkript hæmmer dramatisk dets oversættelse, mens det kortere transkript oversættes effektivt.
3. Regulering ved sekundær struktur
Sekundære strukturer kan fungere som vigtige reguleringsværktøjer i 5′ UTR’er. Der er blevet antydet en korrelation med genfunktion; sekundære strukturer er blevet bestemt til at være særligt udbredt blandt mRNA’er, der koder for transkriptionsfaktorer, protoonkogener, vækstfaktorer og deres receptorer og proteiner, der oversættes dårligt under normale forhold. >90% af transkriptionerne i disse klasser har 5′ UTR’er, der indeholder stabile sekundære strukturer med gennemsnitlige frie energier på mindre end -50 kcal/mol. 60% af disse stabile sekundære strukturer er placeret meget tæt på kappestrukturen . Disse strukturer er meget effektive til at hæmme translation. Faktisk ville en hårnål tæt på kappen med en fri energi på -30 kcal/mol være tilstrækkelig til at blokere adgangen for præinitieringskomplekset til mRNA’et. Når hårnåle er placeret længere væk i 5′ UTR, skal de have en fri energi på over -50 kcal/mol for at kunne blokere translationen . En stabil sekundær struktur kan modstå helikasen elF4A’s afviklingsaktivitet. Denne effekt kan delvist overvindes ved overekspression af elF4A i samarbejde med elF4B . mRNA’er med en stærkt struktureret 5′ UTR som proto-onkogener og andre vækstfaktorer anvender cap-afhængig translationsinitiering. Ikke overraskende er overekspression af komponenter af translationsinitieringsmaskineriet, herunder elf4E, blevet forbundet med tumorigenese (gennemgået i ).
Genet TGF-β1 giver et godt eksempel på translationshæmning medieret af sekundærstruktur . Et evolutionært bevaret motiv i 5′ UTR danner en stabil stamme loop. Denne struktur er imidlertid ikke i sig selv tilstrækkelig til at blokere translation. Translationsrepression af TGF-β1 afhænger af en øget binding af RNA-bindingsproteinet YB-1 til TGF-β1-transkriptet . Det blev derefter foreslået, at YB-1 binder 5′ UTR af TGF-β1 med høj affinitet takket være dets GC-indhold og samarbejder med stamsløjfen for at hæmme TGF-β1 translation ved at lette duplexdannelsen .
4. Regulering ved hjælp af RNA-bindende proteiner
Det forudsiges, at det menneskelige genom koder for ca. 1.000 RNA-bindende proteiner (RBP’er), hvoraf en stor procentdel er involveret i translation. De kan inddeles i to hovedgrupper: RBP’er, der er en del af det grundlæggende oversættelsesmaskineri og er nødvendige for oversættelsen af alle udtrykte mRNA’er (eksempler: PABPI, elf4E) og RBP’er, der fungerer mere selektivt ved at kontrollere enten positivt eller negativt oversættelsesniveauet for specifikke mål-mRNA’er (eksempler: HuR, Musashi1). Hvad angår sidstnævnte gruppe, er det blevet observeret, at RBP’er kan anvende forskellige mekanismer til at øge eller hæmme translation. Selv om der kendes adskillige undtagelser, kan det siges, at RBP’er ofte genkender specifikke motiver i UTR’er og interagerer med oversættelsesmaskineriet for at kontrollere ekspressionen. Interferens med translation finder normalt sted under initieringstrinnet (gennemgået i ).
Det bedst karakteriserede eksempel på RBP-medieret regulering, der involverer 5′ UTR’er, leveres af de jernregulerende proteiner (IRP 1 og 2). Disse proteiner genkender en meget bevaret stammesløjfestruktur med ca. 30 nukleotider, kendt som jernresponselementet (IRE). De vigtigste træk omfatter en hexanukleotidsløjfe med sekvensen CAGYCX (Y = U eller A; X = U, C eller A) og en øverste stamme på 5 bp, som er adskilt fra en nederste stamme af variabel længde af en uparret cytosin. Denne regulering er afgørende for opretholdelsen af den cellulære jernhomøostase, da et stort antal mRNA’er, der er forbundet med jernlagring og -metabolisme, herunder ferritin, mitokondriel aconitase, succinatdehydrogenase-jernprotein, erythroid 5-aminolevulinatsyntetase (eALAS) og et jerneksportinmolekyle ved navn ferroportin (FPN1), har deres ekspression moduleret af dette system. Når det cellulære jernniveau er lavt, binder IRP1 og IRP2 sig til IRE og blokerer translationen af den nedstrøms ORF. Når det intracellulære jernniveau er højt, reduceres begge IRP’ernes RNA-bindingsaktivitet (figur 2(a)). IRE’er har en tendens til at være placeret tæt på kappen, hvilket medfører en sterisk hæmning af bindingen af 40S ribosomale underenheder til transkriptet. Når IRE-IRP-komplekset er placeret længere væk fra kappen, blokerer det ribosomale scanning i stedet for at påvirke 40S-rekruttering (gennemgået i ). En interessant omgåelse af IRE/IRP-mekanismen kan iagttages i jernfattige duodenale og erytroide forløberceller. En opstrøms promotor anvendes til at generere FPN1 præ-mRNA’er, der indeholder endnu et exon, der ved alternativ splejsning er forbundet med en splejseacceptor i 3′ af IRE. Der dannes et modent FPN1-transkript, der indeholder den samme åbne læseramme; 5′ UTR indeholder dog ikke IRE . Derfor udtrykker disse celler den alternative FPN1-isoform på en jernuafhængig måde . Mutationer, der påvirker IRE’er, kan føre til sygdomme. Dette er tilfældet med det hereditære hyperferritinæmi-kataraktsyndrom (HHCS), en genetisk autosomal dominant sygdom, hvor aggregering og krystallisering af ferritin i linsen fører til bilateral grå stær .
(a)
(b)
(a)
(b)
Translationel regulering ved RNA-bindende proteiner. (a) I jernmangelceller binder IRP’er sig til IRE lokaliseret i 5′ UTR af ferritin mRNA, hvilket blokerer dets translation. Når det cellulære jernniveau stiger, binder et kompleks, der indeholder Fe, sig til IRPs. Disse proteiner modificeres således allosterisk, hvilket reducerer IRP-IRE-bindingen og tillader oversættelse af ferritin-mRNA’er. (b) msl-2 genregulering hos hunfluer. Efter transkription i kernen binder SXL specifikt til introniske U-rige regioner af msl-2 præ-mRNA og hæmmer intronfjernelsen (1). I cytoplasmaet binder SXL til de samme elementer, der nu er lokaliseret i 5′ UTR af modent msl-2 mRNA, forbedrer translationsinitieringen af en opstrøms ORF (2) og forhindrer hoved-ORF-oversættelsen (3). De regulerende elementer i 3′ UTR af msl-2 mRNA var ikke repræsenteret.
RBP-medieret regulering kan være meget udførlig og involvere flere trin. Et godt eksempel, der viser overspillet mellem faktorer og forskellige reguleringsprocesser, er genet male-specific-lethal 2 (msl-2) i Drosophila, en hovedaktør i doseringskompensation. Det hun-specifikke RNA-bindingsprotein sex lethal (SXL) deltager i flere aspekter af msl-2-reguleringen, hvor msl-2-ekspression skal forhindres (figur 2(b)). Reguleringen starter på splejsningsplan; SXL binder sig til to polyU-strækninger, der er placeret i et intron, som er en del af 5′ UTR’en. Denne proces forårsager intronretention og bevarer kritiske sekvenser, som senere vil blive brugt i translationsreguleringen . I cytoplasmaet vil det samme SXL-protein fungere som en translationsrepressor for msl-2 i to forskellige mekanismer, der finder sted ved 3′ og 5′ UTR . SXL binder U-rige sekvenser i 3′ UTR og rekrutterer corepressorproteinet UNR (opstrøms for N-ras) og PABP, som blokerer rekrutteringen af præinitieringskomplekset til 5′-enden af mRNA’et . For at sikre, at msl-2 bliver fuldstændig undertrykt, finder et andet regulerende trin, der også formidles af SXL, sted ved 5′ UTR’en. Denne undertrykkelse involverer en ny reguleringsmekanisme, hvor der finder en crosstalk sted mellem SXL og en uORF for effektivt at undertrykke translation . Den 5′ UTR af msl-2 indeholder 3 uORF’er, men kun den tredje er involveret i repressionen. Interessant nok er denne repression meget svag i fravær af SXL (~2 gange), men når SXL er til stede, binder SXL en poly U-strækning et par nukleotider væk fra uAUG’en og øger denne repression til mere end 14 gange. SXL virker ved at øge oversættelsesinitieringen ved uAUG og ikke ved at virke som en simpel sterisk arrest af scannende ribosomer. Denne virkning kan ske via et samspil mellem SXL og translationsinitieringsfaktorer; muligvis medlemmer af elF3-komponenten, som det fremgår af en to-hybrid-screening. Denne mekanisme påvirker potentielt et stort antal mRNA’er; 268 transskriptioner i Drosophila blev bestemt til at indeholde SXL-bindingsmotiver, der er forbundet med uAUG med en passende afstand. For eksempel blev en reporterkonstruktion, der indeholder 5′UTR af genet Irr47, undertrykt ~4-foldigt af SXL-protein .
RBP’er kan have antagonistiske funktioner, når de regulerer translation. Et interessant eksempel er reguleringen af p21 i forbindelse med replikativ senescens, en cellulær tilstand, hvor cellerne går ind i et irreversibelt vækststop. Induktion af p21 er nødvendig for at igangsætte processen og for at hæmme cdk2-cyclin E-komplekser. 5′ UTR af p21 indeholder en GC-rig sekvens, der danner en stamme-loop. Dette element genkendes af to RBP’er med forskellige egenskaber: CUGBP1 og calreticulin (CRT). Konkurrencen mellem de to proteiner bestemmer det endelige niveau af p21-ekspression og bestemmer, om cellerne vil proliferere eller gennemgå vækststop og senescens. Bindingen af CUGBP1 til p21 mRNA er dramatisk forøget i senescensceller sammenlignet med unge fibroblastceller. Proteinniveauerne ændres ikke under processen, og denne stigning i aktiviteten skyldes fosforylering. På den anden side viste CRT-IP’er en fire til femdobbelt reduktion af aktiviteten i senescensceller som følge af et fald i ekspressionen. Det blev påvist, at begge proteiner påvirker p21-oversættelsen. Mens CUGBP1 fungerer som en aktivator, fungerer CRT imidlertid som en repressor. Da de to proteiner har modsatrettet aktivitet i senescerende celler, blev de undersøgt for at se, om de konkurrerer om interaktion med p21 mRNA og for at kontrollere dets translation. Stigende mængder af det ene protein var i stand til at vende det andet proteins binding til p21 mRNA og dets virkning på translation; affiniteten til bindingsstedet er ret forskellig, da CUGBP1 skulle være til stede i bindingsreaktionerne med et fire- til ottedobbelt molært overskud i forhold til CRT for at modvirke dets binding til p21 mRNA og påvirke dets translation .
5. Regulering ved uORF’er og opstrøms AUG’er
uORF’er og uAUG’er er vigtige reguleringselementer i 5′ UTR’er. Som deres navne antyder, er uORF’er sekvenser defineret af en start- og stopkodon opstrøms for den vigtigste kodningsregion, mens uAUG’er er startkodoner uden en in-frame nedstrøms stopkodon, der er placeret opstrøms for den vigtigste kodningsregion. En stor procentdel af det menneskelige transkriptom indeholder uORF’er og/eller uAUG’er, med værdier på mellem 44 og 49 % . Der findes et lignende antal i musetranskriptomet. Selv om disse tal kan lyde høje, er både uORF’er og uAUG’er mindre hyppige end tilfældigt forventet, hvilket tyder på, at de er under selektivt pres. uORF’er og uAUG’er er overrepræsenteret i bestemte undergrupper som transkriptionsfaktorer, vækstfaktorer og deres receptorer og proto-onkogener . Både uORF’er og uAUG’er er ekstremt forskellige, idet de varierer i position i forhold til hætten og hoved-AUG’en, antal pr. transkript og længde (i tilfælde af uORF’er) . Supplerende tabel 1 (i Supplerende materiale, der er tilgængeligt online på http://dx.doi.org/10.1155/2012/475731) indeholder en omfattende liste over uORF’er og uAUG’er, der findes i det menneskelige transkriptom. uORF’er og uAUG’er er ikke blevet grundigt analyseret med hensyn til bevarelse. En pilotundersøgelse udført med en delmængde af transkript fra mennesker, mus og rotter viste, at begge elementer er moderat bevaret, da 38 % af uORF’erne og 24 % af uAUG’erne blev bestemt til at være bevaret blandt tre arter . Den beskedne bevarelse af uORF’er kombineret med det faktum, at deres gennemsnitlige længde (20 nukleotider) forventes tilfældigt, og at uAUG’er giver en stærkere undertrykkelse i forhold til uORF’er, tyder på, at mange uAUG’er er blevet neutraliseret i evolutionsprocessen ved erhvervelse af et nedstrøms stopkodon. Det er derfor blevet foreslået, at kun nogle få uORF’er, højst sandsynligt de bevarede, er blevet rekrutteret til ekspressionsregulering . I gær er det blevet vist, at uORF’er er statistisk underrepræsenteret i 5′ UTR’er og er blevet fjernet ved selektivt pres, hvilket ligeledes indikerer, at de resterende uORF’er kan være involveret i translationsregulering .
Og selv om det generelt er blevet foreslået, at uORF’er er negativt korreleret med proteinproduktion indtil nu, er der kun blevet påvist funktionel aktivitet for et begrænset antal uORF’er og uAUG’er. I figur 3 viser vi eksempler på den indvirkning, som uAUGs kan have på translationseffektiviteten. Blandt de mest relevante træk, der kan bidrage til funktionalitet, er lang 5′ cap-til-uORF-afstand, sekvensbevaring, den kontekst, hvori AUG’en er placeret, styrken af initieringsstedet for ORF’en, uORF’ens længde og antallet af AUG’er i 5′ UTR . Der er blevet observeret forskellige resultater, når et ribosom støder på en uAUG eller uORF . Da antallet af karakteriserede hændelser stadig er lille, er det svært at definere generelle mekanismer; vi beskriver derfor et par velkarakteriserede og relevante hændelser. Lækkende scanning defineres, når en del af scanningskomplekserne går uden om uAUG eller uORF og fortsætter med at scanne efter den næste AUG. I dette tilfælde fungerer den opstrøms AUG som en “lokkedue” fra ORF AUG’en og fungerer som en negativ regulator af translation i det mindste for en vis del af ribosomerne. Produktionen af cis-virkende peptider ved uORF’er kan reducere initieringen af translation af den nedstrøms ORF ved at standse ribosomet ved enden af uORF’en . Et klassisk eksempel er det evolutionært bevarede eukaryotiske arginin-dæmpningspeptid (AAP), som negativt kontrollerer translationen af proteiner, der er involveret i de novo-svampes arginininbiosyntese i høj argininkoncentration, og som har en negativ effekt på translationen af proteiner, der er involveret i de novo-svampes argininbiosyntese . I dette scenarie ændrer arginin AAP-konformationen og/eller P-stedmiljøet og forårsager ribosomal blokering ved termineringskodonen for AAP uORF . AAP reducerer også translationselongationen ved ribosomal blokering, når uORF’en er indsat i en kodningssekvens . Et andet klassisk eksempel på uORF-medieret regulering stammer fra gær. Fire uORF’er er til stede i 5′ UTR af transkriptionsfaktoren GCN4. Den første af de fire uORF’er oversættes altid effektivt uanset næringsbetingelserne. I uforstyrrede celler tillader hurtig genindlæsning af ribosomer og initieringscofaktorer oversættelse af uORF’erne 2-4, mens oversættelsen af hoved-ORF’en hæmmes. I situationer med aminosyresult er initieringsfaktorer knappe, hvilket resulterer i en langsommere genopfyldning af ribosomer og scanning over de sekvenser, der indeholder uORF’erne. Et funktionelt initieringskompleks samles kun igen ved hovedkodningssekvensen, og GCN4 udtrykkes. Denne mekanisme giver mulighed for en hurtig reaktion på ernæringsmæssig stress . Et andet lignende eksempel på reguleret ekspression via uORF er genet for carnitinpalmitoyltransferase 1C (CPT1C). CPT1C regulerer metabolismen i hjernen i situationer med energioverskud. Tilstedeværelsen af uORF i 5′ UTR undertrykker ekspressionen af ORF’en. Denne undertrykkelse ophæves imidlertid som reaktion på specifikke stress-stimuli som f.eks. glukosedepravation og palmitat-BSA-behandling . Det er blevet foreslået, at uORF’er også kan fremkalde mRNA-nedbrydning. En række 5′ UTR-konstruktioner, der som reporter indeholder cat-genet fra det bakterielle transposon Tn9, blev afprøvet i gær. En enkelt nukleotid-substitution blev anvendt til at skabe en 7-codon ORF opstrøms for cat-genet. UORF’en blev oversat effektivt og forårsagede translationshæmning af cat ORF’en og destabilisering af cat mRNA’et . En forbindelse mellem uORF’er og mRNA-nedfald blev også antydet på baggrund af en sammenligning mellem de gennemsnitlige ekspressionsniveauer for uORF-holdige og ikke-uORF-holdige transskriptioner .
(a)
(b)
(a)
(b)
Indflydelse af uAUG-sekvenser på translationsregulering. (a) Sammenligning af luciferase-niveauer, der er opnået for konstruktioner med 5′ UTR af genet ACT (kontrol) og gener, der indeholder uAUG: WBSCR16, MFSD5 og BCL2L13. (b) Sletning eller mutation af uAUG-sekvensen, der er til stede i generne WBSCR16, MFSD5 og BCL2L13, ophæver translationsrepressionen, hvilket ses som en stigning i luciferaseaktiviteten.
Flere mutationer, der eliminerer eller skaber uORF’er, som ender med at ændre proteinniveauerne, er blevet forbundet med menneskelige sygdomme. Deres relevans blev diskuteret for nylig . Prædisposition for melanom kan forårsages af en mutation, der introducerer en uORF i 5′ UTR af genet cyclin-afhængig-kinaseinhibitorprotein (CDKN2A) . Arvelig trombocytæmi skyldes en mutation, der skaber en splejsningvariant, som eliminerer en uORF, hvilket fører til en stigning i proteinproduktionen af genet thrombopoietin . Marie Unna arvelig hypotrichose skyldes en mutation, der afbryder en uORF, der er til stede i 5′ UTR af genet hairless homolog, og som derfor øger dets ekspression . En overgang fra G til A i en af de uORF’er, der er til stede i 5′ UTR af TGF-β3-transkriptet, blev bestemt til at være forbundet med arytmogen højre ventrikulær kardiomyopati/dysplasi (ARVC) . En anden gruppe på fem uORF’er, der er forbundet med sygdomme, er for nylig blevet testet ved hjælp af reporterassays; de omfatter gonadal dysgenese (SRY) , Van der Woude-syndromet (IRF6) , Carney Complex Type 1 (PRKAR1A) , arvelig pancreatitis (SPINK1) og Thalassaemia-β (HBB) . Denne liste vil helt sikkert blive udvidet, da der er blevet rapporteret om mere end 500 enkeltnukleotidpolymorfismer (SNP’er), der skaber eller sletter uORF’er.
6. Søgning efter nye reguleringselementer i 5′ UTR
Kun en lille brøkdel af de posttranskriptionelle reguleringselementer, der er placeret i menneskets 5′ UTR’er, er blevet karakteriseret. Disse identificerede UTR-elementer er katalogiseret i en webressource, der vedligeholdes af Graziano Pesoles gruppe og kaldes UTRdb (http://utrdb.ba.itb.cnr.it/) . In vivo-metoder til identifikation af posttranskriptionelle reguleringselementer i UTR’er, især dem, der er forbundet med RBP’er, har gjort store fremskridt i de sidste fem år takket være dyb sekventeringsteknologi. CLIP og RIP-Seq er metoder baseret på isolering af RNA-proteinmolekyler (RNP’er) via immunoprecipitation efterfulgt af RNasefordøjelse og præcis identifikation af RBP-bindingssteder ved hjælp af dyb sekventering . Selv om antallet af RBP’er, der hidtil er analyseret ved hjælp af disse metoder, er meget lille (gennemgået i ), kan man i takt med, at dyb sekventeringsteknologien bliver mere tilgængelig og metoderne forenklet, forvente, at en stor del af de menneskelige RBP-bindingssteder i UTR’er meget snart vil blive kortlagt.
Et andet valg til kortlægning af UTR-elementer, der regulerer translation, er at anvende rent beregningsmæssige metoder baseret på analyse af UTR-sekvenserne. Disse metoder er baseret på identifikation af degenererede ribonukleotidmønstre, der har de forventede egenskaber for RBP-bindingssteder. Tilsvarende metoder er blevet anvendt i næsten 30 år til at identificere transkriptionelle reguleringsmekanismer i promotorsekvenser. Disse metoder er ved at være modne, anvendes i vid udstrækning og har været til stor hjælp ved udarbejdelsen af databaser om transkriptionel regulering (f.eks. TRANSFAC) . Selv om meget af det arbejde, der er rettet mod udformning og forfining af algoritmer til analyse af regulatoriske sekvenser i forbindelse med transkriptionel regulering, kan tilpasses til tilsvarende analyseproblemer i forbindelse med post-transkriptionelle regulatoriske elementer, er der yderligere komplikationer forbundet med RBP-bindingssteder. Den mest indlysende af disse er, at RBP’er vil have sekundære strukturelle præferencer, og kun få eksisterende analyseværktøjer kan indarbejde oplysninger om RNA-foldning. På samme måde kan reguleringselementer på grund af RNA-foldning lettere fungere synergistisk eller udvise samordnet binding til sekvenselementer, der er distale i den primære sekvens, men meget tæt på hinanden i det foldede molekyle. En anden vanskelighed er manglen på eksempler på translationelle reguleringselementer til at træne analysen. Baseret på en håndfuld velundersøgte eksempler er der ofte en opfattelse af, at RBP-bindingssteder i gennemsnit er kortere end transkriptionsfaktorers (TF’er) bindingssteder, men denne opfattelse kan skyldes en skævhed i det sæt af RBP’er, der er genstand for mest forskningsfokus . En af de mest effektive metoder til identifikation af regulatoriske elementer er fylogenetisk fodaftryk, som udnytter den lokalt forhøjede evolutionære bevarelse til at afsløre funktionelle elementer . Denne logik fungerer lige så godt for post-transkriptionelle regulatoriske elementer. Desværre er TF-bindingssteder også en stor hindring for direkte anvendelse af beregningsmæssig sekvensanalyse til identifikation af 5′ UTR-elementer, der er involveret i translation. Elementer, der er involveret i transkriptionel regulering, findes både op- og nedstrøms for transkriptionelle startsteder, og når 5′ UTR’er er tilstrækkeligt korte, er post-transkriptionelle regulatoriske elementer sandsynligvis interleaved med TF-bindingssteder.
I sidste ende vil de bedste metoder til identifikation af post-transkriptionelle regulatoriske elementer fremkomme ved komplementær anvendelse af eksperimentelle og beregningsmæssige teknikker.
Anerkendelser
Forskning i Penalvas laboratorium er støttet af Voelcker Foundation, Children’s Brain Tumor Foundation og 5R21HG004664-02 og 1R01HG006015-01A1.
Supplementære materialer
Vi opsummerede den grundlæggende statistik for uORF’er i humant transkriptom (NCBI build37.3). Tabel 1.a viser antallet af forekomster af uORF-lignende sekvenser, som indeholder AUG i 5′ UTR’er med hensyn til mRNA’er og gener. Vi adskilte også to særskilte uORF-lignende sekvenser med matchende terminationskodon i 5′ UTR’er eller uden matchende terminationskodon i 5′ UTR’er. De detaljerede oplysninger om disse to tilfælde er anført i tabel 1.b. Endelig viser tabel 1.c, hvor mange uORF-lignende sekvenser der optræder på en individuel 5′ UTR i hvert mRNA.
- Supplementær tabel
Skriv et svar