För att det ska börja: Regulering av översättning vid 5′ UTR
On oktober 5, 2021 by adminAbstract
Translationsreglering spelar viktiga roller i både normala fysiologiska förhållanden och sjukdomstillstånd. Denna reglering kräver cis-regulatoriska element som huvudsakligen är belägna i 5′ och 3′ UTR och trans-regulatoriska faktorer (t.ex. RNA-bindande proteiner (RBPs)) som känner igen specifika RNA-funktioner och interagerar med översättningsmaskineriet för att modulera dess aktivitet. I den här artikeln diskuterar vi viktiga aspekter av 5′ UTR-medierad reglering genom att ge en översikt över egenskaperna och funktionen hos de viktigaste elementen som finns i denna region, som uORF (upstream open reading frame), sekundära strukturer och RBPs-bindningsmotiv samt olika mekanismer för översättningsreglering och den inverkan de har på genuttrycket och människors hälsa när de är avreglerade.
1. Översättningsreglering
Genuttryck kan moduleras på flera nivåer från kromatinmodifiering till mRNA-translation. Trots betydelsen av transkriptionsreglering står det i dagsläget klart att mRNA-nivåer inte kan användas som enda parameter för att motivera proteininnehållet i en cell. I en nyligen genomförd studie från vårt labb fastställde vi faktiskt att det finns en direkt korrelation mellan mRNA och protein för mindre än en tredjedel av de analyserade generna i en mänsklig cellinje. Dessutom tyder vår analys på att translationsreglering bidrar avsevärt till proteinvariationen, eftersom flera parametrar relaterade till translation, t.ex. 5′ UTR, 3′ UTR, längden på den kodande sekvensen, förekomsten av uORF:er och aminosyrasammansättningen, etc., uppvisade goda korrelationer med de erhållna förhållandena mellan mRNA och protein. Översättningsreglering fungerar som en viktig omkopplare när det krävs snabba förändringar i genuttrycket som svar på interna och externa stimuli (PDGF2, VEGF, TGFβ är exempel på gener som styrs på detta sätt). Translationsreglering spelar också en viktig roll under utveckling och celldifferentiering genom att ändra uttrycksnivåerna för specifika mRNA-subgrupper under ett visst tidsfönster medan majoriteten av transkriptionerna förblir oförändrade (granskad i ).
I den här artikeln kommer vi att fokusera på betydelsen av 5′ UTR-medierad reglering och på de olika funktionella element som finns i denna region, med undantag för IRES som diskuteras i en annan artikel i det här numret. De viktigaste regleringselementen i 5′ UTR är sekundära strukturer (inklusive IRES), bindningsställen för RNA-bindande proteiner, uAUGs och uORFs (figur 1).
Regulatoriska element som finns i 5′ UTR.
2. 5′ UTR
Den genomsnittliga längden på 5′ UTR är ~100 till ~220 nukleotider hos alla arter . Hos ryggradsdjur tenderar 5′ UTR att vara längre i transkript som kodar för transkriptionsfaktorer, protoonkogener, tillväxtfaktorer och deras receptorer samt proteiner som är dåligt översatta under normala förhållanden . Hög GC-innehåll är också en bevarad egenskap, med värden som överstiger 60 % hos varmblodiga ryggradsdjur. När det gäller hårnålsstrukturer kan GC-innehållet påverka proteinöversättningseffektiviteten oberoende av hårnålens termiska stabilitet och hårnålens position . UTR i eukaryotiska mRNA:er uppvisar också en mängd olika upprepningar som omfattar korta och långa interspridda element (SINE respektive LINE), enkla sekvensupprepningar (SSR), minisatelliter och makrosatelliter .
Translationsinitiering i eukaryoter kräver rekrytering av ribosomala subenheter vid antingen 5′ m7G-huvudstrukturen. Initieringskodonet är i allmänhet placerat långt nedströms, vilket kräver ribosomal rörelse till denna plats. Denna rörelse tycks vara icke-linjär för vissa mRNA (dvs. ribosomala underenheter tycks förbigå (shunta) segment av 5′ UTR när de rör sig i riktning mot AUG). Shuntning skulle kunna göra det möjligt för mRNA som innehåller uAUGs eller hårnålsstrukturer att översättas effektivt. Viktiga exempel är mRNA från blomkålsmosaikvirus och adenovirus. Mekanismen för ribosomal shunting är ganska komplex och kräver basparning mellan mRNA och RNA.
Gener som uppvisar skillnader i 5′ UTR i sina transkriptioner är relativt vanliga. 10-18 % av generna uttrycker alternativa 5′ UTR genom att använda flera promotorer, medan alternativ splicing inom UTR uppskattas påverka 13 % av generna i däggdjurens transkriptom . Dessa variationer i 5′ UTR kan fungera som viktiga brytare för att reglera genuttrycket. Två viktiga exempel utgörs av de cancerrelaterade generna BRCA1 (bröstcancer 1) och TGF-β (transforming growth factor β). BRCA1 är en tumörsuppressor, ofta muterad i bröstcancer med funktioner i cellcykel, apoptos och reparation av DNA-skador. BRAC1 producerar två olika transkript som härrör från två olika promotorer och därför uppvisar skillnader i deras 5′ UTR. Ett kortare transkript uttrycks i både cancervävnad och icke-cancerös bröstvävnad och översätts effektivt, medan ett längre transkript främst uttrycks i bröstcancer. Närvaron av flera uAUGs och en mer komplex struktur påverkar dramatiskt översättningen av det längre transkriptet. Detta orsakar en övergripande minskning av BRAC1-nivåerna i tumörceller, vilket leder till en lindring av tillväxthämningen . TGF-β är inblandat i ett stort antal processer som omfattar cellproliferation, migration, sårreparation, utveckling, tumörigenesering och immunosuppression. Det finns tre kända isoformer: β1, β2 och β3. TGF-β3 producerar två alternativa transkript: ett 3,5 kb transkript med en mycket lång 5′ UTR (1,1 kb) och ett 2,6 kb transkript med en kortare 5′ UTR (0,23 kb). Närvaron av 11 uORF:er i det längre transkriptet hämmar dramatiskt dess översättning medan det kortare transkriptet översätts effektivt.
3. Reglering genom sekundärstruktur
Sekundärstrukturer kan fungera som viktiga regleringsverktyg i 5′ UTR:er. Ett samband med genens funktion har föreslagits; sekundära strukturer har konstaterats vara särskilt vanligt förekommande bland mRNA som kodar för transkriptionsfaktorer, protoonkogener, tillväxtfaktorer och deras receptorer och proteiner som är dåligt översatta under normala förhållanden. >90 % av transkriptionerna i dessa klasser har 5′ UTR som innehåller stabila sekundärstrukturer med en genomsnittlig fri energi på mindre än -50 kcal/mol. 60 % av dessa stabila sekundärstrukturer är placerade mycket nära kapstrukturen . Dessa strukturer är mycket effektiva när det gäller att hämma translation. En hårnål som är placerad nära kapseln med en fri energi på -30 kcal/mol skulle vara tillräcklig för att blockera preinitieringskomplexets tillträde till mRNA. När hårnålarna ligger längre bort i 5′ UTR krävs en fri energi som är starkare än -50 kcal/mol för att de ska kunna blockera översättningen. En stabil sekundärstruktur kan motstå helikaset elF4A:s avvecklingsaktivitet. Denna effekt kan delvis övervinnas genom överexpression av elF4A i samarbete med elF4B . mRNA med en starkt strukturerad 5′ UTR som proto-onkogener och andra tillväxtfaktorer använder cap-beroende translationsinitiering. Inte överraskande har överuttryck av komponenter i translationsinitieringsmaskineriet, inklusive elf4E, kopplats till tumörigenes (granskat i ).
Genen TGF-β1 är ett bra exempel på översättningshämning som medieras av sekundärstruktur . Ett evolutionärt bevarat motiv i 5′ UTR bildar en stabil stamloop. Denna struktur i sig är dock inte tillräcklig för att blockera translation. Translationsrepression av TGF-β1 beror på ökad bindning av det RNA-bindande proteinet YB-1 till TGF-β1-transkriptet . Det föreslogs då att YB-1 binder 5′ UTR av TGF-β1 med hög affinitet tack vare dess GC-innehåll och samarbetar med stamslingan för att hämma TGF-β1-translationen genom att underlätta duplexbildningen .
4. Reglering genom RNA-bindande proteiner
Den mänskliga arvsmassan förutspås koda för cirka 1 000 RNA-bindande proteiner (RBP) med en stor andel av dem involverade i translation. De kan delas in i två huvudgrupper: RBP:er som ingår i det grundläggande översättningsmaskineriet och som krävs för översättning av alla uttryckta mRNA (exempel: PABPI, elf4E) och RBP:er som fungerar på ett mer selektivt sätt genom att kontrollera antingen positivt eller negativt översättningsnivåerna för specifika mål-mRNA (exempel: HuR, Musashi1). När det gäller denna senare grupp har man observerat att RBP:er kan använda olika mekanismer för att öka eller hämma translation. Även om flera undantag är kända kan man säga att RBPs ofta känner igen specifika motiv i UTRs och interagerar med översättningsmaskineriet för att kontrollera uttrycket. Interferens med translation sker normalt under initieringssteget (granskad i ).
Det bäst karakteriserade exemplet på RBP-medierad reglering som involverar 5′ UTRs tillhandahålls av järnregleringsproteinerna (IRP 1 och 2). Dessa proteiner känner igen en mycket konserverad stamloopstruktur med cirka 30 nukleotider, känd som järnresponselementet (IRE). De viktigaste egenskaperna är en hexanukleotidslinga med sekvensen CAGYCX (Y = U eller A; X = U, C eller A) och en övre stam på 5 bp som är åtskild från en nedre stam av varierande längd genom ett oparat cytosin. Denna reglering är avgörande för att upprätthålla den cellulära järnhomeostasen eftersom ett stort antal mRNA som är kopplade till järnlagring och järnmetabolism, inklusive ferritin, mitokondriellt aconitas, succinatdehydrogenas-järnprotein, erytroid 5-aminolevulinatsyntetas (eALAS) och en järnexportinmolekyl vid namn ferroportin (FPN1), har sitt uttryck modulerat av detta system. När de cellulära järnnivåerna är låga binder IRP1 och IRP2 till IRE och blockerar översättningen av nedströms ORF. När de intracellulära järnnivåerna är höga minskar den RNA-bindande aktiviteten hos båda IRP:erna (figur 2(a)). IREs tenderar att placeras nära locket, vilket orsakar en sterisk hämning av bindningen av 40S-ribosomala underenheter till transkriptet. När IRE-IRP-komplexet är placerat långt från locket blockerar det snarare än att påverka 40S-rekryteringen ribosomal skanning än att påverka 40S-rekryteringen (se ). Ett intressant kringgående av IRE/IRP-mekanismen kan observeras i järnstinna duodenala och erytroida prekursorceller. En promotor uppströms används för att generera FPN1 pre-mRNA som innehåller ytterligare ett exon som är kopplat genom alternativ splicing till en splice acceptor i 3′ av IRE. Ett moget FPN1-transkript som innehåller samma öppna läsram genereras, men 5′ UTR innehåller inte IRE . Därför uttrycker dessa celler den alternativa FPN1-isoformen på ett järnoberoende sätt. Mutationer som påverkar IRE kan leda till sjukdomar. Detta är fallet med det ärftliga hyperferritinemi-kataraktsyndromet (HHCS), en genetisk autosomal dominant sjukdom där aggregering och kristallisering av ferritin i linsen leder till bilateral katarakt .
(a)
(b)
(a)
(b)
Translationell reglering av RNA-bindande proteiner. (a) I järnbristceller binder IRP till IRE som är lokaliserad i 5′ UTR av ferritin mRNA och blockerar dess translation. När de cellulära järnnivåerna ökar binder ett komplex som innehåller Fe till IRPs. Dessa proteiner modifieras således allosteriskt, vilket minskar IRP-IRE-bindningen och möjliggör översättning av ferritin-mRNA. (b) Reglering av msl-2 genen hos honflugor. Efter transkription i kärnan binder SXL specifikt till introniska U-rika regioner av msl-2 pre-mRNA och hämmar avlägsnandet av introner (1). I cytoplasman binder SXL till samma element som nu lokaliseras i 5′ UTR av moget msl-2 mRNA, ökar översättningsinitieringen av en uppströms ORF (2) och förhindrar översättningen av huvud ORF (3). De reglerande elementen i 3′ UTR av msl-2 mRNA var inte representerade.
RBP-medierad reglering kan vara mycket utarbetad och innefatta flera steg. Ett bra exempel som visar övergången mellan faktorer och olika regleringsprocesser är genen male-specific-lethal 2 (msl-2) i Drosophila, en huvudspelare i doseringskompensation. Det honspecifika RNA-bindande proteinet sex lethal (SXL) deltar i flera aspekter av msl-2-regleringen där msl-2-uttryck måste förhindras (figur 2(b)). Regleringen börjar på splicingnivå; SXL binder till två polyU-sträckor som ligger i ett intron som är en del av 5′ UTR. Denna process orsakar intronretention och bevarar kritiska sekvenser som senare kommer att användas vid translationsreglering. I cytoplasman kommer samma SXL-protein att fungera som en translationsrepressor för msl-2 i två olika mekanismer som äger rum vid 3′ och 5′ UTR . SXL binder till U-rika sekvenser i 3′ UTR och rekryterar corepressorproteinet UNR (uppströms N-ras) och PABP som blockerar rekryteringen av preinitieringskomplexet till 5′-änden av mRNA . För att säkerställa att msl-2 blir helt undertryckt sker ett andra regleringssteg som också förmedlas av SXL vid 5′ UTR. Denna repression inbegriper en ny regleringsmekanism där en korsverkan mellan SXL och en uORF äger rum för att effektivt reprimera translation. Msl-2:s 5′ UTR innehåller tre uORF:er, men endast den tredje är involverad i repressionen. Intressant nog är denna repression mycket svag i avsaknad av SXL (~2 gånger), men när SXL är närvarande binder SXL en poly U-sträcka några nukleotider från uAUG och ökar repressionen till mer än 14 gånger. SXL verkar genom att öka översättningsinitieringen vid uAUG och inte genom att fungera som ett enkelt steriskt stopp för skanande ribosomer. Denna effekt kan ske via en interaktion mellan SXL och översättningsinitieringsfaktorer, eventuellt medlemmar av elF3-komponenten, vilket indikeras av en tvåhybrid-screening. Denna mekanism kan potentiellt påverka ett stort antal mRNA:er. 268 transkript i Drosophila fastställdes innehålla SXL-bindningsmotiv associerade med uAUG med lämpligt avstånd. En reporterkonstruktion som innehåller 5′UTR av genen Irr47 reprimerades till exempel ~4 gånger av SXL-protein .
RBP:er kan ha antagonistiska funktioner när de reglerar translation. Ett intressant exempel är regleringen av p21 i samband med replikativ senescens, ett cellulärt tillstånd där celler går in i ett irreversibelt tillväxtstillestånd. Induktion av p21 krävs för att initiera processen och för att hämma cdk2-cyklin E-komplex. 5′ UTR av p21 innehåller en GC-rik sekvens som bildar en stamslinga. Detta element känns igen av två RBPs med olika egenskaper: CUGBP1 och calreticulin (CRT). Konkurrensen mellan de två proteinerna bestämmer de slutliga nivåerna av p21-uttryck och fastställer om cellerna kommer att proliferera eller genomgå tillväxtstillestånd och senescens. Bindningen av CUGBP1 till p21 mRNA ökar dramatiskt i senescens jämfört med unga fibroblastceller. Proteinnivåerna förändras inte under processen och den ökade aktiviteten beror på fosforylering. Å andra sidan visade CRT IPs en fyra- till femfaldig minskning av aktiviteten i senescensceller på grund av en minskning av uttrycket. Båda proteinerna visade sig påverka översättningen av p21. Men medan CUGBP1 fungerar som en aktivator fungerar CRT som en repressor. Eftersom de två proteinerna har motsatt aktivitet i senescensceller undersöktes de för att se om de konkurrerar om interaktion med p21 mRNA och för att kontrollera dess translation. Ökande mängder av det ena proteinet kunde vända det andra proteinets bindning till p21 mRNA och dess effekt på översättningen. Affiniteten till bindningsstället är ganska annorlunda eftersom CUGBP1 var tvungen att vara närvarande i bindningsreaktionerna i ett fyra- till åttafaldigt molärt överskott till CRT för att motverka dess bindning till p21 mRNA och påverka dess översättning .
5. Reglering genom uORFs och uppströms AUGs
uORFs och uAUGs är viktiga regleringselement i 5′ UTRs. Som deras namn antyder är uORFs sekvenser som definieras av en start- och stoppkodon uppströms den huvudsakliga kodningsregionen medan uAUGs är startkodoner utan en inframe nedströms stoppkodon som ligger uppströms den huvudsakliga kodningsregionen. En stor andel av människans transkriptom innehåller uORFs och/eller uAUGs, med värden som varierar mellan 44 och 49 % . Ett liknande antal finns i musens transkriptom. Även om dessa siffror kan låta höga är både uORFs och uAUGs mindre frekventa än vad som förväntas av slumpen, vilket tyder på att de är under selektivt tryck. uORFs och uAUGs är överrepresenterade i särskilda undergrupper, t.ex. transkriptionsfaktorer, tillväxtfaktorer och deras receptorer samt proto-onkogener . Både uORF:er och uAUG:er är extremt varierande i fråga om position i förhållande till huvudet och huvud-AUG:en, antal per transkript och längd (när det gäller uORF:er) . I den kompletterande tabellen 1 (i det kompletterande materialet som finns online på http://dx.doi.org/10.1155/2012/475731) finns en omfattande förteckning över uORF:er och uAUG:er som finns i det mänskliga transkriptomet. uORF:er och uAUG:er har inte analyserats utförligt när det gäller bevarande. En pilotstudie som gjordes med en delmängd av transkript från människa, mus och råtta visade att båda elementen är måttligt konserverade, eftersom 38 % av uORFs och 24 % av uAUGs konstaterades vara konserverade mellan de tre arterna . Den blygsamma bevaringen av uORFs i kombination med det faktum att deras genomsnittliga längd (20 nukleotider) förväntas av slumpen och att uAUGs ger ett starkare undertryckande i jämförelse med uORFs tyder på att många uAUGs har neutraliserats under evolutionen genom att förvärva ett nedströms stoppkodon. Det har då föreslagits att endast ett fåtal uORFs, sannolikt de bevarade, har rekryterats för reglering av uttrycket . I jäst har det visats att uORFs är statistiskt underrepresenterade i 5′ UTRs och har avlägsnats genom selektivt tryck, vilket på samma sätt tyder på att de återstående uORFs kan vara involverade i translationsreglering .
Och även om det överlag har föreslagits att uORFs är negativt korrelerade med proteinproduktion, så har funktionell aktivitet hittills påvisats för endast ett begränsat antal uORFs och uAUGs. I figur 3 visar vi exempel på hur uAUGs kan påverka översättningseffektiviteten. Bland de mest relevanta egenskaperna som kan bidra till funktionalitet är långt avstånd mellan 5′ cap och uORF, sekvensbevarande, kontext i vilken AUG:n är placerad, styrkan hos initieringsstället för ORF:n, längden på uORF:n och antalet AUG:er i 5′ UTR . Olika resultat har observerats när en ribosom möter en uAUG eller uORF . Eftersom antalet karakteriserade händelser fortfarande är litet är det svårt att definiera allmänna mekanismer; vi beskriver därför några välkaraktäriserade och relevanta händelser. Läckande skanning definieras när en andel av skanningskomplexen förbigår uAUG eller uORF och fortsätter att skanna efter nästa AUG. I detta fall fungerar uppströms AUG som ett ”lockbete” från ORF AUG och fungerar som en negativ regulator av translation åtminstone för en viss andel av ribosomerna. Produktionen av cis-verkande peptider av uORF:er kan minska initieringen av translation av ORF:n nedströms genom att stoppa ribosomen i slutet av uORF:n . Ett klassiskt exempel är den evolutionärt bevarade eukaryota arginin attenuator-peptiden (AAP), som negativt kontrollerar översättningen av proteiner som är involverade i de novo-svampens arginininbiosyntes vid hög argininkoncentration . I detta scenario ändrar arginin AAP-konformationen och/eller miljön på P-platsen och orsakar ribosomalt stopp vid termineringskoden för AAP uORF . AAP minskar också översättningslängningen genom att ribosomerna stannar upp när uORF:n är infogad i en kodande sekvens . Ett annat klassiskt exempel på uORF-medierad reglering kommer från jäst. Fyra uORFs finns i 5′ UTR för transkriptionsfaktorn GCN4. Den första av de fyra uORF:erna översätts alltid effektivt oberoende av näringsförhållandena. I ostörda celler möjliggör snabb omladdning av ribosomer och initieringscofaktorer översättning av uORF 2-4 samtidigt som översättningen av huvud-ORF hämmas. I situationer med aminosyrahunger är initieringsfaktorer sällsynta, vilket resulterar i en långsammare omladdning av ribosomer och skanning över de sekvenser som innehåller uORF:erna. Ett funktionellt initieringskomplex återmonteras endast vid huvudkodningssekvensen och GCN4 uttrycks. Denna mekanism möjliggör ett snabbt svar på näringsmässig stress . Ett annat liknande exempel på reglerat uttryck via uORF är genen för karnitinpalmitoyltransferas 1C (CPT1C). CPT1C reglerar ämnesomsättningen i hjärnan i situationer med energiöverskott. Närvaron av uORF i 5′ UTR undertrycker uttrycket av ORF:en. Denna repression avhjälps dock som svar på specifika stresstimuli, t.ex. glukosdepravation och palmitat-BSA-behandling . Det har föreslagits att uORFs också kan inducera nedbrytning av mRNA. En serie 5′ UTR-konstruktioner med cat-genen från det bakteriella transposonet Tn9 som reporter testades i jäst. Ett enda nukleotidbyte användes för att skapa en 7-kodad ORF uppströms från cat-genen. UORF:n översattes effektivt och orsakade översättningshämning av cat ORF:n och destabilisering av cat mRNA . Ett samband mellan uORFs och mRNA-avfall föreslogs också baserat på en jämförelse mellan de genomsnittliga uttrycksnivåerna för uORF-innehållande och icke-uORF-innehållande transkript .
(a)
(b)
(a)
(b)
UAUG-sekvensers inverkan på translationsregleringen. (a) Jämförelse av luciferasnivåer som erhållits för konstruktioner som har 5′ UTR av genen ACT (kontroll) och gener som innehåller uAUG: WBSCR16, MFSD5 och BCL2L13. (b) Deletion eller mutation av uAUG-sekvensen som finns i generna WBSCR16, MFSD5 och BCL2L13 upphäver translationsrepressaltionen vilket ses som en ökning av luciferasaktiviteten.
Flera mutationer som eliminerar eller skapar uORF:er som i slutändan förändrar proteinnivåerna har kopplats till mänskliga sjukdomar. Deras relevans diskuterades nyligen . Predisposition för melanom kan orsakas av en mutation som introducerar en uORF i 5′ UTR av genen cyklinberoende kinashämmareprotein (CDKN2A) . Ärftlig trombocytemi orsakas av en mutation som skapar en skarvningsvariant som eliminerar en uORF, vilket leder till en ökad proteinproduktion av genen trombopoietin . Marie Unnas ärftliga hypotrikos beror på en mutation som avbryter en uORF som finns i 5′ UTR av genen hairless homolog och därmed ökar dess uttryck . En övergång från G till A i en av de uORFs som finns i 5′ UTR av TGF-β3-transkriptet fastställdes vara förknippad med arytmogen högerkammarkardiomyopati/dysplasi (ARVC) . Ytterligare en grupp av fem uORF:er som är associerade med sjukdomar har nyligen testats med hjälp av reporterassays; de omfattar gonadaldysgenes (SRY) , Van der Woudes syndrom (IRF6) , Carney Complex Type 1 (PRKAR1A) , ärftlig bukspottkörtelinflammation (SPINK1) och Thalassaemia-β (HBB) . Denna lista kommer säkerligen att utökas eftersom mer än 500 singelnukleotidpolymorfismer (SNP) som skapar eller raderar uORFs har rapporterats.
6. Sökning efter nya regleringselement i 5′ UTR
Bara en liten del av de posttranskriptionella regleringselement som finns i människans 5′ UTRs har karakteriserats. Dessa identifierade UTR-element katalogiseras i en webbresurs som upprätthålls av Graziano Pesoles grupp och kallas UTRdb (http://utrdb.ba.itb.cnr.it/) . In vivo-metoder för identifiering av posttranskriptionella regleringselement i UTR, särskilt de som är associerade med RBPs, har utvecklats dramatiskt under de senaste fem åren tack vare djup sekvenseringsteknik. CLIP och RIP-Seq är metoder som bygger på isolering av RNA-proteinmolekyler (RNP) genom immunoprecipitation, följt av RNase-desintroduktion och exakt identifiering av RBP-bindningsställen med djup sekvensering . Även om antalet RBP:er som hittills analyserats med dessa metoder är mycket litet (recenserat i ), kan man i takt med att djupsekvenseringstekniken blir mer lättillgänglig och metoderna förenklas förvänta sig att en stor del av de mänskliga RBP-bindningsställena i UTR:erna mycket snart kommer att kartläggas.
Ett annat alternativ för att kartlägga UTR-element som reglerar translation är att använda rent beräkningsmässiga metoder som bygger på analys av UTR-sekvenserna. Dessa metoder bygger på att identifiera degenererade ribonukleotidmönster som har de förväntade egenskaperna hos RBP-bindningsställen. Liknande metoder har tillämpats i nästan 30 år för att identifiera transkriptionsreglerande i promotorsekvenser. Dessa metoder håller på att mogna, används i stor utsträckning och har varit till stor hjälp vid sammanställningen av databaser om transkriptionsreglering (t.ex. TRANSFAC). Även om mycket av det arbete som inriktats på att utforma och förfina algoritmer för analys av regleringssekvenser i samband med transkriptionsreglering kan anpassas till motsvarande analysproblem i samband med posttranskriptionella regleringselement, finns det ytterligare komplikationer som är förknippade med RBP-bindningsställen. Den mest uppenbara av dessa är att RBP:er kommer att ha sekundära strukturella preferenser, och få befintliga analysverktyg kan införliva information om RNA-veckning. På samma sätt kan regleringselement på grund av RNA-föjning lättare fungera synergistiskt eller uppvisa samordnade bindningar till sekvenselement som ligger långt ifrån varandra i den primära sekvensen men mycket nära varandra i den veckade molekylen. En annan svårighet är bristen på exempel på reglerande element för översättning för att träna analysen. Baserat på en handfull välstuderade exempel finns det ofta en uppfattning att RBP-bindningsställen i genomsnitt är kortare än transkriptionsfaktorers (TF) bindningsställen, men denna uppfattning kan bero på en bias i den uppsättning RBP:er som får mest forskningsfokus . En av de mest kraftfulla metoderna för att identifiera regulatoriska element är fylogenetiska fotspår, som drar nytta av lokalt förhöjd evolutionär bevarande för att avslöja funktionella element . Denna logik fungerar lika bra för posttranskriptionella regleringselement. Tyvärr är TF-bindningsställen också ett stort hinder för en direkt tillämpning av beräkningssekvensanalys för att identifiera 5′ UTR-element som är involverade i översättning. Element som är involverade i transkriptionsreglering finns både upp- och nedströms från transkriptionsstartplatser, och när 5′ UTR är tillräckligt korta är det troligt att posttranskriptionella reglerande element är interleaved med TF-bindningsställen.
I slutändan kommer de bästa metoderna för att identifiera posttranskriptionella reglerande element att framträda genom en komplementär tillämpning av experimentella och beräkningsmässiga tekniker.
Acknowledgments
Forskning i Penalvas labb stöds av Voelcker Foundation, Children’s Brain Tumor foundation och 5R21HG004664-02 och 1R01HG006015-01A1.
Supplementary Materials
Vi sammanfattade den grundläggande statistiken för uORF:er i humant transkriptom (NCBI build37.3). Tabell 1.a visar antalet förekomster av uORF-liknande sekvenser som innehåller AUG i 5′ UTRs när det gäller mRNA och gener. Vi separerade också två distinkta uORF-liknande sekvenser med matchande termineringskodon i 5′ UTRs eller utan matchande termineringskodon i 5′ UTRs. Detaljerad information om dessa två fall finns i tabell 1.b. Slutligen visar tabell 1.c hur många uORF-liknande sekvenser som förekommer i en enskild 5′ UTR för varje mRNA.
- Tilläggstabell
Lämna ett svar