Înainte de a începe: Reglarea traducerii la 5′ UTR
On octombrie 5, 2021 by adminAbstract
Reglarea traducerii joacă roluri importante atât în condiții fiziologice normale, cât și în stări de boală. Această reglare necesită elemente de reglementare cis situate în principal în 5′ și 3′ UTR și factori de reglementare trans (de exemplu, proteine de legare a ARN-ului (RBP)) care recunosc caracteristici specifice ale ARN-ului și interacționează cu mașinăria de traducere pentru a-i modula activitatea. În această lucrare, discutăm aspecte importante ale reglării mediate de 5′ UTR, oferind o prezentare generală a caracteristicilor și a funcției principalelor elemente prezente în această regiune, cum ar fi uORF (upstream open reading frame), structurile secundare și motivele de legare a RBPs, precum și diferite mecanisme de reglare a traducerii și impactul pe care acestea îl au asupra expresiei genelor și a sănătății umane atunci când sunt dereglate.
1. Reglarea traducerii
Expresia genelor poate fi modulată la mai multe niveluri, de la modificarea cromatinei la traducerea ARNm. În ciuda importanței reglării transcripționale, este clar în acest moment că nivelurile ARNm nu pot fi folosite ca unic parametru pentru a justifica conținutul proteic al unei celule. De fapt, într-un studiu recent din laboratorul nostru, am determinat că există o corelație directă între ARNm și proteine pentru mai puțin de o treime din genele analizate într-o linie celulară umană. Mai mult, analiza noastră a sugerat că reglarea traducerii contribuie în mod considerabil la variația proteinelor, deoarece mai mulți parametri legați de traducere, cum ar fi 5′ UTR, 3′ UTR, lungimea secvenței de codificare, prezența uORF-urilor și compoziția de aminoacizi și așa mai departe, au arătat corelații bune cu rapoartele ARNm/proteine obținute . Reglarea traducerii funcționează ca un comutator important atunci când sunt necesare schimbări rapide în expresia genelor ca răspuns la stimuli interni și externi (PDGF2, VEGF, TGFβ sunt exemple de gene controlate în acest mod). Reglarea traducerii joacă, de asemenea, un rol semnificativ în timpul dezvoltării și diferențierii celulare prin modificarea nivelurilor de expresie a unor subseturi specifice de ARNm în timpul unui anumit interval de timp, în timp ce majoritatea transcriptelor rămân neschimbate (revizuit în ).
În acest articol, ne vom concentra pe importanța reglării mediate de 5′ UTR și pe diferitele elemente funcționale prezente în această regiune, cu excepția IRES, care este discutată într-un alt articol din acest număr. Principalele elemente de reglementare din 5′ UTR sunt structurile secundare (inclusiv IRES), situsurile de legare pentru proteinele de legare a ARN, uAUG și uORF (Figura 1).
Elemente reglatoare prezente în 5′ UTR.
2. 5′ UTR
Lungimea medie a 5′ UTR este cuprinsă între ~100 și ~220 nucleotide la toate speciile . La vertebrate, 5′ UTR au tendința de a fi mai lungi în transcripțiile care codifică factori de transcripție, protooncogene, factori de creștere și receptorii lor și proteine care sunt slab traduse în condiții normale . Conținutul ridicat de GC este, de asemenea, o caracteristică conservată, cu valori care depășesc 60% în cazul vertebratelor cu sânge cald. În contextul structurilor de tip hairpin, conținutul de GC poate afecta eficiența traducerii proteinelor independent de stabilitatea termică a hairpinului și de poziția acestuia . UTR-urile ARNm eucariote prezintă, de asemenea, o varietate de repetări care includ elemente intercalate scurte și lungi (SINEs și LINEs, respectiv), repetări de secvențe simple (SSRs), minisateliți și macrosateliți .
Inițierea traducerii la eucariote necesită recrutarea subunităților ribozomale fie la nivelul structurii cap 5′ m7G. Codonul de inițiere este, în general, situat mult în aval, ceea ce necesită deplasarea ribozomului către acest sit. Această mișcare pare să fie neliniară pentru unele ARNm (adică, subunitățile ribozomale par să ocolească segmente din UTR 5′ pe măsură ce se deplasează în direcția AUG). Șuntarea ar putea permite traducerea eficientă a ARNm care conțin uAUG sau structuri în ac de păr. Exemple importante sunt oferite de ARNm ai virusului mozaicului conopidei și ai adenovirusului. Mecanismul de derivare ribozomală este destul de complex, necesitând împerecherea bazelor ARNm-ARNr.
Genele care prezintă diferențe în UTR 5′ a transcriptelor lor sunt relativ frecvente. 10-18% din gene exprimă 5′ UTR alternative prin utilizarea mai multor promotori, în timp ce se estimează că splicingul alternativ în cadrul UTR-urilor afectează 13% din genele din transcriptomul mamiferelor . Aceste variații în 5′ UTR pot funcționa ca întrerupătoare importante pentru a regla expresia genelor. Două exemple importante sunt oferite de genele legate de cancer BRCA1 (cancerul de sân 1) și TGF-β (factorul de creștere transformator β). BRCA1 este un supresor tumoral, frecvent mutant în cancerul de sân, cu funcții în ciclul celular, apoptoza și repararea daunelor ADN. BRAC1 produce două transcripte diferite care derivă din doi promotori diferiți și, prin urmare, prezintă diferențe în 5′ UTR. Un transcript mai scurt este exprimat atât în țesutul mamar canceros, cât și în cel necanceros și este tradus eficient, în timp ce un transcript mai lung este exprimat predominant în cancerele mamare. Prezența mai multor uAUG-uri și o structură mai complexă afectează în mod dramatic traducerea acestui transcript mai lung. Acest lucru determină o scădere generală a nivelurilor BRAC1 în celulele tumorale, ceea ce duce la o ameliorare a inhibării creșterii . TGF-β este implicat într-un număr mare de procese care includ proliferarea celulară, migrația, repararea rănilor, dezvoltarea, tumorigeneza și imunosupresia. Există trei izoforme cunoscute: β1, β2 și β3. TGF-β3 produce două transcripții alternative: o transcripție de 3,5 kb cu o UTR 5′ foarte lungă (1,1 kb) și o transcripție de 2,6 kb cu o UTR 5′ mai scurtă (0,23 kb). Prezența a 11 uORF-uri în transcriptul mai lung inhibă dramatic traducerea acestuia, în timp ce transcriptul mai scurt este tradus în mod eficient.
3. Reglarea prin structura secundară
Structurile secundare pot funcționa ca instrumente majore de reglementare în 5′ UTR. A fost sugerată o corelație cu funcția genei; s-a stabilit că structurile secundare sunt deosebit de răspândite printre ARNm care codifică factori de transcripție, protooncogene, factori de creștere și receptorii lor și proteine slab traduse în condiții normale. >90% dintre transcriptele din aceste clase au 5′ UTR-uri care conțin structuri secundare stabile cu energii libere medii mai mici de -50 kcal/mol. 60% dintre aceste structuri secundare stabile sunt poziționate foarte aproape de structura capului . Aceste structuri sunt foarte eficiente în inhibarea traducerii. De fapt, un ac de păr situat în apropierea capului cu o energie liberă de -30 kcal/mol ar fi suficient pentru a bloca accesul complexului de preinițiere la ARNm. Atunci când sunt localizate mai departe în 5′ UTR, ace de păr necesită o energie liberă mai mare de -50 kcal/mol pentru a putea bloca traducerea . Structura secundară stabilă poate rezista la activitatea de derulare a elicazei elF4A. Acest efect poate fi depășit parțial prin supraexprimarea elF4A în parteneriat cu elF4B . ARNm cu o UTR 5′ foarte bine structurată, cum ar fi proto-oncogenele și alți factori de creștere, utilizează inițierea traducerii dependentă de capac. Nu este surprinzător faptul că supraexprimarea componentelor mașinăriei de inițiere a traducerii, inclusiv elf4E, a fost legată de tumorigeneză (revizuit în ).
Gena TGF-β1 oferă un bun exemplu de inhibiție a traducerii mediată de structura secundară . Un motiv conservat din punct de vedere evolutiv în 5′ UTR formează o buclă stem stabilă. Cu toate acestea, această structură în sine nu este suficientă pentru a bloca traducerea. Reprimarea traducerii TGF-β1 depinde de legarea crescută a proteinei de legare a ARN YB-1 la transcriptul TGF-β1 . S-a propus apoi că YB-1 se leagă de 5′ UTR a TGF-β1 cu o afinitate ridicată datorită conținutului său de GC și cooperează cu bucla stem pentru a inhiba traducerea TGF-β1 prin facilitarea formării duplexului .
4. Reglarea prin proteine de legare a ARN-ului
Se preconizează că genomul uman codifică aproximativ 1.000 de proteine de legare a ARN-ului (RBP), un mare procent dintre acestea fiind implicate în traducere. Acestea ar putea fi clasificate în două grupe principale: RBP care fac parte din mașinăria de bază a traducerii și sunt necesare pentru traducerea tuturor ARNm exprimate (exemple: PABPI, elf4E) și RBP care funcționează într-un mod mai selectiv, controlând fie pozitiv, fie negativ, nivelurile de traducere ale unor ARNm țintă specifice (exemple: HuR, Musashi1). În ceea ce privește acest ultim grup, s-a observat că RBP pot utiliza mecanisme distincte pentru a crește sau a inhiba traducerea. Deși sunt cunoscute mai multe excepții, se poate spune că RBP-urile recunosc adesea motive specifice în UTR-uri și interacționează cu mașinăria de traducere pentru a controla expresia. Interferența cu traducerea are loc, în mod normal, în timpul etapei de inițiere (revizuit în ).
Cel mai bine caracterizat exemplu de reglementare mediată de RBP care implică UTR-urile 5′ este oferit de proteinele de reglementare a fierului (IRP 1 și 2). Aceste proteine recunosc o structură de buclă de tulpină foarte conservată cu aproximativ 30 de nucleotide, cunoscută sub numele de element de răspuns la fier (IRE). Cele mai importante caracteristici includ o buclă hexanucleotidică cu secvența CAGYCX (Y = U sau A; X = U, C sau A) și o tulpină superioară de 5 pb care este separată de o tulpină inferioară de lungime variabilă de o citosină nepereche. Această reglare este crucială în menținerea homeostaziei celulare a fierului, deoarece un număr mare de ARNm conectați la stocarea și metabolismul fierului, inclusiv ferritina, aconitaza mitocondrială, proteina dehidrogenazei de succinat-fier, sintetaza eritroidă a 5-aminolevulinatului (eALAS) și o moleculă de fier-exportină numită feroportină (FPN1), au expresia lor modulată de acest sistem. Atunci când nivelurile celulare de fier sunt scăzute, IRP1 și IRP2 se leagă de IRE și blochează traducerea ORF-ului din aval. Atunci când nivelurile intracelulare de fier sunt ridicate, activitatea de legare la ARN a ambilor IRP este redusă [figura 2(a)]. IRE-urile au tendința de a fi poziționate aproape de capac, ceea ce determină o inhibiție sterică a legării subunităților ribozomale 40S la transcript. Atunci când este localizat la distanță de capac, mai degrabă decât să afecteze recrutarea 40S, complexul IRE-IRP blochează scanarea ribozomală (revizuit în ). O ocolire interesantă a mecanismului IRE/IRP poate fi observată în celulele duodenale și precursorii eritroizi lipsiți de fier. Un promotor din amonte este utilizat pentru a genera pre-ARNm FPN1 care conține încă un exon care este conectat prin splicing alternativ la un acceptor de splicing în 3′ al IRE. Se generează un transcript FPN1 matur care conține același cadru de lectură deschis; cu toate acestea, UTR 5′ nu conține IRE . Prin urmare, aceste celule exprimă izoforma alternativă FPN1 într-o manieră independentă de fier. Mutațiile care afectează IRE pot duce la apariția unor boli. Acesta este cazul sindromului de hiperferritinemie-cataractă ereditară (HHCS), o tulburare genetică autosomal dominantă în care agregarea și cristalizarea feritinei în cristalin duce la cataractă bilaterală .
(a)
(b)
(a)
(b)
Reglare translațională prin proteine de legare a ARN. (a) În celulele cu deficit de fier, IRP se leagă de IRE localizat în 5′ UTR al ARNm de feritină, blocând traducerea acestuia. Odată ce nivelurile celulare de fier cresc, un complex care conține Fe se leagă de IRP. Astfel, aceste proteine sunt modificate alosteric, ceea ce reduce legarea IRP-IRE și permite traducerea ARNm de feritină. (b) Reglarea genei msl-2 la muștele femele. După transcrierea în nucleu, SXL se leagă în mod specific de regiunile intronice bogate în U ale pre ARNm msl-2 și inhibă eliminarea intronului (1). În citoplasmă, SXL se leagă de aceleași elemente localizate acum în 5′ UTR al ARNm msl-2 matur, îmbunătățește inițierea traducerii unui ORF din amonte (2) și împiedică traducerea ORF principal (3). Elementele de reglementare din 3′ UTR ale ARNm msl-2 nu au fost reprezentate.
Reglarea mediată de RBP poate fi foarte elaborată și implică mai multe etape. Un bun exemplu care arată încrucișarea dintre factori și procese de reglementare distincte este gena male-specific-lethal 2 (msl-2) la Drosophila, un actor principal în compensarea dozării. Proteina de legare a ARN-ului specific feminin sex letal (SXL) participă la mai multe aspecte ale reglării msl-2, unde expresia msl-2 trebuie să fie împiedicată [Figura 2(b)]. Reglarea începe la nivelul de splicing; SXL se leagă de două întinderi polyU situate într-un intron care face parte din UTR 5′. Acest proces determină retenția intronului și conservă secvențele critice care vor fi utilizate ulterior în reglarea traducerii . În citoplasmă, aceeași proteină SXL va funcționa ca represor al traducerii msl-2 prin două mecanisme distincte care au loc la 3′ și 5′ UTR . SXL se leagă de secvențele bogate în U din 3′ UTR și recrutează proteina corepresoare UNR (în amonte de N-ras) și PABP, blocând recrutarea complexului de preinițiere la capătul 5′ al ARNm . Pentru a se asigura că msl-2 este complet reprimat, o a doua etapă de reglementare, de asemenea mediată de SXL, are loc la 5′ UTR. Această reprimare implică un nou mecanism de reglementare în care are loc o interacțiune încrucișată între SXL și un uORF pentru a reprima eficient traducerea . UTR 5′ a msl-2 conține 3 uORF-uri, dar numai al treilea este implicat în reprimare. Este interesant faptul că această represiune este foarte slabă în absența SXL (~2 ori), dar atunci când este prezentă, SXL se leagă de o întindere poli U la câteva nucleotide distanță de uAUG și crește această represiune la mai mult de 14 ori. SXL acționează prin stimularea inițierii traducerii la nivelul uAUG și nu prin faptul că acționează ca o simplă arestare sterică a ribozomilor de scanare. Este posibil ca acest efect să aibă loc printr-o interacțiune între SXL și factorii de inițiere a traducerii; posibil membri ai componentei elF3, după cum a indicat un screening cu doi hibrizi. Acest mecanism ar putea afecta un număr mare de ARNm; s-a stabilit că 268 de transcripte din Drosophila conțin motive de legare SXL asociate cu uAUG distanțate la o distanță corespunzătoare. De exemplu, o construcție reporter care conținea 5′UTR al genei Irr47 a fost reprimată de ~4 ori de proteina SXL .
RBP-urile pot avea funcții antagoniste atunci când reglează traducerea. Un exemplu interesant este reglementarea p21 în contextul senescenței replicative, o stare celulară în care celulele intră într-un stop ireversibil de creștere. Inducerea p21 este necesară pentru a iniția acest proces și pentru a inhiba complexele cdk2-ciclină E. UTR 5′ a p21 conține o secvență bogată în GC care formează o buclă stem. Acest element este recunoscut de două RBP cu proprietăți distincte: CUGBP1 și calreticulina (CRT). Competiția dintre cele două proteine determină nivelurile finale de expresie a p21 și stabilește dacă celulele vor prolifera sau vor suferi stoparea creșterii și senescența. Legarea CUGBP1 la ARNm p21 este dramatic crescută în senescență în comparație cu celulele fibroblaste tinere. Nivelul proteinelor nu se modifică în timpul procesului, iar această creștere a activității se datorează fosforilării. Pe de altă parte, IP-urile CRT au arătat o reducere de patru până la cinci ori a activității în celulele aflate în senescență din cauza unei scăderi a expresiei. S-a demonstrat că ambele proteine afectează traducerea p21. Cu toate acestea, în timp ce CUGBP1 funcționează ca un activator, CRT acționează ca un represor. Deoarece cele două proteine au o activitate opusă în celulele senescente, acestea au fost examinate pentru a vedea dacă ele concurează pentru interacțiunea cu ARNm p21 și pentru a controla traducerea acestuia. Cantități din ce în ce mai mari ale uneia dintre proteine au fost capabile să inverseze legarea celeilalte proteine la ARNm p21 și efectul acesteia asupra traducerii; afinitatea pentru situsul de legare este destul de diferită, deoarece CUGBP1 a trebuit să fie prezentă în reacțiile de legare la un exces molar de patru până la opt ori mai mare decât CRT pentru a antagoniza legarea acesteia la ARNm p21 și a avea un impact asupra traducerii acestuia .
5. Reglarea prin uORF-uri și AUG-uri din amonte
uORF-urile și uAUG-urile sunt elemente majore de reglare în 5′ UTR-uri. După cum sugerează numele lor, uORF-urile sunt secvențe definite de un codon de start și un codon de oprire în amonte de regiunea principală de codificare, în timp ce uAUG-urile sunt codoni de start fără un codon de oprire în aval situat în amonte de regiunea principală de codificare. Un procent mare din transcriptomul uman conține uORF și/sau uAUG, cu valori cuprinse între 44 și 49% . Un număr similar se găsește în transcriptomul de șoarece. Deși aceste cifre pot părea ridicate, atât uORF-urile, cât și uAUG-urile sunt mai puțin frecvente decât se așteaptă din întâmplare, ceea ce sugerează că sunt supuse unei presiuni selective. uORF-urile și uAUG-urile sunt suprareprezentate în anumite subgrupuri, cum ar fi factorii de transcripție, factorii de creștere și receptorii acestora și proto-oncogenele . Atât uORF-urile, cât și uAUG-urile sunt extrem de diverse, variind în ceea ce privește poziția față de cap și AUG-ul principal, numărul pe transcript și lungimea (în cazul uORF-urilor). Tabelul suplimentar 1 (în Supplementary Material disponibil online la http://dx.doi.org/10.1155/2012/475731) oferă o listă completă a uORF-urilor și uAUG-urilor prezente în transcriptomul uman. uORF-urile și uAUG-urile nu au fost analizate pe larg în ceea ce privește conservarea. Un studiu pilot realizat cu un subset de transcripte umane, de șoarece și de șobolan a indicat faptul că ambele elemente sunt moderat conservate, deoarece s-a stabilit că 38% din uORF-uri și 24% din uAUG-uri sunt conservate între cele trei specii . Conservarea modestă a uORF-urilor, combinată cu faptul că lungimea lor medie (20 de nucleotide) este așteptată din întâmplare, iar uAUG-urile oferă o suprimare mai puternică în comparație cu uORF-urile, sugerează că multe uAUG-uri au fost neutralizate în procesul de evoluție prin dobândirea unui codon de oprire în aval. S-a propus atunci că doar câteva uORF-uri, foarte probabil cele conservate, au fost recrutate pentru reglarea expresiei. La drojdie, s-a demonstrat că uORF-urile sunt subreprezentate statistic în 5′ UTR și au fost eliminate prin presiune selectivă, indicând, în mod similar, că uORF-urile rămase pot fi implicate în reglarea traducerii .
Deși, în general, s-a sugerat că uORF-urile sunt corelate negativ cu producția de proteine până în prezent, activitatea funcțională a fost demonstrată doar pentru un număr limitat de uORF-uri și uAUG-uri. În figura 3, prezentăm exemple de impact pe care uAUG-urile îl pot avea asupra eficienței traducerii. Printre cele mai relevante caracteristici care pot contribui la funcționalitate se numără distanța lungă de la capacul 5′ la uORF, conservarea secvenței, contextul în care se află AUG, puterea situsului de inițiere pentru ORF, lungimea uORF și numărul de AUG-uri în 5′ UTR . S-au observat rezultate diferite atunci când un ribozom întâlnește un uAUG sau un uORF . Deoarece numărul de evenimente caracterizate este încă mic, este dificil să se definească mecanismele generale; vom descrie în continuare câteva evenimente bine caracterizate și relevante. Scanarea neuniformă este definită atunci când o parte din complexele de scanare ocolesc uAUG sau uORF și continuă scanarea pentru următorul AUG. În acest caz, AUG-ul din amonte acționează ca o „momeală” față de AUG-ul din ORF, funcționând ca un regulator negativ al traducerii, cel puțin pentru o anumită fracțiune de ribozomi. Producerea de peptide cu acțiune cis de către uORF-uri poate reduce inițierea traducerii ORF-ului din aval prin blocarea ribozomului la capătul uORF-ului . Un exemplu clasic este oferit de peptida atenuatoare de arginină eucariotă (AAP), conservată din punct de vedere evolutiv, care controlează negativ traducerea proteinelor implicate în biosinteza de novo a argininei fungice în concentrații ridicate de arginină . În acest scenariu, arginina modifică conformația AAP și/sau mediul situsului P, provocând blocarea ribozomală la nivelul codonului de terminație al AAP uORF . AAP reduce, de asemenea, alungirea traducerii prin blocarea ribozomului atunci când uORF-ul este inserat în cadrul unei secvențe de codificare . Un alt exemplu clasic de reglare mediată de uORF provine de la drojdie. Patru uORF-uri sunt prezente în 5′ UTR a factorului de transcripție GCN4. Primul dintre cele patru uORF-uri este întotdeauna tradus eficient, indiferent de condițiile nutriționale. În celulele neperturbate, reîncărcarea rapidă a ribozomilor și a cofactorilor de inițiere permite traducerea uORF-urilor 2-4, inhibând în același timp traducerea ORF-ului principal. În situații de înfometare cu aminoacizi, factorii de inițiere sunt puțini, ceea ce duce la o reîncărcare decelerată a ribozomilor și la o scanare a secvențelor care conțin uORF-urile. Un complex de inițiere funcțional este reasamblat numai la nivelul secvenței principale de codificare și GCN4 exprimat. Acest mecanism permite un răspuns rapid la stresul nutrițional . Un alt exemplu similar de expresie reglementată prin intermediul uORF este gena Carnitină Palmitoiltransferazei 1C (CPT1C). CPT1C reglează metabolismul în creier în situații de surplus de energie. Prezența uORF în 5′ UTR reprimă expresia ORF-ului. Cu toate acestea, această reprimare este atenuată ca răspuns la stimuli de stres specifici, cum ar fi depravarea de glucoză și tratamentul cu palmitat-BSA . S-a sugerat că uORF-urile pot induce, de asemenea, degradarea ARNm. O serie de construcții 5′ UTR care conțin ca raportor gena cat din transpozonul bacterian Tn9 a fost testată în drojdie. O singură substituție nucleotidică a fost utilizată pentru a crea un ORF de 7 codoni în amonte de gena cat. UORF-ul a fost tradus eficient și a provocat inhibarea traducerii ORF-ului cat și destabilizarea ARNm cat . S-a sugerat, de asemenea, o legătură între uORF-uri și degradarea ARNm pe baza unei comparații între nivelurile medii de expresie ale transcriptelor care conțin uORF și cele care nu conțin uORF.
(a)
(b)
(a)
(b)
Impactul secvențelor uAUG asupra reglării traducerii. (a) Comparație a nivelurilor de luciferază obținute pentru construcțiile care au 5′ UTR a genei ACT (control) și gene care conțin uAUG: WBSCR16, MFSD5 și BCL2L13. (b) Ștergerea sau mutația secvenței uAUG prezentă în genele WBSCR16, MFSD5 și BCL2L13 inversează reprimarea traducerii, după cum se observă printr-o creștere a activității luciferazei.
Diverse mutații care elimină sau creează uORF-uri care ajung să modifice nivelurile de proteine au fost legate de boli umane. Relevanța lor a fost discutată recent . Predispoziția la melanom poate fi cauzată de o mutație care introduce o uORF în 5′ UTR a genei proteinei inhibitoare a kinazei dependente de cicline (CDKN2A) . Trombocitemia ereditară este cauzată de o mutație care creează o variantă de splicing care elimină o uORF, ceea ce duce la o creștere a producției de proteină a genei trombopoietină . Hipotricoza ereditară Marie Unna derivă dintr-o mutație care întrerupe un uORF prezent în 5′ UTR al genei omoloage hairless și, în consecință, crește expresia acesteia . S-a stabilit că o tranziție de la G la A într-unul dintre uORF-urile prezente în 5′ UTR al transcriptului TGF-β3 este asociată cu cardiomiopatia/displazia aritmogenă a ventriculului drept (ARVC) . Un alt grup de cinci uORF-uri asociate cu boli au fost testate recent cu ajutorul testelor reporter; acestea includ disgenesia gonadică (SRY) , sindromul Van der Woude (IRF6) , complexul Carney tip 1 (PRKAR1A) , pancreatita ereditară (SPINK1) și talasemia-β (HBB) . Această listă se va extinde cu siguranță, deoarece au fost raportate mai mult de 500 de polimorfisme cu un singur nucleotid (SNP) care creează sau șterg uORF-uri.
6. Căutarea de noi elemente de reglementare în 5′ UTR
Doar o mică parte din elementele de reglementare posttranscripțională localizate în 5′ UTR-urile umane au fost caracterizate. Aceste elemente UTR identificate sunt catalogate într-o resursă web întreținută de grupul lui Graziano Pesole numită UTRdb (http://utrdb.ba.itb.cnr.it/) . Metodele in vivo de identificare a elementelor de reglementare posttranscripțională în UTR, în special cele asociate cu RBP, au avansat dramatic în ultimii cinci ani datorită tehnologiei de secvențiere profundă. CLIP și RIP-Seq sunt metode bazate pe izolarea moleculelor de proteine ARN (RNP) prin imunoprecipitare, urmată de digestia cu RNază și identificarea precisă a situsurilor de legare RBP cu ajutorul secvențierii profunde . Deși numărul de RBP analizate până în prezent prin aceste metode este foarte mic (analizat în ), pe măsură ce tehnologia de secvențiere profundă devine mai accesibilă și metodele se simplifică, ne putem aștepta ca foarte curând să fie cartografiate o mare parte din situsurile de legare a RBP umane din UTR.
O altă alegere pentru cartografierea elementelor UTR care reglează traducerea este utilizarea unor metode pur computaționale bazate pe analiza secvențelor UTR. Aceste metode se bazează pe identificarea modelelor ribonucleotidice degenerate care au proprietățile așteptate ale situsurilor de legare RBP. Metode similare au fost aplicate timp de aproape 30 de ani pentru a identifica secvențe de reglementare transcripțională în secvențe de promotori. Aceste metode au ajuns la maturitate, sunt utilizate pe scară foarte largă și au ajutat foarte mult la compilarea bazelor de date despre reglementarea transcripțională (de exemplu, TRANSFAC) . Deși o mare parte din lucrările orientate spre proiectarea și perfecționarea algoritmilor de analiză a secvențelor de reglementare în contextul reglementării transcripționale pot fi adaptate la problemele de analiză corespunzătoare în contextul elementelor de reglementare post-transcripțională, există complicații suplimentare asociate cu situsurile de legare RBP. Cea mai evidentă dintre acestea este faptul că RBP vor avea preferințe structurale secundare, iar puține instrumente de analiză existente pot încorpora informații despre plierea ARN-ului. În mod similar, din cauza pliajului ARN, elementele de reglementare pot funcționa mai ușor în mod sinergic sau pot prezenta o legătură concertată cu elemente de secvență care sunt distale în secvența primară, dar foarte apropiate în molecula pliată. O altă dificultate este reprezentată de lipsa unor exemple de elemente de reglementare translațională pentru antrenarea analizei. Pe baza câtorva exemple bine studiate, există adesea percepția că situsurile de legare a RBP sunt în medie mai scurte decât situsurile de legare a factorilor de transcripție (TF), dar această percepție se poate datora unei prejudecăți în setul de RBP care beneficiază de cea mai mare atenție din partea cercetării . Una dintre cele mai puternice metode de identificare a elementelor de reglare este amprenta filogenetică, care profită de conservarea evolutivă ridicată la nivel local pentru a descoperi elemente funcționale . Această logică funcționează la fel de bine și în cazul elementelor de reglementare post-transcripțională. Din nefericire, locurile de legare a TF reprezintă, de asemenea, un obstacol major în calea aplicării directe a analizei secvențiale computaționale pentru identificarea elementelor 5′ UTR implicate în traducere. Elementele implicate în reglarea transcripțională se află atât în amonte, cât și în aval de site-urile de pornire a transcripției, iar atunci când 5′ UTR sunt suficient de scurte, elementele de reglare post-transcripțională sunt probabil intercalate cu site-urile de legare a TF.
În cele din urmă, cele mai bune metode de identificare a elementelor de reglare post-transcripțională vor apărea din aplicarea complementară a tehnicilor experimentale și computaționale.
Recunoștințe
Cercetările din laboratorul lui Penalva sunt susținute de Voelcker Foundation, Children’s Brain Tumor foundation și 5R21HG004664-02 și 1R01HG006015-01A1.
Materiale suplimentare
Am rezumat statisticile de bază pentru uORF-urile din transcriptomul uman (NCBI build37.3). Tabelul 1.a arată numărul de apariții ale secvențelor de tip uORF care conțin AUG în 5′ UTR în ceea ce privește ARNm și genele. De asemenea, am separat două secvențe distincte de tip uORF cu codon de terminare corespunzător în 5′ UTR sau fără codon de terminare corespunzător în 5′ UTR. Informațiile detaliate pentru aceste două cazuri sunt enumerate în tabelul 1.b. În cele din urmă, tabelul 1.c arată câte secvențe de tip uORF apar pe o 5′ UTR individuală a fiecărui ARNm.
- Tabel suplimentar
.
Lasă un răspuns