Prima che inizi: Regolazione della traduzione al 5′ UTR
Il Ottobre 5, 2021 da adminAbstract
La regolazione della traduzione gioca un ruolo importante sia in condizioni fisiologiche normali che nelle malattie. Questa regolazione richiede elementi cis-regolatori situati per lo più in 5′ e 3′ UTR e fattori trans-regolatori (ad esempio, RNA binding proteins (RBPs)) che riconoscono specifiche caratteristiche di RNA e interagiscono con il macchinario di traduzione per modulare la sua attività. In questo articolo, discutiamo aspetti importanti della regolazione mediata da 5′ UTR fornendo una panoramica delle caratteristiche e della funzione dei principali elementi presenti in questa regione, come uORF (upstream open reading frame), strutture secondarie e motivi di legame delle RBP e diversi meccanismi di regolazione della traduzione e l’impatto che hanno sull’espressione genica e sulla salute umana quando deregolati.
1. Regolazione della traduzione
L’espressione genica può essere modulata a più livelli, dalla modifica della cromatina alla traduzione dell’mRNA. Nonostante l’importanza della regolazione trascrizionale, è chiaro a questo punto che i livelli di mRNA non possono essere usati come unico parametro per giustificare il contenuto proteico di una cellula. Infatti, in un recente studio del nostro laboratorio, abbiamo determinato che una correlazione diretta tra mRNA e proteine esiste per meno di un terzo dei geni analizzati in una linea cellulare umana. Inoltre, la nostra analisi ha suggerito che la regolazione della traduzione contribuisce notevolmente alla variazione della proteina in quanto diversi parametri relativi alla traduzione come 5′ UTR, 3′ UTR, lunghezza della sequenza codificante, presenza di uORFs e composizione aminoacidica, e così via hanno mostrato buone correlazioni con i rapporti mRNA/proteina ottenuti. La regolazione della traduzione funziona come un importante interruttore quando sono necessari rapidi cambiamenti nell’espressione genica in risposta a stimoli interni ed esterni (PDGF2, VEGF, TGFβ sono esempi di geni controllati in questo modo). La regolazione della traduzione gioca anche un ruolo significativo durante lo sviluppo e la differenziazione cellulare, alterando i livelli di espressione di specifici sottoinsiemi di mRNA durante una particolare finestra temporale, mentre la maggior parte dei trascritti rimane invariata (rivista in ).
In questo articolo, ci concentreremo sull’importanza della regolazione mediata dal 5′ UTR e sui diversi elementi funzionali presenti in questa regione, ad eccezione dell’IRES che è discusso in un altro articolo di questo numero. I principali elementi di regolazione in 5′ UTR sono strutture secondarie (tra cui IRES), siti di legame per le proteine leganti l’RNA, uAUGs e uORFs (Figura 1).
Elementi regolatori presenti in 5′ UTR.
2. 5′ UTR
La lunghezza media di 5′ UTR è da ~100 a ~220 nucleotidi nelle varie specie. Nei vertebrati, le 5′ UTR tendono ad essere più lunghe nelle trascrizioni che codificano fattori di trascrizione, protooncogeni, fattori di crescita e loro recettori, e proteine che sono scarsamente tradotte in condizioni normali. Anche l’alto contenuto di GC è una caratteristica conservata, con valori che superano il 60% nel caso dei vertebrati a sangue caldo. Nel contesto delle strutture a forcina, il contenuto di GC può influenzare l’efficienza di traduzione della proteina indipendentemente dalla stabilità termica della forcina e dalla posizione della forcina. Le UTR degli mRNA eucariotici mostrano anche una varietà di ripetizioni che includono elementi brevi e lunghi interspersi (SINE e LINE, rispettivamente), semplici ripetizioni di sequenza (SSR), minisatelliti e macrosatelliti.
L’iniziazione della traduzione negli eucarioti richiede il reclutamento di subunità ribosomiali sia alla struttura 5′ m7G cap. Il codone di iniziazione è generalmente situato molto a valle, richiedendo il movimento ribosomiale a questo sito. Questo movimento sembra essere non lineare per alcuni mRNA (cioè, le subunità ribosomiali sembrano bypassare (shunt) segmenti del 5′ UTR mentre si muovono in direzione dell’AUG). Lo shunt potrebbe permettere agli mRNA che contengono uAUG o strutture a forcina di essere tradotti in modo efficiente. Esempi importanti sono forniti dagli mRNA del virus del mosaico del cavolfiore e dell’adenovirus. Il meccanismo di smistamento ribosomiale è piuttosto complesso e richiede l’accoppiamento delle basi mRNA-rRNA.
I geni che presentano differenze nel 5′ UTR dei loro trascritti sono relativamente comuni. Il 10-18% dei geni esprimono 5′ UTR alternativi utilizzando più promotori mentre lo splicing alternativo all’interno degli UTR è stimato per interessare il 13% dei geni nel trascrittoma dei mammiferi. Queste variazioni in 5′ UTR possono funzionare come importanti interruttori per regolare l’espressione genica. Due esempi importanti sono forniti dai geni correlati al cancro BRCA1 (cancro al seno 1) e TGF-β (fattore di crescita trasformante β). BRCA1 è un soppressore tumorale, frequentemente mutato nel cancro al seno con funzioni nel ciclo cellulare, apoptosi e riparazione dei danni al DNA. BRAC1 produce due diversi trascritti che derivano da due diversi promotori e quindi mostrano differenze nel loro 5′ UTR. Una trascrizione più corta è espressa sia nel tessuto mammario canceroso che in quello non canceroso ed è tradotta in modo efficiente, mentre una trascrizione più lunga è espressa prevalentemente nei tumori al seno. La presenza di diversi uAUG e una struttura più complessa influenzano drammaticamente la traduzione di questo trascritto più lungo. Questo provoca una diminuzione complessiva dei livelli di BRAC1 nelle cellule tumorali, portando ad un sollievo nell’inibizione della crescita. Il TGF-β è implicato in un gran numero di processi che includono la proliferazione cellulare, la migrazione, la riparazione delle ferite, lo sviluppo, la tumorigenesi e l’immunosoppressione. Ci sono tre isoforme conosciute: β1, β2 e β3. TGF-β3 produce due trascrizioni alternative: una trascrizione di 3,5 kb con un 5′ UTR molto lungo (1,1 kb) e una trascrizione di 2,6 kb con un 5′ UTR più corto (0,23 kb). La presenza di 11 uORFs nel trascritto più lungo inibisce drammaticamente la sua traduzione, mentre il trascritto più corto è tradotto in modo efficiente.
3. Regolazione della struttura secondaria
Le strutture secondarie possono funzionare come strumenti di regolazione importanti in 5′ UTR. È stata suggerita una correlazione con la funzione del gene; le strutture secondarie sono state determinate per essere particolarmente prevalenti tra gli mRNA che codificano fattori di trascrizione, protooncogeni, fattori di crescita e loro recettori e proteine scarsamente tradotte in condizioni normali. >Il 90% dei trascritti in queste classi hanno 5′ UTR che contengono strutture secondarie stabili con energie libere medie inferiori a -50 kcal/mol. Il 60% di queste strutture secondarie stabili sono posizionate molto vicino alla struttura del cappuccio. Queste strutture sono molto efficaci nell’inibire la traduzione. Infatti, una forcina situata vicino al cappuccio con un’energia libera di -30 kcal/mol sarebbe sufficiente a bloccare l’accesso del complesso di preiniziazione all’mRNA. Quando si trova più lontano nel 5′ UTR, le forcine richiedono un’energia libera più forte di -50 kcal/mol per poter bloccare la traduzione. La struttura secondaria stabile può resistere all’attività di srotolamento dell’elicasi elF4A. Questo effetto può essere superato parzialmente dalla sovraespressione di elF4A in collaborazione con elF4B. Gli mRNA con un 5′ UTR altamente strutturato come i proto-oncogeni e altri fattori di crescita utilizzano l’iniziazione della traduzione dipendente dal cappuccio. Non sorprende che la sovraespressione dei componenti del macchinario di iniziazione della traduzione, tra cui elf4E, sia stata collegata alla tumorigenesi (rivista in ).
Il gene TGF-β1 fornisce un buon esempio di inibizione della traduzione mediata dalla struttura secondaria. Un motivo evolutivamente conservato nel 5′ UTR forma un anello stabile. Tuttavia, questa struttura da sola non è sufficiente a bloccare la traduzione. La repressione della traduzione di TGF-β1 dipende dall’aumento del legame della proteina legante l’RNA YB-1 al trascritto di TGF-β1. È stato quindi proposto che YB-1 leghi il 5′ UTR di TGF-β1 con alta affinità grazie al suo contenuto di GC e cooperi con lo stem loop per inibire la traduzione di TGF-β1 facilitando la formazione di duplex.
4. Regolazione delle proteine leganti l’RNA
Si prevede che il genoma umano codifichi circa 1.000 proteine leganti l’RNA (RBPs) con una grande percentuale di esse coinvolte nella traduzione. Possono essere classificate in due gruppi principali: RBP che fanno parte del macchinario di base della traduzione e sono necessarie per la traduzione di tutti gli mRNA espressi (esempi: PABPI, elf4E) e RBP che funzionano in modo più selettivo controllando positivamente o negativamente i livelli di traduzione di specifici mRNA target (esempi: HuR, Musashi1). Per quanto riguarda quest’ultimo gruppo, è stato osservato che le RBPs possono usare meccanismi distinti per aumentare o inibire la traduzione. Anche se sono note diverse eccezioni, si può dire che le RBP spesso riconoscono motivi specifici nelle UTR e interagiscono con il macchinario di traduzione per controllare l’espressione. L’interferenza con la traduzione avviene normalmente durante la fase di iniziazione (rivista in ).
L’esempio meglio caratterizzato di regolazione mediata da RBP che coinvolge 5′ UTR è fornito dalle proteine regolatrici del ferro (IRP 1 e 2). Queste proteine riconoscono una struttura ad anello altamente conservata con circa 30 nucleotidi, nota come elemento di risposta al ferro (IRE). Le caratteristiche più importanti includono un loop esanucleotidico con la sequenza CAGYCX (Y = U o A; X = U, C, o A) e un gambo superiore di 5 bp che è separato da un gambo inferiore di lunghezza variabile da una citosina non appaiata. Questa regolazione è cruciale nel mantenimento dell’omeostasi del ferro cellulare, poiché un gran numero di mRNA collegati all’immagazzinamento e al metabolismo del ferro, tra cui la ferritina, l’aconitasi mitocondriale, la proteina succinato deidrogenasi-ferro, la 5-aminolevulinato sintetasi eritroide (eALAS), e una molecola ferro-esportina chiamata ferroportina (FPN1) hanno la loro espressione modulata da questo sistema. Quando i livelli di ferro cellulare sono bassi, IRP1 e IRP2 legano l’IRE e bloccano la traduzione dell’ORF a valle. Quando i livelli di ferro intracellulare sono alti, l’attività di legame all’RNA di entrambi gli IRP è ridotta (Figura 2(a)). Gli IRE tendono ad essere posizionati vicino al tappo, il che causa un’inibizione sterica del legame delle subunità ribosomiali 40S al trascritto. Quando si trova lontano dal tappo, piuttosto che influenzare il reclutamento 40S, il complesso IRE-IRP blocca la scansione ribosomiale (rivisto in ). Un interessante bypass del meccanismo IRE/IRP può essere osservato nelle cellule precursori duodenali ed eritroidi affamate di ferro. Un promotore a monte viene utilizzato per generare pre-mRNA FPN1 contenente un esone in più che è collegato tramite splicing alternativo a un accettore di splice nel 3′ della IRE. Viene generato un trascritto FPN1 maturo che contiene la stessa struttura di lettura aperta; tuttavia, il 5′ UTR non contiene l’IRE. Pertanto, queste cellule esprimono l’isoforma alternativa FPN1 in modo indipendente dal ferro. Le mutazioni che interessano gli IRE possono portare a malattie. Questo è il caso della sindrome ereditaria iperferritinemia-cataratta (HHCS), un disordine genetico autosomico dominante in cui l’aggregazione e la cristallizzazione della ferritina nella lente porta alla cataratta bilaterale.
(a)
(b)
(a)
(b)
Regolazione traslazionale da proteine di legame RNA. (a) Nelle cellule carenti di ferro, IRPs si legano al IRE localizzato nel 5′ UTR di mRNA della ferritina, bloccando la sua traduzione. Una volta che i livelli di ferro cellulare aumentano, un complesso contenente Fe si lega a IRPs. Così, queste proteine sono modificate allostericamente, che riduce il legame IRP-IRE e permette la traduzione di mRNA di ferritina. (b) regolazione del gene msl-2 in mosche femmine. Dopo la trascrizione nel nucleo, SXL si lega specificamente alle regioni introniche ricche di U del pre-mRNA msl-2 e inibisce la rimozione degli introni (1). Nel citoplasma, SXL si lega agli stessi elementi localizzati ora nel 5′ UTR di msl-2 mRNA maturo, aumenta l’inizio della traduzione di un ORF a monte (2), e impedisce la traduzione ORF principale (3). Gli elementi regolatori nella 3′ UTR di msl-2 mRNA non sono stati rappresentati.
La regolazione mediata da RBP può essere molto elaborata e coinvolgere più fasi. Un buon esempio che mostra il crosstalk tra fattori e processi di regolazione distinti è il gene male-specific-lethal 2 (msl-2) in Drosophila, un attore principale nella compensazione del dosaggio. La proteina legante RNA specifico femminile sesso letale (SXL) partecipa a molteplici aspetti della regolazione msl-2 dove l’espressione msl-2 deve essere impedito (Figura 2 (b)). La regolazione inizia a livello di splicing; SXL si lega a due tratti polyU situati in un introne che fa parte del 5′ UTR. Questo processo causa la ritenzione dell’introne e preserva le sequenze critiche che più tardi saranno utilizzate nella regolazione della traduzione. Nel citoplasma, la stessa proteina SXL funzionerà come un repressore di traduzione di msl-2 in due meccanismi distinti che hanno luogo al 3′ e 5′ UTR. SXL lega le sequenze ricche di U nel 3′ UTR e recluta la proteina corepressiva UNR (a monte di N-ras) e PABP bloccando il reclutamento del complesso di preiniziazione all’estremità 5′ dell’mRNA. Per assicurare che msl-2 venga completamente represso, una seconda fase di regolazione mediata anche da SXL avviene al 5′ UTR. Questa repressione coinvolge un nuovo meccanismo di regolamentazione in cui crosstalk tra SXL e un uORF avviene per reprimere efficacemente la traduzione. Il 5′ UTR di msl-2 contiene 3 uORFs ma solo il 3° è coinvolto nella repressione. È interessante notare che questa repressione è molto debole in assenza di SXL (~ 2 volte), ma quando è presente, SXL lega un tratto poly U a pochi nucleotidi di distanza dalla uAUG e aumenta questa repressione a più di 14 volte. SXL agisce aumentando l’iniziazione della traduzione all’uAUG e non agendo come un semplice arresto sterico dei ribosomi di scansione. Questo effetto può avvenire tramite un’interazione tra SXL e fattori di iniziazione della traduzione; possibilmente membri della componente elF3 come indicato da uno screening two-hybrid. Questo meccanismo colpisce potenzialmente un gran numero di mRNA; 268 trascrizioni in Drosophila sono state determinate per contenere motivi di legame SXL associati a uAUG distanziati ad una distanza appropriata. Per esempio, un costrutto reporter contenente il 5′UTR del gene Irr47 è stato represso ~4 volte dalla proteina SXL.
Le RBP possono avere funzioni antagoniste nella regolazione della traduzione. Un esempio interessante è la regolazione di p21 nel contesto della senescenza replicativa, uno stato cellulare in cui le cellule entrano in un arresto irreversibile della crescita. L’induzione di p21 è necessaria per avviare il processo e per inibire i complessi cdk2-ciclina E. Il 5′ UTR di p21 contiene una sequenza ricca di GC che forma un ciclo di stelo. Questo elemento è riconosciuto da due RBPs con proprietà distinte: CUGBP1 e calreticulina (CRT). La competizione tra le due proteine determina i livelli finali di espressione di p21 e stabilisce se le cellule prolifereranno o subiranno l’arresto della crescita e la senescenza. Il legame di CUGBP1 a p21 mRNA è drammaticamente aumentato nella senescenza rispetto alle cellule giovani di fibroblasti. I livelli delle proteine non cambiano durante il processo e questo aumento di attività è dovuto alla fosforilazione. D’altra parte, gli IP di CRT hanno mostrato una riduzione da quattro a cinque volte dell’attività nelle cellule in senescenza a causa di una diminuzione dell’espressione. Entrambe le proteine hanno dimostrato di influenzare la traduzione di p21. Tuttavia, mentre CUGBP1 funziona come attivatore, CRT agisce come repressore. Poiché le due proteine hanno un’attività opposta nelle cellule senescenti, sono state esaminate per vedere se competono per l’interazione con l’mRNA di p21 e per controllare la sua traduzione. Quantità crescenti di una proteina erano in grado di invertire il legame dell’altra proteina a p21 mRNA e il suo effetto sulla traduzione; l’affinità al sito di legame è piuttosto diversa, poiché CUGBP1 doveva essere presente nelle reazioni di legame in un eccesso molare da quattro a otto volte rispetto a CRT per antagonizzare il suo legame a p21 mRNA e incidere sulla sua traduzione. Regolazione da uORFs e Upstream AUGs
uORFs e uAUGs sono importanti elementi di regolazione in 5′ UTR. Come suggeriscono i loro nomi, le uORF sono sequenze definite da un codone di inizio e di arresto a monte della regione codificante principale, mentre le uAUG sono codoni di inizio senza un codone di arresto a valle in-frame situato a monte della regione codificante principale. Una grande percentuale del trascrittoma umano contiene uORF e/o uAUGs, con valori che vanno dal 44 al 49%. Numeri simili si trovano nel trascrittoma del topo. Anche se questi numeri potrebbero sembrare alti, sia le uORF che le uAUG sono meno frequenti di quanto previsto dal caso, suggerendo che sono sotto pressione selettiva. Le uORF e le uAUG sono sovrarappresentate in particolari sottogruppi come fattori di trascrizione, fattori di crescita e loro recettori e proto-oncogeni. Sia le uORFs che le uAUGs sono estremamente diverse variando nella posizione in relazione al cappuccio e all’AUG principale, nel numero per trascrizione e nella lunghezza (nel caso delle uORFs). La tabella supplementare 1 (in materiale supplementare disponibile online a http://dx.doi.org/10.1155/2012/475731) fornisce un elenco completo di uORFs e uAUGs presenti nel trascrittoma umano. uORFs e uAUGs non sono stati ampiamente analizzati in termini di conservazione. Uno studio pilota fatto con un sottoinsieme di trascrizioni umane, del topo e del ratto ha indicato che entrambi gli elementi sono moderatamente conservati, poiché il 38% delle uORF e il 24% delle uAUG sono stati determinati come conservati tra le tre specie. La modesta conservazione delle uORFs combinata con il fatto che la loro lunghezza media (20 nucleotidi) è prevista dal caso e le uAUGs forniscono una soppressione più forte in confronto alle uORFs suggerisce che molte uAUGs sono state neutralizzate nel processo di evoluzione dall’acquisizione di un codone di stop a valle. È stato quindi proposto che solo alcune uORF, molto probabilmente quelle conservate, siano state reclutate per la regolazione dell’espressione. In lievito, è stato dimostrato che uORFs sono statisticamente sottorappresentati in 5′ UTRs e sono stati rimossi dalla pressione selettiva, indicando allo stesso modo che le uORFs rimanenti possono essere implicati nella regolazione della traduzione.
Anche se, nel complesso è stato suggerito che uORFs sono negativamente correlati con la produzione di proteine finora, attività funzionale è stato dimostrato solo per un numero limitato di uORFs e uAUGs. Nella Figura 3, mostriamo esempi dell’impatto che le uAUG possono avere sull’efficienza della traduzione. Tra le caratteristiche più rilevanti che possono contribuire alla funzionalità sono la lunga distanza 5′ cap-to-uORF, la conservazione della sequenza, il contesto in cui si trova l’AUG, la forza del sito di inizio dell’ORF, la lunghezza dell’uORF e il numero di AUG nel 5′ UTR. Sono stati osservati risultati diversi quando un ribosoma incontra un uAUG o un uORF. Poiché il numero di eventi caratterizzati è ancora piccolo, è difficile definire meccanismi generali; descriviamo quindi alcuni eventi ben caratterizzati e rilevanti. Si parla di leaky scanning quando una parte dei complessi di scansione aggira l’uAUG o l’uORF e continua la scansione per il prossimo AUG. In questo caso, l’AUG a monte agisce come “esca” dall’AUG dell’ORF, funzionando come regolatore negativo della traduzione almeno per una certa frazione di ribosomi. La produzione di peptidi cis-acting da parte delle uORF può ridurre l’inizio della traduzione dell’ORF a valle, bloccando il ribosoma alla fine della uORF. Un esempio classico è fornito dal peptide attenuatore di arginina evolutivamente conservato eucariotico (AAP), che controlla negativamente la traduzione delle proteine coinvolte nella biosintesi di arginina fungina de novo in alta concentrazione di arginina. In questo scenario, l’arginina cambia la conformazione di AAP e/o l’ambiente del sito P causando lo stallo ribosomiale al codone di terminazione di AAP uORF. AAP riduce anche l’allungamento della traduzione per stallo ribosomiale quando la uORF è inserita all’interno di una sequenza codificante. Un altro esempio classico di regolazione uORF-mediata proviene dal lievito. Quattro uORF sono presenti nel 5′ UTR del fattore di trascrizione GCN4. La prima delle quattro uORF è sempre efficientemente tradotta indipendentemente dalle condizioni nutrizionali. In cellule imperturbate, la ricarica rapida dei ribosomi e dei cofattori di iniziazione permette la traduzione delle uORFs 2-4 mentre inibisce la traduzione della ORF principale. In situazioni di fame di aminoacidi, i fattori di iniziazione sono scarsi, con conseguente ricarica decelerata dei ribosomi e scansione attraverso le sequenze contenenti le uORF. Un complesso di iniziazione funzionale viene riassemblato solo in corrispondenza della sequenza codificante principale e GCN4 viene espresso. Questo meccanismo permette una risposta rapida allo stress nutrizionale. Un altro esempio simile di espressione regolata tramite uORF è il gene Carnitina Palmitoyltransferase 1C (CPT1C). CPT1C regola il metabolismo nel cervello in situazioni di surplus energetico. La presenza di uORF nella 5′ UTR reprime l’espressione dell’ORF. Tuttavia, questa repressione è alleviata in risposta a specifici stimoli di stress come la depravazione del glucosio e il trattamento con palmitato-BSA. È stato suggerito che le uORF possono anche indurre la degradazione dell’mRNA. Una serie di costrutti 5′ UTR contenenti come reporter il gene gatto dal trasposone batterico Tn9 è stato testato in lievito. Una sostituzione di un singolo nucleotide è stata usata per creare un ORF di 7 codoni a monte del gene del gatto. La uORF è stata tradotta in modo efficiente e ha causato l’inibizione della traduzione dell’ORF del gatto e la destabilizzazione dell’mRNA del gatto. Un collegamento tra le uORF e il decadimento dell’mRNA è stato anche suggerito sulla base di un confronto tra i livelli medi di espressione dei trascritti contenenti uORF e non contenenti uORF.
(a)
(b)
(a)
(b)
Impatto delle sequenze uAUG sulla regolazione della traduzione. (a) Confronto dei livelli di luciferasi ottenuti per i costrutti che hanno il 5′ UTR del gene ACT (controllo) e geni contenenti uAUG: WBSCR16, MFSD5 e BCL2L13. (b) La delezione o la mutazione della sequenza uAUG presente nei geni WBSCR16, MFSD5 e BCL2L13 fa regredire la repressione della traduzione come si vede come un aumento dell’attività della luciferasi.
Diverse mutazioni che eliminano o creano uORFs che finiscono per alterare i livelli di proteine sono state collegate a malattie umane. La loro rilevanza è stata discussa di recente. La predisposizione al melanoma può essere causata da una mutazione che introduce una uORF nel 5′ UTR del gene della proteina inibitrice della ciclina-dipendente-chinasi (CDKN2A). La trombocitemia ereditaria è causata da una mutazione che crea una variante di splicing che elimina una uORF, portando ad un aumento della produzione proteica del gene trombopoietina . L’ipotricosi ereditaria di Marie Unna deriva da una mutazione che interrompe una uORF presente nel 5′ UTR del gene hairless homolog e di conseguenza aumenta la sua espressione. Una transizione da G ad A in uno degli uORF presenti nel 5′ UTR del trascritto TGF-β3 è stata determinata per essere associata alla cardiomiopatia/displasia aritmogena del ventricolo destro (ARVC). Un altro gruppo di cinque uORF associati a malattie sono stati testati di recente utilizzando saggi reporter; essi comprendono la disgenesia gonadica (SRY), la sindrome di Van der Woude (IRF6), il complesso di Carney tipo 1 (PRKAR1A), la pancreatite ereditaria (SPINK1) e la talassemia-β (HBB). Questa lista è certamente destinata ad espandersi poiché sono stati riportati più di 500 polimorfismi a singolo nucleotide (SNPs) che creano o cancellano le uORFs.
6. Ricerca di nuovi elementi regolatori nel 5′ UTR
Solo una piccola frazione degli elementi regolatori post-trascrizionali situati nel 5′ UTR umano è stata caratterizzata. Gli elementi UTR identificati sono catalogati in una risorsa web mantenuta dal gruppo di Graziano Pesole chiamata UTRdb (http://utrdb.ba.itb.cnr.it/). I metodi in vivo per l’identificazione degli elementi regolatori post-trascrizionali nelle UTR, specialmente quelli associati alle RBP, sono avanzati notevolmente negli ultimi cinque anni grazie alla tecnologia del sequenziamento profondo. CLIP e RIP-Seq sono metodi basati sull’isolamento di molecole di proteine RNA (RNPs) tramite immunoprecipitazione, seguita da digestione RNase e identificazione precisa dei siti di legame RBP con sequenziamento profondo. Anche se il numero di RBP analizzate finora con questi metodi è davvero piccolo (recensito in ), man mano che la tecnologia di sequenziamento profondo diventa più accessibile e i metodi semplificati, ci si potrebbe aspettare che molto presto una gran parte dei siti di legame RBP umani nelle UTR sarà mappata.
Un’altra scelta per mappare gli elementi UTR che regolano la traduzione è quella di utilizzare metodi puramente computazionali basati sull’analisi delle sequenze UTR. Questi metodi si basano sull’identificazione di modelli ribonucleotidici degenerati che hanno le proprietà attese dei siti di legame RBP. Metodi simili sono stati applicati per quasi 30 anni per identificare i regolatori trascrizionali nelle sequenze dei promotori. Questi metodi stanno raggiungendo la maturità, sono molto usati e hanno aiutato molto nella compilazione di database sulla regolazione trascrizionale (per esempio, TRANSFAC). Anche se molto del lavoro diretto alla progettazione e al perfezionamento degli algoritmi di analisi delle sequenze di regolazione nel contesto della regolazione trascrizionale può essere adattato ai corrispondenti problemi di analisi nel contesto degli elementi di regolazione post-trascrizionale, ci sono ulteriori complicazioni associate ai siti di legame RBP. La più ovvia tra queste è che le RBP avranno preferenze strutturali secondarie, e pochi strumenti di analisi esistenti possono incorporare informazioni sul ripiegamento dell’RNA. Allo stesso modo, a causa del ripiegamento dell’RNA gli elementi regolatori possono funzionare più facilmente in modo sinergico o mostrare un legame concertato con elementi di sequenza che sono distali nella sequenza primaria ma molto vicini nella molecola ripiegata. Un’altra difficoltà è la mancanza di elementi regolatori traslazionali di esempio per allenare l’analisi. Sulla base di una manciata di esempi ben studiati, c’è spesso la percezione che i siti di legame delle RBP siano in media più corti dei siti di legame dei fattori di trascrizione (TF), ma questa percezione può essere dovuta a distorsioni nell’insieme delle RBP che ricevono il maggior numero di ricerche. Uno dei metodi più potenti per identificare gli elementi regolatori è il foot-printing filogenetico, che sfrutta la conservazione evolutiva localmente elevata per rivelare elementi funzionali. Questa logica funziona altrettanto bene per gli elementi regolatori post-trascrizionali. Sfortunatamente i siti di legame della TF sono anche un grande ostacolo all’applicazione diretta dell’analisi computazionale delle sequenze per identificare gli elementi 5′ UTR coinvolti nella traduzione. Gli elementi coinvolti nella regolazione trascrizionale risiedono sia a monte che a valle dei siti di inizio della trascrizione, e quando le 5′ UTR sono sufficientemente corte gli elementi di regolazione post-trascrizionale sono probabilmente interlacciati con i siti di legame delle TF.
In definitiva i migliori metodi per identificare gli elementi di regolazione post-trascrizionale emergeranno dall’applicazione complementare di tecniche sperimentali e computazionali.
Riconoscimenti
La ricerca nel laboratorio di Penalva è supportata dalla Fondazione Voelcker, dalla fondazione Children’s Brain Tumor, e dalle 5R21HG004664-02 e 1R01HG006015-01A1.
Materiali di supporto
Abbiamo riassunto le statistiche di base per le uORF nel trascrittoma umano (NCBI build37.3). La tabella 1.a mostra il numero di apparizioni di sequenze uORF-like che contengono AUG in 5′ UTR in termini di mRNA e geni. Inoltre, abbiamo separato due distinte sequenze uORF-like con codone di terminazione corrispondente in 5′ UTR o senza codone di terminazione corrispondente in 5′ UTR. Le informazioni dettagliate per questi due casi sono elencate nella Tabella 1.b. Infine, la Tabella 1.c mostra quante sequenze uORF-like sono apparse su un singolo 5′ UTR di ogni mRNA.
- Tabella supplementare
Lascia un commento