Avant de commencer : Régulation de la traduction au niveau de l’UTR 5′
On octobre 5, 2021 by adminAbstract
La régulation de la traduction joue des rôles importants dans les conditions physiologiques normales et les états pathologiques. Cette régulation nécessite des éléments cis-régulateurs situés principalement dans les 5′ et 3′ UTR et des facteurs trans-régulateurs (par exemple, les protéines de liaison à l’ARN (RBP)) qui reconnaissent des caractéristiques spécifiques de l’ARN et interagissent avec la machinerie de traduction pour moduler son activité. Dans cet article, nous discutons des aspects importants de la régulation médiée par la 5′ UTR en fournissant un aperçu des caractéristiques et de la fonction des principaux éléments présents dans cette région, comme l’uORF (cadre de lecture ouvert en amont), les structures secondaires et les motifs de liaison des RBP, ainsi que différents mécanismes de régulation de la traduction et l’impact qu’ils ont sur l’expression des gènes et la santé humaine lorsqu’ils sont dérégulés.
1. Régulation de la traduction
L’expression des gènes peut être modulée à plusieurs niveaux, de la modification de la chromatine à la traduction de l’ARNm. Malgré l’importance de la régulation transcriptionnelle, il est clair à ce stade que les niveaux d’ARNm ne peuvent pas être utilisés comme seul paramètre pour justifier le contenu protéique d’une cellule. En fait, dans une étude récente de notre laboratoire, nous avons déterminé qu’une corrélation directe entre l’ARNm et la protéine existe pour moins d’un tiers des gènes analysés dans une lignée cellulaire humaine. De plus, notre analyse a suggéré que la régulation de la traduction contribue considérablement à la variation des protéines, car plusieurs paramètres liés à la traduction, tels que 5′ UTR, 3′ UTR, la longueur de la séquence codante, la présence d’uORF et la composition en acides aminés, etc. ont montré de bonnes corrélations avec les rapports ARNm/protéine obtenus. La régulation de la traduction fonctionne comme un interrupteur important lorsque des changements rapides dans l’expression des gènes sont nécessaires en réponse à des stimuli internes et externes (PDGF2, VEGF, TGFβ sont des exemples de gènes contrôlés de cette manière). La régulation de la traduction joue également un rôle important au cours du développement et de la différenciation cellulaire en modifiant les niveaux d’expression de sous-ensembles spécifiques d’ARNm pendant une fenêtre temporelle particulière alors que la majorité des transcrits restent inchangés (revue dans ).
Dans cet article, nous nous concentrerons sur l’importance de la régulation médiée par le 5′ UTR et les différents éléments fonctionnels présents dans cette région à l’exception de l’IRES qui est abordé dans un autre article de ce numéro. Les principaux éléments de régulation dans le 5′ UTR sont les structures secondaires (y compris l’IRES), les sites de liaison pour les protéines de liaison à l’ARN, les uAUG et les uORF (Figure 1).
Éléments régulateurs présents dans le 5′ UTR.
2. 5′ UTR
La longueur moyenne des 5′ UTR est de ~100 à ~220 nucléotides à travers les espèces . Chez les vertébrés, les 5′ UTR ont tendance à être plus longues dans les transcrits codant pour des facteurs de transcription, des protooncogènes, des facteurs de croissance et leurs récepteurs, et des protéines qui sont peu traduites dans des conditions normales . Un contenu GC élevé est également une caractéristique conservée, avec des valeurs dépassant 60% dans le cas des vertébrés à sang chaud. Dans le contexte des structures en épingle à cheveux, la teneur en GC peut affecter l’efficacité de la traduction des protéines indépendamment de la stabilité thermique et de la position de l’épingle à cheveux. Les UTR des ARNm eucaryotes présentent également une variété de répétitions qui incluent des éléments intercalés courts et longs (SINEs et LINEs, respectivement), des répétitions de séquences simples (SSRs), des minisatellites et des macrosatellites .
L’initiation de la traduction chez les eucaryotes nécessite le recrutement de sous-unités ribosomiques soit au niveau de la structure de la coiffe 5′ m7G. Le codon d’initiation est généralement situé loin en aval, ce qui nécessite un mouvement ribosomal vers ce site. Ce mouvement semble être non linéaire pour certains ARNm (c’est-à-dire que les sous-unités ribosomiques semblent contourner (shunter) des segments de la 5′ UTR lorsqu’elles se déplacent en direction de l’AUG). Le shuntage pourrait permettre aux ARNm contenant des uAUG ou des structures en épingle à cheveux d’être traduits efficacement. Des exemples importants sont fournis par les ARNm du virus de la mosaïque du chou-fleur et des adénovirus. Le mécanisme du shuntage ribosomal est assez complexe nécessitant un appariement des bases ARNm-ARNr .
Les gènes présentant des différences dans la 5′ UTR de leurs transcrits sont relativement courants. 10-18% des gènes expriment des 5′ UTR alternatives en utilisant plusieurs promoteurs tandis que l’épissage alternatif au sein des UTR est estimé affecter 13% des gènes du transcriptome des mammifères . Ces variations dans les 5′ UTR peuvent fonctionner comme des commutateurs importants pour réguler l’expression des gènes. Deux exemples importants sont fournis par les gènes liés au cancer BRCA1 (cancer du sein 1) et TGF-β (facteur de croissance transformant β). BRCA1 est un suppresseur de tumeur, fréquemment muté dans le cancer du sein, avec des fonctions dans le cycle cellulaire, l’apoptose et la réparation des dommages à l’ADN. BRAC1 produit deux transcrits différents qui dérivent de deux promoteurs différents et présentent donc des différences dans leur 5′ UTR. Un transcrit plus court est exprimé dans le tissu mammaire cancéreux ainsi que non cancéreux et traduit efficacement, tandis qu’un transcrit plus long est principalement exprimé dans les cancers du sein. La présence de plusieurs uAUG et une structure plus complexe affectent considérablement la traduction de ce transcrit plus long. Cela entraîne une diminution globale des niveaux de BRAC1 dans les cellules tumorales, conduisant à un soulagement de l’inhibition de la croissance . Le TGF-β est impliqué dans un grand nombre de processus, dont la prolifération cellulaire, la migration, la réparation des blessures, le développement, la tumorigenèse et l’immunosuppression. Il existe trois isoformes connues : β1, β2 et β3. Le TGF-β3 produit deux transcrits alternatifs : un transcrit de 3,5 kb avec un 5′ UTR très long (1,1 kb) et un transcrit de 2,6 kb avec un 5′ UTR plus court (0,23 kb). La présence de 11 uORFs dans le transcrit le plus long inhibe dramatiquement sa traduction alors que le transcrit le plus court est efficacement traduit .
3. Régulation par la structure secondaire
Les structures secondaires peuvent fonctionner comme des outils de régulation majeurs dans les 5′ UTR. Une corrélation avec la fonction du gène a été suggérée ; on a déterminé que les structures secondaires sont particulièrement répandues parmi les ARNm codant pour des facteurs de transcription, des protooncogènes, des facteurs de croissance et leurs récepteurs et des protéines mal traduites dans des conditions normales. >90% des transcrits de ces classes ont des 5′ UTR contenant des structures secondaires stables avec des énergies libres moyennes inférieures à -50 kcal/mol. 60% de ces structures secondaires stables sont positionnées très près de la structure de la coiffe . Ces structures sont très efficaces pour inhiber la traduction. En effet, une épingle à cheveux située près de la coiffe avec une énergie libre de -30 kcal/mol serait suffisante pour bloquer l’accès du complexe de préinitiation à l’ARNm. Lorsqu’elles sont situées plus loin dans le 5′ UTR, les épingles à cheveux nécessitent une énergie libre plus forte que -50 kcal/mol pour pouvoir bloquer la traduction . Une structure secondaire stable peut résister à l’activité de déroulement de l’hélicase elF4A. Cet effet peut être partiellement surmonté par la surexpression de elF4A en partenariat avec elF4B . Les ARNm avec un 5′ UTR hautement structuré comme les proto-oncogènes et autres facteurs de croissance utilisent l’initiation de la traduction cap-dépendante. Il n’est pas surprenant que la surexpression des composants de la machinerie d’initiation de la traduction, y compris elf4E, ait été liée à la tumorigenèse (revue dans ).
Le gène TGF-β1 fournit un bon exemple d’inhibition de la traduction médiée par la structure secondaire . Un motif conservé au cours de l’évolution dans le 5′ UTR forme une boucle de tige stable. Cependant, cette structure en elle-même n’est pas suffisante pour bloquer la traduction. La répression de la traduction du TGF-β1 dépend de la liaison accrue de la protéine de liaison à l’ARN YB-1 au transcrit du TGF-β1 . Il a alors été proposé que YB-1 se lie à la 5′ UTR de TGF-β1 avec une haute affinité grâce à son contenu en GC et coopère avec la boucle tige pour inhiber la traduction de TGF-β1 en facilitant la formation de duplex .
4. Régulation par les protéines de liaison à l’ARN
Le génome humain est prédit pour coder environ 1 000 protéines de liaison à l’ARN (RBP) avec un grand pourcentage d’entre elles impliquées dans la traduction. Elles peuvent être classées en deux groupes principaux : Les RBP qui font partie de la machinerie de traduction de base et sont nécessaires à la traduction de tous les ARNm exprimés (exemples : PABPI, elf4E) et les RBP qui fonctionnent de manière plus sélective en contrôlant positivement ou négativement les niveaux de traduction d’ARNm cibles spécifiques (exemples : HuR, Musashi1). En ce qui concerne ce dernier groupe, il a été observé que les RBP peuvent utiliser des mécanismes distincts pour augmenter ou inhiber la traduction. Bien que plusieurs exceptions soient connues, on peut dire que les RBP reconnaissent souvent des motifs spécifiques dans les UTR et interagissent avec la machinerie de traduction pour contrôler l’expression. L’interférence avec la traduction a normalement lieu pendant l’étape d’initiation (revue dans ).
L’exemple le mieux caractérisé de régulation médiée par les RBP impliquant les 5′ UTR est fourni par les protéines régulatrices du fer (IRP 1 et 2). Ces protéines reconnaissent une structure de boucle tige hautement conservée d’environ 30 nucléotides, connue sous le nom d’élément de réponse au fer (IRE). Les caractéristiques les plus importantes comprennent une boucle hexanucléotidique avec la séquence CAGYCX (Y = U ou A ; X = U, C ou A) et une tige supérieure de 5 pb qui est séparée d’une tige inférieure de longueur variable par une cytosine non appariée. Cette régulation est cruciale pour le maintien de l’homéostasie cellulaire du fer car un grand nombre d’ARNm liés au stockage et au métabolisme du fer, notamment la ferritine, l’aconitase mitochondriale, la succinate déshydrogénase-protéine du fer, la 5-aminolévulinate synthétase érythroïde (eALAS) et une molécule d’exportation du fer appelée ferroportine (FPN1) voient leur expression modulée par ce système. Lorsque les niveaux de fer cellulaire sont faibles, IRP1 et IRP2 se lient à l’IRE et bloquent la traduction de l’ORF en aval. Lorsque les niveaux de fer intracellulaire sont élevés, l’activité de liaison à l’ARN des deux IRP est réduite (Figure 2(a)). Les IRE ont tendance à être positionnés près de la coiffe, ce qui entraîne une inhibition stérique de la liaison des sous-unités ribosomiques 40S au transcrit. Lorsqu’il est situé à distance de la coiffe, plutôt que d’affecter le recrutement de 40S, le complexe IRE-IRP bloque le balayage ribosomal (examiné dans ). Un contournement intéressant du mécanisme IRE/IRP peut être observé dans les cellules précurseurs duodénales et érythroïdes privées de fer. Un promoteur en amont est utilisé pour générer des pré-ARNm FPN1 contenant un exon supplémentaire qui est connecté par épissage alternatif à un accepteur d’épissage en 3′ de l’IRE. Un transcrit FPN1 mature contenant le même cadre de lecture ouvert est généré ; cependant, le 5′ UTR ne contient pas l’IRE . Par conséquent, ces cellules expriment l’isoforme alternative FPN1 d’une manière indépendante du fer . Les mutations affectant les IRE peuvent conduire à des maladies. C’est le cas du syndrome héréditaire d’hyperferritinémie-cataracte (HHCS), une maladie génétique autosomique dominante dans laquelle l’agrégation et la cristallisation de la ferritine dans le cristallin entraînent des cataractes bilatérales .
(a)
(b)
(a)
(b)
Régulation transcriptionnelle par les protéines de liaison à l’ARN. (a) Dans les cellules carencées en fer, les IRP se lient à l’IRE localisé dans le 5′ UTR de l’ARNm de la ferritine, bloquant sa traduction. Une fois que le taux de fer cellulaire augmente, un complexe contenant du Fe se lie aux IRP. Ainsi, ces protéines sont modifiées allostériquement, ce qui réduit la liaison IRP-IRE et permet la traduction des ARNm de la ferritine. (b) Régulation du gène msl-2 chez la mouche femelle. Après la transcription dans le noyau, SXL se lie spécifiquement aux régions introniques riches en U du pré-ARNm msl-2 et inhibe la suppression de l’intron (1). Dans le cytoplasme, SXL se lie aux mêmes éléments localisés maintenant dans le 5′ UTR de l’ARNm msl-2 mature, renforce l’initiation de la traduction d’un ORF amont (2), et empêche la traduction de l’ORF principal (3). Les éléments régulateurs dans le 3′ UTR de l’ARNm msl-2 n’étaient pas représentés.
La régulation médiée par la RBP peut être très élaborée et impliquer de multiples étapes. Un bon exemple montrant le crosstalk entre les facteurs et les processus de régulation distincts est le gène male-specific-lethal 2 (msl-2) chez la drosophile, un acteur principal dans la compensation de dosage. La protéine de liaison à l’ARN spécifique de la femelle, sex lethal (SXL), participe à de multiples aspects de la régulation de msl-2 où l’expression de msl-2 doit être empêchée (Figure 2(b)). La régulation commence au niveau de l’épissage ; SXL se lie à deux tronçons polyU situés dans un intron qui fait partie de l’UTR 5′. Ce processus provoque la rétention de l’intron et préserve les séquences critiques qui seront plus tard utilisées dans la régulation de la traduction . Dans le cytoplasme, la même protéine SXL va fonctionner comme un répresseur de traduction de msl-2 selon deux mécanismes distincts ayant lieu au niveau des 3′ et 5′ UTR . SXL se lie aux séquences riches en U dans l’UTR 3′ et recrute la protéine corépressive UNR (en amont de N-ras) et PABP bloquant le recrutement du complexe de pré-initiation à l’extrémité 5′ de l’ARNm . Pour assurer la répression complète de msl-2, une deuxième étape de régulation, également médiée par SXL, a lieu à l’extrémité 5′ UTR. Cette répression implique un nouveau mécanisme de régulation où la diaphonie entre SXL et un uORF a lieu pour réprimer efficacement la traduction. Le 5′ UTR de msl-2 contient 3 uORFs mais seulement le 3ème est impliqué dans la répression. Il est intéressant de noter que cette répression est très faible en l’absence de SXL (~2 fois), mais lorsqu’il est présent, SXL se lie à un stretch poly U à quelques nucléotides de l’uAUG et augmente cette répression à plus de 14 fois. SXL agit en stimulant l’initiation de la traduction au niveau de l’uAUG et non en agissant comme un simple arrêt stérique des ribosomes de balayage. Cet effet peut avoir lieu par le biais d’une interaction entre SXL et les facteurs d’initiation de la traduction ; probablement des membres de la composante elF3 comme l’indique un criblage à deux hybrides. Ce mécanisme affecte potentiellement un grand nombre d’ARNm ; on a déterminé que 268 transcrits chez la drosophile contiennent des motifs de liaison SXL associés à des uAUG espacés à une distance appropriée. Par exemple, une construction rapporteur contenant la 5′UTR du gène Irr47 a été réprimée ~4 fois par la protéine SXL .
Les RBP peuvent avoir des fonctions antagonistes lors de la régulation de la traduction. Un exemple intéressant est la régulation de p21 dans le contexte de la sénescence réplicative, un état cellulaire où les cellules entrent dans un arrêt de croissance irréversible. L’induction de p21 est nécessaire pour initier le processus, et pour inhiber les complexes cdk2-cycline E. La 5′ UTR de p21 contient une séquence riche en GC qui forme une boucle à tige. Cet élément est reconnu par deux RBP aux propriétés distinctes : CUGBP1 et la calréticuline (CRT). La compétition entre ces deux protéines détermine les niveaux finaux d’expression de p21 et établit si les cellules vont proliférer ou subir un arrêt de croissance et une sénescence. La liaison de CUGBP1 à l’ARNm de p21 est considérablement augmentée dans les cellules de fibroblastes sénescentes par rapport aux cellules jeunes. Les niveaux de protéines ne changent pas au cours du processus et cette augmentation de l’activité est due à la phosphorylation. D’autre part, les IPs de CRT ont montré une réduction de quatre à cinq fois de l’activité dans les cellules de sénescence en raison d’une diminution de l’expression. Il a été démontré que les deux protéines affectent la traduction de p21. Cependant, alors que CUGBP1 fonctionne comme un activateur, CRT agit comme un répresseur. Comme les deux protéines ont une activité opposée dans les cellules sénescentes, elles ont été examinées pour voir si elles sont en compétition pour l’interaction avec l’ARNm p21 et pour contrôler sa traduction. Des quantités croissantes d’une protéine ont été capables d’inverser la liaison de l’autre protéine à l’ARNm p21 et son effet sur la traduction ; l’affinité au site de liaison est plutôt différente car CUGBP1 devait être présent dans les réactions de liaison à un excès molaire de quatre à huit fois par rapport à CRT pour antagoniser sa liaison à l’ARNm p21 et avoir un impact sur sa traduction .
5. Régulation par les uORFs et les AUGs amont
Les uORFs et les uAUGs sont des éléments régulateurs majeurs dans les 5′ UTRs. Comme leurs noms le suggèrent, les uORFs sont des séquences définies par un codon de départ et un codon d’arrêt en amont de la région codante principale tandis que les uAUGs sont des codons de départ sans codon d’arrêt en aval dans le cadre, situés en amont de la région codante principale. Un pourcentage important du transcriptome humain contient des uORF et/ou des uAUG, avec des valeurs comprises entre 44 et 49% . On trouve des chiffres similaires dans le transcriptome de la souris. Bien que ces chiffres puissent paraître élevés, les uORF et les uAUG sont moins fréquents que prévu par hasard, ce qui suggère qu’ils sont soumis à une pression sélective. Les uORF et les uAUG sont surreprésentés dans des sous-groupes particuliers tels que les facteurs de transcription, les facteurs de croissance, leurs récepteurs et les proto-oncogènes. Les uORF et les uAUG sont extrêmement diversifiés, variant en termes de position par rapport à la coiffe et à l’AUG principal, de nombre par transcription et de longueur (dans le cas des uORF). Le tableau supplémentaire 1 (dans Supplementary Material disponible en ligne à http://dx.doi.org/10.1155/2012/475731) fournit une liste complète des uORFs et des uAUGs présents dans le transcriptome humain. Les uORFs et les uAUGs n’ont pas été analysés de manière approfondie en termes de conservation. Une étude pilote réalisée avec un sous-ensemble de transcriptions humaines, de souris et de rats a indiqué que ces deux éléments sont modérément conservés, puisque 38 % des uORF et 24 % des uAUG ont été déterminés comme étant conservés entre les trois espèces. La conservation modeste des uORFs combinée au fait que leur longueur moyenne (20 nucléotides) est attendue par hasard et que les uAUGs fournissent une suppression plus forte par rapport aux uORFs suggère que de nombreux uAUGs ont été neutralisés dans le processus d’évolution par l’acquisition d’un codon stop en aval. Il a donc été proposé que seuls quelques uORF, très probablement ceux qui sont conservés, ont été recrutés pour la régulation de l’expression. Chez la levure, il a été démontré que les uORF sont statistiquement sous-représentés dans les 5′ UTR et ont été éliminés par pression sélective, indiquant de la même manière que les uORF restants peuvent être impliqués dans la régulation de la traduction .
Bien que, dans l’ensemble, il a été suggéré que les uORF sont négativement corrélés avec la production de protéines jusqu’à présent, l’activité fonctionnelle a été démontrée pour seulement un nombre limité d’uORF et d’uAUG. Dans la figure 3, nous montrons des exemples de l’impact que les uAUGs peuvent avoir sur l’efficacité de la traduction. Parmi les caractéristiques les plus pertinentes qui peuvent contribuer à la fonctionnalité figurent la longue distance 5′ cap-to-uORF, la conservation de la séquence, le contexte dans lequel se trouve l’AUG, la force du site d’initiation de l’ORF, la longueur de l’uORF et le nombre d’AUG dans la 5′ UTR . Des résultats différents ont été observés lorsqu’un ribosome rencontre un uAUG ou un uORF . Le nombre d’événements caractérisés étant encore faible, il est difficile de définir des mécanismes généraux ; nous décrivons alors quelques événements bien caractérisés et pertinents. On parle de balayage fuyant lorsqu’une partie des complexes de balayage contourne l’uAUG ou l’uORF et continue à balayer l’AUG suivant. Dans ce cas, l’AUG amont agit comme un » leurre » par rapport à l’AUG de l’ORF, fonctionnant comme un régulateur négatif de la traduction, du moins pour une certaine fraction des ribosomes. La production de peptides à action en cis par les uORF peut réduire l’initiation de la traduction de l’ORF en aval en bloquant le ribosome à l’extrémité de l’uORF . Un exemple classique est fourni par le peptide atténuateur d’arginine (AAP) eucaryote conservé au cours de l’évolution, qui contrôle négativement la traduction des protéines impliquées dans la biosynthèse de novo de l’arginine fongique en cas de concentration élevée d’arginine. Dans ce scénario, l’arginine modifie la conformation de l’AAP et/ou l’environnement du site P, provoquant un blocage ribosomal au niveau du codon de terminaison de l’uORF de l’AAP . L’AAP réduit également l’élongation de la traduction en bloquant les ribosomes lorsque l’uORF est inséré dans une séquence codante. Un autre exemple classique de régulation médiée par les uORF provient de la levure. Quatre uORF sont présents dans la 5′ UTR du facteur de transcription GCN4. Le premier des quatre uORF est toujours traduit efficacement quelles que soient les conditions nutritionnelles. Dans les cellules non perturbées, le rechargement rapide des ribosomes et des cofacteurs d’initiation permet la traduction des uORFs 2-4 tout en inhibant la traduction de l’ORF principal. En situation de privation d’acides aminés, les facteurs d’initiation sont rares, ce qui entraîne un rechargement décéléré des ribosomes et un balayage des séquences contenant les uORFs. Un complexe d’initiation fonctionnel est réassemblé uniquement au niveau de la séquence codante principale et GCN4 est exprimé. Ce mécanisme permet une réponse rapide au stress nutritionnel . Un autre exemple similaire d’expression régulée via uORF est le gène de la Carnitine Palmitoyltransférase 1C (CPT1C). Le CPT1C régule le métabolisme dans le cerveau en cas de surplus d’énergie. La présence de l’uORF dans le 5′ UTR réprime l’expression de l’ORF. Cependant, cette répression est levée en réponse à des stimuli de stress spécifiques comme la privation de glucose et le traitement au palmitate-BSA . Il a été suggéré que les uORFs peuvent également induire la dégradation de l’ARNm. Une série de constructions 5′ UTR contenant comme rapporteur le gène cat du transposon bactérien Tn9 a été testée chez la levure. Une substitution d’un seul nucléotide a permis de créer un ORF de 7 canons en amont du gène cat. L’uORF a été traduit efficacement et a provoqué l’inhibition de la traduction de l’ORF cat et la déstabilisation de l’ARNm cat. Un lien entre les uORF et la désintégration de l’ARNm a également été suggéré sur la base d’une comparaison entre les niveaux moyens d’expression des transcrits contenant des uORF et des transcrits ne contenant pas d’uORF .
(a)
(b)
(a)
(b)
Impact des séquences uAUG sur la régulation de la traduction. (a) Comparaison des niveaux de luciférase obtenus pour des constructions ayant le 5′ UTR du gène ACT (contrôle) et des gènes contenant des uAUG : WBSCR16, MFSD5, et BCL2L13. (b) La délétion ou la mutation de la séquence uAUG présente dans les gènes WBSCR16, MFSD5 et BCL2L13 réverse la répression de la traduction, comme on le voit par une augmentation de l’activité de la luciférase.
Plusieurs mutations qui éliminent ou créent des uORF qui finissent par modifier les niveaux de protéines ont été reliées à des maladies humaines. Leur pertinence a été discutée récemment . La prédisposition au mélanome peut être causée par une mutation qui introduit un uORF dans le 5′ UTR du gène de la protéine inhibitrice de la cycline-dépendante-kinase (CDKN2A) . La thrombocytémie héréditaire est causée par une mutation qui crée une variante d’épissage qui élimine un uORF, entraînant une augmentation de la production de la protéine du gène de la thrombopoïétine . L’hypotrichose héréditaire de Marie Unna dérive d’une mutation qui perturbe un uORF présent dans la 5′ UTR du gène hairless homolog et par conséquent augmente son expression . Une transition de G à A dans l’un des uORF présents dans le 5′ UTR du transcrit TGF-β3 a été déterminée comme étant associée à la cardiomyopathie/dysplasie ventriculaire droite arythmogène (ARVC) . Un autre groupe de cinq uORF associés à des maladies a été testé récemment à l’aide de tests rapporteurs ; il s’agit de la dysgénésie gonadique (SRY), du syndrome de Van der Woude (IRF6), du complexe de Carney de type 1 (PRKAR1A), de la pancréatite héréditaire (SPINK1) et de la thalassémie-β (HBB). Cette liste va certainement s’allonger car plus de 500 polymorphismes mononucléotidiques (SNP) créant ou supprimant des uORF ont été rapportés.
6. Recherche de nouveaux éléments régulateurs dans le 5′ UTR
Seule une petite fraction des éléments régulateurs posttranscriptionnels situés dans les 5′ UTR humains a été caractérisée. Ces éléments UTR identifiés sont catalogués dans une ressource web maintenue par le groupe de Graziano Pesole appelée UTRdb (http://utrdb.ba.itb.cnr.it/) . Les méthodes in vivo d’identification des éléments de régulation posttranscriptionnelle dans les UTR, en particulier ceux associés aux RBP, ont progressé de manière spectaculaire au cours des cinq dernières années grâce à la technologie du séquençage profond. CLIP et RIP-Seq sont des méthodes basées sur l’isolement de molécules de protéines d’ARN (RNP) par immunoprécipitation, suivi d’une digestion par RNase et d’une identification précise des sites de liaison des RBP par séquençage profond. Bien que le nombre de RBP analysés jusqu’à présent par ces méthodes soit vraiment faible (examiné dans ), comme la technologie de séquençage profond devient plus accessible et les méthodes simplifiées, on peut s’attendre à ce que très bientôt une grande partie des sites de liaison RBP humains dans les UTR soit cartographiée.
Un autre choix pour cartographier les éléments UTR régulant la traduction est d’utiliser des méthodes purement computationnelles basées sur l’analyse des séquences UTR. Ces méthodes sont basées sur l’identification de motifs ribonucléotidiques dégénérés qui ont les propriétés attendues des sites de liaison RBP. Des méthodes similaires sont appliquées depuis près de 30 ans pour identifier les régulateurs transcriptionnels dans les séquences promotrices. Ces méthodes arrivent à maturité, sont très largement utilisées et ont grandement contribué à la compilation de bases de données sur la régulation transcriptionnelle (par exemple, TRANSFAC). Bien que la plupart des travaux visant à concevoir et à affiner les algorithmes d’analyse des séquences régulatrices dans le contexte de la régulation transcriptionnelle puissent être adaptés aux problèmes d’analyse correspondants dans le contexte des éléments régulateurs post-transcriptionnels, il existe des complications supplémentaires associées aux sites de liaison RBP. La plus évidente d’entre elles est que les RBP auront des préférences structurelles secondaires, et peu d’outils d’analyse existants peuvent intégrer des informations sur le repliement de l’ARN. De même, en raison du repliement de l’ARN, les éléments régulateurs peuvent plus facilement fonctionner en synergie ou se lier de manière concertée à des éléments de séquence distaux dans la séquence primaire mais très proches dans la molécule repliée. Une autre difficulté est le manque d’exemples d’éléments régulateurs translationnels pour entraîner l’analyse. Sur la base d’une poignée d’exemples bien étudiés, on a souvent l’impression que les sites de liaison des RBP sont en moyenne plus courts que les sites de liaison des facteurs de transcription (TF), mais cette impression peut être due à un biais dans l’ensemble des RBP qui font l’objet du plus grand nombre de recherches. L’une des méthodes les plus puissantes pour identifier les éléments régulateurs est l’empreinte phylogénétique, qui tire parti de la conservation évolutive localement élevée pour révéler des éléments fonctionnels. Cette logique fonctionne aussi bien pour les éléments régulateurs post-transcriptionnels. Malheureusement, les sites de liaison de la TF sont également un obstacle majeur à l’application directe de l’analyse computationnelle des séquences pour identifier les éléments 5′ UTR impliqués dans la traduction. Les éléments impliqués dans la régulation transcriptionnelle résident à la fois en amont et en aval des sites de début de transcription, et lorsque les 5′ UTR sont suffisamment courts, les éléments régulateurs post-transcriptionnels sont probablement entrelacés avec les sites de liaison TF.
En fin de compte, les meilleures méthodes pour identifier les éléments régulateurs post-transcriptionnels émergeront de l’application complémentaire des techniques expérimentales et computationnelles.
Remerciements
La recherche dans le laboratoire de Penalva est soutenue par la Fondation Voelcker, la fondation Children’s Brain Tumor, et 5R21HG004664-02 et 1R01HG006015-01A1.
Matériaux supplémentaires
Nous avons résumé les statistiques de base pour les uORF dans le transcriptome humain (NCBI build37.3). Le tableau 1.a montre le nombre d’apparitions de séquences de type uORF qui contiennent AUG dans les 5′ UTR en termes d’ARNm et de gènes. Nous avons également séparé deux séquences distinctes de type uORF avec un codon de terminaison correspondant dans les 5′ UTR ou sans codon de terminaison correspondant dans les 5′ UTR. Les informations détaillées pour ces deux cas sont énumérées dans le tableau 1.b. Enfin, le tableau 1.c montre combien de séquences de type uORF sont apparues sur un 5′ UTR individuel de chaque ARNm.
- Tableau complémentaire
.
Laisser un commentaire