Antes de Começar: Regulação da Tradução no 5′ UTR
On Outubro 5, 2021 by adminAbstract
A regulação da tradução desempenha papéis importantes tanto em condições fisiológicas normais como em estados de doença. Esta regulação requer elementos cis-regulatórios localizados principalmente em 5′ e 3′ UTRs e factores trans-regulatórios (por exemplo, proteínas de ligação do RNA (RBPs)) que reconhecem características específicas do RNA e interagem com a maquinaria de tradução para modular a sua actividade. Neste artigo, discutimos aspectos importantes da regulação mediada por UTR em 5′, fornecendo uma visão geral das características e da função dos principais elementos presentes nesta região, como uORF (upstream open reading frame), estruturas secundárias, e motivos vinculantes de RBPs e diferentes mecanismos de regulação da tradução e o impacto que têm na expressão gênica e na saúde humana quando desregulada.
1. Regulação de tradução
Expressão do gene pode ser modulada em múltiplos níveis desde a modificação da cromatina até a tradução do mRNA. Apesar da importância da regulação transcripcional, é claro neste ponto que os níveis de mRNA não podem ser usados como um único parâmetro para justificar o conteúdo de proteína de uma célula. De facto, num estudo recente do nosso laboratório, determinámos que existe uma correlação directa entre o mRNA e a proteína para menos de um terço dos genes analisados numa linha de células humanas. Além disso, a nossa análise sugeriu que a regulação de tradução contribui consideravelmente para a variação proteica, uma vez que vários parâmetros relacionados com a tradução como 5′ UTR, 3′ UTR, comprimento da sequência de codificação, presença de uORFs e composição de aminoácidos, e assim por diante mostraram boas correlações com os rácios mRNA/proteína obtidos. A regulação de tradução funciona como uma importante mudança quando são necessárias mudanças rápidas na expressão gênica em resposta a estímulos internos e externos (PDGF2, VEGF, TGFβ são exemplos de genes controlados dessa forma). A regulação de tradução também desempenha um papel significativo durante o desenvolvimento e diferenciação celular, alterando os níveis de expressão de subconjuntos específicos de mRNA durante uma determinada janela de tempo, enquanto a maioria das transcrições permanece inalterada (revista em ).
Neste artigo, focaremos a importância da regulação mediada por UTR 5′ e os diferentes elementos funcionais presentes nesta região, com exceção do IRES, que é discutido em um artigo diferente deste número. Os principais elementos regulatórios no 5′ UTR são estruturas secundárias (incluindo IRES), sítios de ligação para proteínas de ligação RNA, uAUGs e uORFs (Figura 1).
Elementos reguladores presentes em 5′ UTR.
2. 5′ UTR
O comprimento médio de 5′ UTRs é de ~100 a ~220 nucleotídeos entre espécies . Em vertebrados, 5′ UTRs tendem a ser mais longos em transcrições que codificam fatores de transcrição, protooncogenes, fatores de crescimento e seus receptores, e proteínas que são mal traduzidos em condições normais . O alto conteúdo de GC também é uma característica conservada, com valores que ultrapassam 60% no caso de vertebrados de sangue quente. No contexto das estruturas do grampo capilar, o conteúdo de GC pode afetar a eficiência da tradução de proteínas independentemente da estabilidade térmica e da posição do grampo capilar. UTRs de mRNAs eucariotas também apresentam uma variedade de repetições que incluem elementos curtos e longos intercalados (SINEs e LINEs, resp.), repetições de sequência simples (SSRs), mini satélites e macrossatélites .
Início de tradução em eucariotas requer o recrutamento de subunidades ribossômicas na estrutura da tampa 5′ m7G. O códão de iniciação está geralmente localizado bem abaixo, requerendo movimento de ribossomal para este site. Este movimento parece não ser linear para alguns mRNAs (i.e., as subunidades ribossomais parecem contornar (shunt) segmentos da UTR do 5′ à medida que se movem na direcção da AUG). A derivação pode permitir que os mRNAs contendo uAUGs ou estruturas de grampo de cabelo sejam traduzidos eficientemente. Exemplos importantes são fornecidos pelo vírus do mosaico da couve-flor e mRNAs do adenovírus. O mecanismo de shunting ribosomal é bastante complexo requerendo o par de bases mRNA-rRNA .
Genes apresentando diferenças no 5′ UTR de suas transcrições são relativamente comuns. 10-18% dos genes expressam alternativas no 5′ UTR usando múltiplos promotores, enquanto a emenda alternativa dentro dos UTRs é estimada para afetar 13% dos genes no transcriptoma de mamíferos . Estas variações no 5′ UTR podem funcionar como importantes interruptores para regular a expressão gênica. Dois exemplos importantes são fornecidos pelos genes relacionados com o cancro BRCA1 (cancro da mama 1) e TGF-β (transforming growth factor β). O BRCA1 é um supressor de tumores, frequentemente mutado no câncer de mama com funções no ciclo celular, apoptose e reparação de danos no DNA. O BRAC1 produz duas transcrições diferentes que derivam de dois promotores diferentes e, portanto, apresentam diferenças em seu 5′ UTR. Uma transcrição mais curta é expressa em tecido mamário canceroso e não canceroso e traduzida eficientemente, enquanto uma transcrição mais longa é predominantemente expressa em cânceres de mama. A presença de vários uAUGs e uma estrutura mais complexa afectam dramaticamente a tradução desta transcrição mais longa. Isto causa uma diminuição geral dos níveis de BRAC1 nas células tumorais, levando a um alívio na inibição do crescimento. TGF-β está implicada em um grande número de processos que incluem proliferação celular, migração, reparação de feridas, desenvolvimento, tumorigenese e imunossupressão. Existem três isoformas conhecidas: β1, β2, e β3. A TGF-β3 produz duas transcrições alternativas: uma transcrição de 3,5 kb com um UTR muito longo 5′ (1,1 kb) e uma transcrição de 2,6 kb com um UTR mais curto 5′ (0,23 kb). A presença de 11 uORFs na transcrição mais longa inibe dramaticamente sua tradução enquanto a transcrição mais curta é traduzida eficientemente .
3. Regulação por Estrutura Secundária
Estruturas secundárias podem funcionar como principais ferramentas reguladoras em 5′ UTRs. Uma correlação com a função gênica foi sugerida; estruturas secundárias foram determinadas como sendo particularmente prevalentes entre os mRNAs que codificam fatores de transcrição, protooncogenes, fatores de crescimento, e seus receptores e proteínas mal traduzidos em condições normais. >90% das transcrições nestas classes têm 5′ UTRs contendo estruturas secundárias estáveis com energias livres médias inferiores a -50 kcal/mol. 60% destas estruturas secundárias estáveis estão posicionadas muito próximas da estrutura da tampa. Estas estruturas são muito eficazes na inibição da tradução. Na verdade, um grampo situado perto da tampa com uma energia livre de -30 kcal/mol seria suficiente para bloquear o acesso do complexo de pré-iniciação ao mRNA. Quando localizado mais longe no UTR 5′, os grampos de cabelo requerem uma energia livre mais forte que -50 kcal/mol para poder bloquear a tradução . Uma estrutura secundária estável pode resistir à atividade de desenrolamento do helicóptero elF4A. Este efeito pode ser parcialmente superado pela superexpressão de elF4A em parceria com elF4B . mRNAs com uma estrutura altamente estruturada 5′ UTR como proto-oncogenes e outros fatores de crescimento usam iniciação de tradução dependente de cap. Não surpreendentemente, a superexpressão dos componentes da maquinaria de iniciação de tradução incluindo elf4E tem sido ligada à tumorigenese (revista em ).
O gene TGF-β1 fornece um bom exemplo de inibição de tradução mediada por uma estrutura secundária . Um motivo evolutivo conservado no 5′ UTR forma um laço de caule estável. No entanto, esta estrutura por si só não é suficiente para bloquear a tradução. A repressão da tradução da TGF-β1 depende do aumento da ligação da proteína YB-1 de ligação do RNA à transcrição da TGF-β1 . Foi então proposto que a YB-1 liga a UTR de TGF-β1 da 5′ com alta afinidade graças ao seu conteúdo de GC e coopera com o laço do caule para inibir a tradução de TGF-β1 facilitando a formação de duplex .
4. Regulação pelas Proteínas de Ligação do RNA
Prevê-se que o genoma humano codifique cerca de 1.000 proteínas de ligação do RNA (RBPs) com uma grande percentagem delas implicadas na tradução. Elas poderiam ser categorizadas em dois grupos principais: RBPs que fazem parte do mecanismo básico de tradução e são necessárias para a tradução de todos os mRNAs expressos (exemplos: PABPI, elf4E) e RBPs que funcionam de forma mais seletiva, controlando positiva ou negativamente os níveis de tradução de mRNAs alvo específicos (exemplos: HuR, Musashi1). Em relação a este último grupo, observou-se que as RBPs podem utilizar mecanismos distintos para aumentar ou inibir a tradução. Embora várias exceções sejam conhecidas, pode-se dizer que os RBPs muitas vezes reconhecem motivos específicos em UTRs e interagem com a maquinaria de tradução para controlar a expressão. A interferência com a tradução normalmente ocorre durante a etapa de iniciação (revisada em ).
O exemplo mais bem caracterizado de regulação mediada por RBP envolvendo 5′ UTRs é fornecido pelas proteínas reguladoras do ferro (IRP 1 e 2). Estas proteínas reconhecem uma estrutura de laço de haste altamente conservada com cerca de 30 nucleotídeos, conhecida como o elemento de resposta do ferro (IRE). As características mais importantes incluem um laço hexanucleotídeo com a seqüência CAGYCX (Y = U ou A; X = U, C ou A) e uma haste superior de 5 bp que é separada de uma haste inferior de comprimento variável por uma citosina não emparelhada. Esta regulação é crucial na manutenção da homeostase do ferro celular, pois um grande número de mRNAs ligados ao armazenamento e metabolismo do ferro, incluindo ferritina, aconitase mitocondrial, proteína succinato de ferro desidrogenase, eritróide 5-aminolevulinato sintetase (eALAS), e uma molécula de ferro exportado chamada ferroportina (FPN1) têm sua expressão modulada por este sistema. Quando os níveis celulares de ferro são baixos, IRP1 e IRP2 ligam a IRE e bloqueiam a tradução da ORF a jusante. Quando os níveis de ferro intracelular são altos, a atividade de ligação do RNA de ambos os PIA é reduzida (Figura 2(a)). As EIRs tendem a ser posicionadas próximas à tampa, o que causa uma inibição estéril da ligação das subunidades ribossômicas 40S à transcrição. Quando localizado longe da tampa, ao invés de afetar o recrutamento do 40S, o complexo IRE-IRP bloqueia a varredura do ribossomo (revisado em ). Um desvio interessante do mecanismo IRE/IRP pode ser observado em células precursoras duodenais e eritróides com fome de ferro. Um promotor upstream é usado para gerar FPN1 pré-mRNAs contendo mais um exon que é conectado por emendas alternativas a um aceitador de emendas no 3′ da IRE. É gerada uma transcrição da FPN1 madura contendo o mesmo quadro de leitura aberta; no entanto, o 5′ UTR não contém o IRE . Portanto, estas células expressam a isoforma alternativa FPN1 de uma forma independente do ferro . As mutações que afectam as IRE podem levar a doenças. Este é o caso da síndrome hereditária hiperferritinemia-catarato (HHCS), uma desordem genética autossômica dominante na qual a agregação e cristalização da ferritina no cristalino leva a cataratas bilaterais .
(a)
(b)
(a)
(b)
RBP-mediated regulation can be very elaborate and involve multiple steps. Um bom exemplo mostrando o crosstalk entre fatores e processos regulatórios distintos é o gene específico masculino-leal 2 (msl-2) em Drosophila, um jogador principal na compensação da dosagem. O RNA específico do sexo feminino, ligado à proteína sex letal (SXL), participa de múltiplos aspectos da regulação do msl-2, onde a expressão do msl-2 deve ser evitada (Figura 2(b)). A regulação começa no nível de emenda; SXL liga-se a dois alongamentos de poliU localizados em um intron que faz parte do 5′ UTR. Este processo causa retenção de intron e preserva sequências críticas que mais tarde serão utilizadas na regulação da tradução . No citoplasma, a mesma proteína SXL funcionará como um repressor de tradução de msl-2 em dois mecanismos distintos que terão lugar no 3′ e 5′ UTR . A SXL liga sequências ricas em U no 3′ UTR e recruta a proteína corepressora UNR (a montante de N-ras) e PABP bloqueando o recrutamento do complexo de pré-iniciação para o fim do mRNA 5′ . Para assegurar que o msl-2 seja totalmente reprimido, um segundo passo regulamentar também mediado pela SXL tem lugar no 5′ UTR. Esta repressão envolve um novo mecanismo regulatório onde o crosstalk entre a SXL e uma uORF tem lugar para reprimir a tradução de forma eficiente. O 5′ UTR do msl-2 contém 3 uORFs mas apenas o 3º está envolvido na repressão. Curiosamente, esta repressão é muito fraca na ausência do SXL (~2 vezes), mas quando presente, o SXL liga um poli U estica alguns nucleotídeos longe do uAUG e aumenta esta repressão para mais de 14 vezes. O SXL age impulsionando a iniciação da tradução no uAUG e não agindo como uma simples prisão estéril de ribossomos de varredura. Este efeito pode ocorrer através de uma interação entre SXL e fatores de iniciação de tradução; possivelmente membros do componente elF3 como indicado por uma triagem bi-híbrida. Este mecanismo afeta potencialmente um grande número de mRNAs; 268 transcrições em Drosophila foram determinadas para conter motivos de ligação SXL associados a uAUG espaçados a uma distância apropriada. Por exemplo, uma construção repórter contendo o 5′UTR do gene Irr47 foi reprimida ~4 vezes pela proteína SXL .
RBPs podem ter funções antagônicas ao regular a tradução. Um exemplo interessante é a regulação do p21 no contexto da senescência replicativa, um estado celular onde as células entram em uma parada irreversível de crescimento. A indução do p21 é necessária para iniciar o processo, e para inibir os complexos cdk2-cyclin E. O 5′ UTR do p21 contém uma sequência rica em GC que forma um ciclo estaminal. Este elemento é reconhecido por dois RBPs com propriedades distintas: CUGBP1 e calreticulina (CRT). A competição entre as duas proteínas determina os níveis finais de expressão da p21 e estabelece se as células irão proliferar ou sofrer uma parada de crescimento e senescência. A ligação de CUGBP1 a p21 mRNA é dramaticamente aumentada na senescência em comparação com células jovens de fibroblastos. Os níveis de proteína não mudam durante o processo e este aumento de atividade é devido à fosforilação. Por outro lado, os IPs de CRT mostraram uma redução de quatro a cinco vezes a atividade nas células de senescência devido a uma diminuição na expressão. Ambas as proteínas mostraram afetar a translação da p21. Entretanto, enquanto a CUGBP1 funciona como ativador, a CRT atua como repressora. Como as duas proteínas têm atividade oposta em células senescentes, foram examinadas para ver se elas competem pela interação com o mRNA p21 e para controlar sua tradução. Quantidades crescentes de uma proteína foram capazes de reverter a ligação da outra proteína ao p21 mRNA e seu efeito na translação; a afinidade com o local de ligação é bastante diferente, pois a CUGBP1 teve que estar presente nas reações de ligação a um excesso de quatro a oito molares à CRT para antagonizar sua ligação ao p21 mRNA e impactar sua translação .
5. Regulação por uORFs e Upstream AUGs
uORFs e uAUGs são os principais elementos reguladores em 5′ UTRs. Como seus nomes sugerem, os uORFs são seqüências definidas por um código-começo e um código-parada a montante da região codificadora principal, enquanto os uAUGs são código-parada de início sem um código-parada a jusante localizado a montante da região codificadora principal. Uma grande percentagem do transcriptoma humano contém uORF e/ou uAUGs, com valores que variam entre 44 e 49% . Números semelhantes são encontrados na transcriptoma do rato. Embora estes números possam parecer elevados, tanto uORFs como uAUGs são menos frequentes do que o esperado por acaso, sugerindo que estão sob pressão selectiva. uORFs e uAUGs estão sobre-representados em subgrupos particulares como factores de transcrição, factores de crescimento, e os seus receptores e proto-oncogenes . Tanto os uORFs como os uAUGs são extremamente diversos variando de posição em relação ao limite e ao AUG principal, número por transcrição e comprimento (no caso dos uORFs) . A Tabela Complementar 1 (em Material Suplementar disponível online em http://dx.doi.org/10.1155/2012/475731) fornece uma lista abrangente de uORFs e uAUGs presentes na transcrição humana. uORFs e uAUGs não têm sido analisados extensivamente em termos de conservação. Um estudo piloto feito com um subconjunto de transcrições humanas, de ratos e de ratos indicou que ambos os elementos são moderadamente conservados, pois 38% dos uORFs e 24% dos uAUGs foram determinados para serem conservados entre três espécies. A modesta conservação dos uORFs combinada com o fato de que seu comprimento médio (20 nucleotídeos) é esperado por acaso e os uAUGs fornecem uma supressão mais forte em comparação com os uORFs sugere que muitos uAUGs foram neutralizados no processo de evolução pela aquisição de um códão de parada a jusante. Foi então proposto que apenas alguns uORFs, muito provavelmente os conservados, foram recrutados para regulação da expressão. Em leveduras, foi demonstrado que os uORFs estão estatisticamente sub-representados em 5′ UTRs e foram removidos por pressão seletiva, indicando de forma semelhante que os uORFs restantes podem estar implicados na regulação de tradução .
Embora tenha sido sugerido que os uORFs estão negativamente correlacionados com a produção de proteína até agora, a atividade funcional tem sido demonstrada apenas para um número limitado de uORFs e uAUGs. Na Figura 3, mostramos exemplos do impacto que os uAUGs podem ter na eficiência da tradução. Entre as características mais relevantes que podem contribuir para a funcionalidade estão a longa distância do 5′, a conservação da sequência, o contexto em que o AUG está localizado, a força do site de iniciação para o ORF, o comprimento do uORF, e o número de AUGs no 5′ UTR . Diferentes resultados têm sido observados quando um ribossomo encontra um uAUG ou uORF . Como o número de eventos caracterizados ainda é pequeno, é difícil definir mecanismos gerais; descrevemos então alguns eventos bem caracterizados e relevantes. O scan com fugas é definido quando uma proporção dos complexos de scan contorna o uAUG ou uORF e continua o scan para o próximo AUG. Neste caso, o AUG a montante actua como um “engodo” do AUG ORF, funcionando como um regulador negativo de tradução pelo menos para alguma fracção dos ribossomas. A produção de peptídeos cis-acting pelos uORFs pode reduzir o início da tradução do ORF a jusante ao empatar o ribossoma no final do uORF . Um exemplo clássico é fornecido pelo peptídeo atenuador de arginina eucariótica (AAP) conservado evolutivamente, que controla negativamente a tradução das proteínas envolvidas na biossíntese de novo fungo arginina em alta concentração de arginina . Neste cenário, a arginina altera a conformação da AAP e/ou o ambiente do local P causando a paralisação do códon terminal do AAP uORF . A AAP também reduz o alongamento da translação pelo emperramento do ribossomo quando o uORF é inserido dentro de uma sequência de codificação . Outro exemplo clássico de regulação uORF-mediated vem da levedura. Quatro uORFs estão presentes no 5′ UTR do fator de transcrição GCN4. O primeiro dos quatro uORFs é sempre traduzido de forma eficiente, independentemente das condições nutricionais. Em células não perturbadas, a rápida recarga de ribossomos e cofactores de iniciação permitem a tradução dos uORFs 2-4 enquanto inibem a tradução dos ORFs principais. Em situações de fome de aminoácidos, os fatores de iniciação são escassos, resultando em uma recarga desacelerada dos ribossomos e um escaneamento através das seqüências contendo os uORFs. Um complexo de iniciação funcional é remontado apenas na sequência de codificação principal e o GCN4 é expresso. Este mecanismo permite uma resposta rápida ao stress nutricional. Outro exemplo similar de expressão regulada via uORF é o gene Carnitine Palmitoyltransferase 1C (CPT1C). A CPT1C regula o metabolismo no cérebro em situações de excesso de energia. A presença da uORF no 5′ UTR reprime a expressão da ORF. No entanto, esta repressão é aliviada em resposta a estímulos de stress específicos como a depravação da glicose e o tratamento palmitato-BSA. Tem sido sugerido que as uORFs também podem induzir a degradação do mRNA. Uma série do 5′ UTR constrói contendo como repórter o gene do gato da transposição bacteriana Tn9 foi testada em levedura. Uma única substituição de nucleotídeos foi usada para criar um ORF de 7-codon a montante do gene do gato. O uORF foi traduzido eficientemente e causou a inibição da tradução do ORF do gato e a desestabilização do mRNA do gato. Uma conexão entre uORFs e mRNA decaimento também foi sugerida com base em uma comparação entre níveis médios de expressão de transcrições contendo uORF e não contendo uORF .
(a)
(b)
(a)
(b)
Mutações evasivas que eliminam ou criam uORFs que acabam alterando os níveis de proteína foram ligadas a doenças humanas. A sua relevância foi discutida recentemente . A predisposição ao melanoma pode ser causada por uma mutação que introduz uma uORF no 5′ UTR da proteína inibidora do gene dependente da ciclina-quinase (CDKN2A) . A trombocitemia hereditária é causada por uma mutação que cria uma variante de emenda que elimina uma uORF, levando a um aumento na produção de proteína do gene trombopoietina . A hipotricose hereditária Marie Unna deriva de uma mutação que perturba uma uORF presente no 5′ UTR do gene homólogo sem pêlos e consequentemente aumenta a sua expressão . Uma transição de G para A em uma das uORFs presentes no 5′ UTR da transcrição do TGF-β3 foi determinada para ser associada à cardiomiopatia/displasia arritmogênica do ventrículo direito (ARVC) . Outro grupo de cinco UORFs associadas a doenças foi testado recentemente usando ensaios de repórter; elas incluem disgenesia gonadal (SRY) , síndrome de Van der Woude (IRF6) , complexo renal tipo 1 (PRKAR1A) , pancreatite hereditária (SPINK1) , e talassemia-β (HBB) . Esta lista certamente se expandirá à medida que mais de 500 polimorfismos de um nucleotídeo (SNPs) criando ou eliminando uORFs foram relatados.
6. Procurando por Novos Elementos Regulatórios no 5′ UTR
Apenas uma pequena fração dos elementos regulatórios pós-transcripcionais localizados no humano 5′ UTRs foram caracterizados. Os elementos UTR identificados são catalogados em um recurso web mantido pelo grupo de Graziano Pesole chamado UTRdb (http://utrdb.ba.itb.cnr.it/) . Os métodos in vivo para a identificação de elementos reguladores pós-transcritores em UTRs, especialmente aqueles associados a RBPs, têm avançado drasticamente nos últimos cinco anos graças à tecnologia de sequenciamento profundo. CLIP e RIP-Seq são métodos baseados no isolamento de moléculas de proteína RNA (RNPs) via imunoprecipitação, seguido de digestão de RNase e identificação precisa dos locais de ligação de RBP com seqüenciamento profundo . Embora o número de RBPs analisadas até agora por estes métodos seja realmente pequeno (revisto em ), como a tecnologia de seqüenciamento profundo se torna mais acessível e os métodos simplificados, pode-se esperar que muito em breve uma grande porção dos sítios de ligação de RBPs humanos em UTRs será mapeada.
Outra escolha para mapear elementos UTR regulando a tradução é usar métodos puramente computacionais baseados na análise das seqüências UTR. Estes métodos são baseados na identificação de padrões degenerados de ribonucleotídeos que possuem as propriedades esperadas dos sites de ligação RBP. Métodos similares têm sido aplicados há quase 30 anos para identificar regulações transcripcionais em seqüências promotoras. Estes métodos estão a atingir a maturidade, são muito utilizados e têm ajudado muito na compilação de bases de dados sobre regulação transcripcional (por exemplo, TRANSFAC). Embora muito do trabalho dirigido ao desenho e refinamento de algoritmos de análise de seqüências regulatórias no contexto da regulação transcripcional possa ser adaptado a problemas de análise correspondentes no contexto de elementos regulatórios pós-transcritores, existem complicações adicionais associadas aos sites vinculados à RBP. A mais óbvia entre elas é que os RBPs terão preferências estruturais secundárias, e poucas ferramentas de análise existentes podem incorporar informações sobre o RNA dobrável. Da mesma forma, devido aos elementos reguladores dobráveis de RNA podem funcionar mais facilmente de forma sinérgica ou mostrar encadernação concertada a elementos de seqüência que são distais na seqüência primária, mas muito próximos na molécula dobrada. Outra dificuldade é a falta de exemplos de elementos reguladores translacionais para treinar a análise. Com base em um punhado de exemplos bem estudados, existe frequentemente uma percepção de que os locais de ligação de PBR são, em média, mais curtos do que os locais de ligação dos fatores de transcrição (TFs), mas esta percepção pode ser devida a um enviesamento no conjunto de PBRs que recebem o maior foco de pesquisa. Um dos métodos mais poderosos para identificar elementos reguladores é a pegada filogenética, que aproveita a conservação evolutiva local elevada para revelar elementos funcionais . Esta lógica funciona igualmente bem para os elementos reguladores pós-transcritores. Infelizmente os sítios de ligação TF são também uma grande confusão para a aplicação directa de análise de sequência computacional para a identificação de elementos UTR 5′ envolvidos na tradução. Os elementos envolvidos na regulação transcripcional residem tanto a montante como a jusante dos sítios de início de transcrição, e quando 5′ UTRs são suficientemente curtos os elementos reguladores pós-tradução são provavelmente intercalados com sítios de ligação TF.
Ultimamente os melhores métodos para identificar elementos reguladores pós-tradução emergirão da aplicação complementar de técnicas experimentais e computacionais.
Conhecimento
Pesquisa no laboratório da Penalva é apoiada pela Fundação Voelcker, Fundação Tumor Cerebral Infantil, e 5R21HG004664-02 e 1R01HG006015-01A1.
Materiais Suplementares
Resumimos as estatísticas básicas para uORFs no transcriptoma humano (NCBI build37.3). A Tabela 1.a mostra o número de aparências de sequências do tipo uORF que contém AUG em 5′ UTRs em termos de mRNAs e genes. Também separamos duas sequências distintas do tipo uORF com códon de terminação correspondente em 5′ UTRs ou sem códon de terminação correspondente em 5′ UTRs. A informação detalhada para estes dois casos está listada na Tabela 1.b. Finalmente, a Tabela 1.c mostra quantas sequências do tipo uORF aparecem em um indivíduo 5′ UTR de cada mRNA.
- Tabela Suplementar
Deixe uma resposta