RÉSUMÉ
A maioria dos mRNAs de eucariotos adquire uma cauda de poliA não codificadora na extremidade 3' durante a maturação, em um processo chamado de poliadenilação (poliA). Mais da metade dos genes de mamíferos apresentam múltiplos sítios de poliA, que podem levar à formação de transcritos com tamanhos variáveis da 3 UTR. A poliA alternativa (APA) pode influenciar a localização, estabilidade e transporte dos transcritos, de maneira tecido-específica ou até mesmo doença-específica. Isto é resultante de muitos elementos em cis situados nas 3' UTRs estarem envolvidos na regulação pós-transcricional, tais como os sítios de ligação a miRNAs. Neste trabalho foi utilizado o sequenciamento de última geração para identificar e avaliar a expressão de variantes de poliA, e ainda correlacioná-las à expressão de miRNAs presentes nas mesmas amostras. Para tanto, um protocolo original de construção de bibliotecas de cDNAs enriquecidas para a extremidade 3 dos transcritos foi desenvolvido, permitindo o sequenciamento preferencial de 3' UTRs e a identificação de sítios de poliA em duas linhagens derivadas de tumor colorretal (HCT116 e SW480). Variantes de poliA com 3' UTR mais curtas do que o transcrito referência (RefSeq com maior 3' UTR) foram identificadas para mais de 4.000 genes, correspondendo a cerca de 30% dos genes expressos nestas células. Cerca de 60% das variantes curtas perderam pelo menos um sítio alvo de miRNA. Especificamente para estes genes foi observada uma diminuição da razão da expressão da variante longa pela expressão da variante curta (razão VL/VC) em relação aos genes que não possuíam sítios alvo. Além disso, foi encontrada uma diferença significativa da razão VL/VC entre os genes que possuíam sítios alvo para miRNAs não expressos e genes que possuíam sítios alvo para miRNAs expressos. Essa redução foi ainda maior para os genes nos quais a variante curta perde sítios para miRNAs altamente expressos comparando-se com genes alvo de miRNAs de baixa...
Most eukaryotic mRNAs acquire an uncoded polyA tail at their 3' end during maturation in a process called polyadenylation (polyA). More than half of mammalian genes have multiple polyA sites, which can lead to the formation of variant transcripts with different 3' UTRs. Alternative polyA (APA) may influence location, stability and transport of transcripts, in tissue or diseasespecific manner. This results from many cis-acting elements located within the 3' UTRs being involved in post-transcriptional regulation, such as the miRNA binding sites. Here we used next generation sequencing to identify and evaluate the expression of polyA variants and also correlate them with miRNA expression in the same samples. To do so, an original cDNA library protocol to enrich for the transcripts 3' ends was developed, enabling the preferential sequencing of the 3' UTRs and identification of polyA sites in two colorectal cancer cell lines (HCT116 and SW480). PolyA variants with 3' UTR shorter than the reference transcript (RefSeq with the longest 3' UTR) were identified for more than 4000 genes, corresponding to 30% of expressed genes in these cells. About 60% of short polyA variants identified have lost at least one conserved miRNA target site. Specifically for these genes, there was a reduction on the ratio of long variants expression by short variants expression (LV/SV ratio) comparing to genes without miRNA target sites. Moreover, there was a significant difference of the LV/LS ratio between genes with target sites for non-expressed miRNAs and genes with target sites for expressed miRNAs. This reduction was even greater for those genes with short variants that lost target sites for highly expressed miRNAs when compared to genes with target sites for miRNAs with low expression. This innovative approach increased the capacity of identification and expression analysis of polyA variants and also confirmed the key role of miRNA expression over polyA variants expression...