Your browser doesn't support javascript.
loading
Análisis estadístico de los espectros de frecuencia de las regiones reguladoras del ENCODE / Statistical analysis of the Fourier Spectra of the ENCODE regulatory regions
Paredes, O.; Romo-Vázquez, R.; Vélez-Pérez, H.; Morales, J. A..
  • Paredes, O.; Universidad de Guadalajara. CUCEI. MX
  • Romo-Vázquez, R.; Universidad de Guadalajara. CUCEI. MX
  • Vélez-Pérez, H.; Universidad de Guadalajara. CUCEI. MX
  • Morales, J. A.; Universidad de Guadalajara. CUCEI. MX
Rev. mex. ing. bioméd ; 38(3): 637-645, sep.-dic. 2017. tab, graf
Article in Spanish | LILACS | ID: biblio-902377
RESUMEN
RESUMEN En la actualidad, nuevas bases de datos genómicos (secuencias de ADN) son puestas al alcance del dominio público para su análisis. La bioinformática ha desarrollado algoritmos para extraer información y características de dichas secuencias. Sin embargo, estos algoritmos bioinformáticos tienen limitaciones. Una alternativa es utilizar herramientas propias del procesamiento digital de señales (DSP) adaptadas a secuencias genómicas (procesamiento de señales genómicas - GSP). El presente trabajo versa sobre el análisis de los cuatro primeros momentos centrales (media, desviación estándar, asimetría y curtosis) y dos momentos estadísticos (mediana y varianza) de los espectros frecuenciales de las 15 Regiones Reguladoras (RRs) de la base de datos ENCODE con el objetivo de estudiar diferencias estadísticas y frecuencias características. La base de datos seleccionada es "mapeada". Luego, la FFT es calculada a estas señales genómicas y finalmente los momentos estadísticos son implementados. Los resultados mues tran la existencia de 3 grupos de RRs utilizando la media, mediana y curtosis. La desviación estándar y la varianza, parecen no resaltar información importante. Finalmente, la asimetría revela un comportamiento homogéneo ante la presencia de valores atípicos en algunas RRs. Estas observaciones permiten inferir que la periodicidad dentro de la secuencia está relacionada o podría determinar la función biológica que desempeña la misma secuencia.
ABSTRACT
ABSTRACT Nowadays, new genomic databases (DNA sequences) are available to the whole scientist community for its analysis. The bioinformatics has developed algorithms to extract information and features of the sequences. However, the bioinformatics algorithms have restrictions. An alternative is the use of digital signal processing (DSP) tools adapted to genomic sequences (genomic signal processing - GSP). This work analyzes the first four statistics moments (mean, standard deviation, skewness and kurtosis) and other two moments (median and variance) of the frequency spectra of 15 regulatory regions (RRs) in ENCODE database with the main objective of studying the statistics di fferences and frequency features. The selected database is mapped. Then, the FFT is calculated to these genomic signals and finally the statistic moments implemented. The results show a three-group behavior in the RRs with the mean, median and kurtosis. The deviations standard and the variance do not show important behavior. Finally, the skewness shows a homogeneous behavior with the lack of atypical values in some RRs. These observations support the idea of the presence of periodicities in a sequence that may be related or may determine the biological function that a sequence may perform.


Full text: Available Index: LILACS (Americas) Language: Spanish Journal: Rev. mex. ing. bioméd Journal subject: Biomedical Engineering Year: 2017 Type: Article Affiliation country: Mexico Institution/Affiliation country: Universidad de Guadalajara/MX

Similar

MEDLINE

...
LILACS

LIS


Full text: Available Index: LILACS (Americas) Language: Spanish Journal: Rev. mex. ing. bioméd Journal subject: Biomedical Engineering Year: 2017 Type: Article Affiliation country: Mexico Institution/Affiliation country: Universidad de Guadalajara/MX