Your browser doesn't support javascript.
loading
Evaluation of window cohabitation of DNA sequencing errors and lowest PHRED quality values
Prosdocimi, Francisco Prosdocimi; Peixoto, Fabiano Cruz; Ortega, José Miguel.
  • Prosdocimi, Francisco Prosdocimi; Universidade Federal de Minas Gerais. Instituto de Ciências Biológicas. Departamento de Biologia Geral. Laboratório de Biodiversidade e Evolução Molecular. Belo Horizonte. BR
  • Peixoto, Fabiano Cruz; Universidade Federal de Minas Gerais. Laboratório de Computação Científica. Belo Horizonte. BR
  • Ortega, José Miguel; Universidade Federal de Minas Gerais. Instituto de Ciências Biológicas. Departamento de Bioquímica e Imunologia. Laboratório de Biodados. Belo Horizonte. BR
Genet. mol. res. (Online) ; 3(4): 483-492, 2004. tab, graf
Artigo em Inglês | LILACS | ID: lil-410893
RESUMO
When analyzing sequencing reads, it is important to distinguish between putative correct and wrong bases. An open question is how a PHRED quality value is capable of identifying the miscalled bases and if there is a quality cutoff that allows mapping of most errors. Considering the fact that a low quality value does not necessarily indicate a miscalled position, we decided to investigate if window-based analyses of quality values might better predict errors. There are many reasons to look for a perfect window in DNA sequences, such as when using SAGE technique, looking for BLAST seeding and clustering sequences. Thus, we set out to find a quality cutoff value that would distinguish non-perfect windows from perfect ones. We produced and compared 846 reads of pUC18 with the published pUC consensus, by local alignment. We then generated a database containing all mismatches, insertions and gaps in order to map real perfect windows. An investigation was made to find the potential to predict perfect windows when all bases in the window show quality values over a given cutoff. We conclude that, in window-based applications, a PHRED quality value cutoff of 7 masks most of the errors without masking real correct windows. We suggest that the putative wrong bases be indicated in lower case, increasing the information on the sequence databases without increasing the size the files.
Assuntos
Texto completo: DisponíveL Índice: LILACS (Américas) Assunto principal: Controle de Qualidade / Algoritmos / Genoma Humano / Análise de Sequência de DNA / Bases de Dados Genéticas Tipo de estudo: Estudo prognóstico Limite: Humanos Idioma: Inglês Revista: Genet. mol. res. (Online) Assunto da revista: Biologia Molecular / Genética Ano de publicação: 2004 Tipo de documento: Artigo País de afiliação: Brasil Instituição/País de afiliação: Universidade Federal de Minas Gerais/BR

Similares

MEDLINE

...
LILACS

LIS

Texto completo: DisponíveL Índice: LILACS (Américas) Assunto principal: Controle de Qualidade / Algoritmos / Genoma Humano / Análise de Sequência de DNA / Bases de Dados Genéticas Tipo de estudo: Estudo prognóstico Limite: Humanos Idioma: Inglês Revista: Genet. mol. res. (Online) Assunto da revista: Biologia Molecular / Genética Ano de publicação: 2004 Tipo de documento: Artigo País de afiliação: Brasil Instituição/País de afiliação: Universidade Federal de Minas Gerais/BR