Genômica comparativa em ambiente computacional distribuído: aplicabilidade e potencial no estudo de homologia entre protozoários / Comparative genomics in a distributed computing scenario: applicability and potential on protozoa homology study
Rio de Janeiro; s.n; 2015. xvii,198 p. ilus, tab, graf.
Thesis
in English, Portuguese
| LILACS
| ID: lil-774264
Responsible library:
BR15.1
RESUMO
A inferência de homologia entre organismos é uma atividade da genômicacomparativa que possibilita compreender melhor a relação entre os mesmos e, porconseguinte, sua distância evolutiva. Especificamente, a identificação de genesortólogos, ou seja, aqueles que têm sua origem em um ancestral comum, permiteoferecer melhorias na anotação funcional de genes, uma vez que genes ortólogostendem a ter sua função conservada.Com a crescente disponibilidade de genomas através de técnicas de NGS, aconstrução e atualização de bases de dados de ortólogos representam um desafioconstante, pois demandam o estudo e identificação das relações entre os genes detais organismos, em um volume de dados cada vez mais extenso e a um custocomputacional cada vez mais elevado.Nesta tese propomos a solução para nuvem computacional elastic-OrthoSearch, umworkflow científico de genômica comparativa inspirado no OrthoSearch, responsávelpela inferência de homologia entre organismos com o uso de abordagem baseadaem melhores hits recíprocos e perfis de Markov.Também propomos uma metodologia para criação de bases de ortólogos construídaatravés do reuso do OrthoSearch. Esta metodologia mostrou-se capaz de alavancara oferta de grupos ortólogos e assim auxiliar, por exemplo, na identificação de alvosde protozoários...
ABSTRACT
Homology inference among organisms is a comparative genomics tasks which allowsfor a better understanding on how such organisms are related to each other and ontheir evolutionary distance. Specifically, the identification of orthologous genes those who share a common ancestor allows for functional gene annotationimprovements, as orthologous genes tend to preserve their functions.The increasing amount of genomic data provided by the NGS techniques makes theorthologous databases building and update processes a challenging task. It requiresthe identification and study of the organisms genes relationships, in an extensivedata volume and at an increasing computational cost.In this thesis we propose elastic-OrthoSearch, a cloud-enabled comparativegenomics scientific workflow, derived from OrthoSearch. It aims at providinghomology inference among organisms, in a reciprocal best hits and Markov profilesapproach.We also propose an improved orthologous database creation methodology built ontop of OrthoSearch. Such methodology has shown means to offer a broaderorthologous groups dataset, which could in turn aid on Protozoa target identification...
Full text:
Available
Collection:
International databases
Database:
LILACS
Main subject:
Genes, Overlapping
/
Genome, Protozoan
/
Genomics
/
Workflow
/
Neglected Diseases
Limits:
Animals
Language:
English
/
Portuguese
Year:
2015
Document type:
Thesis