Your browser doesn't support javascript.
loading
Recuperação de informações em campos de texto livres de prontuários eletrônicos do paciente baseada em semelhança semântica e ortográfica / Information retrieval from free text s of electronic patient records, based on semantic and orthographic portuguese similarity
Martha, Amilton Souza; Campos, Carlos José Reis de; Sigulem, Daniel.
  • Martha, Amilton Souza; Universidade Federal de São Paulo. Informática em Saúde. São Paulo. BR
  • Campos, Carlos José Reis de; Universidade Federal de São Paulo. Disciplina de Informática em Saúde. São Paulo. BR
  • Sigulem, Daniel; Universidade Federal de São Paulo. Disciplina de Informática em Saúde. São Paulo. BR
J. health inform ; 2(3): 63-71, jul.-set. 2010. tab, ilus
Article in Portuguese | LILACS | ID: lil-581013
RESUMO
A maior parte da informação médica em forma digital se encontra na forma de textos livres como nos sites de medicina e saúde, artigos científicos em banco de dados da literatura biomédica e em prontuários eletrônicos do paciente (PEP). Muitos problemas podem ocorrer em sistemas de recuperação de informações médicas como o uso de sinonímia, erros de digitação e variações semânticas na linguagem médica. Para analisar a quantidade de informações que são perdidas em sistemas de busca tradicionais, que fazem um busca do termo exato, foram selecionados 34 termos médicos de duas bases de dados de PEPs e pesquisados com um algoritmo tradicional de busca direta embutido em um PEP chamado Clinic ManagerÒ e um sistema desenvolvido batizado SIRIMED que embutiu algoritmos de semelhança semântica (incorporação de sinônimos) e semelhança ortográfica (edit distance+stemming).Os resultados mostram que a recuperação dos termos aumenta em cerca de 30% em relação à busca tradicional, com uma quantidade de falsos positivos baixa (menos de 1%), o que mostra que muitas informações são perdidas normalmente.
ABSTRACT
Most medical information in digital form occurs in internet health sites, biomedical literature databases and electronic patient record (EPR). Many problems can be found in medical information retrieval systems like problems of synonyms, mistakes on typing and semantic variations in medical language. To analyse the amount of lost infomation in traditional information retrieval systems which use exact string matching, 34 medical terms were selected from two databases of EPRs and they were analysed with traditional search found in EPR System called Clinic Manager and a new system called Sirimed developed by autor which was added algorithms to semantic approximate (synonymous) and approximate string matching (edit distance + stemming). The results show that information retrieval was improved in 30% in compare with the traditional search, with little amopunt of false positives (less 1%), that show a lot of lost informations.
Subject(s)

Full text: Available Index: LILACS (Americas) Main subject: Semantics / Information Storage and Retrieval / Medical Records Systems, Computerized / Abstracting and Indexing / Information Services Language: Portuguese Journal: J. health inform Journal subject: Medical Informatics / Health Services / TECNOLOGIA Year: 2010 Type: Article Affiliation country: Brazil Institution/Affiliation country: Universidade Federal de São Paulo/BR

Similar

MEDLINE

...
LILACS

LIS

Full text: Available Index: LILACS (Americas) Main subject: Semantics / Information Storage and Retrieval / Medical Records Systems, Computerized / Abstracting and Indexing / Information Services Language: Portuguese Journal: J. health inform Journal subject: Medical Informatics / Health Services / TECNOLOGIA Year: 2010 Type: Article Affiliation country: Brazil Institution/Affiliation country: Universidade Federal de São Paulo/BR