Pesquisa | Portal Regional da BVS (teste)

Learning Portuguese Clinical Word Embeddings: A Multi-Specialty and Multi-Institutional Corpus of Clinical Narratives Supporting a Downstream Biomedical Task.

E Oliveira, Lucas Emanuel Silva; Gumiel, Yohan Bonescki; Dos Santos, Arnon Bruno Ventrilho; Cintho, Lilian Mie Mukai; Carvalho, Deborah Ribeiro; Hasan, Sadid A; Moro, Claudia Maria Cabral.

Stud Health Technol Inform ; 264: 123-127, 2019 Aug 21.

Artigo em Inglês | MEDLINE | ID: mdl-31437898

RESUMO

In this paper, we trained a set of Portuguese clinical word embedding models of different granularities from multi-specialty and multi-institutional clinical narrative datasets. Then, we assessed their impact on a downstream biomedical NLP task of Urinary Tract Infection disease identification. Additionally, we intrinsically evaluated our main model using an adapted version of Bio-SimLex for the Portuguese language. Our empirical results showed that the larger, coarse-grained model achieved a slightly better outcome when compared with the small, fine-grained model in the proposed task. Moreover, we obtained satisfactory results with Bio-SimLex intrinsic evaluation.

Assuntos

Aprendizado de Máquina , Processamento de Linguagem Natural , Idioma , Narração , Portugal

RESUMO

Assuntos

ENVIAR RESULTADO:

SELEÇÃO DE REFERÊNCIAS

DETALHE DA PESQUISA