Metodologias e ferramentas para anotação de narrativas clínicas / Methodologies and tools for clinical narratives annotation
J. health inform
;
8(supl.I): 1031-1040, 2016. ilus
Artículo
en Portugués
| LILACS
| ID: biblio-906773
RESUMO
A utilização de técnicas de Processamento de Linguagem Natural (PLN) em textos clínicos é amplamente dependente de grandes quantidades de dados textuais anotados, denominados corpus ou padrão ouro. Sendo essenciais para a modelagem da linguagem durante a fase de treinamento de diversos algoritmos de PLN. Porém, para a criação de um padrão ouro é necessário um extenso e custoso trabalho manual de anotação, que demanda um grande esforço de especialistas. OBJETIVO:
Realizar uma revisão da literatura, visando o estudo de metodologias e ferramentas utilizadas em procedimentos de anotação de textos.MÉTODO:
Levantamento em bases científicas referentes à elaboração de corpus morfológicos, sintáticos e morfossintáticos foi realizado, analisando 32 estudos de anotação e mais 12 ferramentas.RESULTADOS:
Foram levantados os principais aspectos nos processos de anotação, bem como realizada uma avaliação dentre critérios pré-definidos de cada das ferramentas de suporte encontradas.ABSTRACT
The use of natural language processing techniques (NLP) in clinical texts is dependent on large amounts of annotated text data, called corpus or gold standard. Are essential for the modelling language during the training phase of NLP algorithms. However, for the creation of a gold standard is required extensive and costly manual annotation task, that demands a great deal of experts. OBJECTIVES:
To review the literature to identify methodologies and tools applied to text annotation.METHODS:
Scientifics databases search regarding the development of morphological, syntactic and morphosyntactic corpus was performed by analyzing 32 annotation studies and 12 tools.RESULTS:
Main aspects of the annotation process description, as well as an assessment from pre-defined criteria for each one of the annotation tools identified.
Texto completo:
Disponible
Índice:
LILACS (Américas)
Asunto principal:
Procesamiento de Lenguaje Natural
/
Programas Informáticos
/
Almacenamiento y Recuperación de la Información
Tipo de estudio:
Guía de Práctica Clínica
/
Estudio pronóstico
Límite:
Humanos
Idioma:
Portugués
Revista:
J. health inform
Asunto de la revista:
Informática Médica
/
Servicios de Salud
/
TECNOLOGIA
Año:
2016
Tipo del documento:
Artículo
/
Congreso y conferencia
País de afiliación:
Brasil
Institución/País de afiliación:
Pontifícia Universidade Católica do Paraná/BR
Similares
MEDLINE
...
LILACS
LIS