An interpretable machine learning model for covid-19 screening
Journal of Human Growth and Development (Impresso)
;
32(2): 268-274, 23/06/2022.
Article
Dans Anglais, Portugais
|
LILACS-Express
| LILACS
| ID: biblio-1437052
ABSTRACT
Introduction:
the Coronavirus Disease 2019 (COVID-19) is a viral disease which has been declared a pandemic by the WHO. Diagnostic tests are expensive and are not always available. Researches using machine learning (ML) approach for diagnosing SARS-CoV-2 infection have been proposed in the literature to reduce cost and allow better control of the pandemic.Objective:
we aim to develop a machine learning model to predict if a patient has COVID-19 with epidemiological data and clinical features.Methods:
we used six ML algorithms for COVID-19 screening through diagnostic prediction and did an interpretative analysis using SHAP models and feature importances.Results:
our best model was XGBoost (XGB) which obtained an area under the ROC curve of 0.752, a sensitivity of 90%, a specificity of 40%, a positive predictive value (PPV) of 42.16%, and a negative predictive value (NPV) of 91.0%. The best predictors were fever, cough, history of international travel less than 14 days ago, male gender, and nasal congestion, respectively.Conclusion:
we conclude that ML is an important tool for screening with high sensitivity, compared to rapid tests, and can be used to empower clinical precision in COVID-19, a disease in which symptoms are very unspecific.RESUMO
Introdução:
a Doença do Coronavírus 2019 (COVID-19) é uma doença viral que foi declarada uma pandemia pela OMS. Testes diagnósticos são caros e nem sempre estão disponíveis. Pesquisas utilizando a abordagem de aprendizado de máquina (ML) para o diagnóstico de infecção por SARS-CoV-2 têm sido propostas na literatura para reduzir custos e permitir melhor controle da pandemia.Objetivo:
nosso objetivo é desenvolver um modelo de aprendizado de máquina para prever se um paciente tem COVID-19 com dados epidemiológicos e características clínicas.Método:
usamos seis algoritmos de ML para triagem de COVID-19 por meio de predição diagnóstica e fizemos uma análise interpretativa usando modelos SHAP e importâncias de recursos.Resultados:
nosso melhor modelo foi o XGBoost (XGB) que obteve área sob a curva ROC de 0,752, sensibilidade de 90%, especificidade de 40%, valor preditivo positivo (VPP) de 42,16% e valor preditivo negativo ( VPL) de 91,0%. Os melhores preditores foram febre, tosse, história de viagem internacional há menos de 14 dias, sexo masculino e congestão nasal, respectivamente.Conclusão:
Concluímos que o ML é uma importante ferramenta de triagem com alta sensibilidade, em comparação aos testes rápidos, e pode ser usado para potencializar a precisão clínica na COVID-19, doença em que os sintomas são muito inespecíficos.
C - Todos os direitos reservados
Texte intégral:
Disponible
Indice:
LILAS (Amériques)
Type d'étude:
Etude diagnostique
/
Étude pronostique
/
Étude de dépistage
langue:
Anglais
/
Portugais
Texte intégral:
Journal of Human Growth and Development (Impresso)
Année:
2022
Type:
Article
Pays d'affiliation:
Brésil
Institution/Pays d'affiliation:
Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória EMESCAM/BR
/
Prefeitura Municipal de Vitória/BR
/
Universidade Federal de São Paulo UNIFESP/BR
/
Universidade Federal do Espírito Santo UFES/BR
/
Universidade Federal do Espírito Santo UFES,/BR
Documents relatifs à ce sujet
MEDLINE
...
LILACS
LIS