An interpretable machine learning model for covid-19 screening

Pinasco, Gustavo Carreiro; Farina, Eduardo Moreno Júdice de Mattos; Filho, Fabiano Novaes Barcellos; Fiorotti, Willer França; Ferreira, Matheus Coradini Mariano; Cruz, Sheila Cristina de Souza; Colodette, Andre Louzada; Loureiro, Luciene Rossati; Comério, Tatiane; Farias, Dilzilene Cunha Sivirino; Lima, Eliane de Fátima Almeida; Manhambusque, Katia Valéria; Abreu, Luiz Carlos

Pinasco, Gustavo Carreiro; Farina, Eduardo Moreno Júdice de Mattos; Filho, Fabiano Novaes Barcellos; Fiorotti, Willer França; Ferreira, Matheus Coradini Mariano; Cruz, Sheila Cristina de Souza; Colodette, Andre Louzada; Loureiro, Luciene Rossati; Comério, Tatiane; Farias, Dilzilene Cunha Sivirino; Lima, Eliane de Fátima Almeida; Manhambusque, Katia Valéria; Abreu, Luiz Carlos.

Pinasco, Gustavo Carreiro; Universidade Federal do Espírito Santo UFES. Vitória - ES. BR
Farina, Eduardo Moreno Júdice de Mattos; Universidade Federal de São Paulo UNIFESP. São Paulo - SP. BR
Filho, Fabiano Novaes Barcellos; Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória EMESCAM. Vitória - ES. BR
Fiorotti, Willer França; Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória EMESCAM. Vitória - ES. BR
Ferreira, Matheus Coradini Mariano; Prefeitura Municipal de Vitória. Vitória - ES. BR
Cruz, Sheila Cristina de Souza; Prefeitura Municipal de Vitória. Vitória - ES. BR
Colodette, Andre Louzada; Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória EMESCAM. Vitória - ES. BR
Loureiro, Luciene Rossati; Prefeitura Municipal de Vitória. Vitória - ES. BR
Comério, Tatiane; Prefeitura Municipal de Vitória. Vitória - ES. BR
Farias, Dilzilene Cunha Sivirino; Prefeitura Municipal de Vitória. Vitória - ES. BR
Lima, Eliane de Fátima Almeida; Universidade Federal do Espírito Santo UFES. Vitória - ES. BR
Manhambusque, Katia Valéria; Universidade Federal do Espírito Santo UFES,. Vitória - ES. BR

Journal of Human Growth and Development (Impresso) ; 32(2): 268-274, 23/06/2022.

Article Dans Anglais, Portugais | LILACS-Express | LILACS | ID: biblio-1437052

ABSTRACT
RESUMO

ABSTRACT

Introduction:

the Coronavirus Disease 2019 (COVID-19) is a viral disease which has been declared a pandemic by the WHO. Diagnostic tests are expensive and are not always available. Researches using machine learning (ML) approach for diagnosing SARS-CoV-2 infection have been proposed in the literature to reduce cost and allow better control of the pandemic.

Objective:

we aim to develop a machine learning model to predict if a patient has COVID-19 with epidemiological data and clinical features.

Methods:

we used six ML algorithms for COVID-19 screening through diagnostic prediction and did an interpretative analysis using SHAP models and feature importances.

Results:

our best model was XGBoost (XGB) which obtained an area under the ROC curve of 0.752, a sensitivity of 90%, a specificity of 40%, a positive predictive value (PPV) of 42.16%, and a negative predictive value (NPV) of 91.0%. The best predictors were fever, cough, history of international travel less than 14 days ago, male gender, and nasal congestion, respectively.

Conclusion:

we conclude that ML is an important tool for screening with high sensitivity, compared to rapid tests, and can be used to empower clinical precision in COVID-19, a disease in which symptoms are very unspecific.

RESUMO

Introdução:

a Doença do Coronavírus 2019 (COVID-19) é uma doença viral que foi declarada uma pandemia pela OMS. Testes diagnósticos são caros e nem sempre estão disponíveis. Pesquisas utilizando a abordagem de aprendizado de máquina (ML) para o diagnóstico de infecção por SARS-CoV-2 têm sido propostas na literatura para reduzir custos e permitir melhor controle da pandemia.

Objetivo:

nosso objetivo é desenvolver um modelo de aprendizado de máquina para prever se um paciente tem COVID-19 com dados epidemiológicos e características clínicas.

Método:

usamos seis algoritmos de ML para triagem de COVID-19 por meio de predição diagnóstica e fizemos uma análise interpretativa usando modelos SHAP e importâncias de recursos.

Resultados:

nosso melhor modelo foi o XGBoost (XGB) que obteve área sob a curva ROC de 0,752, sensibilidade de 90%, especificidade de 40%, valor preditivo positivo (VPP) de 42,16% e valor preditivo negativo ( VPL) de 91,0%. Os melhores preditores foram febre, tosse, história de viagem internacional há menos de 14 dias, sexo masculino e congestão nasal, respectivamente.

Conclusão:

Concluímos que o ML é uma importante ferramenta de triagem com alta sensibilidade, em comparação aos testes rápidos, e pode ser usado para potencializar a precisão clínica na COVID-19, doença em que os sintomas são muito inespecíficos.

COVID-19, aprendizado de máquina, inteligência artificial, pandemia; COVID-19, machine learning, artificial intelligence, pandemia

Texte intégral

Imprimer

XML

Recherche sur Google

Texte intégral: Disponible Indice: LILAS (Amériques) Type d'étude: Etude diagnostique / Étude pronostique / Étude de dépistage langue: Anglais / Portugais Texte intégral: Journal of Human Growth and Development (Impresso) Année: 2022 Type: Article Pays d'affiliation: Brésil Institution/Pays d'affiliation: Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória EMESCAM/BR / Prefeitura Municipal de Vitória/BR / Universidade Federal de São Paulo UNIFESP/BR / Universidade Federal do Espírito Santo UFES/BR / Universidade Federal do Espírito Santo UFES,/BR

Documents relatifs à ce sujet

MEDLINE

LILACS

LIS

Texte intégral

Imprimer

XML

Recherche sur Google