Your browser doesn't support javascript.
loading
An interpretable machine learning model for covid-19 screening
Pinasco, Gustavo Carreiro; Farina, Eduardo Moreno Júdice de Mattos; Filho, Fabiano Novaes Barcellos; Fiorotti, Willer França; Ferreira, Matheus Coradini Mariano; Cruz, Sheila Cristina de Souza; Colodette, Andre Louzada; Loureiro, Luciene Rossati; Comério, Tatiane; Farias, Dilzilene Cunha Sivirino; Lima, Eliane de Fátima Almeida; Manhambusque, Katia Valéria; Abreu, Luiz Carlos.
Affiliation
  • Pinasco, Gustavo Carreiro; Universidade Federal do Espírito Santo ­ UFES. Vitória - ES. BR
  • Farina, Eduardo Moreno Júdice de Mattos; Universidade Federal de São Paulo ­ UNIFESP. São Paulo - SP. BR
  • Filho, Fabiano Novaes Barcellos; Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória ­ EMESCAM. Vitória - ES. BR
  • Fiorotti, Willer França; Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória ­ EMESCAM. Vitória - ES. BR
  • Ferreira, Matheus Coradini Mariano; Prefeitura Municipal de Vitória. Vitória - ES. BR
  • Cruz, Sheila Cristina de Souza; Prefeitura Municipal de Vitória. Vitória - ES. BR
  • Colodette, Andre Louzada; Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória ­ EMESCAM. Vitória - ES. BR
  • Loureiro, Luciene Rossati; Prefeitura Municipal de Vitória. Vitória - ES. BR
  • Comério, Tatiane; Prefeitura Municipal de Vitória. Vitória - ES. BR
  • Farias, Dilzilene Cunha Sivirino; Prefeitura Municipal de Vitória. Vitória - ES. BR
  • Lima, Eliane de Fátima Almeida; Universidade Federal do Espírito Santo ­ UFES. Vitória - ES. BR
  • Manhambusque, Katia Valéria; Universidade Federal do Espírito Santo ­ UFES,. Vitória - ES. BR
Article in English, Portuguese | LILACS-Express | LILACS | ID: biblio-1437052
Responsible library: BR1251
ABSTRACT

Introduction:

the Coronavirus Disease 2019 (COVID-19) is a viral disease which has been declared a pandemic by the WHO. Diagnostic tests are expensive and are not always available. Researches using machine learning (ML) approach for diagnosing SARS-CoV-2 infection have been proposed in the literature to reduce cost and allow better control of the pandemic.

Objective:

we aim to develop a machine learning model to predict if a patient has COVID-19 with epidemiological data and clinical features.

Methods:

we used six ML algorithms for COVID-19 screening through diagnostic prediction and did an interpretative analysis using SHAP models and feature importances.

Results:

our best model was XGBoost (XGB) which obtained an area under the ROC curve of 0.752, a sensitivity of 90%, a specificity of 40%, a positive predictive value (PPV) of 42.16%, and a negative predictive value (NPV) of 91.0%. The best predictors were fever, cough, history of international travel less than 14 days ago, male gender, and nasal congestion, respectively.

Conclusion:

we conclude that ML is an important tool for screening with high sensitivity, compared to rapid tests, and can be used to empower clinical precision in COVID-19, a disease in which symptoms are very unspecific.
RESUMO

Introdução:

a Doença do Coronavírus 2019 (COVID-19) é uma doença viral que foi declarada uma pandemia pela OMS. Testes diagnósticos são caros e nem sempre estão disponíveis. Pesquisas utilizando a abordagem de aprendizado de máquina (ML) para o diagnóstico de infecção por SARS-CoV-2 têm sido propostas na literatura para reduzir custos e permitir melhor controle da pandemia.

Objetivo:

nosso objetivo é desenvolver um modelo de aprendizado de máquina para prever se um paciente tem COVID-19 com dados epidemiológicos e características clínicas.

Método:

usamos seis algoritmos de ML para triagem de COVID-19 por meio de predição diagnóstica e fizemos uma análise interpretativa usando modelos SHAP e importâncias de recursos.

Resultados:

nosso melhor modelo foi o XGBoost (XGB) que obteve área sob a curva ROC de 0,752, sensibilidade de 90%, especificidade de 40%, valor preditivo positivo (VPP) de 42,16% e valor preditivo negativo ( VPL) de 91,0%. Os melhores preditores foram febre, tosse, história de viagem internacional há menos de 14 dias, sexo masculino e congestão nasal, respectivamente.

Conclusão:

Concluímos que o ML é uma importante ferramenta de triagem com alta sensibilidade, em comparação aos testes rápidos, e pode ser usado para potencializar a precisão clínica na COVID-19, doença em que os sintomas são muito inespecíficos.
License
C - Todos os direitos reservados


Full text: Available Collection: International databases Database: LILACS Type of study: Diagnostic study / Prognostic study / Screening study Language: English / Portuguese Journal: Journal of Human Growth and Development (Impresso) Year: 2022 Document type: Article Affiliation country: Brazil Institution/Affiliation country: Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória ­ EMESCAM/BR / Prefeitura Municipal de Vitória/BR / Universidade Federal de São Paulo ­ UNIFESP/BR / Universidade Federal do Espírito Santo ­ UFES/BR / Universidade Federal do Espírito Santo ­ UFES,/BR

Full text: Available Collection: International databases Database: LILACS Type of study: Diagnostic study / Prognostic study / Screening study Language: English / Portuguese Journal: Journal of Human Growth and Development (Impresso) Year: 2022 Document type: Article Affiliation country: Brazil Institution/Affiliation country: Escola Superior de Ciências da Santa Casa de Misericórdia de Vitória ­ EMESCAM/BR / Prefeitura Municipal de Vitória/BR / Universidade Federal de São Paulo ­ UNIFESP/BR / Universidade Federal do Espírito Santo ­ UFES/BR / Universidade Federal do Espírito Santo ­ UFES,/BR
...