Your browser doesn't support javascript.
loading
Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos / Multiple imputations for missing data: a simulation with epidemiological data
Nunes, Luciana Neves; Klück, Mariza Machado; Fachel, Jandyra Maria Guimarães.
  • Nunes, Luciana Neves; Universidade Federal do Rio Grande do Sul. Faculdade de Medicina. Porto Alegre. BR
  • Klück, Mariza Machado; Universidade Federal do Rio Grande do Sul. Faculdade de Medicina. Porto Alegre. BR
  • Fachel, Jandyra Maria Guimarães; Universidade Federal do Rio Grande do Sul. Faculdade de Medicina. Porto Alegre. BR
Cad. saúde pública ; 25(2): 268-278, fev. 2009. tab
Article in Portuguese | LILACS | ID: lil-505488
RESUMO
Em situações com dados faltantes, é comum restringir-se à análise dos sujeitos com dados completos. Porém, as estimativas com apenas esses sujeitos podem tornar-se viesadas. A prática de preenchimento de dados faltantes é a chamada técnica de imputação. Este trabalho tem como objetivo divulgar o método de imputação múltipla. Em um conjunto de dados de 470 pacientes cirúrgicos, foram ajustados modelos logísticos para o desfecho óbito. Foram gerados dois conjuntos de dados incompletos um com 5 por cento e outro com 20 por cento de dados faltantes para uma variável. Foram ajustados modelos para o conjunto completo, com dados faltantes e para o conjunto completado por imputação múltipla. As estimativas obtidas pela análise dos conjuntos com dados faltantes e com o conjunto completo foram diferentes, principalmente as do conjunto com 20 por cento de dados faltantes. A imputação múltipla utilizada pareceu eficiente, pois os resultados conseguidos com o banco completado por imputações foram próximos dos obtidos com o conjunto completo. Porém, um coeficiente deixou de ser estatisticamente significativo. A imputação múltipla se mostrou superior à análise do conjunto com dados faltantes, que desconsiderou os casos incompletos.
ABSTRACT
In situations with missing data, statistical analyses are usually limited to subjects with complete data. However, such estimates may be biased. The method of "filling in" missing data is called imputation. This article aimed to present a multiple imputation method. From a data set of 470 surgical patients, logistic models were developed for death as the outcome. Two incomplete data sets were generated one with 5 percent and another with 20 percent of missing data in a single variable. Logistic models were fitted for the complete and incomplete data sets and for the data set completed by multiple imputations. Estimates obtained for the data set with missing data were different from those observed in the complete data set, mainly in the situation with 20 percent of missing data. The multiple imputation used here appeared efficient, producing very similar results to those obtained with the complete data set. However, one coefficient became non-significant. The analysis using multiple imputations was considered superior to using the data sets that excluded incomplete cases from the analysis.
Subject(s)

Full text: Available Index: LILACS (Americas) Main subject: Epidemiologic Research Design / Data Interpretation, Statistical Type of study: Prognostic study / Risk factors Limits: Humans Language: Portuguese Journal: Cad. saúde pública Journal subject: Public Health / Toxicology Year: 2009 Type: Article Affiliation country: Brazil Institution/Affiliation country: Universidade Federal do Rio Grande do Sul/BR

Similar

MEDLINE

...
LILACS

LIS

Full text: Available Index: LILACS (Americas) Main subject: Epidemiologic Research Design / Data Interpretation, Statistical Type of study: Prognostic study / Risk factors Limits: Humans Language: Portuguese Journal: Cad. saúde pública Journal subject: Public Health / Toxicology Year: 2009 Type: Article Affiliation country: Brazil Institution/Affiliation country: Universidade Federal do Rio Grande do Sul/BR