Búsqueda | Global Index Medicus

Recovering records on cancer of the larynx from anonymous health information databases / Recuperação de registros de câncer de laringe de bancos de dados anônimos de saúde

Fernandes, Fernando Timoteo; Silva, Diego Rodrigues Mendonça e; Program of Environmental and Workers HealthCampos, Felipe; Program of Environmental and Workers HealthSantana, Vilma Sousa; Cuani, Lucas; Group of Epidemiology and Statistics on CancerCurado, Maria Paula; Program of Environmental and Workers HealthSalvi, Leonardo; Algranti, Eduardo.

Rev. bras. epidemiol ; 24: e210011, 2021. tab, graf

Artículo en Inglés | LILACS | ID: biblio-1156024

RESUMEN

ABSTRACT: Objective: To develop a linkage algorithm to match anonymous death records of cancer of the larynx (ICD-10 C32X), retrieved from the Mortality Information System (SIM) and the Hospital Information System of the Brazilian Unified National Health System (SIH-SUS) in Brazil. Methodology: Death records containing ICD-10 C32X codes were retrieved from SIM and SIH-SUS, limited to individuals aged 30 years and over, between 2002 and 2012, in the state of São Paulo. The databases were linked using a unique key identifier developed with sociodemographic data shared by both systems. Linkage performance was ascertained by applying the same procedure to similar non-anonymous databases. True pairs were those having the same identification variables. Results: A total of 14,311 eligible death records were found. Most records, 10,674 (74.6%), were exclusive to SIM. Only 1,853 (12.9%) deaths were registered in both systems, representing true pairs. A total of 1,784 (12.5%) cases of laryngeal cancer in the SIH-SUS database were tracked in SIM with different causes of death. The linkage failed to match 167 (9.4%) records due to inconsistencies in the key identifier. Conclusion: The authors found that linking anonymous data from mortality and hospital records is a feasible measure to track missing records and may improve cancer statistics.

RESUMO: Objetivo: Desenvolver um algoritmo de vinculação de registros para parear registros de óbito por câncer de laringe (CID-10 C32X), recuperados do Sistema de Informação de Mortalidade (SIM) e do Sistema de Informações Hospitalares do Sistema Único de Saúde (SIH-SUS) do Brasil. Métodos: Foram filtrados registros de óbitos contendo códigos CID-10 C32X do SIM e do SIH-SUS, de indivíduos de mais de 30 anos, entre 2002 e 2012, no Estado de São Paulo. As bases de dados foram vinculadas por meio de um identificador único e de variáveis sociodemográficas comuns a ambos os sistemas. O desempenho da vinculação de dados foi aferido aplicando-se o mesmo procedimento em bancos de dados nominais. Os pares verdadeiros apresentavam os mesmos valores nas variáveis de identificação. Resultados: Ao todo, 14.311 registros elegíveis de óbito foram encontrados. A maioria dos registros, 10.674 (74.6%), era exclusiva do SIM. Apenas 1.853 (12.9%) óbitos foram registrados em ambos os sistemas, representando pares verdadeiros. Um total de 1.784 (12.5%) casos de câncer de laringe presentes no SIH-SUS constavam com diferentes causas de óbito no SIM. Houve falha na vinculação em 167 (9.4%) registros, devido a inconsistências na chave de identificação. Conclusão: Constatou-se que a vinculação de dados anônimos de registros hospitalares e registros de óbito é viável e pode auxiliar na melhoria de estatísticas de câncer.

Asunto(s)

Humanos , Adulto , Neoplasias Laríngeas/mortalidad , Almacenamiento y Recuperación de la Información/métodos , Algoritmos , Brasil/epidemiología , Sistemas de Información , Certificado de Defunción , Estudios de Factibilidad , Bases de Datos Factuales , Sistemas de Información en Hospital

Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações / Machine learning in public health and occupational safety and health: perspectives, techniques and applications

Fernandes, Fernando Timoteo.

São Paulo; s.n; 2021. 117 p.

Tesis en Portugués | LILACS | ID: biblio-1354317

RESUMEN

Algoritmos de machine learning têm impactado a área da saúde nos últimos anos. Muita dessa popularidade deve-se aos ganhos de performance preditiva em comparação aos modelos estatísticos tradicionais, já que estes algoritmos conseguem capturar relações não-lineares e complexas, além de permitirem o uso de diferentes tipos de dados. Esta pesquisa objetiva descrever as diferentes técnicas recentes de machine learning e como elas podem ser aplicadas na saúde e segurança do trabalhador (SST). Os resultados da tese estão organizados em três artigos científicos. No primeiro artigo, foi realizada uma revisão bibliográfica para entender o panorama de uso de machine learning na saúde pública e em SST. Foram identificadas e categorizadas aplicações de aprendizagem supervisionada e não-supervisionada, e os principais problemas de pesquisa correspondentes. No segundo artigo, foram aplicados algoritmos de aprendizagem supervisionada para predição de absenteísmo por doença e doença relacionada ao trabalho em professores da rede pública municipal do Estado de São Paulo entre 2014 a 2018 (n=174.294), usando como fonte de dados a Relação Anual de Informações Sociais (RAIS). Cinco algoritmos foram comparados de acordo com o valor da área abaixo da curva (AUC). Todos os algoritmos obtiveram AUROC superior a 0,76. O melhor algoritmo (redes neurais artificiais) obteve AUROC de 0,79, com acurácia de 71,52%, sensibilidade de 72,86% e especificidade de 70,52%. Foi possível realizar predições que forneceram estimativas de risco no ensino infantil, para subsidiar a prevenção de afastamento por morbidades em professores, utilizando dados públicos e anônimos. No terceiro e último artigo, foram desenvolvidos modelos preditivos para identificar, antecipadamente, trabalhadores com risco de diagnóstico positivo para doença pulmonar obstrutiva crônica (DPOC). O estudo utilizou dados da coorte prospectiva do UK Biobank, de indivíduos acompanhados desde 2006, filtrando aqueles que preencheram o questionário de histórico ocupacional (n=120.289). Desses, 1731 (1,4%) foram diagnosticados com DPOC. Ao todo, foram selecionadas 26 variáveis, entre dados demográficos, exames laboratoriais, hábitos e sintomas, para a construção de modelos generalistas para predição de DPOC. Além disso, foi selecionado um subconjunto de participantes (n=7.628) com histórico ocupacional na indústria da construção civil e na mineração com possível exposição a poeira de sílica, para desenvolver modelos especialistas. Desses, 237 (3,11%) tiveram diagnóstico de DPOC. O modelo generalista obteve AUROC de 0.845, e o modelo especialista obteve AUROC de 0.841. As cinco principais variáveis preditoras foram idade, tosse crônica, tabagismo, histórico de asma e expectoração. Os resultados mostram que é possível predizer risco individual de diagnóstico de DPOC na população geral e nos trabalhadores expostos a poeiras minerais utilizando variáveis comumente coletadas na atenção primária. Nesta tese, mostramos a viabilidade de uso de modelos preditivos na saúde do trabalhador tanto para prognóstico quanto para diagnóstico, com boa performance preditiva. Espera-se que este estudo possa contribuir para uma maior adoção de modelos preditivos por pesquisadores em SST, permitindo identificar antecipadamente trabalhadores expostos a riscos ambientais de forma a auxiliar o início de medidas preventivas que inibam ou minimizem os riscos.

Machine learning algorithms have gained prominence in the health area in recent years. Much of this popularity is due to predictive performance gains when compared to traditional statistical models, as these algorithms are able to capture non-linear relationships and to handle different types of data. This research aims to describe the different machine learning techniques and how these techniques can be applied in occupational safety and health (OSH). The results are organized into three scientific articles. In the first manuscript, a literature review was carried out to understand the panorama of machine learning use in public health and OSH. Supervised and unsupervised learning algorithms were identified and categorized, and main research problems were listed. In the second article, supervised learning algorithms were developed to predict absenteeism due to illness and work related illness in teachers from all public municipal schools in the State of São Paulo between 2014 and 2018 (n=174.294) available from the Relação Anual de Informações Sociais (RAIS). Five algorithms were compared according to the value of the area under the receiver operating characteristic curve (AUROC). All algorithms obtained AUROC greater than 0.76. The best algorithm (artificial neural networks) obtained an AUROC of 0.79, with an accuracy of 71.52%, sensitivity of 72.86% and specificity of 70.52%. It was possible to make assertive predictions, which provide estimates of risk, providing subsidies for preventing sick leave in teachers using public and anonymous data. In the third and last article, predictive models were developed to identify workers at risk of a positive diagnosis for chronic obstructive pulmonary disease (COPD). The study used data from the UK Biobank prospective cohort from individuals followed since 2006, filtering those who completed the occupational history questionnaire (n=120.294). Of these, 1731 (1.4%) had a positive diagnosis of COPD. In all, 26 variables were selected, including demographic data, laboratory tests, habits and symptoms, for the development of generalist models for the prediction of COPD. In addition, a subset of individuals (n=7628) with an occupational background in the construction and mining industry, with possible exposure to mineral dusts was selected to develop specialized models. Of these, 237 (3.11%) were diagnosed with COPD. The generalist model obtained AUROC of 0.845, and the specialist model, an AUC of 0.841. The five main predictive variables were age, chronic cough, smoking, earlier diagnosis of asthma and chronic sputum. The results show that it is possible to predict individual risk of COPD diagnosis in the general population and in workers exposed to silica dust using variables commonly collected in primary care. In this research, we showed the feasibility of using predictive models in worker health for both prognosis and diagnosis, with good predictive performance. We believe that this study can contribute to a greater adoption of predictive models by OSH researchers, allowing the early identification of workers exposed to risks and the adoption of preventive measures that inhibit or minimize risks.

Asunto(s)

Pronóstico , Salud Laboral , Aprendizaje Automático

Perspectivas do uso de mineração de dados e aprendizado de máquina em saúde e segurança no trabalho / Data mining and machine learning perspectives for occupational safety and health

Fernandes, Fernando Timoteo; Chiavegatto Filho, Alexandre Dias Porto.

Rev. bras. saúde ocup ; 44: e13, 2019. tab, graf

Artículo en Portugués | LILACS | ID: biblio-1042555

RESUMEN

Resumo Introdução: a variedade, volume e velocidade de geração de dados (big data) possibilitam novas e mais complexas análises. Objetivo: discutir e apresentar técnicas de mineração de dados (data mining) e de aprendizado de máquina (machine learning) para auxiliar pesquisadores de Saúde e Segurança no Trabalho (SST) na escolha da técnica adequada para lidar com big data. Métodos: revisão bibliográfica com foco em data mining e no uso de análises preditivas com machine learning e suas aplicações para auxiliar diagnósticos e predição de riscos em SST. Resultados: a literatura indica que aplicações de data mining com algoritmos de machine learning para análises preditivas em saúde pública e em SST apresentam melhor desempenho em comparação com análises tradicionais. São sugeridas técnicas de acordo com o tipo de pesquisa almejada. Discussão: data mining tem se tornado uma alternativa cada vez mais comum para lidar com bancos de dados de saúde pública, possibilitando analisar grandes volumes de dados de morbidade e mortalidade. Tais técnicas não visam substituir o fator humano, mas auxiliar em processos de tomada de decisão, servir de ferramenta para a análise estatística e gerar conhecimento para subsidiar ações que possam melhorar a qualidade de vida do trabalhador.

Abstract Introduction: variety, volume and data generation speed allow for new and more complex analyses. Objective: to discuss and present data mining and machine learning techniques to aid occupational safety and health (OSH) researchers to choose the suitable technique when dealing with large volumes of data. Methods: literature review to discuss data mining and machine learning predictive applications for aiding diagnosis and risk prevention in OSH. Results: literature shows that data mining with machine learning algorithms for predictive purposes in OSH and public health present better performance when compared to traditional analysis. According to the research purpose, different techniques are recommended. Discussion: data mining has become a common alternative when dealing with large databases in public health, making it possible to analyze large volume of morbidity and mortality data. These techniques are not meant to replace the human factor, but rather to assist in decision-making processes, to work as a tool for the statistical analysis of OSH data and to build up knowledge to subsidize actions that may improve worker's quality of life.

RESUMEN

Asunto(s)

RESUMEN

Asunto(s)

RESUMEN

ENVIAR RESULTADO:

SELECCIÓN DE REFERENCIAS

DETALLE DE LA BÚSQUEDA