Your browser doesn't support javascript.
loading
Show: 20 | 50 | 100
Results 1 - 4 de 4
Filter
Add filters








Year range
1.
Colomb. med ; 54(1)mar. 2023.
Article in English | LILACS-Express | LILACS | ID: biblio-1534279

ABSTRACT

Background: Pathology reports are stored as unstructured, ungrammatical, fragmented, and abbreviated free text with linguistic variability among pathologists. For this reason, tumor information extraction requires a significant human effort. Recording data in an efficient and high-quality format is essential in implementing and establishing a hospital-based-cancer registry Objective: This study aimed to describe implementing a natural language processing algorithm for oncology pathology reports. Methods: An algorithm was developed to process oncology pathology reports in Spanish to extract 20 medical descriptors. The approach is based on the successive coincidence of regular expressions. Results: The validation was performed with 140 pathological reports. The topography identification was performed manually by humans and the algorithm in all reports. The human identified morphology in 138 reports and by the algorithm in 137. The average fuzzy matching score was 68.3 for Topography and 89.5 for Morphology. Conclusions: A preliminary algorithm validation against human extraction was performed over a small set of reports with satisfactory results. This shows that a regular-expression approach can accurately and precisely extract multiple specimen attributes from free-text Spanish pathology reports. Additionally, we developed a website to facilitate collaborative validation at a larger scale which may be helpful for future research on the subject.


Introducción: Los reportes de patología están almacenados como texto libre sin estructura, gramática, fragmentados o abreviados, con variabilidad lingüística entre patólogos. Por esta razón, la extracción de información de tumores requiere un esfuerzo humano significativo. Almacenar información en un formato eficiente y de alta calidad es esencial para implementar y establecer un registro hospitalario de cáncer. Objetivo: Este estudio busca describir la implementación de un algoritmo de Procesamiento de Lenguaje Natural para reportes de patología oncológica. Métodos: Desarrollamos un algoritmo para procesar reportes de patología oncológica en Español, con el objetivo de extraer 20 descriptores médicos. El abordaje se basa en la coincidencia sucesiva de expresiones regulares. Resultados: La validación se hizo con 140 reportes de patología. La identificación topográfica se realizó por humanos y por el algoritmo en todos los reportes. La morfología fue identificada por humanos en 138 reportes y por el algoritmo en 137. El valor de coincidencias parciales (fuzzy matches) promedio fue de 68.3 para Topografía y 89.5 para Morfología. Conclusiones: Se hizo una validación preliminar del algoritmo contra extracción humana sobre un pequeño grupo de reportes, con resultados satisfactorios. Esto muestra que múltiples atributos del espécimen pueden ser extraídos de manera precisa de texto libre de reportes de patología en Español, usando un abordaje de expresiones regulares. Adicionalmente, desarrollamos una página web para facilitar la validación colaborativa a gran escala, lo que puede ser beneficioso para futuras investigaciones en el tema.

3.
Rev. salud pública ; 22(6): e206, nov.-dic. 2020. tab, graf
Article in Spanish | LILACS-Express | LILACS | ID: biblio-1341639

ABSTRACT

RESUMEN Objetivo Analizar el impacto de la contaminación del aire por material particulado PM2,5 y su relación con el número de asistencias a entidades de salud por enfermedades respiratorias por medio de analítica de datos. Métodos Se analizaron datos del Área Metropolitana de Medellín, Colombia, ciudad ubicada en un valle estrecho densamente poblado e industrializado y que ha presentado episodios críticos de contaminación en los últimos años. Se analizaron tres fuentes de datos: datos meteorológicos aportados por el SIATA (Sistema de Alerta Temprana de Medellín y el Valle de Aburrá); datos de contaminación por material particulado PM2,5 aportados por SIATA; y reportes de los RIPS (Registros Individuales de Prestación de Servicios de Salud) aportados por la Secretaría de Salud. Resultados Se evidenció la relación entre la concentración de PM2,5 con las asistencias médicas por los diagnósticos de IRA, EPOC y asma. En un episodio crítico de contaminación por PM2,5, se encontraron los siguientes retardos en la atención médica: entre 0 y 2 días para el IRA, 0 y 7 días para el EPOC y 0 y 5 días para el asma. Discusión Se encontraron coeficientes de correlación que evidencian la asociación de la concentración de PM2,5 con las asistencias por los diagnósticos de IRA, EPOC y asma. La mayor correlación entre las tres morbilidades se presentó para el asma. La variable meteorológica de mayor correlación con la variable objetivo es la temperatura del aire para el caso de EPOC y asma. En el caso de IRA, la variable con mayor correlación es la velocidad del viento. Por otro lado, el día de la semana es una variable de gran importancia a la hora de realizar un estudio de atenciones por enfermedades.


ABSTRACT Objective To analyze the impact of air pollution by PM2,5 particulate matter and its relationship with the number of attendances to health entities for respiratory diseases through data analytics. Methods Data from the Metropolitan Area of Medellín, Colombia, a city located in a densely populated and industrialized narrow valley and that has presented critical episodes of contamination in recent years, were analyzed. Three data sources were analyzed: meteorological data provided by SIATA (Early Warning System of Medellín and the Aburra Valley), PM2,5 particulate matter contamination data provided by SIATA, and RIPS reports (Individual Registers for the Provision of Health Services) provided by the health department. Results The relationship between the concentration of PM2,5 and medical care for the diagnoses of ARI, COPD and asthma was evidenced. In a critical episode of PM2,5 contamination, the following delays in medical care were found: between 0-2 days for IRA, 0-7 days for COPD, and 0-5 days for asthma. Discussion Correlation coefficients were found that show the association of the concentration of PM2,5 with the attendances for the diagnoses of ARI, COPD, and asthma. The highest correlation between the three morbidities was found for asthma. The meteorological variable with the highest correlation with the objective variable is air temperature in the case of COPD and asthma. In the case of IRA, the variable with the highest correlation is wind speed. On the other hand, the day of the week is a variable of great importance when carrying out a study of care for diseases.

4.
Cad. Ibero Am. Direito Sanit. (Impr.) ; 9(1): 141-156, jan.-mar.2020.
Article in Portuguese | LILACS-Express | LILACS | ID: biblio-1087844

ABSTRACT

Introdução: a produção de dados 3D tem-se revelado uma ferramenta útil na investigação e aplicação nas Ciências Forenses, contudo os avanços tecnológicos nem sempre são acompanhados pela legislação e comités de ética. Objectivo: aprofundar o tema do ponto de vista da Antropologia Forense. Metodologia: revisão bibliográfica sumária e consulta ao sistema jurídico português. Resultados: observa-se um vazio legislativo e uma ausência de normas éticas sobre a produção de dados 3D. Conclusão: é essencial que a revolução tecnológica seja acompanhada por um sistema jurídico adequado e comissões de ética estruturadas para uma evolução sustentável da Ciência.


Introduction: the 3D data production has proven to be a useful tool for Forensic Sciences, however technological advances are not always accompanied by updates of the Legislation and Ethics Committees. Objective: to develop the discussion on the subject from the point of view of Forensic Anthropology. Methodology: a summary review of the literature and consultation of the Portuguese legal system. Results: it is observable a legislative void and an absence of ethical norms about the 3D data production. Conclusion: it is essential that the technological revolution is followed by an adequate legal system and structured ethics committees for a sustainable evolution of Science.


Introducción: la producción de datos 3D ha demostrado ser una herramienta útil en la investigación y aplicación en Ciencias Forenses, sin embargo, los avances tecnológicos no siempre van acompañados de Comités de Legislación y Ética. Objetivo: profundizar el tema desde el punto de vista de la Antropología Forense. Metodología: revisión bibliográfica resumida y consulta del sistema legal portugués. Resultados: hay un vacío legislativo y una ausencia de estándares éticos con respecto a la producción de datos 3D. Conclusión: es esencial que la revolución tecnológica vaya acompañada de un sistema legal adecuado y comisiones de ética estructuradas para una evolución sostenible de la Ciencia

SELECTION OF CITATIONS
SEARCH DETAIL