Requerimientos para mejorar la normalización de datos en software de análisis métricos de la información / Requirements to improve the normalization of data in software for metric analysis of information
Rev. cub. inf. cienc. salud
; 29(1): 55-73, ene.-mar. 2018. ilus, tab
Article
en Es
| LILACS, CUMED
| ID: biblio-900943
Biblioteca responsable:
CU1.1
RESUMEN
Por la diversidad de formas en la entrada de los campos de autor-afiliación, la normalización de los datos bibliográficos es uno de los problemas que limitan los análisis de información métrica en tiempo de ejecución, fiabilidad de los indicadores y tamaño del corpus de datos. Este trabajo tiene como objetivo proponer los requerimientos para el mejoramiento de la normalización de datos en software de análisis métricos. Para lograr el objetivo se realizó un diagnóstico de los principales métodos y técnicas que son empleados a nivel mundial en este tipo de estudio. Como resultado principal, se relacionan los requerimientos para una aplicación de preprocesamiento automatizado de datos con fines métricos. Se proponen la base de datos, las tareas, los pasos y los algoritmos que contendrá esa aplicación. Se debe usar una combinación de algoritmos para desambiguar los campos afiliación y autor(AU)
ABSTRACT
Due to the diversity of methods used to enter author-affiliation information, the resulting lack of standardization of bibliographic data has become one of the problems limiting analysis of metric information in terms of execution time, reliability of indicators and size of the data corpus. The purpose of the study was to propose requirements to improve data normalization in metric analysis software. To achieve this objective, a diagnosis was made of the main methods and techniques used worldwide in this type of study. The main result is the presentation of requirements to be met by an application for automated pre-processing of data for metric purposes. A proposal is made of the database, tasks, steps and algorithms that this application will contain. A combination of algorithms should be used to disambiguate author and affiliation fields(AU)
Palabras clave
Texto completo:
1
Colección:
01-internacional
Base de datos:
CUMED
/
LILACS
Asunto principal:
Procesamiento Automatizado de Datos
/
Interpretación Estadística de Datos
/
Minería de Datos
Límite:
Humans
Idioma:
Es
Revista:
Rev. cub. inf. cienc. salud
Asunto de la revista:
INFORMATICA MEDICA
Año:
2018
Tipo del documento:
Article
País de afiliación:
Cuba
/
México
Pais de publicación:
Cuba