Your browser doesn't support javascript.
loading
Análisis clúster para big data: una aplicación con variables demográficas en provincias del Ecuador / Cluster analysis for big data: an application with demographic variables in provinces of Ecuador
Jaramillo-Feijoo, Leyda Elizabeth; Galindo-Villardon, María Purificación; Real-Cotto, Jhony Joe.
  • Jaramillo-Feijoo, Leyda Elizabeth; SOLCA. Departamento Gestión de la Información y Productividad. Guayaquil. EC
  • Galindo-Villardon, María Purificación; Universidad de Salamanca. ES
  • Real-Cotto, Jhony Joe; Universidad de Guayaquil. EC
J. health med. sci. (Print) ; 6(1): 45-50, ene.-mar. 2020. tab, ilus
Article in Spanish | LILACS | ID: biblio-1096716
RESUMEN
Los métodos de clasificación permiten explorar y analizar grandes conjuntos de datos visualmente, lo cual es de gran utilidad para tomar decisiones rápidas. El objetivo fue comparar dos métodos de análisis de clúster para big data en variables demográficas de las provincias del Ecuador. Se hizo uso de un estudio observacional de tipo comparativo mediante la representación simultanea del HJ-Biplot y el método Two Step (clúster bietápico), a través del software MultBiplot y SPSS. Los datos corresponden a variables demográficas de interés sociosanitarias tasa de mortalidad general, tasa de mortalidad infantil, tasa de natalidad, densidad poblacional, porcentaje urbano y esperanza de vida, medidas en las provincias del Ecuador. Se utilizaron datos provenientes del Instituto de Estadísticas y Censos INEC. Se analizó la asociación entre variables y se identificaron clústeres de las provincias del Ecuador según estas variables demográficas. Según la representación simultánea del HJ-Biplot se identificaron 3 clústeres, el clúster 1 son provincias con mayor densidad poblacional y tasas de mortalidad general, pero valores bajos de tasas de natalidad, el clúster 2 agrupa provincias con mayor esperanza de vida y tasas de mortalidad infantil pero bajos valores de tasa de natalidad y el clúster 3 están las provincias con valores altos de tasas de natalidad y valores bajos de densidad poblacional, esperanza de vida, tasas de mortalidad general y mortalidad infantil, distintos resultados se obtuvieron con el método Two Step. Se pudo concluir que estos métodos son de utilidad para explorar las similitudes entre las provincias según variables demográficas.
ABSTRACT
The classification methods allow to explore and analyze big data sets visually, which is very useful for making quick decisions. This work aimed to compare of two methods of cluster analysis for big data in demographic variables of the provinces of Ecuador. An observational study of comparative type was carried out through the simultaneous representation of the HJ/Biplot and the Two Step method (two-stage cluster), through the MultBiplot and SPSS software. The data correspond to demographic variables of socio-health interest, general mortality rate, infant mortality rate, birth rate, population density, urban percentage and life expectancy, measured in the provinces of Ecuador. Data from Statistics and Census Institute were used. The association between variables was analyzed and clusters of the provinces of Ecuador were identified according to these demographic variables. According to the simultaneous representation of the HJBiplot, 3 clusters were identified, cluster 1 are provinces with higher population density and general mortality rates, but low birth rates values, cluster 2 are provinces with higher life expectancy and mortality rates infantile but low birth rate values and cluster 3 are the provinces with high birth rates values and low population density, life expectancy, general mortality and infant mortality rates, different results were obtained with the Two Step method. It was concluded that these methods are useful for exploring the similarities between provinces according to demographic variables.
Subject(s)

Full text: Available Index: LILACS (Americas) Main subject: Cluster Analysis / Demography / Models, Statistical Type of study: Observational study / Prognostic study / Risk factors Limits: Humans Country/Region as subject: South America / Ecuador Language: Spanish Journal: J. health med. sci. (Print) Journal subject: Medicina Year: 2020 Type: Article Affiliation country: Ecuador / Spain Institution/Affiliation country: SOLCA/EC / Universidad de Guayaquil/EC / Universidad de Salamanca/ES

Similar

MEDLINE

...
LILACS

LIS

Full text: Available Index: LILACS (Americas) Main subject: Cluster Analysis / Demography / Models, Statistical Type of study: Observational study / Prognostic study / Risk factors Limits: Humans Country/Region as subject: South America / Ecuador Language: Spanish Journal: J. health med. sci. (Print) Journal subject: Medicina Year: 2020 Type: Article Affiliation country: Ecuador / Spain Institution/Affiliation country: SOLCA/EC / Universidad de Guayaquil/EC / Universidad de Salamanca/ES