ABSTRACT
SUMMARY: Missing data may occur in every scientific studies. Statistical shape analysis involves methods that use geometric information obtained from objects. The most important input to the use of geometric information in statistical shape analysis is landmarks. Missing data in shape analysis occurs when there is a loss of information about landmark cartesian coordinates. The aim of the study is to propose F approach algorithm for estimating missing landmark coordinates and compare the performance of F approach with generally accepted missing data estimation methods, EM algorithm, PCA based methods such as Bayesian PCA, Nonlinear Estimation by Iterative Partial Least Squares PCA, Inverse non-linear PCA, Probabilistic PCA and regression imputation methods. Landmark counts were taken as 3, 6, 9 and sample sizes were taken as 5, 10, 30, 50, 100 in the simulation study. The data are generated based on multivariate normal distribution with positively defined variance-covariance matrices from isotropic models. In simulation study three different simulation scenarios and simulation based real data are considered with 1000 repetations. The best and the most different result in the performance evaluation according to all sample sizes is the Min (F) criteria of the F approach algorithm proposed in the study. In case of three landmarks which is only the proposed F approach and regression assignment method can be applied, Min (F) criteria give best results.
RESUMEN: Los datos faltantes pueden ocurrir en todos los estudios científicos. El análisis estadístico de formas involucra métodos que utilizan información geométrica obtenida de objetos. La entrada más importante para el uso de información geométrica en el análisis estadístico de formas son los puntos de referencia. Los datos que faltan en el análisis de formas se producen cuando hay una pérdida de información sobre las coordenadas cartesianas históricas. El objetivo del estudio es proponer el algoritmo de enfoque F para estimar las coordenadas de puntos de referencia faltantes y comparar el rendimiento del enfoque F con métodos de estimación de datos faltantes generalmente aceptados, algoritmo EM, métodos basados en PCA como Bayesian PCA, Estimación no lineal por Iterative Partial Least Squares PCA, PCA no lineal inverso, PCA probabilístico y métodos de imputación de regresión. Los recuentos de puntos de referencia se tomaron como 3, 6, 9 y los tamaños de muestra se tomaron como 5, 10, 30, 50, 100 en el estudio de simulación. Los datos se generan en base a una distribución normal multivariada con matrices de varianza-covarianza definidas positivamente a partir de modelos isotrópicos. En el estudio de simulación se consideran tres escenarios de simulación diferentes y se consideran datos reales basados en simulación con 1000 repeticiones. El mejor y más diferente resultado en la evaluación del desempeño según todos los tamaños de muestra es el criterio Min (F) del algoritmo de enfoque F propuesto en el estudio. En el caso de tres puntos de referencia, que es solo el enfoque F propuesto y se puede aplicar el método de asignación de regresión, los criterios Min (F) dan mejores resultados.
Subject(s)
Algorithms , Anatomic Landmarks , Data Interpretation, Statistical , Principal Component AnalysisABSTRACT
Sexual dimorphism in Homo-sapiens is a phenomenon of a direct product of evolution by natural selection where evolutionary forces acted separately on the sexes which brought about the differences in appearance between male and female such as in shape and size. Advances in morphometrics have skyrocketed the rate of research on sex differences in human and other species. However, the current challenges facing 3D in the acquisition of facial data such as lack of homology, insufficient landmarks to characterize the facial shape and complex computational process for facial point digitization require further study in the domain of sex dimorphism. This study investigates sexual dimorphism in the human face with the application of Automatic Homologous Multi-points Warping (AHMW) for 3D facial landmark by building a template mesh as a reference object which is thereby applied to each of the target mesh on Stirling/ESRC dataset containing 101 subjects (male = 47, female = 54). The semi-landmarks are subjected to sliding along tangents to the curves and surfaces until the bending energy between a template and a target form is minimal. Principal Component Analysis (PCA) is used for feature selection and the features are classified using Linear Discriminant Analysis (LDA) with an accuracy of 99.01 % which demonstrates that the method is robust.
El dimorfismo sexual en el Homo-sapiens es un fenómeno directo de la evolución por selección natural, donde las fuerzas evolutivas actuaron por separado en los sexos, lo que provocó las diferencias en la apariencia entre hombres y mujeres, tal como la forma y tamaño. Los avances en el área de la morfometría, han generado un aumento significativo de las investigaciones en las diferencias de sexo en humanos y otras especies. Sin embargo, los desafíos actuales que enfrenta el 3D en el análisis de datos faciales, como la falta de homología, puntos de referencia insuficientes para caracterizar la forma facial y la complejidad del proceso computacional para la digitalización de puntos faciales, requiere un estudio adicional en el área del dimorfismo sexual. Este estudio investiga el dimorfismo sexual en el rostro humano con la aplicación de la deformación automática de múltiples puntos homólogos para el hito facial 3D, mediante la elaboración de una malla de plantilla como objeto de referencia, y se aplica en cada una de las mallas objetivas en el conjunto de datos Stirling / ESRC que contiene 101 sujetos (hombre = 47, mujer = 54). Los semi-puntos de referencia se deslizan a lo largo de las tangentes a las curvas y superficies hasta que la energía de flexión entre una plantilla y una forma objetivo es mínima. El análisis de componentes principales (PCA) se utiliza para la selección de características y las características se clasifican mediante el análisis discriminante lineal (ADL) con una precisión del 99,01 %, lo que demuestra la validez del método.