Your browser doesn't support javascript.
loading
Wavelet packet transform and multilayer perceptron to identify voices with a mild degree of vocal deviation / Transformada Wavelet packet y Perceptrón Multicapa para identificación de voces con grado leve de desvío vocal
Morikawa, Mateus; Spatti, Danilo Hernane; Dajer, María Eugenia.
  • Morikawa, Mateus; Universidade Tecnológica Federal do Paraná. Departamento de Engenharia Elétrica. Cornélio Procópio. BR
  • Spatti, Danilo Hernane; Universidade de São Paulo. Departamento de Sistemas de Computação. São Carlos. BR
  • Dajer, María Eugenia; Universidade Tecnológica Federal do Paraná. Departamento de Engenharia Elétrica. Cornélio Procópio. BR
Rev. Investig. Innov. Cienc. Salud ; 4(1): 16-25, 2022. tab
Artigo em Inglês | LILACS, COLNAL | ID: biblio-1391338
ABSTRACT
Introduction. Laryngeal disorders are characterized by a change in the vibratory pattern of the vocal folds. This disorder may have an organic origin described by anatomical fold modification, or a functional origin caused by vocal abuse or misuse. The most common diagnostic methods are performed by invasive imaging features that cause patient discomfort. In addition, mild voice deviations do not stop the in-dividual from using their voices, which makes it difficult to identify the problem and increases the possibility of complications. Aim. For those reasons, the goal of the present paper was to develop a noninvasive alternative for the identification of voices with a mild degree of vocal deviation ap-plying the Wavelet Packet Transform (WPT) and Multilayer Perceptron (MLP), an Artificial Neural Network (ANN). Methods. A dataset of 74 audio files were used. Shannon energy and entropy mea-sures were extracted using the Daubechies 2 and Symlet 2 families and then the processing step was performed with the MLP ANN. Results. The Symlet 2 family was more efficient in its generalization, obtaining 99.75% and 99.56% accuracy by using Shannon energy and entropy measures, re-spectively. The Daubechies 2 family, however, obtained lower accuracy rates 91.17% and 70.01%, respectively. Conclusion. The combination of WPT and MLP presented high accuracy for the identification of voices with a mild degree of vocal deviation
RESUMEN
ntroducción. Los trastornos laríngeos se caracterizan por un cambio en el patrón vibratorio de los pliegues vocales. Este trastorno puede tener un origen orgánico, descrito como la modificación anatómica de los pliegues vocales, o de origen fun-cional, provocado por abuso o mal uso de la voz. Los métodos de diagnóstico más comunes se realizan mediante procedimientos invasivos que causan malestar al pa-ciente. Además, los desvíos vocales de grado leve no impiden que el individuo utilice la voz, lo que dificulta la identificación del problema y aumenta la posibilidad de complicaciones futuras.Objetivo. Por esas razones, el objetivo de esta investigación es desarrollar una he-rramienta alternativa, no invasiva para la identificación de voces con grado leve de desvío vocal aplicando Transformada Wavelet Packet (WPT) y la red neuronal artifi-cial del tipo Perceptrón Mutlicapa (PMC). Métodos. Fue utilizado un banco de datos con 78 voces. Fueron extraídas las me-didas de energía y entropía de Shannon usando las familias Daubechies 2 y Symlet 2 para después aplicar la red neuronal PMC. Resultados. La familia Symlet 2 fue más eficiente en su generalización, obteniendo un 99.75% y un 99.56% de precisión mediante el uso de medidas de energía y en-tropía de Shannon, respectivamente. La familia Daubechies 2, sin embargo, obtuvo menores índices de precisión 91.17% y 70.01%, respectivamente. Conclusión. La combinación de WPT y PMC presentó alta precisión para la iden-tificación de voces con grado leve de desvío vocal

Assuntos


Texto completo: DisponíveL Índice: LILACS (Américas) Assunto principal: Prega Vocal / Afonia / Distúrbios da Voz Tipo de estudo: Estudo diagnóstico / Estudo prognóstico Limite: Humanos Idioma: Inglês Revista: Rev. Investig. Innov. Cienc. Salud Assunto da revista: Fonoterapia / Medicina / Psicologia / Reabilita‡Æo Ano de publicação: 2022 Tipo de documento: Artigo País de afiliação: Brasil Instituição/País de afiliação: Universidade Tecnológica Federal do Paraná/BR / Universidade de São Paulo/BR

Similares

MEDLINE

...
LILACS

LIS


Texto completo: DisponíveL Índice: LILACS (Américas) Assunto principal: Prega Vocal / Afonia / Distúrbios da Voz Tipo de estudo: Estudo diagnóstico / Estudo prognóstico Limite: Humanos Idioma: Inglês Revista: Rev. Investig. Innov. Cienc. Salud Assunto da revista: Fonoterapia / Medicina / Psicologia / Reabilita‡Æo Ano de publicação: 2022 Tipo de documento: Artigo País de afiliação: Brasil Instituição/País de afiliação: Universidade Tecnológica Federal do Paraná/BR / Universidade de São Paulo/BR