Your browser doesn't support javascript.
loading
Show: 20 | 50 | 100
Results 1 - 3 de 3
Filter
Add filters








Language
Year range
1.
Article in Spanish | LILACS-Express | LILACS | ID: biblio-1536159

ABSTRACT

En este trabajo consideramos 148 semioquímicos reportados para la familia Scarabaeidae, cuya estructura química fue caracterizada empleando un conjunto de 200 descriptores moleculares de cinco clases distintas. La selección de los descriptores más discriminantes se realizó con tres técnicas: análisis de componentes principales, por cada clase de descriptores, bosques aleatorios y Boruta-Shap, aplicados al total de descriptores. A pesar de que las tres técnicas son conceptualmente diferentes, seleccionan un número de descriptores similar de cada clase. Propusimos una combinación de técnicas de aprendizaje de máquina para buscar un patrón estructural en el conjunto de semioquímicos y posteriormente realizar la clasificación de estos. El patrón se estableció a partir de la alta pertenencia de un subconjunto de estos metabolitos a los grupos que fueron obtenidos por un método de agrupamiento basado en lógica difusa, C-means; el patrón descubierto corresponde a las rutas biosintéticas por las cuales se obtienen biológicamente. Esta primera clasificación se corroboró con el empleo de mapas autoorganizados de Kohonen. Para clasificar aquellos semioquímicos cuya pertenencia a una ruta no quedaba claramente definida, construimos dos modelos de perceptrones multicapa, los cuales tuvieron un desempeño aceptable.


In this work we consider 148 semiochemicals reported for the family Scarabaeidae, whose chemical structure was characterized using a set of 200 molecular descriptors from five different classes. The selection of the most discriminating descriptors was carried out with three different techniques: Principal Component Analysis, for each class of descriptors, Random Forests and Boruta-Shap, applied to the total of descriptors. Although the three techniques are conceptually different, they select a similar number of descriptors from each class. We proposed a combination of machine learning techniques to search for a structural pattern in the set of semiochemicals and then perform their classification. The pattern was established from the high belonging of a subset of these metabolites to the groups that were obtained by a grouping method based on fuzzy C-means logic; the discovered pattern corresponds to the biosynthetic pathway by which they are obtained biologically. This first classification was corroborated with Kohonen's self-organizing maps. To classify those semiochemicals whose belonging to a biosynthetic pathway was not clearly defined, we built two models of Multilayer Perceptrons which had an acceptable performance.


Neste trabalho consideramos 148 semioquímicos reportados para a família Scarabaeidae, cuja estrutura química foi caracterizada usando um conjunto de 200 descritores moleculares de 5 classes diferentes. A seleção dos descritores mais discriminantes foi realizada com três técnicas diferentes: Análise de Componentes Principais, para cada classe de descritores, Florestas Aleatórias e Boruta-Shap, aplicadas a todos os descritores. Embora as três técnicas sejam conceitualmente diferentes, elas selecionaram um número semelhante de descritores de cada classe. Nós propusemos uma combinação de técnicas de aprendizado de máquina para buscar um padrão estrutural no conjunto de semioquímicos e então realizar sua classificação. O padrão foi estabelecido a partir da alta pertinência de um subconjunto desses metabólitos aos grupos que foram obtidos por um método de agrupamento baseado em lógica fuzzy, C-means; o padrão descoberto corresponde às rotas biossintéticas pelas quais eles são obtidos biologicamente. Essa primeira classificação foi corroborada com o uso dos mapas auto-organizados de Kohonen. Para classificar os semioquímicos cuja pertença a uma rota não foi claramente definida, construímos dois modelos de Perceptrons Multicamadas que tiveram um desempenho aceitável.

2.
Rev. cuba. inform. méd ; 5(2)jul.-dic. 2013.
Article in Spanish | LILACS, CUMED | ID: lil-739236

ABSTRACT

El perceptrón multicapa (PMC) figura dentro de los tipos de redes neuronales artificiales (RNA) con resultados útiles en los estudios de relación estructura-actividad. Dado que los volúmenes de datos en proyectos de Bioinformática son eventualmente grandes, se propuso evaluar algoritmos para acortar el tiempo de entrenamiento de la red sin afectar su eficiencia. Se desarrolló un algoritmo para el entrenamiento local y distribuido del PMC con la posibilidad de variar las funciones de transferencias para lo cual se utilizaron el Weka y la Plataforma de Tareas Distribuidas Tarenal para distribuir el entrenamiento del perceptrón multicapa. Se demostró que en dependencia de la muestra de entrenamiento, la variación de las funciones de transferencia pueden reportar resultados mucho más eficientes que los obtenidos con la clásica función Sigmoidal, con incremento de la g-media entre el 4.5 y el 17 por ciento. Se encontró además que en los entrenamientos distribuidos es posible alcanzar eventualmente mejores resultados que los logrados en ambiente local(AU)


The multilayer perceptron (PMC) ranks among the types of artificial neural networks (ANN), which has provided better results in studies of structure-activity relationship. As the data volumes in Bioinformatics' projects are eventually big, it was proposed to evaluate algorithms to shorten the training time of the network without affecting its efficiency. There were evaluated different tools that work with ANN and were selected Weka algorithm for extracting the network and the Platform for Distributed Task Tarenal to distribute the training of multilayer perceptron. Finally, it was developed a training algorithm for local and distributed the MLP with the possibility of varying transfer functions. It was shown that depending on the training sample, the change of transfer functions can yield results much more efficient than those obtained with the classic sigmoid function with increased g-media between 4.5 and 17 percent. Moreover, it was found that with distributed training can be achieved eventually, better results than those achieved in the local environment(AU)


Subject(s)
Humans , Medical Informatics Applications , Neural Networks, Computer , Computational Biology/methods
3.
Acta biol. colomb ; 14(3): 71-96, dic. 2009.
Article in Spanish | LILACS | ID: lil-634935

ABSTRACT

El estudio de la estructura jerárquica de comunidades ecológicas, se ha sintetizado de manera regular a través de técnicas multivariadas de ordenación o clasificación. Sin embargo, al contarse actualmente con herramientas analíticas de computación bioinspirada provenientes de la inteligencia artificial, existe la oportunidad de establecer modelos ecológicos, con características deseables como flexibilidad, exactitud, robustez y confiabilidad. En este contexto, esta investigación utilizó dos métodos computacionales de utilidad en ecoinformática, referidos a redes neuronales artificiales (RNARs) para la modelación de la estructura jerárquica de una comunidad de macroinvertebrados bentónicos en términos de auto-organización y predicción. El primer método de modelación consistió en un mapa de auto-organización (MAU), una herramienta de aprendizaje no supervisado que clasificó las especies de macroinvertebrados; este MAU tomó en la capa de entrada la abundancia de cada taxa, y en la de salida proyectó su clasificación en 15 unidades y cuatro agrupamientos jerárquicos. La segunda RNA, correspondió a un Perceptrón multicapa de alimentación adelantada con algoritmo de retropropagación, que modeló separadamente la riqueza y la abundancia de Ephemeroptera, Coleoptera y Trichoptera (ECT), en función de nueve variables fisicoquímicas; la arquitectura del perceptrón correspondió a una constitución de nueve, siete, y una neurona en las capas de entrada, intermedia y salida, respectivamente. Los resultados sugieren que las RNARs utilizadas evidenciaron tanto los patrones jerárquicos, como los de riqueza y abundancia de ECT de manera adecuada, al tiempo que facilitaron el análisis de los datos y el entendimiento de la dinámica de la comunidad de macroinvertebrados, objeto de estudio.


The study of hierarchical structures of ecological communities has been synthesized in an ordinary way by means of multivariated techniques of ordination or clustering. Currently, analytical tools of bio-inspired computation belonging to the area of artificial intelligence are available to achieve ecological models with desirable characteristics, such as; flexibility, accuracy, robustness and reliability. In this context, this study employed two computational methods useful in ecoinformatics referring to artificial neural networks (RNAR) for the modeling of the hierarchical structure of a benthic macroinvertebrate community in self-organization and prediction terms. The first ANN modeling method consisted of a Kohonen self-organization map (SOM), a non-supervised learning tool that classify the species of macroinvertebrates; this SOM in the input layer of gets the abundance of each ‘taxa’ from the data matrix, while in the output layer was visualized the computational results. Thus, in the output layer the species are organized in fifteen units and four hierarchical clusters. The second ANN method applied consisted of a multilayer feed-forward perceptron net with back-propagation algorithm to predict the three major insect orders; this means, Ephemeroptera, Coleoptera and Trichoptera (ECT) richness and abundance using a set of nine physical-chemical variables. This ANN architecture included a neuron for each environmental variable, a hidden layer with seven neurons and a neuron in the output layer for ECT prediction. The results suggest that both types of ANN used, SOM and perceptron, were correspondingly related to the hierarchical patterns and with the richness and abundance patterns’ predictions, and gave the data analysis and understanding of the dynamic of the macroinvertebrates community, in a correct way.

SELECTION OF CITATIONS
SEARCH DETAIL