Your browser doesn't support javascript.
loading
Show: 20 | 50 | 100
Results 1 - 3 de 3
Filter
Add filters








Year range
1.
Ciênc. rural ; 45(9): 1592-1598, set. 2015. tab, ilus
Article in English | LILACS | ID: lil-756419

ABSTRACT

A critical issue in digital soil mapping (DSM) is the selection of data sampling method for model training. One emerging approach applies instance selection to reduce the size of the dataset by drawing only relevant samples in order to obtain a representative subset that is still large enough to preserve relevant information, but small enough to be easily handled by learning algorithms. Although there are suggestions to distribute data sampling as a function of the soil map unit (MU) boundaries location, there are still contradictions among research recommendations for locating samples either closer or more distant from soil MU boundaries. A study was conducted to evaluate instance selection methods based on spatially-explicit data collection using location in relation to soil MU boundaries as the main criterion. Decision tree analysis was performed for modeling digital soil class mapping using two different sampling schemes: a) selecting sampling points located outside buffers near soil MU boundaries, and b) selecting sampling points located within buffers near soil MU boundaries. Data was prepared for generating classification trees to include only data points located within or outside buffers with widths of 60, 120, 240, 360, 480, and 600m near MU boundaries. Instance selection methods using both spatial selection of methods was effective for reduced size of the dataset used for calibrating classification tree models, but failed to provide advantages to digital soil mapping because of potential reduction in the accuracy of classification tree models.

.

Uma questão crítica no mapeamento digital de solos é a seleção do método de amostragem dos dados para treinamento do modelo preditivo. Uma abordagem emergente aplica a seleção de instâncias (observações) para reduzir o tamanho do conjunto de dados, selecionando amostras relevantes para obter um subconjunto representativo, o qual seja grande o suficiente para preservar as informações pertinentes, mas pequeno o suficiente para ser facilmente manipulado pelos algoritmos de aprendizagem. Embora existam sugestões para distribuir a amostragem de dados em função da proximidade de limites de unidades de mapeamento de solos (UM), ainda existem contradições entre as recomendações de pesquisa para localizar amostras mais perto ou mais distantes desses limites. Foi realizado um estudo para avaliar os métodos de seleção de instâncias com base na coleta de dados espacialmente explícita usando a localização em relação aos limites de mapa de solo como o principal critério. Realizou-se análise de árvore de decisão para a modelagem de mapeamento digital de classes de solo usando dois esquemas de amostragem diferentes: a) selecionando pontos de amostragem localizados fora das áreas marginais aos limites das UM e b) selecionando pontos de amostragem situados dentro das áreas marginais aos limites das UM. Os dados foram preparados para a geração de árvores de classificação para incluir somente dados pontuais localizados dentro ou fora de faixas com larguras de 60, 120, 240, 360, 480 e 600m ao redor dos limites de UM. Ambos os métodos de seleção de instâncias foram eficazes para reduzir o tamanho do conjunto de dados usado para calibração de árvores de classificação, mas não trouxeram vantagens para o mapeamento digital de classes de solos.

.

2.
Ciênc. rural ; 41(7): 1170-1176, jul. 2011. ilus, tab
Article in Portuguese | LILACS | ID: lil-595916

ABSTRACT

Tecnologias disponíveis para a observação da Terra oferecem uma grande gama de informações sobre componentes ambientais que, por estarem relacionadas com a formação dos solos, podem ser usadas como variáveis preditoras no Mapeamento Digital de Solos (MDS). No entanto, modelos com um grande número de preditores, bem como a existência de multicolinearidade entre os dados, podem ser ineficazes no mapeamento de classes e propriedades do solo. O objetivo deste estudo foi empregar a Análise de Componentes Principais (ACP) visando a selecionar e diminuir o número de preditores na regressão logística múltipla multinomial (RLMM) utilizada no mapeamento de classes de solos. Nove covariáveis ambientais, ligadas ao fator de formação relevo, foram derivadas de um Modelo Digital de Elevação e denominadas variáveis originais, estas foram submetidas à ACP e transformadas em Componentes Principais (CP). As RLMM foram desenvolvidas utilizando-se atributos de terreno e as CP como variáveis explicativas. O mapa de solos gerado a partir de três CP (65,6 por cento da variância original) obteve um índice kappa de 37,3 por cento, inferior aos 48,5 por cento alcançado pelo mapa de solos gerado a partir de todas as nove variáveis originais.


Available technologies for Earth observation offer a wide range of predictors relevant to Digital Soil Mapping (DSM). However, models with a large number of predictors, as well as, the existence of multicollinearity among the data, may be ineffective in the mapping of classes and soil properties. The aim of this study was to use the Principal Component Analysis (PCA) to reduce the number of predictors in the multinomial logistic regression (MLR) used in soil mapping. Nine environmental covariates, related to the relief factor of soil formation, were derived from a digital elevation model and named the original variables, which were submitted to PCA and transformed into principal components (PC). The MLR were developed using the terrain attributes and the PC as explanatory variables. The soil map generated from three PC (65.6 percent of the original variance) had a kappa index of 37.3 percent, lower than the 48.5 percent achieved by the soil map generated from all nine original variables.

3.
Ciênc. rural ; 41(5): 812-816, May 2011. ilus, tab
Article in Portuguese | LILACS | ID: lil-590089

ABSTRACT

O objetivo deste estudo foi aplicar uma técnica automatizada de mapeamento de solos a partir de modelos preditivos ajustados em uma área de referência e, posteriormente, aplicados em áreas próximas de mesmas relações solo-paisagem. Modelos lineares generalizados foram desenvolvidos utilizando-se de nove atributos de terreno, derivados de um Modelo Digital de Elevação, como covariáveis preditoras e classes de solos, obtidas em um levantamento convencional, como variáveis dependentes. Os modelos foram capazes de distinguir as três principais formas da paisagem local. Classes de solos de pedogênese intimamente ligada às covariáveis preditoras obtiveram os melhores resultados. O mapa de solos gerado apresentou uma reprodutibilidade de 46,12 por cento e uma exatidão de 21,06 por cento.


The aim of this study was to apply an automated technique of soil mapping from predictive models developed at a reference area, into nearby areas of the same soil-landscape relationships. Generalized linear models were developed using nine terrain attributes derived from a digital elevation model as covariate predictors, with soil classes, obtained from a conventional soil survey, as dependent variables. The models were able to distinguish the three main forms of the local landscape. Soil classes with pedogenesis intimately tied to the predictive covariates obtained the best results. The soil maps generated, showed a reproducibility of 46.12 percent and an accuracy of 21.06 percent.

SELECTION OF CITATIONS
SEARCH DETAIL