geoestatÍstica na variabilidade espacial dos … · análise dos dados é o ponto chave para maior...
TRANSCRIPT
GEOESTATÍSTICA NA VARIABILIDADE ESPACIAL DOS ATRIBUTOS FÍSICOS
E QUÍMICOS EM SOLO TROPICAL
GEOSTATISTIC FOR SPATIAL VARIATION OF PHYSICAL AND CHEMICAL
ATTRIBUTES IN TROPICAL SOIL
Apresentação: Comunicação Oral
Wanderson de Sousa Mendes1; José Alexandre Melo Demattê2, José Paulo Molin3, Lucas de
Paula Corrêdo4, Paulo André Tavares5
DOI: https://doi.org/10.31692/2526-7701.IIICOINTERPDVAGRO.2018.00137
Resumo
A caracterização da variabilidade espacial de atributos físicos e químicos do solo depende de
grades amostrais bem definidas e representativas. Feito isso, a escolha do melhor método para
análise dos dados é o ponto chave para maior acurácia dos mapas de atributos a serem gerados.
Entre os métodos mais estudados para caracterização da variabilidade espacial de atributos
químicos e físicos do solo destacam-se a Krigagem Simples, Krigagem Ordinária, Ponderação
do Inverso das Distâncias (IDW) e o algoritmo Random Forest. Os autores desse trabalho
tiveram por objetivo verificar quais desses métodos de interpolação apresentam melhor
potencial prático para a espacialização dos atributos químicos e físicos do solo com o intuito de
gerar mapas de aplicação de calcário. A área de estudo tem 2,65 km2 e foi dividida em uma
malha com espaçamento regular de 222 m entre pontos ao longo de 15 transeções paralelas,
com comprimento variando entre 400 a 850 m. Foi coletado 1 ponto amostral de solo, na
camada de 0-20 cm com trado tipo holandês, a cada 4,93 ha (0,0493 km2), totalizando 53 pontos
no município de Barra do Ouro, TO. As amostras foram analisadas em laboratório para
obtenção de dados de conteúdo de argila, CTC, V% e matéria orgânica. A interpolação dos
dados foi realizada para cada um dos métodos citados, variando a potência de peso do método
IDW em 2, 5 e 10, posteriormente foi realizada a validação dos mesmos. O conteúdo de argila
foi o único atributo a apresentar forte dependência espacial. Entretanto, observa-se que a grade
amostral pouco densa pode ter superestimado ou subestimado alguns atributos analisados. Para
todos os atributos analisados nesse estudo, a IDW mostrou-se como o melhor método de
interpolação.
Palavras-Chave: Argila, CTC, Matéria Orgânica, Saturação por bases, Mapeamento digital de
solos.
Abstract
1 Doutorando em Solos e Nutrição de Plantas, ESALQ/USP, [email protected] 2 Prof. Dr. do Depto de Ciência do Solo, ESALQ/USP, [email protected] 3 Prof. Dr. do Depto de Engenharia de Biossistemas, ESALQ/USP, [email protected] 4 Doutorando em Engenharia de Sistemas Agrícolas, ESALQ/USP, [email protected] 5 Doutorando em Solos e Nutrição de Plantas, ESALQ/USP, [email protected]
Spatial variability characterization of chemical and physical soil attributes depends on well-
defined and representative sample grids. The best model choice for data analysis is the key point
for the attribute maps accuracy. The main methods used to study spatial variability
characterization are Simple Kriging, Ordinary Kriging, Inverse Distance Weighting (IDW) and
Random Forest. The goal of this study was to verify which interpolation methods present better
potential for spatial characterization of chemical and physical soil attributes in order to generate
limestone application maps. The study area has 2.65 km2 and was regularly gridded with 222
m between points through 15 parallel transections ranging from 400 to 850 m at Barra do Ouro,
TO. After laboratory analyses, clay content, CEC, base saturation and organic matter data were
obtained and interpolated. The clay content was the only soil attribute that presented spatial
dependence. However, sample grid may have overestimated or underestimated some analyzed
attributes. For all the attributes analyzed in this study, the IDW proved to be the best
interpolation method.
Keywords: Clay, CEC, Organic matter, Base saturation, Digital soil mapping.
Introdução
A agricultura de precisão é uma ferramenta que auxilia a gestão do sistema solo-planta-
atmosfera com base na caracterização da variabilidade espacial (MONTANARI et al., 2012).
A amostragem georreferenciada de solo por malhas regulares é uma das ferramentas mais
tradicionais utilizadas para caracterizar a variabilidade de atributos físicos e químicos do solo
(CHERUBIN et al., 2015; RAGAGNIN; SENA JUNIOR; SILVEIRA NETO, 2010). O
dimensionamento de uma malha amostral ótima para caracterização de atributos físicos e
químicos do solo é amplamente estudado (CAON; GENÚ, 2013; CHERUBIN et al., 2014;
NANNI et al., 2011; SIQUEIRA et al., 2014; SOUZA et al., 2014). Com os dados de solos
georreferenciados é possível gerar mapas com finalidades específicas (e.g. mapa de aplicação
de adubo e corretivos a taxa variada). Todavia, a acurácia desses mapas está diretamente
relacionada ao método de interpolação utilizado na sua confecção.
Fundamentação Teórica
Dentre alguns métodos geoestatísticos e de aprendizado de máquinas (“machine
learning”) destacam-se: (a) Krigagem Simples (Simple Kriging, SK), baseia-se no princípio da
estacionaridade na qual considera a constância da distribuição e valor da média dos pontos
dentro de uma área; (b) Krigagem Ordinária (Ordinary Kriging, OrK), recalcula a média a partir
do raio de cada ponto, portanto não adotando o princípio da estacionaridade; (c) Ponderação do
Inverso das Distâncias (Inverse Distance Weighting, IDW), pressupõe que pontos mais
próximos apresentam maior similaridade do que pontos mais distantes; e (d) o algoritmo
Random Forest (RF), baseia-se em árvores de decisões normalmente utilizados em regressões
e classificações. Diante do exposto, os autores têm por objetivo verificar qual (is) dos métodos
de interpolação (krigagem simples, krigagem ordinária, ponderação do inverso das distâncias e
algoritmo Random Forest) apresenta (m) potencialidade prática (i.e. campo) para
espacialização dos atributos químicos (saturação por bases, capacidade de troca de cátions e
teor de matéria orgânica) e físicos (teor de argila) do solo na confecção de mapas de aplicação
de calcário agrícola.
Metodologia
O estudo foi conduzido nas proximidades do município de Barra do Ouro, TO. A área
de estudo tem 2,65 km2 e foi dividida em uma malha com espaçamento regular de 222 m entre
pontos ao longo de 15 transeções paralelas, com comprimento variando entre 400 a 850 m. Foi
coletado 1 ponto amostral de solo, na camada de 0-20 cm com trado tipo holandês, a cada 4,93
ha (0,0493 km2), totalizando 53 pontos. Nas amostras coletadas, foram efetuadas as análises
dos atributos físicos (conteúdo de argila, g kg-1) e químicos (capacidade de troca de cátions,
cmol dm-3; saturação por bases, %; matéria orgânica, g kg-1) em laboratório (CAMARGO et
al., 1986) (Figura 1).
Figura. 1. Área de estudo mostrando a distribuição do grid amostral e dos atributos mensurados.
Geostatística e Random Forest
Utilizou-se Simple Kriging (SK), Ordinary Kriging (OrK), Inverse Distance Weighting
(IDW) e Random Forest (RF) na modelagem da predição dos atributos saturação por bases,
capacidade de troca de cátions, conteúdos de matéria orgânica e argila do solo. Calculou-se o
semivariograma dos atributos físicos e químico antes da execução do SK e OrK. O variograma
seguiu os princípios da hipótese intrínseca (ISAAKS; SRIVASTAVA, 1989) e o variograma
experimental foi determinado pela semivariância baseada na distância dos pontos (Equação 1).
O variograma foi delineado usando 53 pontos para uma área de 2,65 km2.
=
+−=)(
1
2)()(
)(
1)(2
hN
n
nn huzuzhN
h
(1)
Em que: γ(h) - semivariância experimental para a distância h; z(un) - valor da propriedade no
ponto n; e N(h) - número de pares de pontos separados pela distância h.
O IDW foi testado com potências de peso 2, 5 e 10. O algoritmo Random Forest foi
calibrado com valores espectrais do mosaico temporal de solo exposto de imagens do Landsat-
5 TM (Thematic Mapper) e os valores do modelo digital de elevação (DEM) foram adquiridos
do U.S. Geological Survey dos Estados Unidos da América.
Cálculo da necessidade de calcário
Efetuou-se o cálculo da necessidade de calcário (Equação 2) a partir de cada mapa de
atributos gerados na SK, OrK, IDW e RF. Foram adotados o valor de poder relativo de
neutralização total (PRNT) igual a 100% e 60% de saturação por bases desejado após a correção.
O software QGIS foi utilizado para o processamento e a álgebra dos mapas de atributos do solo
necessários para geração dos mapas de necessidade de calagem (NC).
𝑁𝐶 = {[(𝑉2 − 𝑉1) ∗ 𝐶𝐸𝐶]/𝑃𝑅𝑁𝑇} ∗ 1000 (2)
Em que: NC - necessidade de calagem, kg ha-1; V2 - saturação por bases desejada após
correção, %; V1 - saturação por bases predita, %; CEC - capacidade de troca de cátions,
cmolcdm-3; PRNT - poder relativo de neutralização total, %; e Clay - conteúdo de argila predito,
g kg-1.
Validação dos modelos
Utilizou-se o programa R para processamento, tratamento e modelagem dos dados. O
teste de skewness foi o principal parâmetro adotado na determinação da assimetria dos dados
em relação à aderência à distribuição gaussiana. Validaram-se os modelos de interpolação
espacial verificando a raiz do erro do quadrado médio (RMSE), e o coeficiente de determinação
(R2) para todos os atributos estudados comparando os resultados das análises laboratoriais com
os resultados preditos para os mesmos pontos.
Resultados e Discussão
No primeiro momento, foi gerado o semivariograma para os atributos analisados (Figura
2), e ajustou-se o melhor modelo para cada atributo. Os dados que não apresentaram
distribuição normal foram transformados para atender o pressuposto estatístico de
homogeneidade e normalidade (Figura 3). Os semivariogramas ajustados foram utilizados na
SK, e OrK. A ponderação do inverso das distâncias (IDW) não se baseia em semivariogramas,
mas no raio em torno do ponto amostrado. O algoritmo RF utilizou os valores das respostas
espectrais de solo exposto das imagens de satélites do Landsat-5 TM (Thematic Mapper) e do
DEM na predição dos atributos mensurados. Visualmente, os mapas de conteúdo de argila
preditos (Figura 4) pelo método da IDW evidenciam a dependência do fator de ponderação
vinculado ao raio em torno do ponto amostral. A SK e OrK apresentam leve suavização dos
valores preditos. A predição pelo algoritmo RF apresenta maior heterogeneidade pixel-a-pixel
do que os outros métodos de interpolação espacial. A distinção entre os métodos de interpolação
estudados nesse trabalho consiste na dependência (SK, OrK, e IDW) e interdependência
espacial entre pontos.
O semivariograma do conteúdo de argila foi o único que apresentou dependência
espacial forte (Figura 2). Uma das hipóteses para que os atributos químicos tenham apresentado
baixa dependência espacial neste estudo foi que a grade amostral utilizada não estava adequada,
ou seja, talvez fosse necessária uma grade amostral mais densa, como constatado no estudo de
CHERUBIN et al. (2015) no qual indica que a grade amostral ideal para mensuração de
atributos químicos do solo deve ser de no máximo uma observação por hectare.
Entretanto, descartando-se o aspecto da amostragem, a predição dos atributos do solo tanto
físicos (argila) quanto químicos (matéria orgânica, saturação por bases e capacidade de troca
de cátions) apresentaram resultados representativos dentro de cada método de interpolação
espacial dos dados. A análise visual dos mapas de predição do conteúdo de matéria orgânica no
solo permite inferir a mesma tendência observada nos mapas de predição do conteúdo de argila
no solo (Figura 5). NANNI et al. (2011) avaliou tamanho ideal de grades de amostragem de
solos para aplicação de corretivos à taxa variável e conclui que para grids maiores que 1 amostra
ha-1 os atributos físicos do solo e a MO mantinham boa qualidade dos mapas de predição finais.
Ademais, os autores pontuaram que para os atributos químicos os grids devem ser menores do
que 1 observação ha-1. Portanto, os nossos resultados ratificam as observações feitas por
NANNI et al. (2011) e CHERUBIN et al. (2015). O algoritmo Random Forest mostrou ser um
método salutar quanto ao aspecto de interdependência espacial entre os pontos amostrais.
Todavia, avaliando-se a RMSE (Tabela 1), o RF apresentou resultados inferiores em relação
aos outros métodos de interpolação espacial, provavelmente, por causa da interdependência
espacial. A tendência dos mapas de predição dos atributos capacidade de troca de cátions
(Figura 6), saturação por bases (Figura 7), cálculo da necessidade de calcário (Figura 8) são
similares aos mensurados para matéria orgânica e argila.
Figura 2. Modelos de semivariogramas dos atributos saturação por bases (a), conteúdo de matéria orgânica (b),
capacidade de troca de cátions (c) e conteúdo de argila (d) do solo.
Figura 3. Histograma e coeficiente de assimetria mostrando a distribuição normal dos atributos saturação por
bases (a), conteúdo de matéria orgânica (b), capacidade de troca de cátions (c) e conteúdo de argila (d) do solo.
*Indica os dados utilizados na modelagem da predição dos atributos usando procedimentos geoestatísticos e o
algoritmo Random Forest.
Figura 4. Mapas do conteúdo de argila preditos por Krigagem Simples (Simple Kriging, SK), Krigagem
Ordinária (Ordinary Kriging, OrK), Ponderação do inverso das distâncias (Inverse Distance Weighting, IDW) a
potência 2, 5 e 10 e algoritmo Random Forest (RF).
Figura 5. Mapas do conteúdo de matéria orgânica no solo preditos por Krigagem Simples (Simple Kriging, SK),
Krigagem Ordinária (Ordinary Kriging, OrK), Ponderação do inverso das distâncias (Inverse Distance
Weighting, IDW) a potência 2, 5 e 10 e algoritmo Random Forest (RF).
Figura 6. Mapas de capacidade de troca de cátions no solo preditos por Krigagem Simples (Simple Kriging, SK),
Krigagem Ordinária (Ordinary Kriging, OrK), Ponderação do inverso das distâncias (Inverse Distance
Weighting, IDW) a potência 2, 5 e 10 e algoritmo Random Forest (RF).
Figura 7. Mapas de saturação de bases no solo preditos por Krigagem Simples (Simple Kriging, SK), Krigagem
Ordinária (Ordinary Kriging, OrK), Ponderação do inverso das distâncias (Inverse Distance Weighting, IDW) a
potência 2, 5 e 10 e algoritmo Random Forest (RF).
Figura 8. Mapas de necessidade de calcário no solo gerados a partir da álgebra entre os rasters de saturação por
bases e capacidade de troca de cátions para cada método de interpolação espacial.
A interpretação da análise regressão linear dos atributos mensurados em campo e
preditos usando os métodos de interpolação permite inferir que para todos os atributos
mensurados no presente estudo a IDW mostrou-se o melhor método (Tabela 1). A característica
intrínseca desse método pode ter influenciado os resultados do coeficiente de determinação e
do RMSE. Ratificando mais uma vez, a grade amostral do estudo pode ter superestimado ou
subestimado alguns dos atributos analisados. Consequentemente, o cálculo da NC apresentou
RMSE variando de 20 kg ha-1 (IDW) a 270 kg ha-1 (SK e RF). Cabe salientar que o RF
apresentou R2 e RMSE similar ao SK e próximo ao OrK demostrando ser um promissor método
no cálculo NC por não depender de grade amostral com maior densidade de pontos. Os valores
mínimos e máximos do SK e RF foram os que mais distintos estiveram da análise de laboratório
para todos os atributos (Tabela 2). Nos cálculos da NC na prática agronômica, os valores
negativos indicam NC igual a zero.
Tabela 1. Análise de regressão linear entre os valores preditos e observados dos atributos conteúdo de matéria
orgânica (MO), capacidade de troca de cátions (CTC), saturação por bases (V), conteúdo de argila e necessidade
de calcário (NC) dentro de cada modelo de interpolação espacial.
Métodos
MO
(g kg-1)
CTC
(cmolc dm-3)
V
(%)
Argila
(g kg-1)
NC
(t ha-1)
RMSE R2 RMSE R2 RMSE R2 RMSE R2 RMSE R2
SK 1,73 0,72 0,76 0,42 5,60 0,37 3,17 0,99 0,27 0,29
OrK 1,36 0,83 0,48 0,76 5,06 0,49 3,01 0,99 0,24 0,47
IDW2 0,09 0,99 0,03 0,99 0,34 0,99 1,26 0,99 0,03 0,98
IDW5 0,00 1,00 0,00 0,99 0,00 0,99 0,00 1,00 0,02 0,99
IDW10 0,00 1,00 0,00 1,00 0,00 1,00 0,00 1,00 0,02 0,99
RF 1,77 0,71 0,54 0,71 5,91 0,30 24,63 0,71 0,27 0,29
Tabela 2. Estatística descritiva dos valores preditos e observados dos atributos conteúdo de matéria orgânica
(MO), capacidade de troca de cátions (CTC), saturação por bases (V), conteúdo de argila e necessidade de
calcário (NC) para cada modelo de interpolação espacial.
Atributos Mínimo 1º quartil Mediana Média 3º quartil Máximo
g kg-1
MO lab. 7,57 10,77 12,88 13,23 14,46 22,95
MO SK 8,61 10,20 11,48 12,06 13,45 18,01
MO OrK 7,43 10,24 11,51 12,12 13,72 19,13
MO IDW2 6,68 9,79 11,86 12,19 13,47 21,79
MO IDW5 6,57 9,77 11,88 12,23 13,46 21,95
MO IDW10 6,57 9,77 11,88 12,23 13,46 21,95
MO RF 8,35 10,50 11,15 12,06 13,11 19,67
g kg-1
Argila lab. 140,00 220,00 240,00 240,20 270,00 340,00
Argila SK 142,50 218,50 240,00 240,30 269,00 336,90
Argila OrK 140,00 218,50 239,90 240,10 267,90 337,30
Argila IDW2 141,00 220,00 239,90 239,90 268,30 338,00
Argila IDW5 140,00 220,00 240,00 240,20 270,00 340,00
Argila IDW10 140,00 220,00 240,00 240,20 270,00 340,00
Argila RF 155,60 210,10 242,10 241,20 267,70 312,00
cmolc dm-3
CTC lab. 2,58 3,65 4,16 4,28 4,72 7,00
CTC SK 3,32 3,90 4,46 4,57 5,03 7,62
CTC OrK 1,86 2,78 3,02 3,22 3,39 5,35
CTC IDW2 1,62 2,70 3,11 3,26 3,69 5,96
CTC IDW5 1,58 2,65 3,16 3,30 3,72 6,00
CTC IDW10 1,58 2,65 3,16 3,28 3,72 6,00
CTC RF 2,27 2,77 3,10 3,21 3,46 5,61
%
V lab. 39,26 47,47 52,03 52,43 58,66 67,84
V SK 49,63 51,48 52,61 52,41 53,72 54,91
V OrK 43,98 50,47 52,86 52,69 55,20 64,99
V IDW2 40,04 47,63 52,30 52,40 58,28 67,32
V IDW5 39,26 47,47 52,03 52,43 58,66 67,84
V IDW10 39,26 47,47 52,03 52,43 58,66 67,84
V RF 41,79 49,17 52,39 51,76 54,99 60,27
kg ha-1
NC lab. -316,70 53,10 337,00 331,80 534,60 1229,90
NC SK 180,50 266,20 324,80 349,70 409,00 605,60
NC OrK -92,81 145,69 241,17 243,96 306,21 563,57
NC IDW2 -213,16 56,88 240,67 256,17 382,85 959,90
NC IDW5 -238,29 34,63 255,88 256,10 406,03 1022,42
NC IDW10 -238,30 34,60 256,00 256,10 406,10 1022,50
NC RF 28,09 156,25 232,86 248,12 315,97 596,23
Conclusões
A metodologia da interpolação espacial apresentou-se como ferramenta importante para
a predição dos conteúdos de argila e matéria orgânica mesmo com grade amostral acima de 1
amostra ha-1. Os atributos químicos dos solos não apresentaram adequada dependência espacial
para grade de 1 amostra por 4,93 ha-1, portanto não é agronomicamente recomendada. Dentre
os interpoladores utilizados, o IDW foi o que apresentou melhor resposta aos atributos
analisados, com altas correlações na regressão e erro quadrado médio baixo, enquanto os outros
interpoladores apresentaram valores maiores. Entretanto, o método do cálculo da espacialização
dos dados adotado pelo IDW pode ter influenciado positivamente seus resultados, não
representando de maneira fidedigna a realidade em campo. A proximidade do R² e do erro
quadrado médio da SK e OrK com RF, oportuna uma promissora área de exploração da
dependência espacial sem influência da grade de amostragem.
Agradecimentos
Os autores agradecem à Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP),
processos nº 2016/26124-6 e nº 2014/22262-0, pelo suporte para desenvolvimento do trabalho
científico. Adicionalmente, estende-se os agradecimentos ao Grupo de Pesquisa em
Geotecnologias em Ciência do Solo (GeoCis, http://esalqgeocis.wixsite.com/geocis).
Referências
CAMARGO, O A et al. Métodos de análise química, mineralógica e física de solos do IAC.
Campinas: [s.n.], 1986. 94 p.
CAON, Diovane; GENÚ, Aline M. Mapeamento de atributos químicos em diferentes
densidades amostrais e influência na adubação e calagem. Revista Brasileira de Engenharia
Agrícola e Ambiental v. 17, n. 6, p. 629–639, 2013.
CHERUBIN, Maurício Roberto et al. Dimensão da malha amostral para caracterização da
variabilidade espacial de fósforo e potássio em Latossolo Vermelho. Pesquisa Agropecuária
Brasileira v. 50, n. 2, p. 168–177, 2015.
CHERUBIN, Maurício Roberto et al. Eficiência de malhas amostrais utilizadas na
caracterização da variabilidade espacial de fósforo e potássio. Ciência Rural v. 44, n. 3, p.
425–432, 2014.
ISAAKS, E.H.; SRIVASTAVA, R.M. Applied Geostatistics. Nova York: Oxford University
Press, 1989. 561 p..
MONTANARI, R. et al. The use of scaled semivariograms to plan soil sampling in sugarcane
fields. Precision Agriculture v. 13, n. 5, p. 542–552, 2012.
NANNI, Marcos Rafael et al. Optimum size in grid soil sampling for variable rate application
in site-specific management. Scientia Agricola v. 68, n. 3, p. 386–392, 2011.
RAGAGNIN, Vilmar A.; SENA JUNIOR, Darly G; SILVEIRA NETO, Americo N.
Recommendation of liming at variable rates under different sampling intensities. REVISTA
BRASILEIRA DE ENGENHARIA AGRICOLA E AMBIENTAL v. 14, n. 6, p. 600–607,
2010.
SIQUEIRA, D. S. et al. Sampling density and proportion for the characterization of the
variability of Oxisol attributes on different materials. Geoderma v. 232–234, p. 172–182, 2014.
SOUZA, Zigomar Menezes De et al. Número de amostras na análise geoestatística e na
krigagem de mapas de atributos do solo. Ciência Rural v. 44, n. 2, p. 261–268, 2014.