Autores
- NIRIELE RODRIGUESUFRRJEmail: nirielebr@yahoo.com.br
 - CAMILLA SANTOS REIS DE ANDRADE DA SILVAUFRRJEmail: camilla.sras@gmail.com
 - Erica Souto Abreu LIMAUFRRJEmail: ericaabreulima@gmail.com
 - NELSON MOURA BRASIL DO AMARAL SOBRINHOUFRRJEmail: nelmoura@ufrrj.br
 - FRANCISCO XIRLEAN XAVIER ALVESUFRRJEmail: alvesxvier11@gmail.com
 
Resumo
A presente pesquisa teve por objetivo analisar variabilidade espacial dos 
atributos de argila, areia e silte e a influência das covariáveis ambientais, 
nas regiões do Norte e Noroeste (RJ). A metodologia baseou-se em: Levantamento 
bibliográfico;construção do banco de dados; estatística descritiva; e mapeamento 
digital a partir do modelo preditivo Random Forest, com os programas 
RStudio (3.6.1), Saga GIS (2.1.2).  Os resultados obtidos, apresentaram para as 
variáveis de  argila de R²  0,45, para areia R² 0,31 e silte com R² 0,21. Na 
predição do  modelo, constatou- se predominância das covariáveis Catchment Area, 
Surface Area  e SAVI, sendo as  que melhor justificam a variabilidade dos 
atributos. Portanto,  as covariáveis geomorfométricas apresentaram maior 
desempenho correlação aos  índices, sendo uma ferramenta importante planejamento 
ambiental.
Palavras chaves
Pedometria; textura; mineração de dados; inteligência artificial; planejamento ambiental
Introdução
Nas últimas décadas a busca por  informação acerca de atributos do solo no 
Brasil, tem sido cada vez mais crescente e essencial para planejamento de uso do 
solo. Nesse contexto, sabemos que, o solo é resultado da função do processo dos 
fatores de formação atrelado a processos pedogenéticos que atuam com 
determinados pesos na relação solo e paisagem, fatores esses que elucidam as 
diversas características do comportamento físico e químico e a variabilidade do 
solo.  
A pedometria tem buscado quantificar a variabilidade espacial dos atributos do 
solo, por meio da combinação de métodos de mapeamento. Os atributos do solo 
podem ser previstos a partir da posição espacial em grande parte pela 
interpolação entre locais de observação do solo (McBRATNEY,2003). A pedometria é 
denominada como estatística em solos e/ou pedologia quantitativa, os estudos têm 
buscado a partir de dados mensurados em campo atrelado a outras variáveis 
ambientais, predizer modelos pedológicos quanto à variação espacial de 
determinada área (McBRATNEY (2000). Nesse viés de pedometria, diversos trabalhos 
relacionando a espacialização de atributos físicos e químicos de solos, tem 
indicado o avanço de instrumentação no campo da ciência do solo (McBRATNEY, 
2000; Mendonça, 2007; Ten Caten, 2011).
A variabilidade espacial das frações granulométricas está ligada diretamente ao 
processo de formação do solo e entender como essas frações estão distribuídas 
espacialmente, principalmente, as partículas primárias areia, silte e argila, 
possibilita a interpretação da disponibilidade dos elementos químicos no solo 
(Silva et al., 2010). Os princípios básicos de experimentação e a variabilidade 
do solo ocorrem de forma aleatória; no entanto, vários estudos têm demonstrado 
que a variabilidade das propriedades físicas do solo apresenta dependência 
espacial (Libardi et al. 1986).
 Entretanto, com intuito de avaliar a variabilidade espacial de atributos 
físicos do solo, o objetivo deste trabalho foi avaliar a variabilidade e a 
correlação com os covariáveis ambientais. Os dados foram avaliados por 
estatística descritiva e modelo Random Forest (RF).
Material e métodos
Os procedimentos metodológicos desse trabalho foram divididos em 4 etapas que 
consistiram em: 1) Levantamento Bibliográfico; 2) Organização do Banco de Dados; 
3) Processamento Digital de Imagens e Documentos Cartográficos; e 4) Mapeamento 
Digital Aplicado a atributos do solo. As regiões Norte e Noroeste Fluminense 
localizam-se entre as coordenadas 42°22´14´´; 40°57´33´´WG, e 22°26´21´´; 22°45
´47´´S (Figura 1), e possui uma área total de 17.573 km². Os pontos de 
amostragem foram definidos com base no algoritmo conditioned Latin Hypercube 
Sampling, definindo o total de 95 pontos, ressalta-se que o algoritmo tem como 
critério os planos de informação de acessibilidade, 100 m de estrada e uso e 
cobertura, proposto por Minasny & McBratney (2006), utilizando informações na 
profundidade de 0-20 cm.Esta pesquisa utilizou o conjunto de dados de atributos 
químicos e físicos de solos, resultante do banco de dados de pesquisas 
realizadas no laboratório de Química e Poluição de Solo-UFRRJ. Os teores das 
frações granulométricas (frações de areia, silte e argila), conforme métodos 
propostos por Donagemma et al. (2011). A etapa de processamento digital de dados 
e imagens da área de estudo foi realizada a partir do uso de geotecnologias, 
utilizando-se como base, o Modelo Digital de Elevação Hidrologicamente 
Consistente (MDE-HC) com resolução espacial de 30 m, processado no ArcGIS 
Desktop v. 10.3, a partir de dados primários vetoriais de curvas de nível com 
equidistância de 10 metros, pontos cotados, hidrografia, extraído da base 
cartográfica do Instituto Brasileiro de Geografia e Estatística (IBGE)- escala 
1:25.000. As covariáveis geomorfométricas de atributos de terreno foram obtidas 
a  partir do programa System for Automated Geoscientific Analyses (SAGA-GIS 
v.2.1.2) (CONRAD, 2007).  Para o processamento de índices de sensoriamento 
remoto, foram utilizadas imagens do sensor TM do OLI/ Landsat 8, com resolução 
espacial de 30 m, órbita/ponto 216-75, obtida em 08/11/2019, disponibilizados 
National Aeronautics and Space Administration (NASA), United States Geological 
Survey (USGS).
Como critério para seleção das covariáveis foi gerada análise de correlação de 
Pearson via pacote (Corrplot) no programa RStudio (3.6.1), e selecionadas 
através da matriz as covariáveis com o valor coeficiente de correlação positivo 
e negativo maior  ou igual a 0,05. Para averiguar a variabilidade espacial dos 
teores dos  elementos, optou-se por trabalhar com modelo regressão, dentre os 
baseados em árvore de decisão, o Random Forest (RF), considerando o diferencial 
desse modelo em  ranking de importância de covariáveis ambientais. No 
processamento de validação  dos modelos, foi adotado como critério a validação 
cruzada, via pacote Caret (KUHN et al. 2017). Os procedimentos estatísticos 
foram implementados no  software R (R Development Core Team, 2014). Nesse 
sentido, foram ajustados os  hiperparâmetros para o modelo RF: número de árvores 
(ntree), e o número de covariáveis em divisão (mtry), assim adotaram-se como 
critério os respectivos  valores: 500 ntree (default) e 1/3 do conjunto de 
covariáveis para cada elemento.  Frisa-se que, nesta etapa ao total foram 
utilizadas 18 covariáveis de entrada  para utilização nos modelos preditivos, 
sendo 14 covariáveis geomorfométricas (Catchment Area,  Surface Area, Flow 
Acumulation, Curvature, Profile Curvature, Plan Curvature, Slope, Geomorphos, LS 
Factor, Topographic Wetness Index (TWI), Convergence Index, Relative Slope 
(RSP),Terrain Ruggedness (TRI)), e  4 índices (Clay  minerals, SAVI, NDVI, Iron 
Oxide). Os mapas das covariáveis de entrada estão na  projeção Coordenadas 
Geográficas e Datum SIRGAS 2000.
Resultado e discussão
Os resultados do Coeficiente Linear de Pearson (r) indicam se as predições 
apresentaram uma alta correlação positiva ou negativa entre os valores medidos e 
os valores estimados. Nesse sentido, foram escolhidas as covariáveis com p valor 
igual ou maior que 0,05. Para avaliar a importância e/ou peso de cada variável 
(Figura 1), foi utilizado também no software RStudio (v. 3.4) via pacote 
Corrplot.
Deste modo, as frações granulométricas apresentaram, potencialmente, uma 
tendência para correlação positiva com as covariáveis preditoras topográficas 
(TWI, LS fator, Convexity) e os índices (NDVI, Clay Minerals, Iron Oxide, SAVI). 
Esse comportamento, provavelmente, se deve a função de variação explicativa da 
dinâmica do material quanto ao relevo, sendo considerado como um fator os 
aspectos: declive; formas de encostas (côncavas, convexas, retilínea); fluxo 
superficial, entre outros. Uma das vantagens do modelo Random Forest é a função 
"VarImport", que tem por objetivo indicar um ranking de medida de importância 
das covariáveis ambientais preditoras do modelo (Figura 2), adotando como 
critério " Out of Bag (OOB)", embasado no aumento do erro de predição. Conforme 
Breiman (2001), a importância relativa das covariáveis preditoras são mensuradas 
com base no decréscimo da acurácia da predição. De modo geral, as covariáveis 
preditoras para os modelos apresentaram uma heterogeneidade na composição de 
seus conjuntos. De acordo com o grau de importância para os atributos do solo, 
verificou-se que as covariáveis ambientais provenientes de atributos 
geomorfométricas de relevo, derivadas de MDE -HC, obtiveram maior influência em 
relação aos índices provenientes das imagens Landsat-8. Nesse sentido, liderando 
as primeiras posições no ranking por via de regra, destaca-se a covariáveis: 
Curvature, Catchment Area, Geomorphos, Plan Curvature e das covariáveis 
provenientes de índices Iron Oxide, SAVI e NDVI, no que tange ao fator de 
influência sobre a explicação da variabilidade dos atributos (Figura 2).
Verificou-se que a conectividade das covariáveis como, por exemplo: Catchment 
Area, Geomorphons, e Surface Area, foram importantes no que corresponde a 
dinâmica das frações granulométricas e controle de processos pedogenéticos. 
Esses resultados corroboram com o processo de transporte superficial e 
subsuperficial desses elementos, e o comportamento de acúmulo e/ou perda no 
solo. As covariáveis de índices provenientes de imagem Landsat 8, tais como: 
NDVI e SAVI, apresentaram baixa influência na variação explicativa dos modelos. 
Andrade (2010) e Pinheiro (2012), em estudos de áreas adjacentes frisam a menor 
influência de covariáveis de imagens, e ressaltam a importância das covariáveis 
provenientes de terreno em seus modelos. Andrade (2010) destaca, no mesmo 
recorte espacial, porém, via Regressão Linear Múltipla para predição de 
atributos, observou uma maior influência das covariáveis de relevo (Perfil de 
curvatura e Índice de Umidade) na região Norte, associado a discussão de 
variações em diferentes pedoformas, como principal responsável pelas variações 
de atributos do solo. Na região Noroeste, destacou-se as covariáveis: Elevação; 
Aspecto, e Índice de Umidade, em associação a característica de relevo 
movimentado da região influenciando na variabilidade. A validação dos modelos 
foi pelo método de validação cruzada via pacote Caret.
Acerca dos atributos físicos do solo, a fração argila apresentou distribuição 
homogênea na região do Noroeste, em função da predominância de Argissolos e 
Latossolos que, apresentam maior conteúdo de argila (SANTOS et al., 2018). Na 
região Norte, verificou-se pontos acima de 359,51- 401,14 (mg kg-¹), próximo a 
lagoa Feia e outros corpos hídricos, podendo estar associado a áreas de 
deposição de material provenientes do relevo das partes mais altas visto que, 
está sob material de depósitos do depósitos neogênicos e Quaternário. A 
variabilidade  espacial da argila é inversamente proporcional à da areia. Para 
variabilidade da fração areia, verifica-se que, há predominância dessa fração em 
relevo plano na região do Norte, nesse sentido a pedogênese está associado com o 
regime  climático e o fator de declividade. De acordo com CPRM (2011), o 
material local tem formação de rochas sedimentares o que explica a predominância 
da fração areia, atrelado aos aspectos climáticos classificado com Aw, que 
favorece a via de formação de intemperismo físico-químico, com a presença de 
solos Neossolo, Gleissolo, Espodossolo, intemperizados.  A elevada concentração 
da fração areia ao Norte, foi correlacionado com à proximidade de canais de rios 
e solos jovens, conforme também frisado por Pinheiro (2018), em área adjacente 
na bacia hidrográfica de Macacu. Entretanto, a fração de silte, é dada pela 
diferença entre as frações de areia e argila, como se observa nas manchas no 
mapa (Figura 3), apresentando maiores conteúdos nas zonas de agradação ao Norte, 
sob solos como Gleissolos e Neossolos. 

Figura 1. Matriz de correlação entre atributos físicos e covariáveis ambientais

Figura 2. Análise de importância das covariáveis preditoras para os atributos do solo (argila, areia e silte) "VarImport".

Figura 22. Mapeamento da variabilidade espacial da concentração de argila, areia e silte na camada superficial em solos.

Figura 22. Mapeamento da variabilidade espacial da concentração de argila, areia e silte na camada superficial em solos.
Considerações Finais
Constatou-se, que a partir do uso do modelo Random Forest que as covariáveis 
geomorfométricas de terreno (Curvature, Catchment Area, Geomorphos), obtiveram 
maior potencial preditivo correlação as covariáveis provenientes de sensoriamento 
remoto. Ressalta-se a necessidade de mapeamento semidetalhado de áreas 
prioritárias, com delineamento de malha amostral denso espacialmente, em função da 
eficiência do modelo para a criação de mapas de atributos de solos. Além disso, a 
variabilidade espacial dos atributos reflete na dinâmica de solo-paisagem, sendo 
uma boa ferramenta para o planejamento/conhecimento de propriedades do solo e 
manejo de agroecossistemas.
Agradecimentos
Referências
BREIMAN, L. Random forests. Machine Learning Journal. Hingham, v.45, p. 5-32, jan. 2001.
CARVALHO JUNIOR, W. D., CHAGAS, C. D. S., LAGACHERIE, P., CALDERANO FILHO, B., & BHERING, S. B. Evaluation of statistical and geostatistical models of digital soil properties mapping in tropical mountain regions. Revista Brasileira de Ciência do Solo, v. 38, n. 3, p. 706-717, 2014.
CIDE - Centro de Informações e Dados do Rio de Janeiro. Mapa de uso e cobertura do solo: Estado do Rio de Janeiro. Rio de Janeiro, escala 1:50.000. 2003.
CONRAD, O. SAGA – System für Automatisierte Geowissenschaftliche Analysen. Presentation held at FOSSGIS 2007, Berlin, Germany, 14. March 2007. Available from: http://www.fossgis.de/wiki/images/e/eb/Oconrad_fossgis2007_saga.pdf.
CPRM (Companhia de Pesquisa de Recursos Minerais). Mapa geológico e de recursos minerais do estado do Rio de Janeiro, escala 1:400.000. Belo Horizonte: CPRM, 2016. Disponível em http://rigeo.cprm.gov.br/xmlui/handle/doc/18458?show=full. Acessado em 20/12/2019.
DONAGEMMA, G. K.; CAMPOS, D. V. B.; CALDERANO, S. B.; TEIXEIRA, W. G.;VIANA, J. H. M. Manual de métodos de análise de solos. Segunda Edição. Rio de Janeiro, RJ: Embrapa Solos. 2011.
DOS SANTOS, H. G., JACOMINE, P. K. T., DOS ANJOS, L. H. C., DE OLIVEIRA, V. A., LUMBRERAS, J. F., COELHO, M. R.; CUNHA, T. J. F. Sistema brasileiro de classificação de solos. Brasília, DF: Embrapa, 2018.
LIBARDI, P.L.; PREVEDELLO, C.L.; PAULETTO, E.A.; MORAES, S.O. Variabilidade espacial da umidade, textura e densidade de partículas ao longo de uma transeção. Revista Brasileira de Ciência do Solo, Campinas, SP, v.10, n.2, p.85-90, 1986.
KUHN, M.; WING, J.; WESTON, S.; WILLIAMS, A.; KEEFER, C.; ENGELHARDT, A.; COOPER, T.; MAYER, Z.; KENKEL, B.; BENESTY, M.; LESCARBEAU, R.; ZIEM, A.; SCRUCCA, L.; TANG, Y.; CANDAN, C.; HUNT, T. caret: classification and regression training, 2017. Disponível em: https://cran.r-project.org/package=caret
MINASNY, B.; McBRATNEY, A. B. A conditioned Latin hypercube method for sampling inthe presence of ancillary information. Computers & Geosciences, v. 32. p. 1378-1388. 2006.
PINHEIRO, H. S. K. Mapeamento Digital de Solos por Redes Neurais Artificiais da Bacia Hidrográfica do Rio Guapi-Macacu, RJ. Dissertação (Mestrado em Agronomia, Ciência do Solo) - Instituto de Agronomia, Departamento de Solos, Universidade Federal Rural do Rio de Janeiro, Seropédica, RJ. p.151. 2012.
SILVA, L. C.; SILVA, H. C. Geologia do Estado do Rio de Janeiro. In: CPRM. Rio de Janeiro. CPRM – Serviço Geológico do Brasil: Rio de Janeiro. 1CD Rom, 2000.
SILVA, S. A; LIMA, J. S. S.; SILVA, A. F. Variabilidade espacial do fósforo e das frações granulométricas de um Latossolo Vermelho Amarelo. Revista Ciência Agronômica, 41:1-8, 2010.








 









 