数据集(库)目录

出版期刊|区域分类

2021年第12期
2019年第02期
数据详情

融合多源遥感与机器学习的太原市多层土壤总氮含量数据集(2020年)


邵馨1杨婷*2
1 云南师范大学地理学部,昆明65050012 中国科学院地理科学与资源研究所黄河三角洲现代农业工程实验室,北京100101

DOI:10.3974/geodb.2025.04.01.V1

出版时间:2025年4月

网页浏览次数:48       数据下载次数:0      
数据下载量: 无      数据DOI引用次数:

关键词:

GEE,土壤总氮,多源遥感数据,机器学习模型,

摘要:

土壤总氮含量是反映土壤养分水平与生态功能的重要指标,对农业生产、生态保护与环境安全具有重要意义。作者以山西省太原市为研究区域,依托Google Earth Engine(GEE)云计算平台,融合多源遥感数据,构建2020年太原市多层(0-200 cm)土壤总氮含量数据集。所选环境因子包括:(1)NDVI指数(AVHRR NDVI 长时间序列数据集,16天合成,约5.1 km分辨率);(2)Sentinel-2近红外波段反射率(Level-2A产品,b8波段,10 m分辨率);(3)地表土壤水分(OpenLandMap土壤水分-33 kPa(b10波段),约250 m分辨率);(4)降水量(CHIRPS数据集,0.05°分辨率,约5.6 km);(5)地表温度(MOD11A1数据集,白天地表温度LST_Day_1km波段,1 km分辨率);(6)数字高程模型(SRTM DEM数据集,30 m分辨率)。为减少人造地表干扰,采用中国科学院30 m分辨率土地利用与土地覆盖(LUCC)分类体系,对研究区域中的建设用地和水体进行了掩膜,仅保留自然土壤区域用于建模分析。采用随机森林回归(RF)、分类回归树(CART)与梯度提升回归树(GBRT)三种机器学习方法进行建模反演,并以ISRIC SoilGrids的土壤总氮数据集为参考,结合均方根误差(RMSE)和决定系数(R²)进行交叉验证。结果表明,RF、CART、GBRT的RMSE分别为0.16 g/kg、0.21 g/kg、0.17 g/kg,R²分别为0.79、0.64、0.75。数据集内容为2020年太原市多层(包括6个深度层次:0-5 cm、5-15 cm、15-30 cm、30-60 cm、60-100 cm 与 100-200 cm)土壤总氮含量数据集,空间分辨率为30 m,以.tif格式存储,共18个数据文件,数据总量为1.52 GB(压缩为1个文件,219 MB)。

基金项目:

中华人民共和国科学技术部(2023YFD1701804);

数据引用方式:

邵馨, 杨婷*. 融合多源遥感与机器学习的太原市多层土壤总氮含量数据集(2020年)[J/DB/OL]. 全球变化数据仓储电子杂志(中英文), 2025. https://doi.org/10.3974/geodb.2025.04.01.V1.

参考文献:

[1] 庞煜龚, 张孟豪, 姜敏等. 广东省肇庆市高要区耕地土壤理化性质和微生物特征的空间异质性及综合质量评价[J]. 华南农业大学学报, 2025, 46: 151-163.
     [2] Chapin, F. S., Matson, P.A., Vitousek, P. M. Principles of Terrestrial Ecosystem Ecology [M]. New York: Springer, 2014.
     [3] Htwe, N. M. P. S., Ruangrak, E. A review of sensing, uptake, and environmental factors influencing nitrate accumulation in crops [J]. Journal of Plant Nutrition, 2021.
     [4] 刘丽琪, 魏广源, 周萍. 基于机器学习优化建模的GF-5影像土壤总氮量预测填图[J]. 智慧农业(中英文), 2024, 6: 61-73.
     [5] 宋雪, 张民, 周洪印等. 基于土壤优化光谱参数估测太湖地区土壤全氮含量[J]. 农业资源与环境学报, 2020, 37: 43-50. https://doi.org/10.13254/j.jare.2018.0365.
     [6] 章海亮, 谢潮勇, 田彭等. 基于可见/近红外光谱和数据驱动的机器学习方法测量土壤有机质和总氮[J]. 光谱学与光谱分析, 2023, 43: 2226-2231.
     [7] 赵春江. 农业遥感研究与应用进展[J]. 农业机械学报, 2014, 45: 277-293.
     [8] 聂鹏程, 钱程, 覃锐苗等. 天空地一体化信息感知与融合技术发展现状与趋势[J]. 智能化农业装备学报(中英文), 2023, 4: 1-11.
     [9] Zhang, S., Zhang, J., Bai, Y., et al. Evaluation and improvement of the daily Boreal Ecosystem Productivity Simulator in simulating gross primary productivity at 41 flux sites across Europe [J]. Ecological Modelling, 2018, 368: 205-232. https://doi.org/10.1016/j.ecolmodel.2017.11.023.
     [10] 杨子, 潘鑫, 袁洁等. 基于随机森林算法的卫星监测太湖蓝藻数据集(2019)[J]. 全球变化数据学报, 2023, 7(3): 321-326..
     [11] 潘霞. 基于Google Earth Engine云平台下地物覆被类型的遥感影像智能分类方法研究[D]. 呼和浩特: 内蒙古农业大学, 2021.
     [12] 遥感云计算平台发展及地球科学应用[OL]. https://d.wanfangdata.com.cn/Periodical/ygxb202101014 [2025-4-13].
     [13] Prasad, A. M., Iverson, L. R., Liaw, A. newer tree classification and prediction techniques: bagging and random forests for ecological regression [J]. Ecosystems, 2006, 9(2):181-199.
     [14] Breiman, L. Random forests [J]. Machine Learning, 2001, 45: 5-32.
     [15] 王大鹏, 王周龙, 李德一等. 综合非光谱信息的荒漠化土地CART分类[J]. 遥感学报, 2007: 487-492.
     [16] Breiman, L., Friedman, J. H., Olshen, R. A., et al. Classification and Regression Trees [M]. Belmont: Wadsworth International Group, 1984.
     [17] Friedman, J. H. Greedy function approximation: a gradient boosting machine [J]. Annals of Statistics, 2001, 29(5): 1189-1232.
     

数据下载:

序号 数据名 数据大小 操作
主管单位