1. 卫星海洋环境动力学国家重点实验室,自然资源部第二海洋研究所,杭州 310012
2. 自然资源部杭州全球海洋Argo系统野外科学观测研究站,杭州 310012
摘 要:截至2020年底,国际Argo(Array for Real-time Geostrophic Oceanography)计划已经在全球海洋上收集了超过230万条温、盐度剖面。虽然各国Argo资料中心(DACs)按照国际Argo资料管理组(ADMT)制定的质量控制规程,但是各国提交的数据质量仍然参差不齐,这与DACs编写的解码软件存在问题、浮标本身存在技术缺陷、质控过程选取的阈值过于宽泛等有关。同时,全球Argo数据集越来越复杂,也给用户读取和使用Argo数据带来了困难。中国Argo实时资料中心于2019年开始准业务化收集并整理所有布放在全球海洋中的Argo浮标观测资料,根据国际规程,对其进行质量再控制,得到全球海洋Argo温盐度剖面散点数据集。该数据集存储为.dat格式,由2,244,712个数据文件组成,数据量为41.1 GB(压缩为18个文件,7.56 GB)。
关键词:Argo;温度;盐度;全球海洋
DOI: https://doi.org/10.3974/geodp.2021.03.09
CSTR: https://cstr.escience.org.cn/CSTR:20146.14.2021.03.09
数据可用性声明:
本文关联实体数据集已在《全球变化数据仓储电子杂志(中英文)》出版,可获取:
https://doi.org/10.3974/geodb.2021.06.05.V1或https://cstr.escience.org.cn/CSTR:20146.11.2021.06.05.V1.
1998年,美国、澳大利亚、法国和日本等国的海洋与大气科学家正式提出“实时地转海洋学观测阵”(Array for Real-time Geostrophic Oceanography)计划,即国际Argo计划[1–3],设想用5–7年时间在全球无冰覆盖海域建成一个由3,000个自动剖面浮标组成的观测网,从而快速、大范围收集全球海洋0–2,000 m范围内的温、盐度剖面,以提高气候预报精度,有效防御全球日益严重的气候灾害(如飓风、龙卷风、洪水和干旱等)给人类造成的威胁。该计划的推出,迅速得到了世界主要沿海国家的响应,美国和澳大利亚两国于2000年首先在大西洋、东南太平洋和东印度洋布放了两批自动剖面浮标,标志着全球Argo实时海洋观测网的全面启动实施。至2007年11月,在世界近30个国家的共同努力下,由3,000个剖面浮标(称为“核心Argo”,仅观测海水温度和电导率/盐度)组成的观测网正式建成,并且每年会补充布放800–1,000个浮标来维持该观测网的正常运行。如今,全球Argo实时海洋观测网已成为全球海洋观测系统(GOOS)的重要组成部分,是当前获取全球海洋中、上层水域温、盐度剖面资料最为有效的手段,被喻为“海洋观测的一场革命[4,5]”。
全球Argo实时海洋观测网使用的观测设备为自动剖面浮标,因通常只用于国际Argo计划,所以也有“Argo剖面浮标”之称。Argo浮标利用船只或飞机布放后能通过改变自身浮力方式下潜至1,000 m,在该深度上随海流自由漂移约9 d时间,随后浮标再次下潜1,000 m,即到达2,000 m深度后开始以10 cm/s左右的速度上浮至海面,并在上升过程中通过其携带的电导率-温度-深度(Conductivity-Temperature-Depth,CTD)传感器测量海水的温度、电导率(自动换算成盐度)和压力(在浅层水域104 Pa约等于1 m);当浮标到达海面后,通过安装在顶部的卫星天线获取定位信息并传送观测数据及浮标的技术信息,待全部数据发送完毕,浮标将再次下潜开始下一个循环的测量[2,3,6,7]。国际Argo计划仅用十四年(1999‒2013年)时间就收集到了100万条全球海洋温、盐度剖面数据,至2018年9月,收集的温、盐度剖面达到了200余万条,远远超过过去上百年通过船载CTD、XBT、锚碇浮标等方式获取的数据量。目前,国际Argo计划已开始向深海、极地、边缘海和生物地球化学领域拓展,计划在2025年前建成一个由4,700个浮标(其中“核心Argo”浮标2,500个,“深海Argo”浮标1,200个,“生物地球化学”Argo浮标1,000个)组成的真正意义上全球性、全水深和多学科的综合海洋观测网[8]。
为了保证Argo浮标观测资料的质量,国际Argo计划在实施之初,就着手制定了实时/延时模式质量控制方法,以及统一的数据存储规范和格式,并要求各国Argo资料中心(DACs)遵照执行;还成立了Argo资料管理组(Argo Data Management Team,ADMT),负责对质量控制方法进行完善以及对规范进行修订[9–12]。设在法国和美国的两个全球Argo资料中心(Global Data Assembly Center,GDAC)除了汇总各国提交的Argo资料以外,还对每条温、盐度剖面进行质量检测,一旦发现问题,会向所属国家资料中心发送警告邮件,提醒该国资料中心质量控制操作员对数据重新进行检验。Argo浮标属抛弃式海洋观测仪器设备,布放后通常能在海上连续工作3–5年时间,受海水腐蚀、生物附着及CTD传感器内安装的生物杀灭剂释放等影响,电导率传感器会出现漂移问题,导致电导率/盐度观测剖面存在系统性误差,需要进行校正[14]。为此,ADMT专门组织技术人员开发了浮标观测数据延时模式质量控制方法,利用浮标附近历史高质量船载CTD数据集作为参考,对浮标盐度进行校正[14],通常在浮标布放后6–12个月内进行第一次延时模式质量控制。然而,对全球海洋上的全部剖面数据进行延时模式质量控制,既费时又费力,需要具备专业知识的人员进行判断。同时,由于DACs投入的人力资源不同,导致延时模式质量控制进度不一。为此,GDAC提供的全球海洋Argo数据集仍会存在一些质量问题,需要用户针对各自的用途,在使用前进行质量再控制,以确保获得高质量的Argo资料。中国Argo实时资料中心于2019年开发了一套Argo温、盐度剖面质量再控制方法,完全由计算机自动运行,可快速检测出传感器出现漂移或偏移等问题的剖面数据,基本上可以满足追求高质量Argo资料用户的需求。
《全球海洋Argo温盐度剖面散点数据集》[15]的名称、作者、地理区域、数据年代、数据集组成、数据出版与共享服务平台、数据共享政策等信息见表1。
表1 《全球海洋Argo温盐度剖面散点数据集》元数据简表
条 目 |
描 述 |
数据集名称 |
全球海洋Argo温盐度剖面散点数据集(1997‒2020) |
数据集短名 |
GlobalOceanTemSalinityArgo |
作者信息 |
刘增宏 M-9975-2015, 自然资源部第二海洋研究所,
liuzenghong@139.com 李兆钦 AAJ-4021-2021, 自然资源部第二海洋研究所,
lizhaoqin@sio.org.cn 卢少磊 AAJ-7419-2021, 自然资源部第二海洋研究所,
lsl324004@163.com 吴晓芬 J-2546-2016, 自然资源部第二海洋研究所,
wuxiaofen83@163.com 孙朝辉 AAK-6331-2021, 自然资源部第二海洋研究所,
siosun@163.com 许建平, 自然资源部第二海洋研究所, sioxjp@139.com |
地理区域 |
全球海洋(包括墨西哥湾、日本海、白令海、地中海、南海、红海、黑海等边缘海) |
数据年代 |
1997–2020 |
数据格式 |
.dat |
数据量 |
7.56 GB(压缩后) |
数据集组成 |
全球海洋Argo温盐度剖面数据 |
基金项目 |
中华人民共和国科学技术部(2012FY112300);中央级公益性科研院所基本科研业务费专项资金资助项目(JG1709,JG1812);浙江省自然科学基金/青山湖科技城联合基金(LQY18D060001);国家自然科学基金联合基金(U1811464) |
数据计算环境 |
Linux version 3.10.0-693.el7.x86_64, MATLAB R2018b 64bit |
出版与共享服务平台 |
全球变化科学研究数据出版系统 http://www.geodoi.ac.cn |
地址 |
北京市朝阳区大屯路甲11号100101,中国科学院地理科学与资源研究所 |
数据共享政策 |
全球变化科学研究数据出版系统的“数据”包括元数据(中英文)、通过《全球变化数据仓储电子杂志(中英文)》发表的实体数据集和通过《全球变化数据学报(中英文)》发表的数据论文。其共享政策如下:(1)“数据”以最便利的方式通过互联网系统免费向全社会开放,用户免费浏览、免费下载;(2)最终用户使用“数据”需要按照引用格式在参考文献或适当的位置标注数据来源;(3)增值服务用户或以任何形式散发和传播(包括通过计算机服务器)“数据”的用户需要与《全球变化数据学报(中英文)》编辑部签署书面协议,获得许可;(4)摘取“数据”中的部分记录创作新数据的作者需要遵循10%引用原则,即从本数据集中摘取的数据记录少于新数据集总记录量的10%,同时需要对摘取的数据记录标注数据来源[16] |
数据和论文检索系统 |
DOI, CSTR, Crossref,
DCI, CSCD, CNKI, SciEngine, WDS/ISC, GEOSS |
3.1 数据时空覆盖范围
全球海洋Argo温、盐度剖面散点数据集收集的浮标观测剖面时间范围是1997年7月至2020年12月,空间范围为90°S-90°N,180°W-180°E,包括太平洋、印度洋、大西洋、北冰洋和全球主要边缘海区域,数据覆盖范围和密度如图1所示。
图1 1997–2020年全球海洋Argo温盐度剖面密度分布(1997–2020年剖面数量的对数)
表2 质量控制符说明 |
质量控制符 |
描 述 |
0 |
未经质量控制 |
1 |
好的数据 |
2 |
可能好的数据 |
3 |
可校正的坏数据 |
4 |
坏的数据 |
8 |
插值得到的数据 |
9 |
缺失数据 |
|
3.2 数据的组成
每个Argo温盐度剖面存储为一个数据文件(.dat)。整个数据集由2,244,712个数据文件组成,每一组数据文件包含表头信息和观测数据两部分,其中表头信息包括浮标的世界气象组织(WMO)编号、循环序号、所属项目、负责人(PI)、浮标型号、浮标序列号、通信系统、定位系统、采样方向、数据模式、观测时间和卫星定位等信息,而观测数据包括压强(104 Pa)、校正后的压强(104 Pa)、温度(℃)、校正后的温度(℃)、盐度(PSU)、校正后的盐度(PSU)等要素,以及3个要素的质量控制符(表2)。文件的命名方式为XXXXXXX_NNN.dat,其中XXXXXXX为浮标的WMO编号(唯一识别码),NNN为浮标的循环序号。
全球海洋每个散点的Argo温、盐度剖面数据来源于GDAC,尽管每条剖面数据已按照国际Argo资料管理组制定的方法进行了实时质量控制,且部分数据还经过延时模式质量控制[14],但由于种种原因,其数据质量依然会参差不一。为了进一步提高数据集质量,利用中国Argo实时资料中心建立的质量再控制方法,对每一条剖面数据又进行了一番更加严格的筛选和质量控制,同时还将每一个浮标的温、盐度观测数据绘制图件,进行人工审核,从而整编出一套高质量的全球海洋Argo温、盐度剖面散点数据集[17]。
4.1 质量再控制方法
Argo温、盐度剖面数据质量再控制技术方案包括了ADMT规定的实时质量控制方法和由中国Argo实时资料中心经过长期探索、实践制订的一套专用程序,包含观测时间、定位位置、漂移速度、温盐度异常、密度翻转、压力异常等测试步骤,以及由法国Coriolis资料中心开发的MEDD测试和本中心开发的气候态测试等,共计15个检测步骤。
(1)观测时间检测:当剖面观测时间早于1996年1月1日或者晚于当前日期(处理数据之日)时,应删除该数据文件。
(2)经纬度检测:当剖面的经度不在(‒180,180)和纬度不在(‒90,90)范围之内时,则将位置的质量控制符标记为“4”。
(3)卫星定位检测:通过剖面的定位信息从etopo5全球地形[1]中计算该位置处的地形高度,若地形高度大于0,则将位置的质量控制符标记为“4”,或使用线性插值法获得当前剖面插值后的定位,并将位置质量标记记为“8”。
(4)浮标漂移速度检测:根据当前剖面和前一个剖面的经纬度、时间来检测浮标的漂移速度,若速度大于2 m/s时判定为未通过检测,将位置的质量控制符标记为“4”。
(5)变量的全局范围检测:当压力小于‒2.5´104 Pa时,或温度不在(‒2.5,40.0)范围内或盐度不在(2.00,41.00)范围内时,则将相应的压力、温度、盐度的质量控制符标记为“4”(注意:当压力存在问题时,对应的温度和盐度也应进行标记)。
(6)特定区域检测:当剖面位于红海或地中海内时,其温度和盐度的范围分别为(4.0,21.7)/(10.0,40.0)和(2.00,41.00)/(2.00,41.00),若温度或者盐度不在此范围内,则将其质量控制符标记为“4”。
(7)压力递增检测:若剖面的压力观测值出现不单调增加的情况,则将对应的压力及其邻近的压力均标记为“4”,同时对应的温度和盐度也应标记为“4”。
(8)剖面毛刺检测:检测温度和盐度剖面是否存在毛刺,若存在,则将质量控制符标记为“4”。
(9)剖面梯度检测:根据不同压力范围内温度和盐度相应的梯度阈值进行检测,若计算的梯度大于相应阈值,则将其质量控制符标记为“4”。
(10)MEDD毛刺检测:该方法是由法国Coriolis资料中心的D. Dobler博士在第20次Argo资料管理组会议(2019年,法国滨海自由城)上提出的,并将相关程序脚本分发给了各国资料中心共享应用。MEDD方法根据不同深度设置温度和盐度的变化阈值(见表3),然后得到垂向的滑动中值和数据边界,最后计算观测值与对应深度上中值的距离,并结合密度剖面来检验毛刺。经实际检验,该方法可以有效检测出连续明显的毛刺异常(图2)。
表3
MEDD方法阈值设置表
压力(MPa) |
温度(℃)阈值 |
盐度(PSU)阈值 |
<0.6 |
5.0 |
1.0 |
0.6–1.5 |
3.5 |
1.0 |
1.5–5 |
0.5 |
0.08 |
5–10 |
0.15 |
0.02 |
10–21 |
0.05 |
0.004 |
>21 |
0.004 |
0.000,2 |
图2 MEDD测试示例
(注:3901496号浮标第163号盐度剖面)
(11)数位翻转检测:该问题主要由浮标存储数据(或编码)的位数不够引起,通常会引起相邻层次的数据差别很大。若相邻两个观测层次间的温度差大于10 ℃或者盐度差大5,则将其质量标记记为“4”。
(12)冻结剖面检测:若观测剖面内所有的温度或者盐度都等于同一个值,则将其质量控制符标记为“4”。
(13)密度倒转检测:利用通用的海水(seawater)工具包计算剖面的密度,由浅往深,若当前层密度减去下一层密度大于0.03 kg/m3时,则将这两个层次的温度和盐度均标记为“4”;反之,由深往浅,若当前层密度减去下一层密度小于‒0.03 kg/m3时,则同样将这两个层次的温度和盐度均标记为“4”。
(14)最大压力检测:若压力值大于浮标预设最大观测深度的1.1倍,则将相应的压力、温度和盐度值均标记为“4”。
(15)气候态检测:该检测根据每一条剖面的位置搜索相近的,由法国Coriolis资料中心提供的用于Argo延时模式质量控制的历史CTD数据(或历史Argo数据,图3),并计算不同深度上温盐度的标准差。当浮标的温度或盐度值超出±6.5倍标准差范围时,将其质量标记为“3”(可疑数据),当某条剖面超过33%的数据(温度或盐度)被标记为“3”时,则将整条剖面所有数据标记为“3”。
图3 Argo延时模式质量控制使用的历史CTD数据地理分布
图4给出了2902581号浮标的第93条盐度剖面的气候态检测结果,盐度在463´104 Pa 以深的部分均落在±6.5倍历史CTD标准差的之外,说明该盐度剖面可能存在漂移问题,需要进行延时模式质量控制(盐度校正)或由具备专业知识的人员作进一步判断。
图4 气候态检测示例
(注:灰色虚线表示历史CTD数据,黑色虚线表示由历史CTD资料计算的±6.5倍标准差,黑色实线
表示由历史CTD资料计算的平均值,空心点表示落入±6.5倍标准差内的Argo盐度数据,
实心点表示在±6.5倍标准差范围外的Argo盐度数据)
5.1 数据结果
1997年7月至2020年12月期间,从GDAC共获取温、盐度剖面文件2,373,923个,利用中国Argo实时资料中心建立的质量再控制方法[17],经质量再控制后保留的剖面文件约2,244,712个,约占全部剖面总数的94.5%(图5)。随着各国不断补充布放新的Argo浮标以及浮标工作寿命的增加,2008年开始,该观测网每年获取的温、盐度剖面超过10万条。至2020年底,由约4,000个活跃浮标组成的全球Argo实时海洋观测网,每年至少能获取15万条温、盐度剖面。也就是说,当前全球Argo实时海洋观测网只需不到7年的时间,即可获取100万条温、盐度剖面。
图5 历年(1997‒2020)全球Argo实时海洋观测网提供的温、盐度剖面数量
5.2 数据精度评估
目前,Argo浮标普遍安装了美国海鸟公司(Sea Bird Inc.)生产的SBE41或SBE41CP型CTD传感器,其实验室标定精度为:压力±2.0´104 Pa、温度±0.002 ℃、电导率±0.0003 S/m(相当于盐度±0.0035 PSU),但在实际观测过程中,通常无法达到该精度。特别是Argo浮标属抛弃式观测仪器设备,无法像船载CTD仪、水下滑翔机(underwater glider)那样回收后对CTD传感器再次进行标定。据Wong等人(2020)[12]对10,048个浮标的分析结果,不到10%的浮标在布放2年后需要通过延时模式质量控制进行盐度校正,而当浮标观测280条剖面后,约40%的浮标需要进行盐度校正。当然,国际Argo计划在实施过程中,也出现过批次性压力和电导率传感器技术问题,导致数据出现较大的误差,有些误差甚至无法通过延时模式进行校正,ADMT又通常会将这些浮标列入灰名单,并赋予出现问题的观测要素统一的质量控制符(见表2)。
国际Argo计划早在实施之初就提出了压力±2.4´104 Pa、温度±0.005 ℃和盐度±0.01 PSU的观测精度目标,其中温度传感器相对比较稳定和精确,基本能满足上述精度要求,但压力和盐度要满足上述观测精度要求,则面临较大挑战。为了评估过去二十年全球Argo数据集的观测精度,Wong等人(2020)[12]利用全球海洋船基水文调查项目(GO-SHIP)获取的全球海洋断面调查资料与邻近的Argo盐度剖面进行配对分析,表明经过延时模式质量控制后,全球海洋Argo数据集中的压力和盐度值基本能达到±2.4´104 Pa和±0.01 PSU的目标观测精度;而经过中国Argo实时资料中心利用质量再控制方法制作的全球海洋Argo温、盐度剖面散点数据集,Argo数据的质量得到了更加可靠的保障,用户可以放心使用。
国际Argo计划在世界上近30个国家的共同努力下,已在全球海洋上布放了超过16,000个Argo剖面浮标,至少获取了230万条温盐度剖面,这些数据已在海洋与大气、气候领域的业务化预测预报中得到广泛应用,是当前最为成功的全球海洋观测系统之一。虽然,国际Argo组织制定了较为严格的Argo数据质量控制方法,但由于剖面浮标具有抛弃式特点,携带的CTD传感器又会受到海面油污染、生物附着和电子器件老化等因素影响,导致观测数据出现质量问题,限制了其在基础研究领域的进一步推广应用。
2019年,中国Argo实时资料中心在ADMT规定使用的质量控制方法基础上,结合DACs及其数据质量控制技术人员的实践及其提出的改进技术与方法,研制了一套全球Argo数据快速接入与质量再控制系统,并投入业务运行,可以根据用户需求,定期或者不定期地整编并提供各个时间段的全球海洋Argo温、盐度剖面散点数据集,并可通过网络(ftp://ftp.argo.org.cn/pub/ARGO/global/)免费获取[2]。
本项工作整编的1997‒2020年间全球海洋Argo温、盐度剖面散点数据集,其数据来源于GDAC,但已经过中国Argo实时资料中心更为严格的质量再控制。该质量再控制方法由计算机自动完成,可快速标记出那些未经延时模式质量控制,且电导率传感器存在漂移或偏移的剖面。该数据集的质量明显优于在GDAC网站上公开共享的Argo剖面数据,完全可以满足用户对高质量Argo数据的需求。
作者分工:刘增宏负责系统和算法的具体开发;许建平对数据集的质量再控制和人工审核方法进行指导;李兆钦利用系统采集和整编数据集,并负责人工审核;吴晓芬负责我国Argo观测网内所有Argo浮标观测数据的延时模式质量控制;卢少磊负责数据验证;孙朝辉负责数据集的信息统计。
致谢:感谢来自Liwen
Bianji (Edanz)的 Sev
Kender博士对本文的英文稿编辑润色。
利益冲突声明:本研究不存在研究者以及与公开研究成果有关的利益冲突。
[1]
Argo
Steering Team. On the design and implementation of Argo—an initial plan for the
global array of profiling floats [R]. International CLIVAR Project Office
Report 21, GODAE Report 5, GODAE International Project Office, Melbourne,
Australia, 1998, 32.
[2]
Roemmich,
D. H., Davis, R. E., Riser, S. C., et al.
The Argo project: global ocean observations for understanding and prediction of
climate variability [J]. Oceanography,
2000, 13(2): 45‒50.
[3]
许建平.
阿尔戈全球海洋观测大探秘[M]. 北京: 海洋出版社, 2002: 115.
[4]
Riser, S.
C., Freeland, H. J., Roemmich, D., et al.
Fifteen years of ocean observations with the global Argo array [J]. Nature Climate Change, 2016, 6(2):
145‒153.
[5]
Liu, Z. H.,
Wu, X. F., Xu J. P., et al. China
Argo project: progress in China Argo ocean observations and data applications
[J]. Acta Oceanologica Sinica, 2017,
36(6): 1‒11.
[6]
Oka, E.,
Ando, K. Stability of temperature and conductivity sensors of Argo profiling
floats [J]. Journal of Oceanography,
2004, 60(2): 253‒258.
[7]
刘增宏,
朱伯康, 郭明等. Argo剖面浮标的检测及其施放探讨[J]. 海洋技术, 2002(2): 13‒24.
[8]
Bushinsky,
S. M., Takeshita, Y., Williams, N. L. Observing changes in ocean carbonate
chemistry: our autonomous future [J]. Current
Climate Change Reports, 2019, 5: 207‒220.
[9]
Wong, A.,
Keeley, R., Carval, T., et al. Argo
quality control manual for CTD and trajectory data V3.3 [Z]. 2020.
DOI:10.13155/33951.
[10]
Kobayashi,
T., Minato, S. Importance of reference dataset improvements for Argo
delayed-mode quality control [J]. Journal
of Oceanography, 2005, 61(6): 995‒1009.
[11]
卢少磊,刘增宏,孙朝辉. Argo盐度延时质量控制改进方法的试应用[J]. 解放军理工大学学报(自然科学版),
2016, 17(2): 43‒52.
[12]
Wong, A.,
Wijffels, S. E., Riser, S. C., et al.
Argo data 1999–2019: two million temperature-salinity profiles and subsurface
velocity observations from a global array of profiling floats [J]. Frontiers in Marine Science, 2020, 7:
700. DOI: 10.3389/fmars.2020.00700.
[13]
Owens, W.
B., Wong, A. P. S. An improved calibration method for the drift of the
conductivity sensor on autonomous CTD profiling floats by theta-S climatology
[J]. Deep Sea Research, 2009, 56(3): 450‒457.
[14]
Bohme, L.,
Send, U. Objective analyses of hydrographic data for referencing profiling
float salinities in highly variable environments [J]. Deep Sea Research, 2005, 52(3/4): 651‒664.
[15]
刘增宏, 李兆钦, 卢少磊等. 全球海洋Argo温盐度剖面散点数据集[J/DB/OL]. 全球变化数据仓储电子杂志, 2021. https://doi.org/10.3974/geodb.2021.06.05.V1.
https://cstr.escience.org.cn/CSTR:20146.11.
2021.06.05.V1.
[16]
全球变化科学研究数据出版系统. 全球变化科学研究数据共享政策[OL]. https://doi.org/10.3974/ dp.policy.2014.05 (2017年更新).
[17]
Li, Z. Q., Liu, Z. H., Lu, S. L. Global Argo data fast receiving and
post-quality-control-system [C]. IOP Conference Series: Earth and Environmental
Science, 2020, 502: 012012. DOI: 10.1088/1755-1315/502/ 1/012012.