精细化预报背景下自动气象站数据质量控制后的再分析与利用开题报告
2021-12-14 21:55:52
1. 研究目的与意义及国内外研究现状
风能作为一种可再生的清洁能源,具有装机规模灵活、风电发电机组可靠性高、造价低、运行维护简单等优点。物理方法和统计方法是现今风电厂的风速预报的常用方法,物理方法根据风电场风机运行实际情况,综合考虑各种等级发电影响因素,建立出力预测物理模型,进行风电场出力预测。物理方法要求要有准确的数学来描述大气的物理特性和风电场的特性,这些方程求解困难,所需资料海量计算量大、计算时间长、并且从气象部门获取资料的难度大、费用高。因此,在短期风电场风速预报中,仍常用统计方法。目前,统计方法大多根据风电场测风塔的历史资料,采用持续法、随机时间序列法、卡尔曼滤波法、神经网络法、支持向量机等方法。仅仅依靠测风塔数据进行预报的最大缺点在于风电场受地形、紊流等影响,风电机处机舱的风速与测风塔处风速可能存在明显的差异,因此仅以测风塔的测量风速预报整个风电场的出力,必将导致较大的预报误差,这个与具体的预报方法无关。随着测量技术和计算机计算能力的提高,精细化的对单台发电机机舱的风速进行预报成为可能。
国内外研究现状
系统开发上,随着观测自动化技术的发展,西方发达国家纷纷研制了自动观测资料质量控制系统[4-12]。北欧5国对自动站资料控制流程分4级:台站级资料质量控制、入库前实时资料质量控制、入库后非实时资料质量控制以及人工质量控制。美国是由1100多个观测站组成的地面自动观测系统,在业务运行中,通过对资料进行台站级、州级、国家级三级质量控制,及时发现并反馈观测资料的质量问题,保证资料的准确性。 我国从2004年开始,研制由台站级、到省级、国家级资料部门的地面自动站观测资料三级质量控制业务系统,各级质量控制系统融合了自动控制技术和交互式应用技术,允许在必要时对疑误资料进行详细的人工分析、判断与修正,在此框架下各地积极探索适合本地的质量控制技术[13-24]。三级质量控制业务系统以业务观测的常规资料的采集传输流程为依据,包括台站级、省级和国家级。台站级质量控制是指:台站对自动站实时采集数据、数据文件及年报文件,利用台站级质量控制软件进行质量检查和预审,认为合格后上报到省级资料处理部门;省级质量控制是指:在每月规定时间内,收集本省范围内台站上传的数据文件,利用省级质量控制软件对其进行质量检查和人机交互审核,同时向台站反馈审核信息,经复查合格后,按要求上报至国家气象信息中心;国家级质量控制是指:在每月规定时段内,收集各省上传来的数据文件,利用国家级质量控制软件对其进行滚动格式检查和质量检查,利用人机交互界面进行数据检查处理,同时向各省反馈最终质量控制信息,确认合格后,归档存储到国家气象信息中心气象资料室[13]。三级质量控制业务系统中,质量控制为整个系统的核心,质量控制技术包括格式检查、界限值或要素允许值检查、台站气候极值检查、内部一致性检查、时间一致性检查、空间一致性检查[13,15]。界限值检查分为:气候界限值、区域界限值以及台站界限值检查等;时间一致性是指气象要素值不能超出一定时间内的变化范围,如:分钟变化率、小时变化率、日变化率、月变化率等;内部一致性检查是气象要素间是否符合一定的规律,通过一个变量的值来判定另一个变量的值是否可信。空间一致性的检查根据气象要素的空间分布规律,将某个站的据与相邻近的站点数据值进行比较,空间一致性检查对应的方法有:madsen-allerupt方法[4]、空间回归检验法[25]等。 在研究方法上,不同的质量控制技术对应多种质量控制方法,不同的质量控制方法是质量控制技术中的重要部分,根据分析的对象和研究目的提出了不同的质量控制方法[14-28]。 气象资料是庞大的多变量集合,地面气象要素有:气温、最高气温、最低气温、露点温度、相对湿度、风向、风速、能见度、现在天气、总云量、低云量共11项,各项之间存在着密切的关系,并满足一定的物理规律。在气象资料的质量控制中,根据气象资料组织方式的不同可以分为两种:多要素气象综合资料的质量控制和单要素气象资料质量控制。多要素气象综合资料的质量控制是以气象要素自身的变化规律和各气象要素间相互联系的规律为依据,质量控制方法除了对要素气候学界限值的检验和极值检验外,在内部一致性检验、时间和空间一致性检验过程中要考虑要素之间的关系,以及他们所满足的物理规律[26,27]。 除了质量控制的传统方法,黄颖[28]等根据自动气象站测量序列在不同时段、不同尺度条件下的不同特性,基于混沌理论、gis技术以及雷达测量动态数据处理等方法,对不同时间尺度条件下的观测序列提出了自动气象站观测数据质量控制方法。 数据进行了质量控制后,每个观测数据都给出表示该数据质量状况的标识,这些标识为数据质量信息,数据质量信息包质量控制码信息和数据更正信息。质量控制码用三位整数表示,个位表示国家级,十位表示省级,百位表示台站级,各级质量控制码含义为:0:数据正确;1:数据可疑;2:数据错误;3:数据有订正值;4:数据已修改;8:数据缺测;9:数据未作质量控制。 从对观测资料进行质量控制到资料在气象业务、科研、服务工作中,还需要经过对可疑数据、错误数据、无观测数据、甚至部分未作质量控制的数据进行合理的订正和处理,同时针对不同应用目的,仍需要对资料进行进一步处理。目前在对自动气象站资料使用过程中,很多作者把错误或者可疑的数据进行了剔除,对缺测率高的站点也简单的进行了剔除,这在某种程度上消弱了数据的代表性,可能丢失一些重要的大气运动信息。 高精度、高分辨率的自动气象站逐时观测数据在中尺度、短时效事件的预报、以及机理探讨方面越来越发挥重要作用,张劲梅[29]等利用自动站资料、卫星云图和雷达产品,对广东一次连日暴雨进行了实况分析,给出数值预报模式对该次暴雨精细化预报偏差的原因。高精度、高分辨率的自动气象站逐时观测数据对于越来越频繁的极端天气事件、区域气候分析、预报以及对预报结果的验证方面也有着重要的作用,窦晶晶[30]利用北京城区高密度自动站逐时观测数据,分析了北京城区近地面气象要素时空精细分布特征,指出城市化对北京近地面气象要素的显著影响,因此,在高密度自动站资料为局地性天气、气候分析提供了一个重要前提。
2. 研究的基本内容
1. 本设采用的基于粒子群算法的自适应神经网络模糊系统所涉及的自适应神经网络模糊推理系统的基本原理与结构概念、粒子群算法的历史来源和思想、现今使用的标准的粒子群算法的结构。2.所使用的两种算法的流程,对自适应神经网络模糊系统使用粒子群算法进行优化的原理及算法过程。3.所提到的PSO优化ANFIS代码过程中所涉及到的相关功能函数的流程及作用,对比分析PSO-ANFIS与BP神经网络和ANFIS案例实验。4.填充风电场风电机做风速数据,在已知动态时间规整法(DTW)和Pearson相关系数法(PCC)的基础上,分别搜寻出与缺损测量风速风电机风速演化最为相似的两个台风电机及对应的测量风速时序,使用粒子群算法优化的自适应神经网络模糊系统模型搜索最佳参数,填充后50组数据。
3. 实施方案、进度安排及预期效果
2015年12月-2016年1月搜集相关文献,借鉴以往经验对气象站数据的处理确定初步的算法, 构思整体算法2016年1月-2016年2月了解使用matlab中anfis工具箱,对输入参数进行处理,使用自适应神经模糊推理系统设计的anfis和genfis1函数进行初步的模糊训练2016年2月-2015年3月对初始初始隶属度函数个数和类型、训练次数使用粒子群算法优化,编写pso-anfis模型代码,测试运行。
2015年3月-2015年4月对比anfis、bp神经网络算例填充数据,以均方根误差为依据提高pso-anfis精度。
2015年4月-2015年5月应用pso-anfis模型填充风电机风速缺损数据,并和anfis填充数据进行均方差对比分析。
4. 参考文献
[1] 赵声蓉,赵翠光. 赵瑞霞等我国精细化客观气象要素预报进展[j].气象科技进展,2012,2(5):12-21.
[2] 丁建军,罗兵,赵光平. 精细化预报订正平台设计[j].气象,2008,34(11):89-95.
[3] 李朝兴,吴蓁,李周,等. 2008年汛期国家精细化温度指导预报在河南区域的检验[j].气象与环境科,2009,32(2):21-25.