天气预报预警怎么排?
这个问题好像有点久远了,但没关系,最近我刚好在研究这个,所以来分享我的想法。 首先需要明确一点,目前所有的计算机预测模型(包括机器学习、神经网络等)的输出结果都是概率,也就是说即使同样的输入数据,不同的模型可能也会有不一样的输出概率。而我们的预警系统最终还是要基于这样的概率结果来做判断,因此如何有效利用这些概率结果就是需要深入探讨的问题了。
1.忽略小概率事件 对于一个城市的天气状况而言,一天有30次预报机会,也就是会有60次的概率输出。如果设置警报阀值为0.8,即当连续两次输出的概率值都大于等于0.8的时候发出警报,那么就会只有15次报警的机会(60*0.8=48,48/2=24,24%2=12...以此类推,每次报警都要减去之前已经使用的次数)。对于大部分城市这种算法都不会有什么问题,但对于那些极端天气多发城市,例如哈尔滨,这种简单的方法就可能会带来很多无用或错误的警报。为了应对这种情况,可以加入对特定地区特性的加权分析,例如可以将该地区的年极端气温值作为特征加入到分析中。而对于某些特殊的情况,如台风登陆前的一两天内,由于海洋温压场异常可能会导致出现极小概率的极端气温情况,单纯依靠概率模型是无法有效处理的,这时候可以利用其他的方法来解决,例如利用历史同期数据构造参考样本,通过对比测试寻找最佳阈值。
2.考虑多种因素的关联性 前面所说的每种因素都是单独考虑的,但实际上天气变化是一种复杂的关联现象。例如前一天温度偏高,第二天可能会有高温的出现;前一天有光照,第二天也可能有高温;前几天有阴雨,后几天也可能会有高温。因此可以考虑将一些相关性很高的因素集成起来构建一个综合指标,再通过这个指标来计算风险值并进而做预警。这里面需要深入研究的就是多因素影响下的概率计算,以及不同特征间相关性分析。