最近幾天,河南水災牽動了全國人民的心。據說,這種降雨量是千年一遇、五千年一遇。于是有人奇怪:百年一遇的災難怎么年年有?對此,網上出現了一些解釋。但在我看來,有些解釋是不準確的。于是,我也想從數據分析師的角度來說幾句。
首先,發生災情的“百年一遇”、“千年一遇”,針對的是特定的地方;人們聽到的“百年一遇”、“千年一遇”,則是全國甚至全球的范圍內的。比如,這次的河南受災面積約5、6萬平方公里。即便全部都達到“千年一遇”水平,但考慮到我國的總面積是960萬平方公里,這樣的“千年一遇”也會隔幾年發生一次。如果災情發生在偏遠的地方、如果影響面積還要小,人們可能就注意不到了。反之,如果發生在北京、上海,全世界都會知道了。
其次,“百年一遇”、“千年一遇”是統計概率算出來的。計算概率就要給出假設。比如,某個地方的降雨服從正態分布。假如某個地方平均年降雨600mm、標準差200mm。這種情況下,年降雨量1200mm大約就是500年一遇了。但概率假設是對的嗎?參數是多長時間內求出來的?在這么長的周期內參數會變嗎? 所以,我嚴重懷疑參數假設的合理性。特別是:地球變暖以后,這些參數都可能會發生變化。如果,現在的參數是:平均年降雨量達到800mm、標準差400mm。那么,年降雨1200mm就變成了5、6年一遇了。
很多人意識到了前面這個原因,卻沒有談到后面這個原因。要研究透這個問題,涉及到很多問題,有價值也有難度。有時間、有興趣、有條件的人,可以研究一下。
作者:郭朝暉(工學博士,教授級高工。企業研發一線工作20年;優也科技信息公司首席科學家;東北大學、上海交大等多所院校兼職教授。國內知名智庫、走向智能研究院的發起人之一。原寶鋼研究院首席研究員)