研究表明,機器學習可以預測災難性事件,如地震或新冠。

研究人員建議,科學家應通過結合先進的機器學習系統和順序采樣技術,避免對大量數據集的需求,以預測極端事件。

研究表明,機器學習可以預測災難性事件,如地震或新冠。

在預測極端事件《比如地震、大流行病或可能摧毀海岸結構的『巨浪』》帶來的災難時,計算建模面臨著一個幾乎無法克服的挑戰:從統計上講,這些事件非常罕見,以至於沒有足夠的數據來使用預測模型準確預測下一次發生的時間。

但佈朗大學和麻省理工學院的一組研究人員表示,不一定要這樣。

在『自然計算科學』《Nature Computational Science》的一項新研究中,科學家們描述了他們如何將統計算法與佈朗大學開發的強大的機器學習技術相結合,並對其進行了訓練,以預測情景、概率,有時甚至預測罕見事件的時間線,盡管缺乏歷史記錄。

研究團隊發現,這一新框架可以提供一種方法來避免傳統上需要大量數據進行此類計算,而不是將預測罕見事件的巨大挑戰歸結為質量而非數量問題。

『你必須意識到這些都是隨機事件,』佈朗大學應用數學和工程教授、研究作者喬治·卡納達基斯說。

『像新冠肺炎這樣的疫情爆發,墨西哥灣的環境災難,地震,加利福尼亞州的巨大野火,30米的海浪翻船,這些都是罕見的事件,因為它們很罕見,我們沒有很多歷史數據。

我們沒有足夠的過去樣本來預測未來。

我們在論文中要解決的問題是:我們可以使用哪些最佳數據來減少所需數據點的數量?』

研究人員在一種叫做主動學習的順序抽樣技術中找到了答案。

這些類型的統計算法不僅能夠分析輸入到其中的數據,而且更重要的是,它們可以從信息中學習,以標記新的相關數據點,這些數據點對正在計算的結果同樣重要,甚至更重要。

在最基本的層面上,他們允許用更少的資源做更多的事情。

這對研究人員在研究中使用的機器學習模型至關重要。

該模型被稱為DeepOnet,是一種人工神經網絡,它使用連續層中的互連節點,大致模擬人腦神經元的連接。

DeepOnet被稱為深度神經算子。

它比典型的人工神經網絡更先進、更強大,因為它實際上是兩個神經網絡合一,在兩個並行網絡中處理數據。

這使得它能夠以極快的速度分析大量的數據和場景,一旦它了解到它在尋找什麼,就可以輸出同樣大量的概率集。

這一強大工具的瓶頸,尤其是與罕見事件相關的工具,是深度神經操作員需要大量數據進行訓練,以進行有效和準確的計算。

在論文中,研究團隊表明,與主動學習技術相結合,DeepOnet模型可以得到訓練,了解哪些參數或前兆會導致某人正在分析的災難性事件,即使數據點不多。

Karniadakis說:『重點不是獲取所有可能的數據並將其放入系統中,而是積極尋找將意味著罕見事件的事件。

我們可能沒有太多真實事件的例子,但我們可能有這些前兆。

通過數學,我們識別出它們,這與真實事件一起將有助於我們訓練這個數據饑渴的操作員』

在這篇論文中,研究人員應用這種方法來精確確定大流行期間危險尖峰的參數和不同概率范圍,發現並預測巨浪,並估計船隻何時會因壓力而開裂。

例如,研究人員發現,對於遊蕩波——其大小是周圍波浪的兩倍——他們可以通過觀察隨時間非線性相互作用的可能波浪條件來發現和量化遊蕩波何時形成,有時會導致波浪的原始大小的三倍。

研究人員發現,他們的新方法勝過了傳統的建模方法,他們相信這提供了一個可以有效發現和預測各種罕見事件的框架。

在這篇論文中,研究團隊概述了科學家應該如何設計未來的實驗,以使成本最小化並提高預測精度。

例如,Karniadakis已經與環境科學家合作,使用這種新方法來預測氣候事件,如颶風。