一、借尸,同化軀體的誕生
同化,一個并不是很起眼的名字,近十年來,不知為什么竟然越來越吸引人們的眼球。 也正因為如此,同化也在世人面前變得神秘起來。同化,你到底是誰?你還是我們以前的 插值嗎?你還是我們經(jīng)常關(guān)心的初值問題嗎?
記得大概50年前,為了把觀測插值到模式格點上,作為模式積分的初值,產(chǎn)生一個叫主 觀分析的名詞。后來,把人工插值變?yōu)橛嬎銠C插值,就改名叫客觀分析。再后來,發(fā)現(xiàn)單 純觀測的插值不能解決模式的初值問題,又把背景場引進來。多少年來,氣象領(lǐng)域的大部 分人都是圍繞著如何更好的把觀測更好“插到”格點上,如何更好的產(chǎn)生更好的初值(為 此,又誕生了一個初始化)的問題來思考相關(guān)問題。
客觀分析主流方法發(fā)展經(jīng)歷了以下幾個階段:
(1)多項式擬合。該方法于1949年由Panofsky提出,它是用一個多項式展開去擬合包含 數(shù)個分析格點的一小塊分析區(qū)域中的所有觀測點。展開系數(shù)用最小二乘擬合確定??陀^分 析的平滑度 可由展開系數(shù)的個數(shù)控制,根據(jù)假定的精度加權(quán)觀測。多項式擬合開創(chuàng)了客觀 分析的新紀元。
(2)逐步訂正法。這種方法的原理是不直接分析觀測,從每個觀測中減去背景場得到觀 測增量,通過分析觀測增量得到分析增量,然后將分析增量加到背景場得到最終分析。每 個分析格點上的分析增量通過其周圍影響區(qū)域內(nèi)觀測增量的線性組合而加權(quán),觀測權(quán)重與 觀測位置和格點之間的距離成反比。Cressman于1959年在這種方法的基礎(chǔ)上采用的迭代求 解方法,形成了逐步訂正法。逐步訂正法引入了背景場的概念,解決了多項式擬合在資料 稀少地區(qū)的“不連續(xù)”問題。
(3)最優(yōu)插值。這是一種從統(tǒng)計意義上來說均方差最小的線性插值方法。最優(yōu)插值比逐 步訂正法最大的改進就是權(quán)重考慮了誤差和相關(guān)函數(shù),即包含了觀測、預(yù)報和分析之間的 一切關(guān)系。80年代開始,它在世界上得到了廣泛應(yīng)用,成為業(yè)務(wù)用的最多的一種同化方法 。
(4)變分方法。這種方法利用了變分原理,使得包括預(yù)報場和所有的觀測資料進行全局 調(diào)整,從而也使分析場達到統(tǒng)計意義上的最優(yōu)。在變分方法中,觀測算子可以是非線性的 ,從而使得直接同化非常規(guī)資料變?yōu)榭赡?。同時,它可以全局調(diào)整,克服了最優(yōu)插值在實 際應(yīng)用中的“資料選擇”問題。變分方法90年代開始在少數(shù)國家實現(xiàn)了業(yè)務(wù)化,并且成為 了目前客觀分析方法的一個發(fā)展主流。
但是,在國外,不知道是誰第一個把這些工作賦予了一個“assimilation”名字, 國內(nèi) 也不知道是誰首先把這個名詞翻譯成“同化”。這個名詞也不知道到底是從其它學科引進 還是某個人茶余飯后的一句“戲言”。但是不管怎么樣,同化這個名詞產(chǎn)生后,宛如人猿 直到從直立行走那天開始,就把雙手解放出來,才真正的從一般動物脫離,獲得“新生” ,真正地成為“人”。
可是上帝似乎是先賦予了同化一個“空殼”,而遲遲不予以其靈魂。以致世人一直把其 看作客觀分析和初始化的結(jié)合物,甚至看成一種插值方法。結(jié)果,同化誕生后,很長時間 搞不清自己是誰。正如一個人從誕生開始,就生活在猴子群里,發(fā)現(xiàn)自己和猴子實在是太 象了,就把自己看成不長毛的猴子。
上帝終于發(fā)現(xiàn)了自己的疏漏,于是一部分人開始肩負著上帝賦予神圣使命,開始給同化 注入新的生命。
二、出發(fā),尋找同化靈魂的棲息地
有人說,同化已經(jīng)成為一門新興學科,甚至有人說同化已經(jīng)成為一門科學。不管怎么樣 ,一種方法或理論,要稱的上一門學科或科學,首先必須是可以用數(shù)學語言予以精確的描 述,即完備性;其次,它必須能滿足人們廣泛的需要,即廣泛性。 當初,氣象上的同化確實是借助客觀分析和初始化的軀體誕生的。在幾十年的時間里面, 絕大部分的人一直把它當作處理初值問題的一個重要方法來看待。但是,同化僅僅就是客 觀分析和初始化的結(jié)合體嗎?不,一部分人開始喚醒沉睡在觀分析和初始化的軀體里幾十 年的同化的靈魂。
那么,同化的靈魂到底是什么?諸君莫急,先砌杯茶,回顧一下科學史上兩位重要的人 物及其兩個重要的思想觀念。
牛頓,這位創(chuàng)造了經(jīng)典力學的偉大科學家,自從牛頓三大定律誕生以來,人們發(fā)現(xiàn),自 然界不再是神秘的捉摸不透的東西,紛紛鼓起勇氣向自然界進軍。之后物理學、數(shù)學和化 學這些基礎(chǔ)學科得到了長足發(fā)展,相應(yīng)的應(yīng)用學科也是煥然一新。人類的科學到達了一個 前所未有的高度。借助相應(yīng)的物理和數(shù)學工具,以天氣學和動力氣象為兩根支柱,近代氣 象學的大廈也建立起來。
但是,所謂物極必反,在輝煌的科學成就面前,人們開始狂妄起來,思想觀念開始走向 一個極端——決定論。拉普拉斯說過“知道了絕對準確的方程和絕對準確的初值,就知道 了未來的全部演化”。無獨有偶,近代氣象學的鼻祖——皮葉克尼斯也說過“根據(jù)某一時 刻實測大氣狀態(tài)和運動,通過描述大氣運動規(guī)律的微分方程,來計算將來某一時刻的相應(yīng) 大氣狀態(tài)和運動。從原則上說,大氣的未來的狀態(tài)完全由大氣的初始狀態(tài)和邊界條件決定 ”。人們在這些思想下,拼命地去尋找并企圖建立一個“絕對準確的方程”(模式)和“ 絕對準確的初值”。
這種長達三百年的連愛因斯坦都沒打破的決定論觀念,在二十世紀最后二十余年里,竟 被一篇沉睡了十年的文章予以致命的一擊——洛倫茲的“決定性的非周期流”。洛倫茲的 奇怪吸引子讓人看到,隨機性在自然界扮演著和決定性同樣重要的角色。人們不但要去認 識具有必然性的規(guī)律,還要去認識具有偶然性的規(guī)律。一時間,混沌、蝴蝶效應(yīng)、可預(yù)報 性、集合預(yù)報等等,相應(yīng)名詞和概念蜂擁而起。決定性中而不確定性開始被人接受。
而同化,這個早早就誕生于二十世紀五十年代的客觀分析里的概念,沒人覺得和幾十年 后才時髦起來的“混沌”等這些名詞有什么聯(lián)系。人們一直把同化當作為模式產(chǎn)生盡可能 的精確的初值的一個工具看待??墒牵陀^分析和初始化僅僅是同化的一個軀體,其靈魂 卻一直棲息在軀體以外和混沌等概念有著密切聯(lián)系的一個地方——基于隨機動力學的估計 理論。它苦苦地等待著人們的喚醒。
三、喚醒,同化的靈魂
基于隨機動力學的估計理論(以下簡稱估計理論),這個聽起來似乎不是那么耳熟 , 但是,它的根源——概率論恐怕大家是最熟悉不過。但是,它又不完全等價于概率論,就 像概率論不等同于數(shù)學一樣。1969年,Epstein. E. S. Tellus.發(fā)表的“Stochastic dyn amic prediction”時已經(jīng)初具雛形。任何理論和技術(shù)都是根據(jù)需要而產(chǎn)生的,那么這種估 計理論是為了滿足什么需要而產(chǎn)生的呢。
大家知道,為了對現(xiàn)實中的現(xiàn)象描述,科學家們都會根據(jù)相應(yīng)的物理規(guī)律,建立起相應(yīng) 的數(shù)學模型。然后進行相應(yīng)的輸入(輸入可以是實際觀測的,也可以是人為的“控制”資 料),通過模型運算后,然后對輸出分析,從而對其物理現(xiàn)象進一步研究。這是現(xiàn)今最常 見的科學研究方法之一。那么有一個輸入,通過模式的運算,就有一個相應(yīng)得輸出,似乎 是屬于牛頓力學的決定論的范疇。但是,在實際的工作中,我們會發(fā)現(xiàn),這種方法其實是 充滿著不確定性的,因為:1)對于實測資料的輸入而言,也是有很多不確定性的。這個也 就是我們同化中經(jīng)常提到的儀器誤差和代表性誤差。 2)從計算數(shù)學的角度來看,模式在 運算求解的過程中,會引入計算上的不確定性。也就是我們常說的計算誤差和截斷誤差。 3)我們所建立的模型是不完美的。我們所建立的模型只能說是對現(xiàn)實情況的一個近似。雖 然有時候,我們的模式是一個很好的近似,比如牛頓第二定律對低速運動的描述。但是, 很多時候我們模式所不能很好地描述部分卻對我們所關(guān)心現(xiàn)象有著很大的影響,比如在氣 候模式中的非絕熱項。
所以,企圖從決定論方面來描述我們的現(xiàn)實生活中的現(xiàn)象是行不通的。我們需要根據(jù)一 種新的理論來建立模型。這種理論不但可以考慮物理規(guī)律,而且要考慮其不確定性,從某 種最優(yōu)的意義上最大地除去其噪音(即不確定性或者誤差)提取信號。不但要對輸出值進 行分析,還要對輸出值的質(zhì)量進行分析,這種理論就是估計理論。 這種估計理論首先承認了系統(tǒng)本身的決定性,承認物理規(guī)律,認為系統(tǒng)是由一定的物理規(guī) 律來決定其基本的時空狀態(tài),而引入這個決定性的規(guī)律就是我們的模式。
同時,估計理論 還以前所未有的高度來對待系統(tǒng)的隨機性,認為不可能具有完全決定性的系統(tǒng),在一定范 圍內(nèi)又呈現(xiàn)隨機性。就像吸引子一樣,所有的解最終會跑到吸引子里,但是吸引子內(nèi)又表 現(xiàn)為完全隨機的。
理論要滿足人們的需要,必須通過一定具體形式來表現(xiàn)。氣象上,有兩顆新星正閃耀著 估計理論的光芒——集合預(yù)報和資料同化。集合預(yù)報就是從在一定誤差范圍內(nèi)的一組初值 出發(fā),這組初值代表了初始時刻的大氣狀態(tài)的概率分布,然后用模式去預(yù)報,得到一個預(yù) 報值的集合,即未來某時刻的大氣狀態(tài)的概論分布。而同化就是利用一切有用信息,盡可 能準確地估計出某一時刻的大氣出現(xiàn)的概論分布。
應(yīng)該說,集合預(yù)報和資料同化其實是一個問題的兩個方面。它們都是在給定觀測和預(yù)報 模式的情況下,去描述大氣狀態(tài)的概論分布及其發(fā)展。它們都有一個共同的理論基礎(chǔ)—— 估計理論。
前面說過,氣象里的同化是借客觀分析和初始化的軀體誕生的。所以,它最初被認為一 種插值方法,后來有被認為是對大氣狀態(tài)的一個最優(yōu)估計。其實,人們從最優(yōu)估計的理論 上來理解同化時,同化的靈魂已經(jīng)開始喚醒,但是,還沒有完全醒來。因為,從估計理論 上來講,最優(yōu)不過是概率分布中概率密度最大的地方。但是,現(xiàn)在人們知道,小概率事件 不一定是不發(fā)生。何況,如果概率分布是一個雙峰狀態(tài)時,假如另一峰僅僅比主峰低一點 ,我們的僅僅去求“最優(yōu)”時,其實漏了一個很重要的可能出現(xiàn)的狀態(tài)。 那么,要完全體現(xiàn)估計理論,使得同化的靈魂完全復(fù)蘇,同化需要一個新的軀體——基于 集合的同化。
四、新生,基于集合的同化
如果說起基于集合的同化,大家可能還不大習慣,但是說起集合Kalman 濾波的話,可 能就覺得很熟悉了。記得一兩年前,國內(nèi)在談同化的時候,言必出變分,某種意義來講, 變分幾乎壟斷了人們對同化的思考。其實,這和國際大環(huán)境有關(guān)系。九十年代中后期,以 ECMWF為主的“歐派”開始實現(xiàn)四維變分同化的業(yè)務(wù)化,令世人垂涎不已,此外,以NCAR為 首的“美派”,由我們很熟悉的華人ZOU等通過開發(fā)的MM5的伴隨模式,造就了國內(nèi)最為熟 悉的中尺度模式MM5的四維變分同化系統(tǒng)。一時間,變分、伴隨無不成了同化的代名詞。
但是,最近,一個叫集合Kalman 濾波的東西居然能在變分統(tǒng)治的同化世界里能割出一 小塊領(lǐng)地來,并有大舉擴張的趨勢。表面上來看,變分是給集合Kalman 濾波用一把叫“f low dependent”的刀子在軟肋上狠狠的捅了一刀,而且變分的最引以為豪的伴隨之劍,在 集合Kalman 濾波面前居然毫無用武之地。正所謂沒有一個統(tǒng)治者甘心退出歷史舞臺,為了 保住江山,變分也開始用集合以及減秩等方法鑄造“flow dependent” 之劍。 他們到底誰勝誰負我們暫且不去討論,但是,經(jīng)過集合Kalman 濾波這么一反抗,竟然 把集合的概念活生生地帶到了同化里面。于是,人們開始用集合的概念來思考同化的問題 。
前面說過,估計理論是同化的理論基礎(chǔ)。但是,人們并不是從一開始就從估計理論去認 識同化的。最初把它看出是個插值問題,后來又從最小方差和極大似然估計去理解同化, 即把它看成一個發(fā)生概率最大的最優(yōu)問題。把同化里面的值看成概率密度函數(shù)然后求概率 最大,已經(jīng)是把同化的靈魂喚醒了。但是,這并不是它的靈魂——估計理論的全部,因為 估計理論要求我們不能僅僅估計概率密度最大的地方,而是估計整個的概率分布。人們通 常會把同化理解成一種盡可能使估計值接近真值的一種方法。這種認識其實是很有局限性 的。在估計理論里面,所謂的絕對真值(在估計理論里,這不過是一個發(fā)生概率為百分百 的事件)并沒有太大意義,因為假如百分百發(fā)生的事件(也就是概率分布為一個點)就無 需去估計。估計理論的對象恰恰不是百分百發(fā)生的事件,也就是認為它估計的事件具有一 定的不確定性,但統(tǒng)計上又具有一定的規(guī)律,也就是具有一個概率分布。
那么同化的任務(wù)就應(yīng)該是要去估計一個事件的概率分布,而不是僅僅是一個最優(yōu)。那么 概率分布是通過什么描述的呢?概率論上說的很清楚,它是用隨機變量來描述的,但是隨 機變量還是一個精確又抽象的數(shù)學名詞,實際應(yīng)用中,是通過樣本來描述的。集合,就是 我們氣象在概率上的“樣本”代名詞。也就是說,只有基于集合的同化,才能完成估計理 論賦予的神圣使命。
五、比較,集合同化VS非集合同化
我們一般所說的基于最優(yōu)的同化,其實都是非集合同化,而非集合同化其實僅僅是 集 合同化的一個特例,既然是特例,就有它的局限性。那么下面我們通過考查同化的具體方 法,僅從估計理論的角度(不考慮技術(shù)及其它問題)來說明這個局限性。
目前,非集合的同化形式比較好的是Kalman濾波和變分。但是,它們得到的分析值僅僅 是一個概率最大的狀態(tài)。而這個“大”的程度,在Kalman濾波里面是用分析誤差來衡量的 。換而言之,如果分析誤差為零,最大概率就是百分百。而分析誤差越大,這個概率最大 的“絕對值”就越少,也就是可信度越差。這個時候,那些概率次大的狀態(tài)就顯得很有參 考價值,如果假設(shè)概率分布是正態(tài)分布的話,這時分布曲線就越平且接近X軸,那么遠離最 優(yōu)的其它狀態(tài)可能具有和“最優(yōu)”幾乎相同的概率,只是不是“最優(yōu)”罷了。可惜所有的 非集合同化方法這時就無法提供概率最大以外的狀態(tài),它永遠只有一個最優(yōu)狀態(tài)。
如果說Kalman濾波里盡管不能提供最優(yōu)以外的狀態(tài),但是它還能通過一個分析誤差的尺 子來衡量概率最大的“絕對值”的大小的話,那么可憐的變分連這把尺子都不能提供。當 然,由于技術(shù)上實現(xiàn)原因,傳統(tǒng)的Kalman濾波變成了非集合同化里面的一朵“水中花”。
此外,在變分里面,整個誤差協(xié)方差是靜態(tài)的,而靜態(tài)的統(tǒng)計樣本取自時間序列。那么 ,這就意味著它的最優(yōu)只是在整個時間序列里面的統(tǒng)計最優(yōu)。也就是說,如果樣本是取一 個季度的話,那么只能說整個季的同化綜合結(jié)果是最優(yōu)的,對于某天或著某個天氣過程, 并無最優(yōu)可言。只有你的統(tǒng)計樣本取自特定時刻可能出現(xiàn)的狀態(tài),同化出來的結(jié)果才能說 是真正的最優(yōu)。這樣的樣本只能是“集合”。
值得一提的是,在這里提的基于集合的同化不是要否定變分、否定Kalman濾波。只是提 出要從集合的觀點、從估計理論的觀點去看待同化?;诩系耐蛡鹘y(tǒng)的同化方法并 不是完全對立的。目前國際上也開始出現(xiàn)基于集合的三維變分和四維變分。
目前,幾乎所有的同化形式都可以從條件概率的貝葉斯公式推導出來。如果用集合來表 示貝葉斯公式里面的概率分布,而且假設(shè)概率密度函數(shù)是高斯型的話,那么這些基于集合 的同化形式都可以歸結(jié)為廣義的集合Kalman濾波。由于高斯型的概率密度函數(shù)的假設(shè)會在 同化中帶來極大的方便,同時這個假設(shè)又有較好的合理性,所以,到目前為止,幾乎所有 的基于集合的同化形式都屬于廣義的集合Kalman濾波。
可以說,基于集合的同化已經(jīng)是同化發(fā)展的一個趨勢。但是,目前國際上對基于集合的 同化的研究主要側(cè)重于用集合技術(shù)來解決同化的存在的一些問題,但尚未對集合預(yù)報和同 化的統(tǒng)一進行系統(tǒng)的理論研究。如果我們國家能不失時機的抓住機遇,在這方面加大投入 和研究,必然能實現(xiàn)同化理論上的創(chuàng)新和同化技術(shù)上的跨越式發(fā)展。(完)