網站首頁 文學常識 簡歷 公文文書 文學名著 實用文 人生哲理 作文 熱點話題作文
當前位置:文萃咖 > 實用範文 > 論文

大數據時代對地觀測衞星的發展現狀與趨勢論文

欄目: 論文 / 發佈於: / 人氣:8.29K

一、前言

對地觀測是人類利用衞星、飛船、航天飛機、飛機以及近空間飛行器等空間平台和地面、地下的各種傳感器設備獲取觀測數據,結合各個學科的專業知識,對地面物體和地理過程進行監測和預測的科學活動,其目的是更加深刻和科學地揭示人類社會活動所依賴的地球環境和人地環境的規律和變化,增強人類對地球的利用和適應能力。對地觀測研究工作具有非常明顯的信息學特徵。因此,除了地球科學方法論外,信息科學方法論也對對地觀測科學活動有非常重要的指導意義。對地觀測研究很大程度上是圍繞着“信號—數據—信息—知識”的數字化信息過程來展開的,並構成了“信息獲取—信息傳輸—信息存儲—信息加工—信息挖掘—信息呈現”的數據全生命週期。

從信息科學的角度來看,對地觀測領域知識發現的方法主要是確定模型分析方法。在遙感技術的發展初期,觀測數據量較小,用於數據挖掘分析的理論和模型也不夠成熟,因此更多是依靠專業人員的目視判讀進行信息解譯和勾繪製圖,然後再利用其他學科的知識對獲得的信息進行修正。這種方法顯然不能滿足日益增大的觀測數據量和日益複雜的應用模式需求。在數據量不斷增大、信息提取精度不斷提高的情況下,依賴於計算機處理的數據分析新模式出現了。遙感信息反演的定量化成為對地觀測信息深度應用的趨勢,這種能力也隨着計算機處理能力的提升不斷提高,逐步滿足了 MB(220 字節)、GB(230 字節)、TB(240字節)甚至部分 PB(250 字節)量級的數據分析和信息挖掘工作,從應用上解決了較大地理尺度上的複雜地學問題。提升計算機的處理速度和存儲設備的規模已經成為解決觀測數據量增大和信息模型複雜化所帶來的問題的一個很好的途徑。進入 21 世紀以後,對地觀測技術又呈現出很多新的發展趨勢,其中大數據的出現給對地觀測的研究帶來了全新的挑戰和發展機遇。近年來,隨着對地觀測需求的增加和技術的進步,各種類型傳感器獲取數據的能力不斷提高,使得國內外以專業化、行業化為特徵的各類數據中心迅速崛起,對地觀測領域成為數據密集型計算的一個典型應用。整個對地觀測系統流程突出體現了“需求牽引—知識驅動”的概念和原則,形成了以社會需求為先導來發展對地觀測衞星、傳感器、平台、數據傳輸、信息處理、應用模型及相應科學理論的發展模式。

二、對地觀測領域的大數據現象

在對地觀測領域,各類分辨率的衞星產生的遙感信息無疑屬於大數據。以我國遙感衞星為例,2008 年發射的風雲三號 A 星搭載着 20 通道的中分辨率光譜成像儀和 10 通道的可見光近紅外掃描輻射計,實現了對整個地球進行連續觀測,隨後與 2010 年和 2013 年發射的風雲三號 B 星和 C 星組網,對地球開展每天 6 次的觀測。衞星觀測數據切割成 5 分鐘段的數據文件,又將 250m 和 1000m 中分辨率光譜成像儀的數據分別存放,每天產生的數據文件和數據量均非常巨大。要管理、處理和分發這些全球數據需要運用“大數據”的方式,而且需要大量的數據科學家開展基礎研究工作,研究算法,從數據中實時提取地球參數信息,進而為科研、業務的數據信息需求服務。這一事實充分説明了從海量遙感數據的獲取、存儲、提取與分發、數值處理,到數據挖掘和知識發現,對地觀測活動的整個生命週期體現了大數據的“4V”特性:數據體量大 (volume)、數據來源和類型繁多(variety)、數據的真實性難以保證(veracity)、數據增加和變化的速度快(velocity)。

國際上,美國和歐洲處理和分發中分辨率數據較中國稍早幾年,美國處理 MODIS 數據和產品的方式、歐洲處理 ENVISAT/MERIS 數據和產品的方式可為我們借鑑。由於美國沒有 MODIS 的後續衞星計劃,數據的供給將隨着傳感器的失效而終止。歐洲的 ENVISAT/MERIS 於 2012 年失效,只能提供 2002-2012 年間的數據。中國風雲氣象衞星規劃已持續到 2020 年,因而,在未來幾年,中國的風雲衞星中分辨率遙感數據在國際上將是重要的數據源,向全球用户提供優質的數據和產品,將是中國數據科學家肩上的重任。

1. 觀測平台和傳感器的數據獲取

遙感數據獲取是由載有成像傳感器的遙感飛行平台來完成的。遙感飛行平台的`發展體現在:①先進的衞星對地觀測系統,包括大型的綜合衞星平台與小衞星星座;②先進的集成高—中—低空飛行作業的航空遙感平台;③全面一體化的對地觀測綜合系統。未來的傳感器搭載平台將是由相輔相成的高中低軌道上的大小衞星平台和高中低航空平台組成的,天地一體化、全球性、立體和多維的觀測體系。與此同時,對地觀測傳感器的數據獲取能力將向着“三高”(高空間分辨率、高光譜分辨率和高時相分辨率)和全天候方向發展。遙感平台和傳感器的技術進步使得獲取的數據量大幅度增大。比如剛剛退役的 Landsat -5 衞星在其29 年的在軌工作期間,平均每年獲取 8.6 萬景影像,每天獲取 67GB 的觀測數據。而 2012 年發射的資源 3 號衞星,每天的觀測數據獲取量可以達到 10TB 以上。類似的傳感器現在已經大量部署在衞星、飛機等飛行平台上,未來 10 年全球天、空、地空間中部署的百萬計傳感器每天獲取的觀測數據將超過 10PB。

2.天- 空- 地一體化的對地觀測數據網絡傳輸

巨大的觀測能力需要通過覆蓋天-空-地的高速數據傳輸網來實現對地觀測平台和全球地面接收站網絡之間的數據傳遞。這種傳輸能力要通過一個由光纜、地面微波、蜂窩移動通信和低、中以及靜止軌道的衞星通信系統組成的、服務於全球的、無縫隙覆蓋的、全球一體化的高速天-空-地對地觀測數據傳輸網絡實現。現在,單個傳感器的信號下傳速率已經突破了 Gbit/s。

3. 海量數據的快速處理

標準遙感產品的快速生成需要高吞吐量、高精度及自動化的分佈式數據處理能力,以滿足規模化、業務化的標準產品生產的要求。標準產品快速處理的突出特點是即時性和大吞吐量,兼有數據密集、計算密集的性質。海量遙感數據的處理需要利用龐大的網絡計算資源,通過並行計算、分佈式處理以及集羣計算技術來實現網絡化大數據量處理及多機分佈式並行處理,以滿足應用的需求。我們可以利用網格技術把分散在不同地理位置的計算機組織成一個“虛擬的超級計算機”,來提供高性能和高吞吐量的計算環境,為完成計算密集型任務提供有力的手段;同時充分利用網絡上多種閒置計算設備的處理能力,完成傳統計算模式下不能完成的各種大數據量的計算任務,從而保證標準產品的快速處理和生成。

4. 下一代空間數據設施

下一代空間數據設施建設將以全球尺度問題求解和多樣化實體數據設施建設為前提,基於傳統空間數據設施和聯邦數據設施,通過鬆耦合形式建立一種非中心化、虛擬化、按需服務化和全球化的數據服務體系。分佈在世界各地的各種對地觀測數據中心,將在下一代空間數據設施的連接下,面向特定專題,與高性能的信息化設施結合,動態形成大量專業化的虛擬數據設施。這些設施不僅可以匯聚和提供超大規模的數據,還具備對數據進行深度加工和挖掘的計算能力。地球觀測組織(GEO)所推動建立的全球綜合地球觀測系統(GEOSS)就是一種下一代空間數據設施,這種設施管理和處理的都是超大規模的對地觀測數據和空間數據。

5. 數字地球與未來地球

作為和對地觀測銜接的科學框架,數字地球是一個廣泛的以信息高速公路和空間基礎設施為依託的概念,其核心思想是用數字化手段整體性解決地球的各種科學問題,並最大限度地利用信息資源。未來的數字地球不再侷限於進行地學數據的表達和呈現,而將成為一種對地球的各種學科的數據和模型進行綜合分析的平台。同時,由國際科學理事會(ICSU)和國際社會科學理事會(ISSC) 共同發起的“未來地球”計劃將多學科交叉研究推向更加重要的位置。不論數字地球還是未來地球,其多學科的高度數據複雜性是非常顯著的信息特徵。和常規的單學科研究不同,在這種綜合研究場景中,信息技術要面對的是多學科複雜數據類型之間的數據建模、數據發現和數據整合問題。

三、大數據在對地觀測領域應用的典型案例

大數據時代的對地觀測技術為發展空間地球信息科學奠定了基礎,從對地觀測過程的信息學特徵可以清晰地看到此領域大數據的發展趨勢。但目前大數據研究普遍存在着“只有數據、沒有利用”的問題,導致蒐集數據、存儲數據付出的成本被浪費。據報道,通過遙感衞星獲得的影像數據中,目前得到應用的不到 5%,多半數企業不知如何從數據中獲得價值,因此這個問題急需解決,下面將介紹一些國內外創新企業利用大數據技術為遙感圖像應用找出路的典型案例,希望能夠擴寬我們的視野並從中得到有價值的借鑑。

tal Globle: 遙感圖像 + 大數據分析助力尋找馬航 MH370 迷蹤

馬航失聯客機 MH370 去哪兒的問題,牽動着全世界的心。為了找出謎題的答案,尋回239名乘客的信息,各方為此動用了許多手段,包括直接分析飛機上設備發出的各種信號,衞星和雷達的天羅地網等先進的科技方式,調遣各類船隻前往可能事故區域搜網式調查,可惜都無果而終,就在失聯事件發生的 12 天后,澳大利亞宣佈從衞星影像中找到了疑似馬航 MH370 失聯航班殘骸,廣袤的洋麪找一架飛機如同大海撈針實屬不易,雖然還未能確定殘骸是否來自於 MH370,但在短短几天內在能夠通過海量的衞星圖片發現如此重要的線索可見其背後的數據分析能力之強大,支撐這一能力的正是大數據技術,快速定位殘骸座標體現了大數據技術在處理海量高分遙感圖像上的速度優勢,展示了大數據與遙感技術的融合將在災難救援方面的關鍵作用。

ox Imaging:邁向大數據時代的商業遙感成像公司

Skybox 成像公司成立於 2009 年,目前員工不到 60人,是名副其實的“小”公司,但卻在多輪融資中備受風投的青睞,麻省理工學院技術評論將其評為 2012年最具“摧毀性”的 50 家公司之一。

3. 禾訊科技:商業化衞星遙感服務現代化農業生產

農業是生命之源、發展之基。由於農業資源、環境及多樣化的生產經營方式,農業大數據涉及到水、土、光、熱、氣候資源,作物育種、種植、施肥、植保、過程管理、收穫、加工、存儲、機械化等環節會產生大量結構化和非結構化數據,而且隨着農業科技創新發展和物聯網的應用,非結構化數據呈現快速增長的勢頭,其數量將大大超過結構化數據,為保障“舌尖上的安全”,利用大數據技術對不斷產生的大批非結構化數據的信息獲取、挖掘、存貯、處理與智慧應用是農業現代化不可或缺的手段。

四、大數據情境下對地觀測研究的發展趨勢

1.從量變到質變

對地觀測領域的大數據現象,在不同尺度上對現有的技術水平提出了挑戰。對地觀測領域的大數據現象包括 4 個方面:①數據量劇增,已經達到 PB 量級;②數據類型多樣,來自空基、天基的各種不同成像機理及數據獲取方式、不同時空分辨率和光譜特性的傳感器數據和地面台站的觀測數據及實驗模擬數據、統計數據等構成了紛繁複雜的數據類型;③應用場景眾多,目前對地觀測數據在氣象、水文、能源、農林種植、工礦開發及災害應急等諸多領域體現了其應用價值;④應用服務時間尺度多種多樣,天氣預報、災害應急等需要實時或準實時的數據分發反饋,而地圖測繪、土地變化等則需要中長期的對地觀測數據,不需要高時效性。

2.多數據中心協同處理

傳統的對地觀測知識發現的科研模式在大數據情境下已經不再適用,原因是傳統的科研模型不具有普適性且支持的數據量受限,受到數據傳輸、存儲及時效性需求的制約等。因此,新知識正更多來自於大數據的使用,數據生命週期中信息學流程的變化正引發傳統科研模式的變化。以“用户需求”為導向的對地觀測活動,需要為有不同應用需求的用户提供恰當的數據產品及信息資源,要求對地觀測數據實時處理及快速分發。實現這一目標的關鍵是多中心協同計算,通過構建分佈式多中心計算環境,將大量鬆散綁定或獨立的數據處理任務動態分配給閒置計算資源,實現資源動態調度及任務分配。目前需要解決的問題是如何實現有效地調度計算資源及跨異構系統計算時如何維持系統的高性能等。

3.模型驅動到數據中的知識發現模式

傳統的數據生命週期信息學流程是從數據到信息,再通過模型進行知識發現。而隨着數據量的爆炸式增長,可用模型已不能對海量數據進行模擬推演,因此由模型發現知識的傳統方法已經不能適應大數據時代的需求。

4.多學科交叉的科學研究

全球性的資源、環境問題日益凸顯,使得全球變化問題和可持續發展成為全世界科學家關注的焦點和研究的重點。全球變化的研究對象包括大氣圈、水圈、生物圈、人文圈並涉及外層空間,需要理解並掌握這些圈層中各個要素之間的物理、化學、生物、人文的影響過程和規律,需要自然科學、社會科學和工程科學相融合的面向大數據的新科學研究方法,也需要科學數據和互聯網數據之間的全新耦合和整合方法。