空間信息分析技術(shù)
- 期刊名字:地理研究
- 文件大小:112kb
- 論文作者:王勁峰,武繼磊,孫英君,李連發(fā),孟斌
- 作者單位:中國科學(xué)院地理科學(xué)與資源研究所
- 更新時(shí)間:2020-09-25
- 下載次數(shù):次
第24卷第3期地究Vol. 24, No. 32005年5月GEOGRAPHICAL RESEARCHMay, 2005空間信息分析技術(shù)王勁峰,武繼磊,孫英君,李連發(fā),孟斌(中國科學(xué)院地理科學(xué)與資源研究所,北京100101)摘要:在GIS技術(shù)日趨成熟和空間數(shù)據(jù)極大豐富的今天,通過分析空間數(shù)據(jù)探索空間過程機(jī)理正變得日益迫切??臻g信息分析技術(shù)至少包括以下六個(gè)主要方面: (1)空間數(shù)據(jù)獲取和預(yù)處理; (2) 屬性數(shù)據(jù)空間化和空間尺度轉(zhuǎn)換; (3) 空間信息探索分析; (4) 地統(tǒng)計(jì); (5) 格數(shù)據(jù)分析; (6) 復(fù)雜信息反演和預(yù)報(bào)。本文提出了解決具體應(yīng)用問題一般的空間數(shù)據(jù)分析計(jì)算、結(jié)果解釋和反饋程序。認(rèn)為空間過程的一般共性和作為共同的研究對(duì)象,各種不同的方法技術(shù)最終可能導(dǎo)致空間數(shù)學(xué)(spatial mathematics)的產(chǎn)生,同時(shí)發(fā)展魯棒的空間分析軟件包對(duì)于普及空間數(shù)學(xué)是必要的。關(guān)鍵詞: GIS;空間信息;空間過程;空間分析;機(jī)理解釋文章編號(hào): 1000-0585(2005)03-0464-091引言隨著對(duì)地觀測(cè)、社會(huì)經(jīng)濟(jì)調(diào)查、計(jì)算機(jī)網(wǎng)絡(luò)和格網(wǎng)信息處理能力的迅速提高,空間數(shù)據(jù)正在以指數(shù)方式急速增加。通用和專用的(時(shí))空間數(shù)據(jù)結(jié)構(gòu)1、應(yīng)用于具體事物的管理信息系統(tǒng)、以及對(duì)這些海量空間數(shù)據(jù)進(jìn)行深加工以獲得高附加值的信息產(chǎn)品的空間信息分析技術(shù)[2]成為空間信息三大領(lǐng)域。數(shù)據(jù)分析通常用統(tǒng)計(jì)學(xué)方法,當(dāng)今流行軟件包SPSS、MATLAB 等大大地促進(jìn)了數(shù)據(jù)分析深加工及其在各領(lǐng)域的應(yīng)用(徐建華,2002)。但是,空間數(shù)據(jù)通常具有非獨(dú)立性,這與經(jīng)典統(tǒng)計(jì)學(xué)基本假設(shè)相駁。因此,專門的空間信息分析理論和技術(shù)正在迅速發(fā)展[3~5],已在遙感、生態(tài)環(huán)境、地球科學(xué)、社會(huì)經(jīng)濟(jì)等領(lǐng)域得到諸多成功的應(yīng)用,展現(xiàn)出廣闊的應(yīng)用潛力。2研究動(dòng)態(tài)統(tǒng)計(jì)分析是常規(guī)數(shù)據(jù)分析的主要手段。然而,傳統(tǒng)統(tǒng)計(jì)學(xué)在分析空間數(shù)據(jù)時(shí)存在致命的缺陷,這種缺陷是由空間數(shù)據(jù)的本質(zhì)特征和傳統(tǒng)的統(tǒng)計(jì)學(xué)方法的基本假設(shè)共同造成的。傳統(tǒng)的統(tǒng)計(jì)學(xué)方法是建立在樣本獨(dú)立與大樣本兩個(gè)基本假設(shè)之上的,對(duì)于空間數(shù)據(jù),這兩個(gè)基本假設(shè)前提通常都得不到滿足??臻g上分布的對(duì)象與事件在空間上的相互依賴性是普遍存在的,這使大部分空間數(shù)據(jù)樣本間不獨(dú)立,即不滿足傳統(tǒng)統(tǒng)計(jì)分析的樣本獨(dú)立性前提,因而不適于進(jìn)行經(jīng)典統(tǒng)計(jì)分析[°];另一方面,有些空間數(shù)據(jù)采樣困難,如某些氣象臺(tái)站分布在稀疏的山區(qū),導(dǎo)致樣本點(diǎn)太少而不能滿足傳統(tǒng)統(tǒng)計(jì)分析方法大樣本的前提;地學(xué)中國煤化工收稿日期: 2004-10-16; 修訂日期: 2005-01-28YHCNMHG基金項(xiàng)目:國家自然科學(xué)基金課題(4071111)、 863 項(xiàng)目(2002AA135230-1) 和973項(xiàng)目(2001CB5103) 支持。作者簡介:王勁峰(1965-), 上海市人,研究員,博士生導(dǎo)師。主要從事地球信息科學(xué)研究。Email: wangjf@igsnrr. ac. cn3期王勁峰等:空間信息分析技術(shù)465空間數(shù)據(jù)通常的不可重復(fù)性進(jìn)--步造成了空間數(shù)據(jù)分析的特殊性。因此,專門的空間信息分析理論、方法和技術(shù)自20世紀(jì)60年代末開始得到認(rèn)識(shí)并研究??臻g數(shù)據(jù)大體.上可分為空間離散或連續(xù)型數(shù)據(jù)(可互相轉(zhuǎn)化),以及多邊形數(shù)據(jù)兩大.類。自然科學(xué)多涉及前者,而社會(huì)經(jīng)濟(jì)科學(xué)多涉及后者。隨著人地一體化研究趨勢(shì)的發(fā)展,對(duì)兩類數(shù)據(jù)進(jìn)行綜合分析的趨勢(shì)日益顯露。目前空間數(shù)據(jù)分析軟件包已有不少,主要來自兩大學(xué)科領(lǐng)域:地理學(xué)和地質(zhì)學(xué)。由于地理學(xué)和地質(zhì)學(xué)研究對(duì)象不同,所涉及的數(shù)據(jù)特點(diǎn)和分析方法不同,造成兩大流派在軟件功能、結(jié)構(gòu)、風(fēng)格上的不同。在歐美,60年代經(jīng)歷了地理學(xué)計(jì)量革命,其主流是試圖將社會(huì)經(jīng)濟(jì)時(shí)空格局和過程數(shù)學(xué)公式化。在GIS趨于成熟和空間數(shù)據(jù)迅速膨脹的技術(shù)條件下,當(dāng)時(shí)的學(xué)者成為現(xiàn)今地理信息科學(xué)的主要推動(dòng)者,造成地理學(xué)者所研發(fā)的空間信息分析軟件包多帶有處理多邊形數(shù)據(jù)(社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)單元,遙感像元數(shù)據(jù)亦屬此類)的特點(diǎn)。相反,源于地質(zhì)學(xué)的空間分析軟件包一般適用于分析離散和連續(xù)的數(shù)據(jù)??臻g信息分析理論和技術(shù)較為復(fù)雜,對(duì)于一般科研人員而言掌握難度大,耗費(fèi)精力多。為此,美英兩國都已建立了相應(yīng)的國家級(jí)研發(fā)計(jì)劃,更有甚者,全球銷量最大的GIS基礎(chǔ)軟件的研發(fā)者美國環(huán)境系統(tǒng)研究所在ARCGIS8.1及以上版本已集成了地統(tǒng)計(jì)學(xué)模塊刀,目前正在積極爭(zhēng)取集成美國國家基僉會(huì)資助完成的Lattice數(shù)據(jù)分析模塊,該功能可以被幾乎所有從事地理信息管理的用戶所使用,進(jìn)行空間信息的分析和深加工。3技術(shù)體系空間信息分析包括數(shù)據(jù)獲取和預(yù)處理(模塊M1);當(dāng)進(jìn)行多源異構(gòu)數(shù)據(jù)綜合分析時(shí),需要進(jìn)行屬性數(shù)據(jù)空間化和尺度轉(zhuǎn)換處理(模塊M2);然后進(jìn)行空間數(shù)據(jù)探索分析(模塊M3);之后根據(jù)屬性數(shù)據(jù)的空間存在格式(空間連續(xù)分布或離散分布、規(guī)則或不規(guī)則多邊形分布、多源復(fù)雜異構(gòu)信息),分別引導(dǎo)建立地統(tǒng)計(jì)模型(模塊M4)、格數(shù)據(jù)分析模型(模塊M5)、復(fù)雜信息分解和預(yù)報(bào)模型(模塊M6)、以及其他(見圖1)。M1至M3屬數(shù)據(jù)預(yù)處理范疇,M4至M6屬問題建模范疇,對(duì)建立的模型M4- M6 需要求解,機(jī)理解釋及預(yù)報(bào)。圖中各模塊可獨(dú)立或聯(lián)合運(yùn)行,這取決于所研究的問題和對(duì)象(所需輸出),以及研究人員當(dāng)前所處的分析階段(輸人)。 具體研究內(nèi)容如下:模塊1.空間數(shù)據(jù)獲取和預(yù)處理空間數(shù)據(jù)采集與盡可能完備化是所有工作重要的第一一步,主要利用采樣、插值、缺值方法。(1)空間信息抽樣估計(jì)在地學(xué)空間應(yīng)用領(lǐng)域, 如環(huán)境監(jiān)測(cè)、資源調(diào)查、社會(huì)統(tǒng)計(jì)等,空間信息抽樣估計(jì)問題大量存在(8.9]??臻g抽樣針對(duì)地學(xué)對(duì)象普遍存在的空間關(guān)聯(lián)性和先驗(yàn)信息,從樣本選取方式、空間關(guān)聯(lián)性及精度衡量三方面對(duì)空間信息獲取提供符合統(tǒng)計(jì)假設(shè)的新的解決思路。全國耕地面積動(dòng)態(tài)調(diào)查,原先窮盡總體的方法.中國煤化工既耗時(shí)又花費(fèi)巨大,報(bào)告形成緩慢;而采用Sandwich空間采樣模MHCNMHG信息并輔以少量樣本,就可以同時(shí)形成全國2700多個(gè)縣的分縣報(bào)告,既節(jié)省大量時(shí)間和開支又能滿足精度要求。在此基礎(chǔ)之上建立空間抽樣優(yōu)化決策通用集成模型,解決地學(xué)分析及資源調(diào)查466地理研究24卷M1空間數(shù)據(jù)獲取和預(yù)處理:多源異構(gòu)數(shù)據(jù)空間覆蓋、采樣,插值.缺值處M3空間數(shù)據(jù)探索分析M2屬性數(shù)據(jù)空間(數(shù)據(jù)性質(zhì)認(rèn)知→建模引導(dǎo))化和空間尺度轉(zhuǎn)換|為數(shù)據(jù)提出模型類型:建|M4地統(tǒng)計(jì)(空間離散、連續(xù))模|M5格分析模型( 多邊形、格網(wǎng))M6多源復(fù)雜信息自適應(yīng)模型其他:如空間數(shù)據(jù)挖掘等選擇參數(shù)估計(jì)方法選擇數(shù)值方法以完成參數(shù)估計(jì)細(xì)化或調(diào)整模型|求|解個(gè)診斷統(tǒng)計(jì):殘差和敏感分析評(píng)價(jià)擬合度和預(yù)報(bào)能力擬合/預(yù)報(bào)是否可接受?是否|機(jī)解釋報(bào)合,分析、模擬、預(yù)報(bào)圖1空間數(shù)據(jù)分 析技術(shù)和計(jì)算程序Fig. 1 Spatial data analysis techniques and algorithm中空間抽樣問題。軟件實(shí)現(xiàn)上,基于Microsoft Windows 平臺(tái),Visual 系列軟件組件對(duì)象方法系統(tǒng)集成11。(2)空間數(shù)據(jù)插值與缺值根據(jù)已 知空間樣本點(diǎn)(例如氣象臺(tái)站、野外調(diào)查)數(shù)據(jù)進(jìn)行插值12.18]或推理[4J]來生成面狀數(shù)據(jù)或估計(jì)未測(cè)點(diǎn)數(shù)值是地學(xué)研究經(jīng)常遇到的問題。理解初始假設(shè)和使用的方法是空間插值過程的一一個(gè)關(guān)鍵,為不同空間過程選擇不同插值方法[15.16]。缺值問題與插值類似,有部分交叉,以Bayes先驗(yàn)概率為其特征。插值有點(diǎn)、面之分,對(duì)于面插值,經(jīng)過預(yù)處理(如去除趨勢(shì)特征等)可以進(jìn)行缺值分析;對(duì)于點(diǎn)插值,經(jīng)過預(yù)處理(如構(gòu)建泰森多邊形再去除趨勢(shì)特征等)也可以使用缺值方法。對(duì)于缺值的補(bǔ)整,如果具備某些時(shí)空特征,則完全可以使用插值中國煤化工模塊2.屬性數(shù)據(jù)空間化與空間轉(zhuǎn)換fYHCNMHG自然與人文要素結(jié)合研究的時(shí)代正在到來。美國宇航局(NASA)將地表人類活動(dòng)模式加入全球變化模型中從本質(zhì)上提高了預(yù)報(bào)精度。又如,自然災(zāi)害的災(zāi)情空間預(yù)報(bào)需要自3期王勁峰等:空間信息分析技術(shù)467然要素和社會(huì)經(jīng)濟(jì)要素相互作用的計(jì)算,自然要素可以通過遙感獲取,社經(jīng)要素需要根據(jù)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行空間細(xì)化。地球生態(tài)環(huán)境以及社會(huì)經(jīng)濟(jì)數(shù)據(jù)通常是具有不同形狀和尺度的地理空間單元,需要建立屬性數(shù)據(jù)空間化及空間尺度轉(zhuǎn)換技術(shù),其核心是非空間信息或更大空間單元的屬性數(shù)據(jù)在(較小)空間上表達(dá)的理論和方法,或稱可變面元問題(Modifia-ble areal unit problem) (MAUP),包括三類技術(shù):GIS方法。實(shí)現(xiàn)地理空間單元間屬性數(shù)據(jù)的轉(zhuǎn)化,包括聚集、拆分和空間建模(Spa-tial modeling)。聚集主要解決從小區(qū)域(點(diǎn))向大區(qū)域(面)轉(zhuǎn)化問題;拆分則考慮從大區(qū)域向小區(qū)域轉(zhuǎn)化問題。前者可利用空間采樣技術(shù)實(shí)現(xiàn)。尺度轉(zhuǎn)化理論及方法。不同的時(shí)間和空間尺度限制了信息被觀測(cè)、描述、分析和表達(dá)的詳細(xì)程度。尺度轉(zhuǎn)化存在“自上而下scaling down”和“自下而上scaling up”兩種基本方式。不同尺度水平上,尤其是Downscaling的轉(zhuǎn)化,存在其區(qū)域邊界規(guī)則與地理邊界規(guī)則的差異、數(shù)據(jù)轉(zhuǎn)化的控制和實(shí)施形式。小區(qū)域統(tǒng)計(jì)學(xué)理論及方法。所謂“小區(qū)域”,本質(zhì)上是指區(qū)域內(nèi)樣本點(diǎn)較少,因此在統(tǒng)計(jì)分析過程中,需要從相關(guān)區(qū)域“借力”來獲得詳細(xì)的信息,其核心是建立相關(guān)區(qū)域(數(shù)據(jù))的聯(lián)系模型,實(shí)現(xiàn)屬性數(shù)據(jù)空間表達(dá)。以上內(nèi)容著眼點(diǎn)有所不同,但都可歸結(jié)為屬性數(shù)據(jù)從大區(qū)域向小區(qū)域轉(zhuǎn)化,最終完成綜合的屬性數(shù)據(jù)空間化方法和軟件包設(shè)計(jì)與實(shí)現(xiàn),并對(duì)表達(dá)結(jié)果的精確性和不確定性做定量分析和解釋。模塊3.空間信息探索分析探索數(shù)據(jù)分析(Exploratory Data Analysis, EDA)目標(biāo)是最大化分析者對(duì)數(shù)據(jù)集及其隱含結(jié)構(gòu)的洞察,揭示數(shù)據(jù)屬性,用以引導(dǎo)選擇合適的數(shù)據(jù)分析模型。EDA主要采用圖形技術(shù)進(jìn)行以下分析: (1)最大化對(duì)數(shù)據(jù)集的洞察; (2) 揭示數(shù)據(jù)隱含的結(jié)構(gòu); (3)提取重要的變量; (4) 檢測(cè)異常點(diǎn); (5) 檢驗(yàn)隱含的假設(shè)條件; (6) 發(fā)展精簡的模型; (7)決定因素的最優(yōu)設(shè)置。空間數(shù)據(jù)探索分析(Exploratory Spatial Data Analysis, ESDA) 是EDA的擴(kuò)展,用來對(duì)具有空間定位信息的屬性進(jìn)行分析,包括:探索數(shù)據(jù)的空間模式[7],對(duì)假設(shè)數(shù)據(jù)模型、模型基礎(chǔ)和數(shù)據(jù)的地理性質(zhì)進(jìn)行闡述,評(píng)價(jià)空間模型等。ESDA 技術(shù)同樣要求可視和健壯,強(qiáng)調(diào)把數(shù)字和圖形技術(shù)與地圖聯(lián)系。對(duì)“某些事件在地圖上的什么位置”[18,19]、“這部分地圖的屬性值在概括統(tǒng)計(jì)中處于什么位置”、“地圖的哪些區(qū)域滿足特定的屬性要求”等問題的回答是很重要的。本模塊具體內(nèi)容包括:探索工具。軟件實(shí)現(xiàn)當(dāng)前已經(jīng)有ESDA技術(shù),并且實(shí)現(xiàn)表(Table)、 地圖(Map) 和圖形(Figure) 各窗口鏈接,支持同時(shí)打開四個(gè)窗口:數(shù)據(jù)表窗口(顯示 當(dāng)前數(shù)據(jù)和在過程中創(chuàng)建的變量),地圖窗口,圖形窗口和文本輸出窗口(返回ESDA輸出)。區(qū)劃(regionalization)。 空間單元有時(shí)很小,比如一個(gè)村或鄉(xiāng)鎮(zhèn),如果以此進(jìn)行自然災(zāi)害發(fā)生率或疾病發(fā)生率等小概率事件,統(tǒng)計(jì)對(duì)這種小的統(tǒng)計(jì)單元很敏感。由于空間信息分析要求各空間單元內(nèi)的信息變差具有相對(duì)--致性,因此,經(jīng)常需要對(duì)空間單元的大小進(jìn)行調(diào)整,通過模型計(jì)算,實(shí)現(xiàn)統(tǒng)計(jì)單元的均質(zhì)性中國煤化工(eguality)和空間緊湊性(compactness)。YHCNMHG模塊4.地統(tǒng)計(jì)模塊點(diǎn)狀數(shù)據(jù)或空間連續(xù)分布數(shù)據(jù)(直接獲得或由點(diǎn)狀數(shù)據(jù)通過空間插值或趨勢(shì)面模擬獲468地理研究24卷得)是空間數(shù)據(jù)的一-種主要存在形式(例如氣象臺(tái)站、地質(zhì)物探、生態(tài)環(huán)境等數(shù)據(jù))[0。主要包括以下幾方面:變異函數(shù)(variogram)。 變異函數(shù)可以說是整個(gè)地統(tǒng)計(jì)學(xué)的基礎(chǔ),但以前人們只注重了點(diǎn)的變異函數(shù)。隨著尺度問題的提出,變異函數(shù)的正則化( regulization)問題提上了日程??死锔穹椒?Kriging)。 以往把Kriging法看成是地統(tǒng)計(jì)學(xué)的全部。通過它人們找到了一種最優(yōu)的、無偏的估值方法。長期以來,人們僅僅把它看作是一種插值方法。其實(shí)不僅僅如此,Kriging還可以給出每一點(diǎn)的不確定性、利用多種附屬信息填補(bǔ)采樣不足的缺陷等。模擬方法(Simulation)。 這是當(dāng)今地統(tǒng)計(jì)領(lǐng)域中最為活躍的一種方法。由于Kriging方法具有平滑作用,即將極大值偏小估計(jì)、極小值偏大估計(jì),使得整幅圖像趨于平緩。但有時(shí)人們需要的恰恰正是那種極值,例如在水污染中,就是要通過污染金屬所表現(xiàn)的極值來發(fā)現(xiàn)污染源。此外,Simulation通過多種實(shí)現(xiàn)(realization) 系統(tǒng)的表現(xiàn),研究問題的各種情況,具有較好的統(tǒng)計(jì)效用。模塊5.格數(shù)據(jù)分析模塊多邊形數(shù)據(jù)(杜 會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)格式),包括規(guī)則格網(wǎng)數(shù)據(jù)(遙感), 是空間數(shù)據(jù)的又-種主要存在形式。通過空間自相關(guān)和協(xié)相關(guān)模型,找出研究對(duì)象在空間布局上的聯(lián)系與差異,以及空間多元解釋變量。例如土地利用變化的環(huán)境和人文經(jīng)濟(jì)驅(qū)動(dòng)因子識(shí)別,環(huán)境污染的空間動(dòng)態(tài)建模,為預(yù)報(bào)和調(diào)控提供科學(xué)依據(jù)。空間局域統(tǒng)計(jì)分析技術(shù),則可找出空間熱點(diǎn)(hotspots)問題區(qū),應(yīng)用于疾病、犯罪等空間格局的熱點(diǎn)診斷和預(yù)報(bào)??臻g回歸模型??臻g回歸分析技術(shù)可以用于探討估計(jì)值的空間關(guān)系,地學(xué)對(duì)象的空間依賴性和空間異質(zhì)性使一般回歸方法不適應(yīng)在空間上的分析??臻g回歸分析有三種特殊形式: (1)聯(lián)立自回歸模型(Simultaneous Autoregressive Model, SAR); (2)空間移動(dòng)平均模型(Spatial Moving Average Model, SMA); (3)條件自回歸模型(Conditional Au-toregressive Model, CAR)。局域統(tǒng)計(jì)模型。局域統(tǒng)計(jì)分析模型對(duì)研究區(qū)域內(nèi)距某一目標(biāo)單元一定距離的空間范圍內(nèi)所有點(diǎn)的值進(jìn)行分析。計(jì)算指定距離內(nèi)的空間關(guān)聯(lián)度,從而監(jiān)測(cè)空間內(nèi)的熱點(diǎn)區(qū)域,并通過G;檢驗(yàn)。模塊6.多源復(fù)雜時(shí)空信息的分解、融合、預(yù)報(bào)模塊環(huán)境、地學(xué)、社會(huì)、經(jīng)濟(jì)、交通、疾病、遙感監(jiān)測(cè)等時(shí)空信息大多是多源復(fù)雜因素綜合作用的結(jié)果。通過觀測(cè)信息反演地學(xué)過程機(jī)理是地球科學(xué),特別是地球空間信息科學(xué)的基本任務(wù)之一,目前可用的數(shù)學(xué)方法有統(tǒng)計(jì)[21]、神經(jīng)網(wǎng)絡(luò)、小波分析、遺傳算法、元胞自動(dòng)機(jī)22?等,也是目前數(shù)據(jù)挖掘的基本手段。但這些方法只能進(jìn)行單一成因要素(團(tuán))提取和簡單過程預(yù)報(bào),要實(shí)現(xiàn)基于時(shí)空信息復(fù)合過程的科學(xué)預(yù)報(bào),不僅需要實(shí)現(xiàn)多源復(fù)雜因子的分解,更需要將多種分解模式重新組構(gòu)融合,形成一個(gè)新的整體模式。另外,氣象臺(tái)站、生態(tài)網(wǎng)絡(luò)、污染監(jiān)測(cè)、野外采樣、社會(huì)經(jīng)濟(jì)調(diào)查等等,均是空間分散的點(diǎn)狀數(shù)據(jù)。根據(jù)已知點(diǎn)的值推斷未知點(diǎn)的值,中國煤化工雙域狀況是地學(xué).研究的經(jīng)常性任務(wù)。目前使用的是空間幾何插值、MHCNMHG印新近的考慮全局和局域關(guān)聯(lián)信息的空間統(tǒng)計(jì)方法。實(shí)際上,前人的研究已經(jīng)獲得了很多半結(jié)構(gòu)化的地學(xué)機(jī)理和規(guī)律,這些先驗(yàn)信息與空間統(tǒng)計(jì)的結(jié)合有望從本質(zhì)上提高空間估計(jì)預(yù)報(bào)的精度。借3期王勁峰等:空間信息分析技術(shù)469助貝葉斯方法建立統(tǒng)計(jì)和機(jī)理結(jié)合的空間擴(kuò)展模型是一種可能的新途徑??偠灾臻g信息分析是指對(duì)地球空間信息進(jìn)行分析模擬和預(yù)測(cè),以及根據(jù)空間信息進(jìn)行時(shí)空運(yùn)籌的技術(shù)、方法和理論。下表給出了從輸人輸出角度理解什么是空間信息分析模型及其舉例。表1空間信息分析模型的輸入和輸出Tab. 1 Input and output of spatial information analysis model輸出信息屬性舉例空間非空間空間采樣模型熱點(diǎn)探測(cè)、插值(Upscaling)輸人信息屬性屬性數(shù)據(jù)空間化經(jīng)典統(tǒng)計(jì)學(xué)(Downscaling)4若干創(chuàng)新和前沿(1)空間抽樣模型目前空間抽樣模型是針對(duì)空間連續(xù)分布對(duì)象(如坡面降水)提出的,對(duì)于如大區(qū)域耕地問題等空間離散分布地物調(diào)查,缺乏專門的離散空間抽樣模型,雖然可以借助面積成數(shù)進(jìn)行換算;另外,對(duì)小樣本問題、流動(dòng)地物(海洋)、多維地物(降雨、溫度、土壤含水量等多要素)聯(lián)合調(diào)查和動(dòng)態(tài)空間(植被變化)采樣問題需要發(fā)展相應(yīng)的空間抽樣模型。(2)屬性數(shù)據(jù)空間化屬性數(shù)據(jù)空間化的系統(tǒng)研究在國際上剛剛開始,有影響的研究成果較少,主要限于GIS的空間分析、尺度變化研究領(lǐng)域。小區(qū)域統(tǒng)計(jì)學(xué)與GIS的結(jié)合最近開始得到廣泛的關(guān)注。(3)空間尺度轉(zhuǎn)換Statistical Downscaling基于不同尺度空間變量的統(tǒng)計(jì)關(guān)系來建立,在全球環(huán)流模型(GCM) 中有廣泛應(yīng)用。該方法假定變量之間的統(tǒng)計(jì)關(guān)系不隨尺度變化而改變。Dynamical Downscaling也集中在GCMs領(lǐng)域。因研究對(duì)象不同,需要分別設(shè)計(jì)模型,在社會(huì)經(jīng)濟(jì)數(shù)據(jù)方面研究則較少。(4)隨機(jī)模擬除Kriging法外,現(xiàn)在的地統(tǒng)計(jì)學(xué)還可以作為評(píng)估未知值不確定性的工具,這主要通過模擬來完成。即通過條件模擬產(chǎn)生多幅模擬圖象用以再現(xiàn)空間依賴的分布格局等統(tǒng)計(jì)特性。模擬圖像是地統(tǒng)計(jì)學(xué)領(lǐng)域中最具潛力的領(lǐng)域。(5)格數(shù)據(jù)模型遙 感和社會(huì)經(jīng)濟(jì)屬性信息均以規(guī)則和不規(guī)則多邊形為其載體。隨著計(jì)算技術(shù)迅速發(fā)展起來的格數(shù)據(jù)分析技術(shù)(Latticedataanalysis)23.24),在美國國家基金支持下,自1999年開始也設(shè)立了五年的研究計(jì)劃,由Sergio Rey和Luc Anselin 牽頭,其核心就是空間計(jì)量經(jīng)濟(jì)學(xué)模型分析軟件包的構(gòu)建,在該研究計(jì)劃中,設(shè)定了軟件包開發(fā)計(jì)劃,同ESRI公司合作,開發(fā)成熟的、具有友好用戶界面的商業(yè)化空間統(tǒng)計(jì)與空間分析軟件包。(6)復(fù)合信息模型我們經(jīng)常希望從得到的空聞信息后演地學(xué)過程的各種影響因子,例如遙感影像的像元值經(jīng)常是地表混合物體以及地H中國煤化工E綜合作用的結(jié).果;全球氣候變暖受自然和人文因子的雙重作用,享CNM!G訂科學(xué)的環(huán)境政策至關(guān)重要;生態(tài)環(huán)境的空間動(dòng)態(tài)變化受溫度、降水、人類活動(dòng)空間格局變化的多重影響,準(zhǔn)確分解之將有助于對(duì)生態(tài)環(huán)境空間動(dòng)態(tài)進(jìn)行預(yù)報(bào)。470地理研究24卷功率譜和小波可以分解出不同尺度的結(jié)構(gòu)特征;多元回歸通常是全局性的;神經(jīng)網(wǎng)絡(luò)對(duì)于短記憶非線性較為有效;遺傳規(guī)劃可以對(duì)多個(gè)給定模式進(jìn)行優(yōu)化組合。但是,空間數(shù)據(jù)經(jīng)常受多種因子影響,在缺少對(duì)其生成機(jī)理了解之前,不應(yīng)人為地套用某個(gè)單一模式,各種信息都可能隱含在其中,應(yīng)該建立多模式融合模型,讓數(shù)據(jù)自己說話。5應(yīng)用領(lǐng)域舉例(1)災(zāi)情損失快速準(zhǔn)確評(píng)估 重大災(zāi)情快速評(píng)估涉及受災(zāi)地區(qū)自然和社會(huì)經(jīng)濟(jì)情況的綜合信息[25]。遙感等技術(shù)為獲得受災(zāi)地區(qū)的致災(zāi)因子信息提供了有效的途徑,但社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)更新周期較長,不能滿足實(shí)時(shí)需要,并且是以行政單元為存在形式,與災(zāi)害的地域單元不--致。屬性數(shù)據(jù)空間化技術(shù)與抽樣技術(shù)結(jié)合有望彌補(bǔ)當(dāng)前災(zāi)情評(píng)估中社會(huì)經(jīng)濟(jì)數(shù)據(jù)難以快速和準(zhǔn)確獲得的缺陷,為災(zāi)情損失評(píng)估提供技術(shù)保障。(2)人類健康和疾病研究領(lǐng)域通過遙感和地理信息系統(tǒng)手段對(duì)截面數(shù)據(jù)如疾病分布、空間擴(kuò)散[26]、時(shí)空演變[C27] 與自然和經(jīng)濟(jì)環(huán)境狀況的分布進(jìn)行分析。公眾的健康問題很大程度與當(dāng)?shù)氐沫h(huán)境因素有關(guān),對(duì)于某些關(guān)鍵的疾病以及醫(yī)療設(shè)施的分布研究也可通過空間數(shù)據(jù)的分析和處理進(jìn)行。社會(huì)學(xué)家、經(jīng)濟(jì)學(xué)家、人類學(xué)家以及環(huán)境工作者也將公眾健康安全與有毒廢物、低收入人口乃至少數(shù)人種分布聯(lián)系起來。(3) 公共安全領(lǐng)域犯罪發(fā)生率的分析,開始應(yīng)用空間統(tǒng)計(jì)與分析手段,例如,根據(jù)美國的犯罪數(shù)據(jù)分析,盜竊、搶劫以及其他類別的暴力犯罪與當(dāng)?shù)氐某鞘兄械褪杖搿⒏呤I(yè)率以及人群混雜的區(qū)域高度相關(guān)。利用空間統(tǒng)計(jì)和空間分析等手段,可以對(duì)犯罪率高發(fā)區(qū)集中控制以及進(jìn)行社會(huì)經(jīng)濟(jì)調(diào)節(jié),維護(hù)公共安全。(4)其他統(tǒng)計(jì)分析在氣候變化、 環(huán)境退化、區(qū)域可持續(xù)發(fā)展、人類活動(dòng)與環(huán)境及氣候變化的關(guān)系研究、社會(huì)經(jīng)濟(jì)空間格局動(dòng)態(tài)變化[8、城市擴(kuò)張、商業(yè)、遷移、旅游、交通和通訊網(wǎng)絡(luò)分析中廣泛的應(yīng)用,空間分析技術(shù)有望挖掘更多的信息和知識(shí)。由于空間信息分析技術(shù)的復(fù)雜性,實(shí)際運(yùn)用基本限于商業(yè)軟件所提供的功能,因此適應(yīng)于各種實(shí)際問題的空間信息分析理論和軟件的研發(fā)是受歡迎的,例如SpaceStat,GesLib, CrimeStat,和由國家863計(jì)劃支持于2004年完成的國產(chǎn)空間分析軟件包原型Simple0. 1[29]。6結(jié)論和討論空間信息來源于地球科學(xué)、社會(huì)經(jīng)濟(jì)、生命科學(xué)、資源和能源、軍事等等廣泛領(lǐng)域,亦是認(rèn)識(shí)和調(diào)控這些系統(tǒng)的基本根據(jù)。數(shù)據(jù)分析的理論是概率論、數(shù)理統(tǒng)計(jì)和數(shù)學(xué),但是由于空間過程廣泛存在的相互關(guān)聯(lián)性以及空間信息在空間上特有的多種存在形式與已有經(jīng)典數(shù)學(xué)的假設(shè)條件常常產(chǎn)生矛盾,或者在理論上沒有被后者覆蓋,因此產(chǎn)生了專門用于空間信息分析的理論研究[30]。當(dāng)今空間信息分析技術(shù)至少包括以下六個(gè)主要方面: (1)空間數(shù)據(jù)獲取和預(yù)處理; (2) 屬性數(shù)據(jù)空間化和空間尺度轉(zhuǎn)換; (3) 空間信息探索分析;(4)地統(tǒng)計(jì); (5) 格數(shù)據(jù)分析; (6) 復(fù)雜信息反演和預(yù)報(bào)模塊應(yīng)用需求、計(jì)算技術(shù)進(jìn)步、空間數(shù)據(jù)激增、學(xué)科交叉是空間信息分析技術(shù)中國煤化工空間信息分析技術(shù)的目的是建立研究對(duì)象的(統(tǒng)計(jì))數(shù)學(xué)模型、且MHCNMHG數(shù)據(jù)挖掘或者機(jī)器學(xué)習(xí)技術(shù)首先產(chǎn)生于計(jì)算機(jī)科學(xué)和生物信息分析81],以概率統(tǒng)計(jì)為理論根據(jù),迅速被地球信息分析所借鑒,發(fā)展出來的生物信息科學(xué)和地球信息科學(xué)在數(shù)3期王勁峰等:空間信息分析技術(shù)471學(xué)方法上大體有70%的重合,雖然研究對(duì)象完全不同。數(shù)據(jù)挖掘技術(shù)的目的是通過信息發(fā)現(xiàn)研究對(duì)象的知識(shí)、規(guī)則、關(guān)聯(lián)和模式。當(dāng)空間過程的機(jī)理比較清楚,并且可以據(jù)此建立數(shù)學(xué)模型時(shí),例如大氣環(huán)流模式、海洋物理場(chǎng)、地球動(dòng)力學(xué)等,統(tǒng)計(jì)類理論就降低到次要地位。但是由于真實(shí)世界的復(fù)雜性和或多或少的不確定性,需要確定性的數(shù)學(xué)模型和不確定性的統(tǒng)計(jì)模型的結(jié)合。確定性數(shù)學(xué)模型、空間信息分析技術(shù)和數(shù)據(jù)挖掘技術(shù)是分析空間過程的三種不同的手段。對(duì)于傳染病時(shí)空過程建模,既可以用確定性的微分方程,也可以用不確定的隨機(jī)過程,當(dāng)后者取極限時(shí)將逼近前者,達(dá)到形式統(tǒng)一;空間信息分析技術(shù)用于識(shí)別傳染病傳播的影響因子,而數(shù)據(jù)挖掘技術(shù)被用于反演傳染病參數(shù)。三種方法靈活使用,互相補(bǔ)充,可以揭示空間過程的多方面特征。雖然出發(fā)點(diǎn)不同,但是研究對(duì)象都是空間過程,所以空間過程數(shù)學(xué)模型、空間信息分析技術(shù)和數(shù)據(jù)挖掘技術(shù)等發(fā)展最終融合形成統(tǒng)一的空間數(shù)學(xué)(spatial mathematics)是有可能的。Matlab, SAS, Spss等軟件包的開發(fā)大大推動(dòng)了數(shù)學(xué)在各領(lǐng)域的廣泛應(yīng)用,空間信息分析技術(shù)的廣泛使用亦需要開發(fā)空間分析軟件包。參考文獻(xiàn):[1] Buliung R, Kanaroglou P. On design and implementation of an object -relational spatial database for activity/ travelbehavior research. Journal of Geographical System, 2004, 6;237~262.[2] 王勁峰,李連發(fā),葛詠,等.地理信息空間分析的理論體系. 地理學(xué)報(bào),2000, 55(1); 92~ 103[ 3 ] Fischer Manfred , Getis Arthur. Recent Developments in Spatial Analysis. Berlin; Springer, 1997.[4]Haining Robert. Spatial Data Analysis, Theory and Practice. Cambridge University Press, 2003.[5] Anselin Luc. Spatial Econometrics: Methods and Models. Dordrecht: Kuwer Academic, 1988[6] 柏延臣,李新,馮學(xué)智??臻g數(shù)據(jù)分析與空間模型.地理研究,1999, 18(2): 185~190.[7]ESRI, http://www. esri. com/ software/ arcgis/extensions/ geostatistical/ index html[8]梁進(jìn)社, 張華.土地利用變化遙感監(jiān)測(cè)精度評(píng)價(jià)系統(tǒng)--以隨機(jī)抽樣 為基礎(chǔ)的方法.地理研究,2004,23(1):29~ 37.[9] 鄭袁明,陳同斌.“北京市土壤和蔬菜重金屬污染與風(fēng)險(xiǎn)評(píng)價(jià)”取得重要進(jìn)展. 地理研究, 2004, 23(5): 455.[10] Wang J,Liu J,Zhuang D,et al. Spatial sampling design for monitoring cultivated land. International Journal of Re-mote Sensing, 2002,23(2): 263~284.[11]李連 發(fā),王勁峰,劉紀(jì)遠(yuǎn)。國土澠感調(diào)查的空間抽樣優(yōu)化決策.中國科學(xué)D緝,2004 ,34(10) :975~982.[12] 鄭紅星,劉昌明,王中根,等。黃河典型流域分布式水文過程模擬,地理研究,2004 ,23(4) :447~454.[13]廖順寶, 李澤輝,積溫?cái)?shù)據(jù)柵格化方法的實(shí)驗(yàn)。地理研究,2004 ,23(5) :633~640.[14] 周斌,王繁.基于決策樹模型的土壤性質(zhì)空間推斷.土壤邇報(bào), 2004, 35<4) :385~390.[15] 朱會(huì)義,劉述林,賈紹鳳.自然地理要素空間插值的幾個(gè)問題.地理研究,2004 ,23(4) :425 ~ 432.[16] 李新,程國棟,盧玲.空間內(nèi)插方法比較.地球科學(xué)進(jìn)展,2000,15(3):260~265.[17] 邵全琴,戎愷,馬巍巍,等.西北太平洋柔魚中心漁場(chǎng)分布模式.地理研究,2004,23(1):1~9.[18] 楊林生,陳如桂,王五一,等。1840年以來我國鼠疫的時(shí)空分布規(guī)律。地理研究, 2000, 19(3): 43~248.[19] WHO. Disease Mapping and Risk Assessment for Public中國煤化工/1CP/EHRO 02 0301,1997.HCNM H G_[20] 朱華忠,羅天祥,Christopher Daly. 中國高分辨率溫度和降水模擬數(shù)據(jù)的驗(yàn)讓●吧埋財(cái)咒,cU03,22(3) :349~359[21] 徐建華.現(xiàn)代地理學(xué)中的數(shù)學(xué)方法(第二版).北京:高等教育出版社,2002.[22]黎夏,葉嘉安 .知識(shí)發(fā)現(xiàn)及地理元胞自動(dòng)機(jī).中國科學(xué)D輯,2004,34(9) :865~872.472地研究24卷[23] Ying Longgeng. Understanding China's recent growth experience: a spatial econometric perspective. Ann. Reg.Sci, 2003, 37:613~628.[24] Chen Shupeng, Chenghu Zhou. New generation of grid mapping. In: Proceedings of the International Conferenceon Geoinformatics and Modelling Geographical Systems, Beiing, 2004. 15~ 23.[25] Wang J, Wise s, Haining R. An integrated regionalization of earthquake, flood and drought hazards in China.Transactions in GIS, 1997, 2 (1):25~44.[26] 顏維安,馮建良,杭德榮,等。用地理信息系統(tǒng)評(píng)價(jià)垃圾填埋場(chǎng)對(duì)環(huán)境污染及危害的研究,中國衛(wèi)生工程學(xué),2004,3 (3):130~132.[27] Dankmar Bohning,Ekkehart Dietz,Peter Schlattmann. Space time mixture modelling of public health data,Sta-tistics in Medicine , 2000,19; 2333~2344.[28] 劉紀(jì)遠(yuǎn),張?jiān)鱿椋f大方,等。20世紀(jì)90年代中國土地利用變化時(shí)空特征及其成因分析.地理研究,2003,22(1):1~12.[29] Simple 0. 1, htp://autoib. homebj. com/[30] Michael F Goodchild, Robert P Haining. GIS and spatial data analysis: converging perspectives ,Papers Reg. Sci,2004 ,83:363~385.[31] Pierre Baldi,Soren Brunak. Bioinformatics: The Machine Learning Approach, MIT, 2001.Techniques of spatial data analysisWANG Jin-feng, WU Ji-lei, SUN Ying-jun, LI Lian-fa, MENG Bin,(State Key Lab of Resources and Environment Information System, Institute of GeographicSciences and Natural Resources Research, CAS, Bejing 100101, China)Abstract:GIS is a geo- referenced data based system for manipulating digital spatial and the-matic data. Because of its unique properties of spatial data (spatial dependence and spatialheterogeneity), there is an urgent need to investigate the mechanisms of spatial processesthrough exploring spatial data. The techniques of spatial analysis can be categorized intosix groups: (1) generation of spatial data and its preliminary treatment; (2) spatializationof attribute data and scale transformation of spatial data; (3) visualization and explorationof spatial data; (4) geo-statistics; (5) analysis of lattice data; and (6) reversing informa-tion from complicated spatial data. To meet the real world solutions, a procedural diagramof spatial data analysis is suggested as below: (1) preliminary data treatment; (2) model-ing; (3) solution; and (4) interpretation. Various techniques are being employed to inves-tigate spatial processes, the identical study objective and some common characteristics ofthe study object may lead to the integration and convergence of the various approaches ,and further the introduction of a general science: spatial mathematics. A same importantissue is to develop robust spatial analysis computer packages for public uses.中國煤化工Key words:GIS; spatial data; spatial process; spat,MYHCNMHGofmechanism
-
C4烯烴制丙烯催化劑 2020-09-25
-
煤基聚乙醇酸技術(shù)進(jìn)展 2020-09-25
-
生物質(zhì)能的應(yīng)用工程 2020-09-25
-
我國甲醇工業(yè)現(xiàn)狀 2020-09-25
-
石油化工設(shè)備腐蝕與防護(hù)參考書十本免費(fèi)下載,絕版珍藏 2020-09-25
-
四噴嘴水煤漿氣化爐工業(yè)應(yīng)用情況簡介 2020-09-25
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-09-25
-
甲醇制芳烴研究進(jìn)展 2020-09-25
-
精甲醇及MTO級(jí)甲醇精餾工藝技術(shù)進(jìn)展 2020-09-25









