聯(lián)機分析處理的綜述和分析
- 期刊名字:計算機應(yīng)用研究
- 文件大?。?20kb
- 論文作者:張忠平,李榮,郭麗麗
- 作者單位:燕山大學(xué),復(fù)旦大學(xué)
- 更新時間:2020-09-25
- 下載次數(shù):次
10.計算機應(yīng)用研究2003年聯(lián)機分析處理的綜述和分析張忠平12 ,李榮2, 郭麗麗'( 1.燕山大學(xué)信息科學(xué)與工程學(xué)院,河北秦皇島066004; 2. 復(fù)旦大學(xué)計算機與信息技術(shù)系,上海200433)摘要:介紹了聯(lián)機分析處理的研究狀況對-些典型的聯(lián)機分析處理產(chǎn)品進行了分析和評價指出了可視化的不足引入概念層次提升改進可視化效果的方法提出了聯(lián)機分析處理非數(shù)值型的量度和虛擬視圖的更新方法展望了聯(lián)機分析處理的未來研究的問題和方向。關(guān)鍵詞:數(shù)據(jù)倉庫;聯(lián)機分析處理;多維數(shù)據(jù);數(shù)據(jù)立方體;數(shù)據(jù)挖掘中圖法分類號: TP311文獻標(biāo)識碼: A文章編號: 1001-3695( 2003 )8-0010-04An Analytical Overview of On-Line Analytical ProcessingZHANG Zhong-ping'2 , L Rong2 , GUO Li-i'( 1. Cllege of Information Science & Engineering , Yanshan Unixersity ,Qinhuangdao Helei 066004 ,China 2. Dept . of Compuer & Information Tech-nology , Fudan Unirersity ,Shanghai 200433 ,China )Abstract : This paper provides studied status of On-line Analytical Processing( OLAP ), analyses and estimates typical productions ,points out shortage of visual OLAP,inducts concept levels extraction and improves visual OLAP , brings measure of no numerical valuetype and updated ways of virtual view , views some future directions and problems in OLAP.Key words : Data Warehouse ; OLAP ; Multidimensional Data ; DataCube ; Data Mining策今年旺季的產(chǎn)品進貨等有關(guān)事宜”。這是一個非常實1引言際的問題。決策者所需要的數(shù)據(jù)總是與一些統(tǒng)計指標(biāo)聯(lián)機分析處理( On-line Analytical Processing ,0LAP )如銷售額、銷售產(chǎn)品、銷售地區(qū)、銷售時間等統(tǒng)計有關(guān)。是最近幾年剛剛興起的軟件技術(shù),它在企業(yè)的領(lǐng)域內(nèi)已這些統(tǒng)計數(shù)據(jù)是多維數(shù)據(jù)在多維數(shù)據(jù)上進行分析是決被數(shù)據(jù)庫界廣泛研究與應(yīng)用。20 世紀(jì)60年代末,關(guān)系策的主要內(nèi)容。傳統(tǒng)的數(shù)據(jù)庫很難適應(yīng)這種決策分析。數(shù)據(jù)庫之父E.F. Codd提出了關(guān)系模型,促進了關(guān)系數(shù)聯(lián)機分析處理軟件技術(shù)是專門用于支持復(fù)雜分析操作據(jù)庫與聯(lián)機事務(wù)處理( On-Line Transaction Processing ,的,它以一種直觀易懂的餅圖、曲線圖、直方圖等形式[1]OLTP)的發(fā)展數(shù)據(jù)以關(guān)系表的形式而非文件方式存儲將查詢分析結(jié)果提供給決策人員,側(cè)重于對決策及管理為用戶提供資源共享。隨著社會的進步和企業(yè)的發(fā)展,人員的決策支持。數(shù)據(jù)量從兆(M)字節(jié)、千兆(G字節(jié)發(fā)展到現(xiàn)在的兆兆OL AP基本概念.(T序節(jié)、千兆兆(P字節(jié)與此同時用戶的查詢需求也變得越來越多樣化,每一個需求不只是涉及簡單的一個(1變量。它是數(shù)據(jù)度量的指標(biāo)是數(shù)據(jù)的實際意關(guān)系表,而是多個關(guān)系表的多條乃至上千萬條記錄的綜義即描述數(shù)據(jù)是什么”。通常也將變量稱為度量(或合信息。關(guān)系數(shù)據(jù)庫及聯(lián)機事務(wù)處理已不能滿足終端量度)用戶(決策者及管理人員對數(shù)據(jù)復(fù)雜的查詢分析需求。(2)維。它是人們觀察數(shù)據(jù)的特定角度。維實際上1993年EF.Codd提出了多維數(shù)據(jù)庫和多維分析的概是考慮問題時的一類屬性單個屬性或?qū)傩约峡梢詷?gòu)念即0LAP。它側(cè)重于分析型應(yīng)用,區(qū)別于OLTP的操成一個維。作型應(yīng)用。在日常實際決策過程中決策者需要的信息在中國煤化工成共享維、私有維、常數(shù)據(jù)往往不只是單一的某個指標(biāo)數(shù)值,而是要能夠從多.規(guī)維、MHCNMH(c為用戶更好地展現(xiàn)維個角度觀察某個指標(biāo)或多個指標(biāo)的數(shù)值并能發(fā)現(xiàn)各指的特性。標(biāo)之間的關(guān)系。比如某公司總裁可能想知道本公司(3維的層次。人們觀察數(shù)據(jù)的某個特定角度(即最近兩年在銷售旺季產(chǎn)品銷售總額的對比情況,用以決某個維還可以從細(xì)節(jié)不同的各個方面進行描述將不同的各個描述方面稱為維的層次。收稿日期2掉6;修返日期: 2002-10-08(4維的成員。它是指維的一個取值。若維是多層第8期張忠平等聯(lián)機分析處理的綜述和分析11.次的不同層次的取值構(gòu)成-一個維成員。這里需要指出供快速的分析這也正是體現(xiàn)聯(lián)機分析處理的特性。的是維成員不一定每個維層次都必須取值部分維層次在文獻13 ]中介紹了時間序列數(shù)據(jù)類型,在一個同樣可以構(gòu)成維成員,且維成員是次序無關(guān)的。數(shù)據(jù)單元內(nèi)存儲一個時間序列的數(shù)據(jù)。這種數(shù)據(jù)類型有些成員由輸入的數(shù)據(jù)組成后稱為輸入成員,由輸可以省去時間維,簡化了對時間的處理,同時減少多維入成員和操作符組成表達式可以構(gòu)成導(dǎo)出成員。導(dǎo)出數(shù)據(jù)庫對數(shù)據(jù)單元的數(shù)量限制。但是需要定義起始時成員既可以作為維成員,也可以作為度量成員。導(dǎo)出成間、時間周期以及周期之間的數(shù)據(jù)轉(zhuǎn)換規(guī)則。比如:財員作為度量成員在實際應(yīng)用中較為普遍。政年、閏月、周時間跨越月份等問題在數(shù)據(jù)之間轉(zhuǎn)換時.(5多維數(shù)組。它是維和變量的組合表示。一個多都需要詳細(xì)考慮45]增加了額外數(shù)據(jù)準(zhǔn)備步驟。新的維數(shù)組可以表示為(維1、 維....維n變量)在多維數(shù)據(jù)增加在矩陣中會增加列,矩陣會變得越來越龐大,數(shù)組中,-定要有變量存在,且變量通常是數(shù)值型的。響應(yīng)速度將會受到影響。所以目前0LAP產(chǎn)品較少使用(6數(shù)據(jù)單元。多維數(shù)組的取值稱為數(shù)據(jù)單元。當(dāng)時間序列數(shù)據(jù)類型。多維數(shù)組的各個維確定一個維成員就惟一確定一個變(8 )聯(lián)機分析處理。它是使分析人員、管理人員或量的值??梢员硎緸?維1成員、維2成員....維n成執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出來的、員、變量的值)。能夠真正為用戶所理解的、并真實反映企業(yè)維特性的信.(7數(shù)據(jù)立方體。它是為輸入數(shù)據(jù)的聚合定義的框息進行快速、-致、交互地存取,從而獲得對數(shù)據(jù)的更深架結(jié)構(gòu)是多維數(shù)據(jù)庫23數(shù)據(jù)在維模型中的一種表述,入了解的一類軟件技術(shù)。允許以多維對數(shù)據(jù)建模和觀察,由維和事實組成。聯(lián)機分析處理具有快速性、可分析性、多維性和復(fù)圖1所示是按季度時間、城市地區(qū)和商品類型三個雜性四個特性167。維銷售的數(shù)據(jù)組成的數(shù)據(jù)立方體集中反映了上述定義。3OLAP的多維數(shù)據(jù)在多維數(shù)組定義中指明變量通常是數(shù)值型的下面我們定義變量是非數(shù)值型類型的情況。假定圖1是函3.1 多維數(shù)據(jù)結(jié)構(gòu)數(shù)V=KX,Y zIX為季度;Y 為城市z為商品)確定的數(shù)值?,F(xiàn)定義一個邏輯函數(shù):OLAP的多維數(shù)據(jù)分為兩種結(jié)構(gòu)形式8]:aV)= {! KxY 2)>800認(rèn)為是有意義的銷售)(1)以多維數(shù)組的形式存儲在多維數(shù)據(jù)庫(Muli.0≤KX,YZ)<800(認(rèn)為是無意義的銷售)Dimesional Database ,MDD )中,而不是像關(guān)系數(shù)據(jù)庫那樣根據(jù)邏輯函數(shù)Q V )圖1數(shù)據(jù)立方體可以轉(zhuǎn)換為如以記錄的形式存放,因 此它存在大量空值、重復(fù)等稀疏圖2所示的立方體。對于立方體中數(shù)據(jù)單元為邏輯值,數(shù)據(jù)1。人們可以通過多維視圖來觀察數(shù)據(jù)。多維數(shù)我們可以定義邏輯AND" 和OR" 等運算。據(jù)庫與關(guān)系數(shù)據(jù)庫相比它的優(yōu)勢在于可以提高數(shù)據(jù)處:(城市)巾)理速度加快反應(yīng)時間,提高查詢效率。對于大量稀疏南享數(shù)據(jù)采用壓縮技術(shù)處理[ 9,10]。(2)基于關(guān)系數(shù)據(jù)庫的星型模式(StarSchema)和雪02680952 31 512052233花模式(SnovflakeSchema)》星型模式由事實表和維表組0.9379383858000I本毒畜(尚品類型)成。事實表包含基本不含冗余數(shù)據(jù)的中心表。維表包含維數(shù)據(jù)的附屬表,每維對應(yīng)一個維表。事實表通過外圖1按季度城市和商品圖2邏輯數(shù)值的多維.鍵與維表相連接,像星星爆炸一樣,故稱為星型模式。類型三個維銷售的數(shù)數(shù)據(jù)立方體雪花模式是星型模式的變形。在星型模式中某些維表據(jù)立方體(單位:萬元)對應(yīng)多維數(shù)組(O 上海計算機,1);較為復(fù)雜,用一張維表來描述會帶來過多冗余數(shù)據(jù),為(Q2上海計算機1);了避免冗余數(shù)據(jù)占用過多的空間將維表再進行模式分(Q3上海計算機1);解把數(shù)據(jù)進一步分解到附加的維表中,這樣星型模式(Qa上海計算機1)形成類似雪花的形狀故稱為雪花模式。進行AND"運算結(jié)果為1”則說明計算機在上海一年雪花模式和星型模式的主要區(qū)別是雪花模式的維,四季都有很好的銷售,可以為銷售部門提供在上海加大表可能是規(guī)范化形式,以便減少冗余。但是由于執(zhí)行查計算機進貨力度的決策信息。詢需要更多的連接操作,雪花結(jié)構(gòu)可能導(dǎo)致瀏覽性能下同理對應(yīng)多維數(shù)組(Q, 上海電話0);降使整個系統(tǒng)性能將會受到影響。因此在數(shù)據(jù)倉庫(Q2上海電話0);和0LAHtf5地早型模式流行。(Q。上海電話0);中國煤化工(Q。上海電話0b3.2CNMHG進行OR"運算結(jié)果為0”則說明電話在上海一年四季(1徹萬和功狀( Slice and Dice)在多維數(shù)據(jù)結(jié)構(gòu)銷售情況都不是很好,可以為銷售部門提供在上海減少中選定二維子集的操作理解為切片選定三維子集的電話進貨力度或取消電話商品銷售的決策信息。因為操作理解為切塊。按二維進行切片按三維進行切塊,銷售數(shù)據(jù)用邏輯10表示其運算速度要比數(shù)值型數(shù)據(jù).可得到所需要的分析數(shù)據(jù)。如在季度時間、城市、商品運算快得夏方勢換策人員決策進貨或取消某種商品提類型"三維立方體中進行切片和切塊,便可得到各城市、12.計算機應(yīng)用研究2003年各商品在某時間的銷售數(shù)據(jù)。方體結(jié)構(gòu)(度量值、維度等)或?qū)ζ洮F(xiàn)有源數(shù)據(jù)的更改。(2 )鉆取( Drill)b 鉆取包含向下鉆取和向上鉆取操②刷新。清除重新加載立方體數(shù)據(jù)并重新計算它的聚作分別稱為下鉆( Dill-down )和上卷( Roll-up)鉆取的合。在立方體源數(shù)據(jù)已更改、但其結(jié)構(gòu)未更改的情況下深度與維所劃分的層次相對應(yīng)。層次可以根據(jù)用戶需使用此方法。③完全處理。在當(dāng)前定義基礎(chǔ)上完全重新求通過給定維或?qū)傩苑纸M來定義。也可以由數(shù)據(jù)庫中構(gòu)造立方體然后重新計算它的數(shù)據(jù)。在文獻11 ]中提.的隱含模式定義全序或偏序的模式分層。出了G-Cube M-Cube ,Hybrid-Cube三種算法應(yīng)用于超大型(3 )旋轉(zhuǎn)( Rotate夏 又稱轉(zhuǎn)軸( Pivo)旋轉(zhuǎn)是- - -種視壓縮數(shù)據(jù)倉庫上提高了數(shù)據(jù)立方體的處理速度。圖操作通過旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù)。為了使用戶能從多角度觀察多種數(shù)據(jù),0LAP 技術(shù)(4 )其它操作。有些OLAP操作提供其它鉆取操作提供了虛擬視圖技術(shù),虛擬視圖又稱為虛擬多維數(shù)據(jù)包括鉆過( Dillacross )和鉆透( Dill-through操作39。集。虛擬多維數(shù)據(jù)集是一個邏輯多維數(shù)據(jù)集內(nèi)多個多上述分析操作,0LAP提供可視化的直方圖、餅圖等維數(shù)據(jù)集的組合,它與由其它視圖和表組合而成的關(guān)系可視化效果呈現(xiàn)給用戶但是由于維的層次級別和成員.數(shù)據(jù)庫視圖有些相似,即只存儲其定義而不存儲其組數(shù)量的增加在一個可視化圖中,用戶難以區(qū)分成員之件多維數(shù)據(jù)集的數(shù)據(jù)。因此,它們實際.上不需要物理存間的關(guān)系如圖3所示。為了呈現(xiàn)在用戶面前清晰的可儲空間??梢允褂锰摂M多維數(shù)據(jù)集創(chuàng)建已有多維數(shù)據(jù)視化效果,有必要引入概念層次提升處理。例如",彩集的組合及變形,而不需要使用大量的額外存儲空間。電""冰箱”"空調(diào)”等,可以將概念層次提升到家用電由于用戶操作的是虛擬視圖那么對數(shù)據(jù)的更新操作也器”概念層次上來",面包””餅干”等,可以提升到食在虛擬視圖上進行。依據(jù)關(guān)系數(shù)據(jù)庫視圖原理我們約品”概念層上來等等。概念提升到高層次可視化效果束只有來源于一個數(shù)據(jù)立方體的虛擬視圖(我們稱其為清晰可見如圖4所示。子集虛擬視圖)才能進行更新操作,更新后的數(shù)據(jù)通過子集虛擬視圖映射回原始數(shù)據(jù)立方體。4OLAPServer分類及體系結(jié)構(gòu)從邏輯上講0LAP Server為用戶提供來自數(shù)據(jù)倉庫圖3多級概念層次效果餅圖圖4概念提升后的效果餅圖或數(shù)據(jù)集市的多維數(shù)據(jù)而不必關(guān)心如何存放問題。但是0LAP Server的物理結(jié)構(gòu)和實現(xiàn)必須要考慮數(shù)據(jù)存放3.3 數(shù)據(jù)立方體的計算問題12。目前0LAPServer的數(shù)據(jù)是以星型模式和多維多維數(shù)據(jù)分析的核心是有效地計算多個維的聚集。數(shù)組形式存放。0LAP Server實現(xiàn)包括:在文獻3 ]中介紹了對立方體有效計算的三種方法:●關(guān)系OLAR Relational OLAP ,ROLAP Server ;( 1 )Computer Cube操作●多維OLAR Multidimensional OLAP ,MOLAP )Server ;這是一種擴充SQL的方法,包含Computer Cube 操●混合OLAR Hybrid OLAP ,HOLAP )Server。ROLAP Server是-種中間件服務(wù)器具有可伸縮性;作。Computer Cube操作指定維的所有子集上計算聚集。.MOLAP Server是一種基于 數(shù)組的多維存儲引擎支持?jǐn)?shù)(2 )方體物化●方體的選擇計算據(jù)的多維視圖并將多維視圖直接映射到數(shù)據(jù)立方體數(shù)方體的物化有三種選擇:①不物化,即不預(yù)先計算組結(jié)構(gòu),具有快速性;H0LAP Server 是結(jié)合ROLAP和任何非基本”方體②全物化,即預(yù)先計算所有方體;③MOLAP技術(shù)得益于ROLAP較大的可伸縮性和MOLAP部分物化,即在方體集中,有選擇地物化一個適當(dāng)?shù)淖拥目焖儆嬎恪<?。部分物化在存儲空間和響應(yīng)時間兩者之間提供了OLAP采用三層的體系結(jié)構(gòu):數(shù)據(jù)庫服務(wù)器、OLAP很好的折中。但是在部分物化時要考慮三個因素:①確服務(wù)器和用戶(圖5)定要物化的方體子集;②利用查詢處理時物化的方體;隨著www技術(shù)的普遍應(yīng)用,用戶需要使用瀏覽器③在裝入和刷新時,有效地更新物化的方體。來訪問傳統(tǒng)的基于客戶/服務(wù)器方式的OLAP應(yīng)用?,F(xiàn)( 3 )數(shù)據(jù)立方體中多維數(shù)據(jù)聚集在很多OLAP產(chǎn)品支持三層Web體系結(jié)構(gòu)如圖6所示。①ROLAP立方體計算使用技術(shù)HTML●排序、散列和分組操作用于維屬性,以便對相關(guān)客戶瀏覽器Jave. Serp元組重新排序和聚類;Database Server jOLAP Senver Front-end ToWeb服務(wù)器應(yīng)用ICGI3355-API●在特定子集上分組;中國煤化工OLAP Server●在聚集.上計算新的聚集。YHCNMHGDatabase Serverr小相何圖6基于Web的②MOLAP立方體計算使用技術(shù)OLAP體系結(jié)構(gòu)●采用多路數(shù)組聚集技術(shù)將數(shù)組分成塊;●通過數(shù)據(jù)單元計算聚集。5OLAP產(chǎn)品及應(yīng)用立方體的更新又分為三種:①增量更新。將新數(shù)據(jù)添加到立月體平的分區(qū)并更新聚合。此方法不處理對立如果把0LAP定義為對共享的多維信息的快速分析第8期張忠平等聯(lián)機分析處理的綜述和分析13 .( Fast Analysis of Shared Multidimensional Informnation ,FAS-品指出了0LAP可視化的不足提出了聯(lián)機分析處理非MI )有很多產(chǎn)品可以劃入此類按使用方式的不同可分?jǐn)?shù)值型的量度和虛擬視圖的更新方法。0LAP 在各個領(lǐng)為通用型OLAP工具和特定商業(yè)問題分析軟件兩類[13]。域應(yīng)用已日益受到青睞,但在理論和應(yīng)用上仍然存在一數(shù)據(jù)密集型行業(yè)( Data Rich Industies X生活資料、零售、些有待進-步研究的問題,比如維類型的數(shù)值型(非離金融服務(wù)、運輸)是OLAP軟件的主要需求者,針對其中散量)變量的非數(shù)值型、維類型與量度之間的轉(zhuǎn)換、概各個行業(yè)的OLAP解決方案也出現(xiàn)了很多行業(yè)也從中念層次提升、實時更新、0LAP分析結(jié)果的可視化等等問得到了收益,獲得了極大的經(jīng)濟效益。隨著OLAP技術(shù)題。0LAP、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘技術(shù)的集成是未來研究的日漸成熟,相應(yīng)的產(chǎn)品在功能上也日漸豐富,如表1所示。的熱點。表1 OLAP 產(chǎn)品對照表參考文獻:[1] EF Codd ,S B Codd C T Salley. Providing OLAP to User-Ana-HYPERION程序具有幾百個計算公式支持多種計算用戶可以自Hperin Esduse OLAP Serv-|己構(gòu)件復(fù)雜的查詢 支持多用戶同時讀寫有30多個剪lysts :An IT Mandate[ EB/OL ]. http ://www. cis . com. mx/pdf/端工具可供選擇支持多種財務(wù)標(biāo)準(zhǔn)采用類似數(shù)組的結(jié)構(gòu)避免了連接操作提供組存儲過wp _ providing - olap_ to _ enduser. pdf 2002-01.ORACLE程語言來支持對數(shù)據(jù)的抽取靈活的數(shù)據(jù)組織方式數(shù)據(jù)Orade Express Sener為以在勢森后政箱Son肉也可直接在BDB上使用有[2] A Multdimensional Database and View Mode[ EB/OL ]. http ://erad. ict. ac. en/ papers/1999-2-214. htm 2002-01 .將lryrin, Exsbus的OL4P引警和DR的關(guān)系數(shù)據(jù)庫集IBM DB2 OLAP Sener .關(guān)系數(shù)振庫中們完全兼容數(shù)據(jù)用皇型模型存放|[3] Jiawei Han , Micheline Kamber. Data Mining Concepts and Tec-采里Murdeo技術(shù)通過QLE和ODBC對外開放采用中,hique[ M ].北京高等教育出版社2001.INFORMIX ..開放的體系結(jié)構(gòu)司以方便地其它數(shù)據(jù)庫及前臺工員進行集成[4] Rich Caickhoff.A New Face For OLAF[ Z ]. Intermet Systems ,SYBASE數(shù)據(jù)垂直分?jǐn)?shù)搜列"存儲)采用了突破性的數(shù)據(jù)存取January 1997Sybase Pwwer Dinension方法一i索引技術(shù)在教據(jù)壓縮和并行處理方面有獨到之處提供有效的預(yù)連織Po.in肢術(shù)[5 ] Kalyan Mukherjee ,Sushankar Daspal ,et al. Advanced DatabaseMICROSOFTManagement System[ C ]. Term Paper On Online Analytical Pro-SQL Sener 7.0 OLAP應(yīng)速度降低網(wǎng)絡(luò)流量通過OLE DB u 0LAP ,允許不同的客戶端訪問cessing,Xavier Institute of Management ,Bhubaneswar 2001.[6] Seok-Ju Chun ,Chin- Wan Chung ,Ju- Hong Lee ,et al. Dynamic6從聯(lián)機分析處理到聯(lián)機分析挖掘Update Cube for Range Sum Querie[ M ]. VLDB 2001.在數(shù)據(jù)挖掘領(lǐng)域?qū)⒙?lián)機分析處理與數(shù)據(jù)挖掘以及[7 ] Surajit Chaudhuri ,Microsoft Ressearch ,Redmond. Umeshwar Da-在數(shù)據(jù)倉庫中發(fā)現(xiàn)知識集成在-起稱之為聯(lián)機分析挖yal. HewletPackard Lads, Palo Alto ,An Overview of Data掘( On-Line Analytical Mining , 0LAM ),也稱OLAP挖Warehousing and OLAP Technolog[L EB/OL ]. http ://www. cs.掘3.14]。這是因為:sfu. ca/CourseCentral/459/ han/ papers/ chaudhuri97. pdf ,①數(shù)據(jù)倉庫中有高質(zhì)量的數(shù)據(jù);2002-01 .②構(gòu)建數(shù)據(jù)倉庫有良好的基礎(chǔ)設(shè)施;[8] Cheng Li ,X Sean Wang. A Data Model for Supporting On-Line③OLAP具有探測式數(shù)據(jù)分析能力;Analytical Processing[ EB/OL]. http ://www. isse. gmu. edu/④數(shù)據(jù)挖掘具有聯(lián)機選擇功能。數(shù)據(jù)挖掘和OLAPfaculty/xywang/ Papers/ cikm96. ps 2001-09.在算法結(jié)合方面具有下列方式:[9 ] Gayatri Sathe , Sunita Sarawagi . Itelligent Rollups in Mulidi-●先進行立方體計算后進行數(shù)據(jù)挖掘;mensional 0LAP Dat[ M ] VLDB 2001 .●先對多維數(shù)據(jù)進行數(shù)據(jù)挖掘然后再利用立方體[ 10 ] Wei Wang. Supprting Online Analytical Processing EB/OL]計算算法對挖掘結(jié)果分析;www . cs. ust. hk/ pg/ defenses/ Soyabs QL Wang w. txt 2002-01 .●立方體計算與數(shù)據(jù)挖掘同時進行。[11]高宏李建中.超大型壓縮數(shù)據(jù)倉庫上的CUBE算法J]. .數(shù)據(jù)挖掘是一種挖掘型工具,它能自動地發(fā)現(xiàn)隱藏軟件學(xué)報2001 1X 6) 830-839.在數(shù)據(jù)中的模式是一種能有效地從大量數(shù)據(jù)中發(fā)現(xiàn)潛[ 12] Alex Berson , Stephen J Smith. Data W arehousing ,Data Mining ,在數(shù)據(jù)模式、做出預(yù)測性分析的分析工具。0LAP 是一&OLAH[ M ]. McGraw-Hill Book Co. ,1999.種自上而下、不斷深入的分析工具用戶提出問題或假[ 13] 0LAP市場狀況及產(chǎn)品評測EB/OL ]. htp :/www dnmgroup.設(shè),0LAP負(fù)責(zé)從上而下深入地提取出關(guān)于該問題的詳org. cn/zs12. htm 2002-01.細(xì)信息并以可視化的方式呈現(xiàn)給用戶。作為驗證型分[14]劉中國煤化工到0LAM[ EB/OL ]. ht:/析工具,OLAP更需要對用戶需求有全面而深入地了解。1:.HCNMH G/ htm olap4. htm 2002-01.0數(shù)據(jù)挖掘和OLAP緊密結(jié)合能為用戶選擇所期望的數(shù)據(jù)作者簡介:挖掘功能動態(tài)修改挖掘任務(wù)提供靈活性。張忠平( 1972-)男,吉林人,講師,博士研究生研究方向為數(shù)據(jù)庫與知識庫、數(shù)據(jù)挖掘李榮( 1970- ),女山東人,講師,博士7結(jié)論與展望研究生研究方向為數(shù)據(jù)庫與知識庫、生物信息學(xué);郭麗麗本文論述了OLAP的基本概念、結(jié)構(gòu)、操作及相關(guān)產(chǎn)( 1978- ),女黑龍江人工程師。
-
C4烯烴制丙烯催化劑 2020-09-25
-
煤基聚乙醇酸技術(shù)進展 2020-09-25
-
生物質(zhì)能的應(yīng)用工程 2020-09-25
-
我國甲醇工業(yè)現(xiàn)狀 2020-09-25
-
石油化工設(shè)備腐蝕與防護參考書十本免費下載,絕版珍藏 2020-09-25
-
四噴嘴水煤漿氣化爐工業(yè)應(yīng)用情況簡介 2020-09-25
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-09-25
-
甲醇制芳烴研究進展 2020-09-25
-
精甲醇及MTO級甲醇精餾工藝技術(shù)進展 2020-09-25




