ISODATA算法的實現(xiàn)與分析
- 期刊名字:采礦技術
- 文件大?。?66kb
- 論文作者:楊小明,羅云
- 作者單位:長江大學地球物理與石油資源學院,長江大學計算機科學學院
- 更新時間:2020-09-25
- 下載次數(shù):次
ISSN 1671 -2900采礦技術第6卷第2期_2006年6月CN 43 - 1347/TDMining Technology, Vol. 6 ,No.2Jun. 2006ISODATA算法的實現(xiàn)與分析楊小明’,羅云(1.長江大學地球物理與石油資源學院,湖北 荊州市434023;2.長江大學計算機科學學院,湖北荊州市434203)摘要::ISODATA算法是一種基于統(tǒng)計模式識別的非監(jiān)督學習動態(tài)聚類算法,有較強的實用性。介紹了ISODATA算法原理和實現(xiàn)步驟,結合具體算例進行了聚類分析,得到了理想的分類結果,并分析了參數(shù)的選取將對分類結果產(chǎn)生的影響。關鍵詞:ISODATA;算法;聚類;模式識別ISODATA算法是- -種聚類劃分算法,稱為迭代獲得的聚類集進行分裂和合并處理,以獲得新的聚自組織數(shù)據(jù)分析或動態(tài)聚類。與傳統(tǒng)分類方法的根類中心和分類集(其中(4)為分裂處理,(5)為合并本區(qū)別是,它是--種軟性分類,而傳統(tǒng)聚類劃分是硬處理)。性的劃分。軟性分類可以認識到大多數(shù)分類對象在(6)再次迭代運算,重新計算各項指標,判別聚初始認知或是初始分類時不太可能顯示的最本質(zhì)屬類結果是否符合要求,以此反復經(jīng)過多次迭代運算,性,這種模糊聚類的過程以一種逐步進化的方式來直至得到理想的聚類結果。逼近事物的本質(zhì),可以客觀的反映人們認識事物的2具體算例與分析過程,是一-種更科學的聚類方式。依據(jù)ISODATA算法,采用C+ +編程語言實1 ISODATA算法現(xiàn),輸入10個樣本組成樣本集{X,X,,Xg},XISODATA算法是在沒有什么先驗知識的情況{0.0,0.0} ,X{3.0,8.0} ,X2{2.0,2.0} ,X{1.0,下進行分類,是- -種無監(jiān)督分類,它是先選擇若干樣1.0} ,X{5.0,3.0},Xs{4.0,8.0},X{6.0,3.0},品作為聚類中心,再按照最小距離準則使其余樣品X,{5.0,4.0} ,X。{6.0,4.0} ,X{7.0,5.0} ,見圖1。向各中心聚集,從而得到初始聚類,然后判斷初始聚10.類結果是否符合要求,若不符,則將聚類集進行分裂8.0 t和合并處理,以獲得新的聚類中心(聚類中心是通.0 t過樣品均值的迭代運算來決定的) ,再判斷聚類結.0果是否符合要求。如此反復迭代,直到完成聚類劉分操作。ISODATA算法步驟如下:(1)設置聚類分析控制參數(shù),主要包括:期望得到的聚類數(shù)K;-一個聚類中的最少樣本數(shù)θN ,如小于10.0此數(shù)就不作為一個獨立的聚類;一個聚類域中樣本圖1輸入樣本坐標距離分布的標準差Os;兩聚類中心之間的最小距離從圖1中可以直觀地看出,樣本集分為3類是θc ,如小于此數(shù),兩個聚類進行合并;一次迭代運算較合理的,{Xo,Xz,X}為第1類,{X,X;}為第2中可以合并的聚類中心的最多對數(shù)L;允許迭代的類,{X,X,X,X,X,}為第3類。當規(guī)定期望得到次數(shù)1。的|中國煤化工ATA算法進行迭代計(2)初始分類,將準備分類的N個模式樣本JHCNMHG與直觀看到的結果是{X;,i= 1,2,.-,N}讀人,預選N。個初始聚類中心,- -致時,驗證」IDUUAIA 異法分類的準確性。按照與聚類中心距離最小的原則將各樣本分類。分別取K (期望得到的聚類數(shù)) =2,3,4,運用(3) ~(5)按控制參數(shù)給定的要求,將前一次(下轉第68頁)8采礦技術2006 ,6(2)余設計。操作過程實現(xiàn)雙線控制方式,對提升機運部故障時,提升機能實現(xiàn)低速故障運行(2 m/s)在行關健的信號(如速度、位置、安全、減速、過卷等)PLC、監(jiān)測系統(tǒng)控制軟件檢測有故障而硬件及連接均采用多重保護,互為監(jiān)視。完全取代了原機械監(jiān)無故障時,可以通過旁路工作方式,以旁路軟件故障控器的功能;將本次運行結束;,(3) PLC操作控制系統(tǒng)能完成提升機手動、半(7)井上、下信號工可在井上、下信號房內(nèi)根據(jù)自動、全自動、檢修及緊急控制等各種運行方式的控實際需要,通過按鈕完成慢動功能;制要求以及特殊工I況如下爆破器材、下大件、低速爬(8)整個電控系統(tǒng)的各部分可以通過網(wǎng)絡進行行等,并根據(jù)提升種類、運行方式、運行的區(qū)間自動數(shù)據(jù)和信號交換,具有遠程監(jiān)視功能。確定運行速度,實現(xiàn)有機聯(lián)鎖;(4)整個電控系統(tǒng)中有不少于3套的提升機安3結束語全保護回路,除每個PLC中具備的軟件安全保護隨著科技進步與新技術的發(fā)展,工業(yè)生產(chǎn)過程外,還采用繼電器硬接線方式組成的安全保護回路,的自動化程度越來越高,對老設備進行技術改造是對關健環(huán)節(jié)采用3重或多重保護,保護功能齊全;提高生產(chǎn)力的一-種行之有效的方法。實踐證明該控(5)監(jiān)控系統(tǒng)可實現(xiàn)多畫面實時監(jiān)控,多參量制系統(tǒng)能較好地滿足生產(chǎn)的要求,技術先進,控制精數(shù)碼及曲線顯示并加以自動記錄,各種故障的報警度高,故障率低,保證了提升系統(tǒng)安全穩(wěn)定的運行。及記錄;(6)故障開車功能。在PLC、監(jiān)測系統(tǒng)出現(xiàn)局(收稿日期:2005 -05 -24)(上接第66頁)迭代次數(shù)過大,會引起過度分類;迭代次數(shù)過小,又ISODATA算法進行迭代計算,規(guī)定的控制參數(shù)見表會導致分類不到位,因此要根據(jù)具體情況選擇合適1 ,輸出的分類結果見表2。的迭代次數(shù)。標準偏差參數(shù)和合并參數(shù)改變后對分表1控制參數(shù)類結果的改善受到迭代次數(shù)大小的影響;當?shù)蜬初始聚類中 初始聚0N0s0cLI數(shù)增加到- -定程度時(約10) ,如果保持標準偏差參心數(shù)(N.)類中心數(shù)和合并參數(shù)不變,則分類結果變化很小。x2X0.5 23結論4以上介紹了ISODATA算法原理和實現(xiàn)步驟,結表2運算結果輸出合算例進行了聚類分析,得到了理想的分類結果,并聚類數(shù)聚類中心包含的樣本2 (5.14,5.00)X,X,Xs, X,x, Xg,X,分析了參數(shù)的選取將對分類結果產(chǎn)生的影響。該算(1.00,1.00)Xo,X2,X法要求在分類之前地確定- -些參數(shù),- -定程度上反(3. 50,8. 00)X, Xs映了人機交互的特點,正因為這種人為干預的存在,(1. 00,1.00)X,x,X在某種程度上減少了聚類的盲目性,有利于取得較(5. 80,3.80)X,X;x,X,X(3. 50,8.00)X,X好的分類效果。作者沒有在迭代過程中動態(tài)修改初X,X2,X始設定的參數(shù),所以可以從該方面改進此算法。(6.004.33)X,Xg,X.參考文獻:(5. s0,3.00)X,X。[1]邊肇祺,張學工,等 模式識別[ M].北京:清華大學出版社,在運用ISODATA算法分類之前,人為確定- -些2000控制參數(shù),參數(shù)的選取將對分類結果產(chǎn)生影響,如表[2] 沈清,湯 霖.模式識別導論[M].長沙:國防科技大學出版社.19912中3種不同的分類結果。算法中r的3個參數(shù):標[3]中國煤化工計教程[M].北京:清華準偏差參數(shù)0s、合并參數(shù)θc和迭代次數(shù)I較重要。標準偏差參數(shù)越大,執(zhí)行分裂的可能性越小,分類數(shù)DHCNMH G(收稿日期:2005-12-16)目趨少;合并參數(shù)越小,算法迭代過程中合并的可能作者簡介:楊小明(1981-),男,湖北孝感人,2003年江漢石性越小,因此在較大程度上保留以前的分類結果。油學院畢業(yè),碩士生,主要從事地球物理測井研究工作。
-
C4烯烴制丙烯催化劑 2020-09-25
-
煤基聚乙醇酸技術進展 2020-09-25
-
生物質(zhì)能的應用工程 2020-09-25
-
我國甲醇工業(yè)現(xiàn)狀 2020-09-25
-
JB/T 11699-2013 高處作業(yè)吊籃安裝、拆卸、使用技術規(guī)程 2020-09-25
-
石油化工設備腐蝕與防護參考書十本免費下載,絕版珍藏 2020-09-25
-
四噴嘴水煤漿氣化爐工業(yè)應用情況簡介 2020-09-25
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-09-25
-
甲醇制芳烴研究進展 2020-09-25
-
精甲醇及MTO級甲醇精餾工藝技術進展 2020-09-25


