Agent在Internet中的應(yīng)用
- 期刊名字:計算機與數(shù)字工程
- 文件大小:343kb
- 論文作者:黃俊勇,陳
- 作者單位:華中科技大學(xué)計算機學(xué)院
- 更新時間:2020-06-12
- 下載次數(shù):次
計算機與數(shù)字工程第29卷Agent在 Internet中的應(yīng)用黃俊勇陳(華中科技大學(xué)計算機學(xué)院武漢430074)摘要隨著 Internet自身的快速增長,在它之上的信息已經(jīng)使得用戶可以無限地進行文檔訪問,但同時也產(chǎn)生了用戶找不到感趣文檔的困難。我們提出了一種 Agent系統(tǒng)模型,它可以自動學(xué)習(xí)用戶的訪問模式和信息資源的更新模式,將信息主動地推到用戶面前,從而最大可能地滿足了用戶方的需求和減輕了服務(wù)方的開銷。關(guān)鍵詞: agent Internet數(shù)據(jù)庫中圖法分類號:TP393The Application of Agent in InternetHuang Junyong Chen Yan( The Computer College, HUST, Wuhan, 430074)Abstract: With the rapid growing of Internet, its users can have almost unlimited access to document on it, butat the same time, it has the problem that users are difficult to find interesting documents We design an agent systemmodel, which can learn users'access pattern and information update pattern by itself and push information to usersSo it contents users'requirements and reduces servers'cost at bestKey words: agent, Internet, databaseClass number: TP3931引言mazon等提供了搜索引擎使用戶在網(wǎng)頁上給出一定的條件來查找信息。我們將提出一種在最近的幾年中, Internet獲得了爆炸新型的 Agent系統(tǒng)工具,它能自動發(fā)現(xiàn)用戶式的增長,每天有大量的信息和主機涌入In的訪問模式,并對信息的源文件進行管理,從ternet之中。在 Internet之中可用的信息是而提高效率。巨大的,但有一些老的信息被定期或不定期地更新,對個人來說他是不可能追蹤所有這2相關(guān)的工作些信息及它們的變換的,為此我們必須提供年產(chǎn)計兮和風(fēng)終用戶感興趣的些軟件工具來幫助用戶檢索、定位和管理領(lǐng)域中國煤化少研究者的注CNMH網(wǎng)頁文檔。著名的商業(yè)網(wǎng)站如 Altavista、A意,產(chǎn)日,我們對它們進行收到本文時間:2001年7月18日第29卷(2001)第5期計算機與數(shù)字工程43了分類需求?!せ竟ぞ遖gent是高級工具中應(yīng)用最廣泛的方它們是用戶上網(wǎng)所必備的工具,如網(wǎng)景·式,它的目標在于既能通知用戶最近的更新的 Netscape和微軟的I,它們在用戶的直接和相關(guān)信息,又能理解信息資源的行為,使得命令下檢索網(wǎng)頁,用戶通過輸入URL來對系統(tǒng)能夠匹配信息交互雙方的需求和行為網(wǎng)頁進行定位。在這篇文章中,我們設(shè)計了一種 Agent模型,·初級輔助工具:它通過對用戶歷史記錄的研究來實現(xiàn)目標。他們?yōu)橛脩舭l(fā)現(xiàn)相關(guān)網(wǎng)頁提供了初始化的應(yīng)用這就是通常所說的搜索引擎例如搜3一種 Agent系統(tǒng)模型狐和雅虎。大多數(shù)這樣的工具通過在 Inter在這一部分,我們描述了一種模型來實net網(wǎng)上漫游以生成大量受歡迎的網(wǎng)頁的索現(xiàn)智能 Agent的目標—讓用戶以最小的努引。用戶向搜索引擎提供感興趣的主題關(guān)鍵力獲取最多的信息并且系統(tǒng)資源占用最少。詞,搜索引擎將匹配的網(wǎng)頁信息反饋紿用戶。(1)定義需求但是隨著網(wǎng)絡(luò)的巨大增長,搜索引擎受對于一個系統(tǒng)我們有如下需求歡迎的程度正在降低,因為它們對于一個單①系統(tǒng)應(yīng)能了解信息資源的更新模式,個的搜索返回了大量的網(wǎng)頁,對于用戶來說,它應(yīng)該通過學(xué)習(xí)知道信息資源文檔的更新時在網(wǎng)頁列表中找到相關(guān)的信息是件費時的工間,并在用戶對文檔進行需求之前預(yù)先檢索作它們。中級自動工具②系統(tǒng)應(yīng)能自動發(fā)現(xiàn)用戶感興趣的主為了解決搜索引擎存在的問題,許多研題,也能知道隨著時間的推移用戶興趣的轉(zhuǎn)究者投資于自動機這種工具,例如Web-換方向,當(dāng)系統(tǒng)幫助用戶在 Internet上發(fā)現(xiàn)watcher和SIFT,它們是 Agent的初級形式,有關(guān)信息時,對于用戶興趣如何的知識將派它們可以利用用戶的配置文件,如SIFT能上用場。自動根據(jù)用戶的配置去匹配最新的新聞,找③系統(tǒng)應(yīng)能有效地利用網(wǎng)絡(luò),避免因過到用戶感興趣的文章并以Emal的形式發(fā)分搜索而引起的網(wǎng)絡(luò)阻塞,或負擔(dān)過重,對于給用戶。多個用戶的搜索目標應(yīng)能集簇。這種工具的優(yōu)點在于它們能執(zhí)行大多數(shù)④系統(tǒng)應(yīng)能維護其自身的數(shù)據(jù)庫,利用有用的任務(wù),例如統(tǒng)計分析、維護、鏡像等。數(shù)據(jù)挖掘技術(shù)來發(fā)現(xiàn)和存儲用戶的訪問模式然而它們也有大量的缺點,例如它們通常需及相關(guān)的感興趣的文檔的集合。要相當(dāng)大的帶寬來進行操作,這樣就導(dǎo)致了(2)系統(tǒng)結(jié)構(gòu)概述:網(wǎng)絡(luò)的過載帶寬短缺和維護代價的上升等我們的系統(tǒng)用增量機制來加強學(xué)習(xí)能力問題。以幫助用戶發(fā)現(xiàn)網(wǎng)頁。它首先通過分析用戶高級工具對網(wǎng)站的訪問記錄來了解用戶感興趣的領(lǐng)高級工具具有學(xué)習(xí)和演繹用戶配置文件域,然后通過向用戶提供網(wǎng)站更新信息來幫的能力,能夠推斷出用戶感興趣的主題和訪助他『V中國煤化工圖如圖1問模式例如 yan et. al發(fā)明了在在線商店領(lǐng)CNMHG像 Netscape或域來記錄和學(xué)習(xí)用戶的訪問模式的系統(tǒng),這I這樣方便的網(wǎng)絡(luò)瀏覽器來訪問 Internet個系統(tǒng)利用集簇技術(shù)來識別用戶的訪問模上的網(wǎng)頁。在我們的系統(tǒng)中,瀏覽器與代理式然后重新組織自身的結(jié)構(gòu)以適應(yīng)用戶的服務(wù)器相連,從而在一個用戶會話期中,所有Agent在 Internet中的應(yīng)用第29卷的HTTP需求都經(jīng)過了代理,這樣系統(tǒng)就可文件由三部分組成以通過維護訪問日志來記下用戶的訪問過用戶D:用來標識用戶的特定身份。程感興趣的主題:感興趣的主題是一個二元組的集合,每個元組包括兩個部分(主題代理麗務(wù)器權(quán)重)例如(飛機,0.5),權(quán)重越大,表示用戶感興趣的程序越高。定期訪問模式:有些文檔是大量用戶的文蕾理器共同需求,例如新聞,股票信息等,這些文檔彬號厙是有時間性的,并且定期刷新,定期訪問模式記錄文檔的地址和定期的時間,監(jiān)督 Agent⑥通過它們來預(yù)先取得文檔以方便用戶使用。⑤監(jiān)督 Agent:監(jiān)督 Agent監(jiān)督包含興趣文檔的特定的網(wǎng)站和網(wǎng)頁,它有兩種功能。是對于用戶能夠指定那些要更新的文檔,監(jiān)督 Agent定期地進行訪問并學(xué)習(xí)信息源的圖1系統(tǒng)結(jié)構(gòu)圖②代理服務(wù)器:用戶通過代理服務(wù)器和更新模式,即一個網(wǎng)頁多久更新一次及何時更新,根據(jù)這些知識,監(jiān)督 Agent安排將來對系統(tǒng)通信,當(dāng)用戶發(fā)出一個HTTP需求時這些網(wǎng)頁的檢索并保證在文檔數(shù)據(jù)庫中存儲這個需求被向前傳遞到代理服務(wù)器上,然后的是它們的最新版本。另一個功能是安排預(yù)它將用戶所需要的文檔反饋給用戶。被檢索先存取那些經(jīng)常被用戶訪問的網(wǎng)頁。的網(wǎng)頁通過文檔管理器存儲在文檔數(shù)據(jù)庫⑥搜索引擎:搜索引擎執(zhí)行的是在In-中。當(dāng)代理服務(wù)器收到一個HTTP請求時,ternet上快速漫游的功能,在網(wǎng)頁探測中遇它首先檢查文檔管理器,看所需要的文檔是到的感興趣的文檔被保存到文檔數(shù)據(jù)庫中,否已經(jīng)緩存在文檔數(shù)據(jù)庫中,如果在的話,就然后被編排索引。在這個原型中,搜索引擎將本地拷貝反饋給用戶,否則的話,它將訪問的實現(xiàn)是采用面向目標的方式,利用學(xué)習(xí)AInternet代理服務(wù)器將用戶的執(zhí)行信息記gent生成的用戶配置文件,特別是感興趣的錄到日志中,每個用戶需求產(chǎn)生一個用戶記主題來驅(qū)動,盡量避免訪問那些與目標無關(guān)錄這個記錄由用戶D、訪問地址、訪問時的網(wǎng)站和網(wǎng)頁。間、檢索文檔的摘要組成。學(xué)習(xí) Agent將會(3)發(fā)現(xiàn)模式的過程:利用日志信息來構(gòu)造用戶的訪問模式在我們的 Agent系統(tǒng)中,學(xué)習(xí) Agent是③文檔管理器文檔管理器是訪問文檔重要的部分。對于客戶方來說,學(xué)習(xí) Agent數(shù)據(jù)庫的接口,它負責(zé)存儲和檢索被系統(tǒng)存通過兩種方式,交互的方式和靜止的方式來儲的文檔,這些要根據(jù)用戶的HTTP請求和學(xué)習(xí),從而有能力識別用戶的訪問模式。而系統(tǒng)初始化的結(jié)果來設(shè)定。存儲文檔的超文對于服務(wù)器方來說,它能發(fā)現(xiàn)收集的網(wǎng)頁的本結(jié)構(gòu)被重新構(gòu)造的鏈接代替。數(shù)據(jù)庫也維更中國煤化工④學(xué)習(xí) Agent:學(xué)習(xí) Agent通過分析代一是交, CNMHG學(xué)習(xí)有兩種方式,護對文檔的全文索引。秤力八促且接,它提供一種圖理服務(wù)器創(chuàng)建的訪問日志來發(fā)現(xiàn)用戶的訪問形用戶接口,允許用戶直接輸入一套他們感模式,它為每個用戶產(chǎn)生一個配置文件,配置興趣的領(lǐng)域的關(guān)鍵詞,這些關(guān)鍵詞被存儲到第29卷(2001)第5期計算機與數(shù)字工程用戶配置文件中,以便將來查找網(wǎng)頁。舉例是一個參考網(wǎng)頁,其相關(guān)性被降低,從它中間來說,用戶可能會輸入“數(shù)據(jù)挖掘”和“ Inter-抽取出來的關(guān)鍵詞的權(quán)重要降低。net",于是在配置文件中產(chǎn)生二元組(數(shù)據(jù)挖②在一個會話中最后訪問的文檔很可能掘,0.5)和( Internet,0.5),代理將會在搜索是內(nèi)容文檔,為了識別它們是不是內(nèi)容豐富時反饋給用戶一些有關(guān)“數(shù)據(jù)挖掘”和“ Inter-的文檔,從訪問日志中我們構(gòu)造了一個包含net"的網(wǎng)頁,通過用戶對列表的進一步挑選,瀏覽器前后瀏覽關(guān)系的運動圖,在訪問日志學(xué)習(xí) Agent可能會發(fā)現(xiàn)用戶感興趣的是將二中的每一個文檔是圖中的一個節(jié)點,如果用者都涉及到的網(wǎng)頁,于是要考慮邏輯條件戶從一個文檔轉(zhuǎn)到另一個文檔,那么就生成AND,OR,NOT的運用,將它們嵌入到主題條邊。在運動圖中,游歷的過程被標識出之中,于是將原來的二元組刪去,生成新二元來,一條路線是從用戶的主頁出發(fā)為開始到組(數(shù)據(jù)挖掘 AND Internet,0.6)。如果用戶個向后動作的產(chǎn)生為結(jié)束。通過決定訪問開始時不輸入任何關(guān)鍵詞,系統(tǒng)也可以在開日志中所有的向后瀏覽的運動來識別所有的始提供大量的網(wǎng)頁讓用戶作選擇,從而起到路線。一條路線作為一個瀏覽會話看待,離初始化的作用,然后再進行上述的步驟。個會話末尾最近的文檔有可能是一個內(nèi)容第二種方式稱為靜止的方式,這種方式文檔,如果一個文檔被認為是內(nèi)容豐富的文利用了代理服務(wù)器生成的日志記錄,通過對檔,那么它的相關(guān)性要提高,其中的關(guān)鍵詞權(quán)記錄的研究,來發(fā)現(xiàn)用戶的訪問模式。在日重也要提高。志中包含的是大量沒有經(jīng)過處理的信息,為③一個節(jié)點有可能是一個廣告節(jié)點,即了發(fā)現(xiàn)用戶的訪問模式,我們必須經(jīng)過下面它可以有很多個不同的前一頁,從很多節(jié)點的三個步驟來對數(shù)據(jù)進行處理瀏覽器都能指向它。根據(jù)b中的運動圖,我第一步:學(xué)習(xí) Agent將處理每個在用戶們可以采用與a相同的定界限值的方法來進訪問日中記錄的文檔全文,產(chǎn)生一套二元組,行判斷,然后對關(guān)鍵詞的權(quán)重進行調(diào)整。例如二元組(飛機,20)、(戰(zhàn)斗機,10)就可能④從訪問日志中能估計用戶在一個文檔是從一個航空文檔中抽取出來的,然后根據(jù)上停留的時間,一個停留時間很短的文檔很詞數(shù)在全文中的比例,乘以一個固定系數(shù)來可能只是一個過渡頁,我們也可以設(shè)定一個生成權(quán)重,例如(飛機,0.24),(戰(zhàn)斗機,0.界限值,小于這個值的文檔的相關(guān)性被降低,2)其中的關(guān)鍵詞的權(quán)重被降低,反之就按比例第二步:在第一步中產(chǎn)生的二元組可能進行提高。可以直接用于發(fā)現(xiàn)用戶感興趣的主題,但它總的來說,第二步的輸入是第一步的原們之中存在著大量的干擾信息,舉例來說,有始二元組集合,經(jīng)過內(nèi)部的啟發(fā)性規(guī)則的修些網(wǎng)頁不向用戶提供任何信息,它們被訪問改,輸出的是權(quán)重經(jīng)過調(diào)整了的二元組集合。只是因為它們之中包含了大量的參考超鏈第三步:這是最后一步處理過程,在這接就像搜索引擎的結(jié)果網(wǎng)頁一樣,因此學(xué)習(xí)步中使用了集簇的技術(shù)來產(chǎn)生主題,我們對Agent必須決定每個網(wǎng)頁的相關(guān)性,利用下任意兩個二元組中的主題的相似性進行測面的啟發(fā)式規(guī)則來修改權(quán)重中國煤化工的差距越小,當(dāng)一①一個包含了大量URL的網(wǎng)頁很可能個CNMH它與前面的集簇是一個參考超鏈接的指導(dǎo)性網(wǎng)頁,我們可以的中心進行測量,僅當(dāng)它與中心的距離超過預(yù)先規(guī)定一個界線值,如果一個文檔中包含定限度的時候才吸收它,它自身產(chǎn)生一個的超鏈接數(shù)超過了這個值,那么它就被認為新的集簇,否則就放棄。(下轉(zhuǎn)第56頁)數(shù)據(jù)倉庫在現(xiàn)代企業(yè)中的應(yīng)用與安全問題第29卷段,以統(tǒng)計分析技術(shù)作為分析數(shù)據(jù)和提取信出現(xiàn)1使用密鑰息的有效方法,以人工智能技術(shù)作為挖掘知出現(xiàn)2識和發(fā)現(xiàn)規(guī)律的科學(xué)途徑而得到廣泛應(yīng)用并出現(xiàn)3進行加密迅速地發(fā)展成熟。數(shù)據(jù)列A網(wǎng)絡(luò)環(huán)境下對數(shù)據(jù)庫數(shù)據(jù)倉庫的安全現(xiàn)4使用密鑰保護措施與單機環(huán)境下數(shù)據(jù)庫的保護措施以出現(xiàn)5Y及網(wǎng)絡(luò)上消息通信的保密機制有著很大的不同,為了實現(xiàn)更小粒度的安全保護,達到更高出現(xiàn)6進行加密的應(yīng)用性能,需要對現(xiàn)有的安全機制作不斷圖2對同一個數(shù)據(jù)的不同出現(xiàn)場合的改進并設(shè)計新的安全機制。使用不同的加密密鑰數(shù)據(jù)庫數(shù)據(jù)倉庫環(huán)境下對數(shù)據(jù)庫表的參考文獻不同列以及對同一個數(shù)據(jù)的不同出現(xiàn)場合進1薩師煊,王珊.數(shù)據(jù)庫系統(tǒng)導(dǎo)論高等教育出版社行不同的加密處理的功能能夠在更小的粒度2汪永生,邵惠鶴過程工業(yè)中的數(shù)據(jù)倉庫技術(shù)展級上為數(shù)據(jù)庫數(shù)據(jù)倉庫提供安全保護,并相tE. Proceedings of the 3 d world congress on Intelli應(yīng)提高數(shù)據(jù)庫數(shù)據(jù)倉庫的應(yīng)用性能與使用gent Control and Automation范圍。3 Christopher Harmon. Safeguarding the Data Ware-house. Computer Fraud Security June 19984總結(jié)Park Kyung, Favrel Joel. Virtual Enterprise-Information System and Networking Solution. Com現(xiàn)代企業(yè)面臨的是激烈的市場競爭、大puter Industrial Engineering量的實時與歷史數(shù)據(jù)以及更加大規(guī)模的生產(chǎn)5 Mario Platini, Jose Antonio rodero. Auditing Data運行機制,應(yīng)運而生的數(shù)據(jù)倉庫以傳統(tǒng)的數(shù)Warehouse Security. 1999 IEEE據(jù)庫技術(shù)作為存取數(shù)據(jù)和管理資源的基本手(上接第45頁)更好的方法涌現(xiàn)出來用于網(wǎng)絡(luò)應(yīng)用之中。通過這種方法來減少二元組的個數(shù)。參考文獻[1]M. S Chen, J S Park, P. S. Yu, Data Mining for4小結(jié)path traversal patterns in a web environment, Pro-在這篇文章中,我們構(gòu)造了一個 Agentceedings of the 16th International conference on的系統(tǒng)模型,對它在網(wǎng)絡(luò)中的運用方法、原理Distributed computing system. HongKong, Ma1996,pp.385-392進行了描述,并展示了它的廣泛用途,通過我[2]李旸,吳國棟利用代理服務(wù)器實現(xiàn) Internet訪問們的構(gòu)造,希望起到拋磚引玉的作用,讓更多計算機系統(tǒng)應(yīng)用1999年12期中國煤化工CNMHG
-
C4烯烴制丙烯催化劑 2020-06-12
-
煤基聚乙醇酸技術(shù)進展 2020-06-12
-
生物質(zhì)能的應(yīng)用工程 2020-06-12
-
我國甲醇工業(yè)現(xiàn)狀 2020-06-12
-
石油化工設(shè)備腐蝕與防護參考書十本免費下載,絕版珍藏 2020-06-12
-
四噴嘴水煤漿氣化爐工業(yè)應(yīng)用情況簡介 2020-06-12
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-06-12
-
甲醇制芳烴研究進展 2020-06-12
-
精甲醇及MTO級甲醇精餾工藝技術(shù)進展 2020-06-12
