Google的排名算法分析
- 期刊名字:景德鎮(zhèn)高專學(xué)報(bào)
- 文件大?。?86kb
- 論文作者:陳蕓
- 作者單位:江蘇信息職業(yè)技術(shù)學(xué)院計(jì)算機(jī)系
- 更新時(shí)間:2020-09-25
- 下載次數(shù):次
第20卷第2期景德鎮(zhèn)高專學(xué)報(bào)Vol. 20 No.22005年6月Journal of Jingdezhen CollegeJun.2005Google的排名算法分析陳蕓°(江蘇信息職業(yè)技術(shù)學(xué)院計(jì)算機(jī)系江蘇無錫214101 )摘要:介紹了Google的排名算法PageRank的原理及其具體實(shí)現(xiàn),并對未來搜索引擎的排名算法研究進(jìn)行了展望。關(guān)鍵詞:搜索引擎;PageRank;Google中圖分類號:TP 301.6文獻(xiàn)標(biāo)識碼:A.文章編號:1008 - 8458(2005)02 - 0043-02網(wǎng)頁u的PageRank值,C為規(guī)范化因子,作用是保證所有網(wǎng)0概述頁的PageRank總和為常量。隨著搜索引擎技術(shù)的發(fā)展,Google最終憑借其強(qiáng)大的功R(a)=cZNOyR( w(1能與簡單的界面成為目前的搜索之王。Google 擁有多項(xiàng)專利技術(shù),其中PageRank 算法是關(guān)鍵技術(shù)之一,它奠定公式(1)是遞歸定義的,可以開始于任何等級的集合,反Google強(qiáng)大檢索及提供各種特色功能的基礎(chǔ)。PageRank技復(fù)迭代直到匯聚一點(diǎn)。圖1顯示了等級在頁面間的傳播。術(shù)是Google檢索結(jié)果的一種排序算法,中文通常譯為頁面所有的網(wǎng)頁的PageRank值都可以根據(jù)其他網(wǎng)頁的PageR-級別或頁面等級,根據(jù)這個算法,Google認(rèn)為每個網(wǎng)頁都ank值和鏈接的數(shù)量來計(jì)算得到,即所有鏈接到它的網(wǎng)頁的有一個反映其重要性的值,值越高表明其頁面級別越高,即PageRank值除以各自向外的鏈接數(shù)的商進(jìn)行求和。根據(jù)公式(1),-個網(wǎng)頁的鏈入數(shù)量越多、這些鏈入網(wǎng)頁網(wǎng)頁越重要。的PageRank 值越高、這些鏈入網(wǎng)頁本身的鏈出數(shù)量越少,1基本原理則該網(wǎng)頁的PageRank 值越高。PageRank的基本思想主要基于“從許多優(yōu)質(zhì)的網(wǎng)頁鏈.10050|53接過來的網(wǎng)頁,必定還是優(yōu)質(zhì)網(wǎng)頁”的回歸關(guān)系,來判定所有3網(wǎng)頁的重要性。,當(dāng)從網(wǎng)頁A鏈接到網(wǎng)頁B時(shí),就認(rèn)為”網(wǎng)頁A投了網(wǎng)頁B一票”,增加了網(wǎng)頁B的重要性。最后根據(jù)網(wǎng)頁的得票數(shù)評定其重要性,以此來幫助實(shí)現(xiàn)排序算法的國。350▼優(yōu)化,而這個重要性的量化指標(biāo)就是PageRank值。在實(shí)際計(jì)算網(wǎng)頁的PageRank值時(shí),Google還考慮到網(wǎng)頁A的所有鏈入網(wǎng)頁(鏈接到某網(wǎng)頁的其它網(wǎng)頁稱為該網(wǎng)PageRank技術(shù)根據(jù)網(wǎng)頁之間的鏈接結(jié)構(gòu)對網(wǎng)頁的重要頁的鏈入網(wǎng)頁)對它的推薦能力(即由于它們對網(wǎng)頁A的鏈.性進(jìn)行客觀的評價(jià),并將網(wǎng)頁的PageRank值應(yīng)用于檢索結(jié)接,使人們認(rèn)為網(wǎng)頁A的重要程度)和推薦程度(即它們認(rèn)果的排序。這樣,PageRank 技術(shù)在很大程度上避免和減少為網(wǎng)頁A的重要程度)。一個網(wǎng)頁本身的PageRank值越了人為因素,客觀地將最恰當(dāng)?shù)臋z索結(jié)果呈現(xiàn)給用戶。高,則它對其鏈出網(wǎng)頁(從某個網(wǎng)頁鏈出的網(wǎng)頁稱為該網(wǎng)頁的鏈出網(wǎng)頁)的推薦能力就越大;一個網(wǎng)頁的鏈出網(wǎng)頁越2PageRank的計(jì)算及其具體實(shí)現(xiàn)少,那么它對其中一個鏈出網(wǎng)頁的推薦程度就越高。也即假設(shè)網(wǎng)頁A有網(wǎng)頁T,T...T.的鏈接指向它。若把一篇文獻(xiàn)被其它文獻(xiàn)引用越多,則文獻(xiàn)質(zhì)量就越高。根據(jù)上面的基本原理,L. Page 等給出PageRank 的簡公式中國煤化工R ank算法計(jì)算為:R(ui) +.+ R(T,)N(T,))單定義如公式(1):令u為一個網(wǎng)頁,Nu表示從網(wǎng)頁。向外MYHCNMHG'的鏈接數(shù)目,Bu表示鏈接到網(wǎng)頁u的網(wǎng)頁集合, R(u)表示①收稿日期:2005-01-12作者簡介:陳蕓(1974-),女,漢族,廣東揭陽人,碩土,講師。景德鎮(zhèn)高專學(xué)報(bào)2005年6月T]是鏈點(diǎn)指向網(wǎng)頁T的網(wǎng)頁; R (TI)是網(wǎng)頁Tl的網(wǎng)接數(shù)(非零要素?cái)?shù))。這樣形成的行列被稱為“推移概率行頁級別PageRank的值(i=1,2,..n);N(T1)是指網(wǎng)頁.列”,含有N個概率變量,各個行矢量表示狀態(tài)之間的推移概T,的鏈出網(wǎng)頁的數(shù)量(i= 1, 2, . ; C取值范圍是0<率。倒置的理由是,PageRank并非重視鏈接到多少頁面,而C<1,通常取0185; R(T.)C(T)為鏈接指向網(wǎng)頁A的網(wǎng)是重視被多少頁面鏈接。頁T投與網(wǎng)頁A的網(wǎng)頁級別值,亦稱M iniPageRank。3結(jié)束語根據(jù)以上公式,一個網(wǎng)頁的鏈入數(shù)量越多,鏈出數(shù)量越少,則該網(wǎng)頁的PageRank值越高。Google給每--個網(wǎng)頁都PageRank是集頁面關(guān)鍵詞關(guān)聯(lián)度和鏈接普遍度為一體賦予一個初始PageR ank值,然后根據(jù)PageRank算法計(jì)算的綜合性排名算法,但是其技術(shù)本身也并不是十全十美的,其PageR ank值。算法的具體實(shí)現(xiàn)可以利用行列陣的形式Google還存在著許多問題,搜索引擎的完善與發(fā)展還有很來表達(dá)鏈接關(guān)系。從頁面i鏈接到另一張頁面j的時(shí),將其長的路要走,研究PageRank是為了能在此基礎(chǔ)上提出更有成分定義為1,反之則定義為0。即行列陣A中的元素的值創(chuàng)意的排序算法。同時(shí),更多新技術(shù)的應(yīng)用也將會給搜索引為:擎技術(shù)帶來新的活力。a, =1(從頁面i向頁面j有鏈接的情況)a=0(從頁面i向頁面j沒有鏈接的情況)參考文獻(xiàn):若存在N個頁面,則該行列式成為NX N的方陣。因[1] L. Page,s. Brin,R. Motwani,T. Winograd. The PageR-此可以把Web的鏈接關(guān)系看做是采用了鄰接關(guān)系有向圖表ank Citation Rank2ing,January, 1998. .s。只要建立了鏈接,就應(yīng)該有鄰接關(guān)系。PageRank中的2] Taher H. Haveliwala, . Efficient Computation of PageRank ,行列陣是把這個鄰接行列倒置后(行和列互換),為了將各列Stanford Technical Report, 1999.矢量的總和變成1 (全概率),把各個列矢量除以各自的鏈Analysis Of The Google Rank AlgorithmCHEN Yun(Department of computer, JiangSu Information Technology College,Wuxi 214101)Abstract :This paper introduces the theory and implementation of Page Rank algorthms. Then ,it covers an initial study on thefuture directions for Search engine's rank algorithms.Keywords : Search engine ; PageRank; Google米米業(yè)業(yè)****業(yè)*業(yè)**業(yè)*業(yè)**業(yè)業(yè)**業(yè)***業(yè)業(yè)*業(yè)*業(yè)******業(yè)**業(yè)*業(yè)*業(yè)業(yè)業(yè)ψ(上接第42頁)ty模板引擎。踐中,被廣為使用。4結(jié)語3. 2.2 JavaServer Faces(JSF) .JSF是以Web用戶界面為側(cè)重點(diǎn)的MVC應(yīng)用框架,目開發(fā)一個企業(yè)級的J2EE架構(gòu)的Web應(yīng)用程序是一個的是通過對視圖的組件化處理,進(jìn)-步豐富Web用戶界面非常龐大的工程,而且尤其是在開發(fā)的過程中用戶需求的變的表現(xiàn)形式,并提供可視化及工具支持。JSF的一大特點(diǎn)是化.代碼的復(fù)用、開發(fā)隊(duì)伍的協(xié)調(diào)等等。都要求我們在開發(fā)將組件類與組建的表現(xiàn)技術(shù)分離,從而不把開發(fā)者局限在某之初就必須選擇好一個好的開發(fā)模式。MVC 模式就提供了.種特定的腳本技術(shù)或標(biāo)記語言上。這樣一種模式,在開發(fā)實(shí)踐中證明,按照MVC模式將Web3.2.3 WebWork應(yīng)用分解成模型一視圖-控制三個部分。將不同功能的代是一個開源的MVC應(yīng)用框架,它基于命令設(shè)計(jì)模式,碼分離出來,形成多個組件,并結(jié)合一些常用的應(yīng)用框架,可力圖將用戶動作建模為不依賴于Servlet API 的命令對象。以做到事半功倍的效果。此外,WebWork不僅提供自己的JSP標(biāo)簽庫,還支持Veloci-The Application of MVC Design Model in JIEE Software StructureHU Zhi - gangCHEN Zhi - gang(1. Information and Engineering College,Zhongnan University ,Changsha,4 10083 ;2. Computer Center, Jingdezhen College,中國煤化工Abstret: In the process of the development of large type of distributive :YHC N M H Gw to reduce the complexityof the development and increase the robustness and reuse of softwares. It is a common solution to resolve the complex softwarestructure into several layers. MVC Model is widely used,for it has the properties of separating the front and back stand andhaving no relation with platform. This present article discusses something about the application of MVC design model in JIEEsoftware structure.Key words: design model;JIEE software structure ;distributive system; MVC model
-
C4烯烴制丙烯催化劑 2020-09-25
-
煤基聚乙醇酸技術(shù)進(jìn)展 2020-09-25
-
生物質(zhì)能的應(yīng)用工程 2020-09-25
-
我國甲醇工業(yè)現(xiàn)狀 2020-09-25
-
石油化工設(shè)備腐蝕與防護(hù)參考書十本免費(fèi)下載,絕版珍藏 2020-09-25
-
四噴嘴水煤漿氣化爐工業(yè)應(yīng)用情況簡介 2020-09-25
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-09-25
-
甲醇制芳烴研究進(jìn)展 2020-09-25
-
精甲醇及MTO級甲醇精餾工藝技術(shù)進(jìn)展 2020-09-25


