草莓…视频在线观看_韩国床戏激情合集视频_国产精品调教奴变态_中文字幕亚洲天堂

合肥市高新區(qū)長江西路與科學大道交口5F創(chuàng)業(yè)園A座309
136 5560 1775

HITS算法是Web結構挖掘中最具有權威性和使用最廣泛的算法

發(fā)表日期:2012-05-19 瀏覽次數:2797次

做SEO優(yōu)化的朋友都知道HITS算法是Web結構挖掘中最具有權威性和使用最廣泛的算法。但這個算法貌似不是很好懂,一般不經過深思熟慮普通人是很難想通透的,如果有一天你搞得懂了HITS算法,也就意味著你的優(yōu)化技術已經高人一等了。

該算法的大概思想是指利用頁面之間的引用鏈來發(fā)掘隱含在其中的有用信息(eg:權威性),具有計算簡單且效率高的特點。HITS算法通過兩個評價權值——內容權威度(Authority)和鏈接權威度(Hub)來對網頁質量進行評估。

內容權威度與網頁自身直接提供內容信息的質量息息相關,被越多網頁所引用的網頁,其內容權威度越高;鏈接權威度與網頁提供的超鏈接頁面的質量相關,引用越多高質量頁面的網頁,其鏈接權威度越高。

HITS算法認為對每一個網頁應該將其內容權威度和鏈接權威度隔開來思索,在對網頁內容權威度做出評價的基礎上再對頁面的鏈接權威度進行評價,然后給出該頁面的綜合評價。然而HITS算法也有其顯然的不足。

首先,它完全將網頁的內容或文本消除在外,僅思索網頁之間的鏈接結構來剖析頁面的權威性,這與現實網絡中的權威頁面對比,其不科學性昭然若揭。因為權威頁面必須針對某一主題或關鍵詞而言。某一頁面對一確定主題的具有較大權威性的頁面并不體表在其他與其無關的主題方面同樣具備權威性。

其次一個頁面對另一頁面的引用有多種情況,其中包含了一頁面對另一頁面的肯定,但除此之外也有其他目的鏈接,eg:為了導航或為了付費廣告。而HITS算法在達成過程中均沒有思索以上情況.致使了結果與目標的差距。就HITS算法的思想與實現過程做了詳細的研究與概括。

針對前面第一種瑕疵,就有相關的學者提出了一種利用超鏈文字及其周邊文字與關鍵字相匹配而計算超鏈權值的方法,并引入系數對周圍文字和超鏈文字進行權值的相對遏制,很好地將頁面文本信息引入到HITS算法,提升了算法的可靠性,并在現實中取得了優(yōu)良的效果。

對HITS算法的第二個瑕疵,即非正常目的的引用.在HITS算法看來,也誤認為是正常引用,致使實際結果與目標的出入。后來,經過不斷的改善。HITS算法又引入了時間參數,即借助對一鏈接引用的時問長短來評判是否為正常引用。因為非正常鏈接其引用時問必將不會很長(eg:交換鏈接、廣告鏈接),相反,倘若一頁面對另一頁面的鏈接時間較長,則必將反映此頁面就是用戶的相找頁面。即目標頁面或起碼是正常引用。

倘使設定時間閥值,則可以將非正常引用的鏈接在HITS算法的實現過程中甄選出來。如設定訪問時間少于1min者為非正常引用。另外可構造時間訪問函數,遏制權威頁面的相對大小。如隨訪問時間的增大而其權威性也逐漸非線性增大.這樣可為HITS算法的權威頁面提供更得當、更科學的解釋。SEO優(yōu)化鏈接穩(wěn)定性,在外部鏈接的建設中,占領非常重要的地位。鏈接越穩(wěn)定,對排名的幫助就愈大。

將文章分享到:

版權所有:啟邁科技-合肥網站建設 皖ICP備19009304號-1 皖公網安備 34010402702162號

網站建設,網站設計公司啟邁科技,為眾多企業(yè)提供網站建設,網站制作,響應式網站設計,手機網站建設,微網站,模板建站,企業(yè)郵箱等一站式互聯網解決方案和建站服務10年。