草莓…视频在线观看_韩国床戏激情合集视频_国产精品调教奴变态_中文字幕亚洲天堂

合肥市高新區長江西路與科學大道交口5F創業園A座309
136 5560 1775

淺談搜索引擎的核心—搜索引擎的爬行蜘蛛

發表日期:2010-04-09 瀏覽次數:2593次

   今天合肥網絡公司和大家談談搜索引擎的核心,搜索引擎蜘蛛(crawler)。蜘蛛是搜索引擎獲取網絡資源的重要途徑。通過網絡蜘蛛,搜索引擎可以有機的獲取當前互聯網上最新的網頁,為接下來分析關鍵詞,排序等等提供素材。既然蜘蛛如此的重要,那么我們就應該針對蜘蛛給他提供一些適合他的“食物”但是在這里有個非常重要的概念就是蜘蛛是很有禮貌的,它不會不告而訪。它會在自己的“user agent”聲稱“我是某某搜索引擎的蜘蛛”。這就為我們提用一個很好的機會,因為機器畢竟和人不一樣,要達到人類最好的視覺效果可能會對搜索引擎對頁面的分析不利,反之亦然。通過探測蜘蛛的方法,可以把一個完全只適合給機器看的頁面交給蜘蛛但是一點也不影響到自己真正用戶的用戶體驗。而且,隨著時間的發展,蜘蛛開始變的越來越聰明,有些蜘蛛比如說google,已經可以理解頁面本身中的javascript(但不是包括 〈SCRIPT src="XXX" type=text/javascript〉這樣外部的javascript),這樣如果你不想讓蜘蛛去某個鏈接的話完全可以把它寫進javascript中。至于說html里面的各個標簽應該怎么寫對搜索引擎有益,互聯網上已經有很多文章闡述了,本文就不贅述了。
      蜘蛛還有一個重要但是很無奈的特點就是蜘蛛的資源是有限的。特別是對于一些規模較小的搜索引擎,他們會設計自己的一套算法來決定是否要讓蜘蛛訪問某個頁面。如果這個頁面不夠“重要”(由各個引擎自己定義),而且資源也不夠的情況下,這個頁面就會被忽略。我們不妨來做個實驗,去百度的網站輸入site: cn.alexa.com,會顯示有約694,000篇,再去sogou的網頁嘗試,你會看見找到 6 個網頁。這也給各位希望做搜索引擎優化的諸位提個警鐘,不要太在意這個時候在(小規模搜索引擎的)結果。如果資金允許的話,在這個時候在小規模引擎上買些關鍵字。

    合肥網站建設認為我們要想獲得好的關鍵字排名一定要很好的對待搜索引擎蜘蛛。因為他是搜索引擎的核心。


將文章分享到:

版權所有:啟邁科技-合肥網站建設 皖ICP備19009304號-1 皖公網安備 34010402702162號

網站建設,網站設計公司啟邁科技,為眾多企業提供網站建設,網站制作,響應式網站設計,手機網站建設,微網站,模板建站,企業郵箱等一站式互聯網解決方案和建站服務10年。