高跟美脚av国产一区 I 7799视频精品免费观 I 天天干,狠狠干 I 色偷偷av一区二区三区时间停止 I 爱爱视频一区 I 99久久精品午夜一区二区小说 I 少妇情欲一区二区影视 I 国产亚洲在线观看 I 99国产综合 I 草草日 I 日日干日日干 I 亚洲狠狠婷婷综合久久久久图片 I 人人做人人性 I 国产亚洲精品第一综合另类 I 丝袜视频一区 I 亚洲国产三级在线 I 国产高清在线精品 I 色午夜 I 国产精成人品 I 免费av 在线 I 国产无套喷白浆在线播放 I 午夜性视频 I 精品999 I 色婷婷久久一区二区三区麻豆 I 成人午夜免费福利视频 I 女人16一毛片 I 99er6免费热在线观看精品 I 午夜香蕉视频 I 精品国产99久久久久久宅男i I 亚洲男人第一无码av网 I 91嫩草影院在线观看 I 亚洲美女av电影 I 高清视频一区二区三区 I 伦理福利在线 I 女女同性高清片免费看

新聞資訊
您當前的位置:首頁 新聞資訊
百度蜘蛛抓取原理 發布時間:2014-04-25 已訪問:2359 次



網絡蜘蛛即Web Spider,是一個比喻得很形象的名字。把互聯網比喻成一個蜘蛛網,那么Spider就是在網上爬來爬去的蜘蛛。網絡蜘蛛是通過網頁的鏈接地址來尋找網頁,從網站某一個頁面(通常是首頁)開始,讀取網頁的內容,找到在網頁中的其它鏈接地址,然后通過這些鏈接地址尋找下一個網頁,這樣一直循環下去,直到把這個網站所有的網頁都抓取完為止。如果把整個互聯網當成一個網站,那么網絡蜘蛛就可以用這個原理把互聯網上所有的網頁都抓取下來。 

在抓取網頁的時候,網絡蜘蛛一般有兩種策略:廣度優先和深度優先  

廣度優先是指網絡蜘蛛會先抓取起始網頁中鏈接的所有網頁,然后再選擇其中的一個鏈接網頁,繼續抓取在此網頁中鏈接的所有網頁。這是最常用的方式,因為這個方法可以讓網絡蜘蛛并行處理,提高其抓取速度。

深度優先是指網絡蜘蛛會從起始頁開始,一個鏈接一個鏈接跟蹤下去,處理完這條線路之后再轉入下一個起始頁,繼續跟蹤鏈接。這個方法有個優點是網絡蜘蛛在設計的時候比較容易。