網絡蜘蛛雖然不是人,但它同樣也有范圍,很顯然對于如大海般浩瀚的網絡世界來說,網絡蜘蛛抓取互聯網上所有的網頁幾乎是不可能的,從目前公布的數據來看,容量最大的搜索引擎不過是抓取了整個網頁數量的40%左右,有很多網頁根本無法被收錄。因此,要想讓網絡蜘蛛抓到你,要想讓客戶能從搜索引擎中找到你的信息,就必須先做好網站收錄工作。
筆者一直都認為這個網絡蜘蛛很人性化。因此,下面了解一下網絡蜘蛛的工作原理。要想網站被百度收錄可以從以下八個方面入手。
(1) 向百度提交你的網站,這對新網站而言尤其重要,網絡蜘蛛也喜歡認識“新朋友”,像百度提交你的網站就好像你向百度提交你的“名片”一樣,讓人家記住你。一般情況下,網絡蜘蛛會在1~4周的時間對你的網站作出收錄回應。提交網站時只要提交網站首頁就可以了,沒必要提交內容網頁,因為只要給網絡蜘蛛一個開頭,它就會自動爬遍每個“角落”。
百度網站提交網址為:http://ziyuan.baidu.com/linksubmit/url
(2) 適度競價排名。雖然百度收錄只與網頁價值有關,與競價排名等商業因素沒多大關系,但如果你的網站還未被百度收錄,進行競價排名不失為一種良策,此時網站猶如在“行賄”一樣,提醒百度蜘蛛記住你。
(3) 設置友情鏈接。這里的友情鏈接是指有“質量”的友情鏈接,而不是垃圾鏈接(垃圾鏈接太多,反而會讓百度蜘蛛生厭,有損網絡收錄),這個過程猶如從別人的網頁上搭“橋”過來。在百度蜘蛛收錄別人的同時,順著“橋”會爬到你的網頁中。
(4) 給每個網頁加上與正文相關的標題。之所以說百度蜘蛛具有人性,其原因是百度只會收錄符合用戶搜索體驗的網頁或網站。給每個網頁加上標題,無疑就是為了符合人的閱讀習慣,即往往是先看標題是否感興趣,再決定是否看內容。對于網頁標題的設置必須保證標題中的關鍵詞與正文有關,如果是網站首頁,那么標題最好是網站的名稱或公司的名稱,如果是其余頁面,標題最好是正文內容的提煉。
(5) 設置最容易提取的網頁形態。網絡蜘蛛能抓取下來的網頁有html、圖片、doc、pdf、多媒體、動態網頁及其他格式。這些文件抓取下來后,需要把這些文件中的文本信息提取出來,相對而言,doc、pdf等文檔比HTML、圖片、多媒體等文檔更容易提取,靜態網頁比動態網頁更容易提取。
(6) 提高網頁的質量。百度蜘蛛更喜歡高質量的網頁,因此網頁內容最好是原創性文章。如果是復制的文章有可能不會被收錄。
(7) 經常保持網站更新。經常更新的網站,網絡蜘蛛就會經常光顧,而長期不更新的網站,網絡蜘蛛到訪會減少。同時,網站的更新時間最好是在工作日的9點到10點,這個時候是網絡蜘蛛進行重新梳理的最佳時間,因為百度收錄除了機器收錄之外,還有人工收錄方式。
(8) 如果上述工作都做了,還是沒有被百度收錄,你也可以發信息到webmaster baidu.com去詢問。
本文鏈接:http://gujaratreit.com/xinwenzhongxin/563.html
|