如何查看網(wǎng)站被百度抓取的情況?

95246次閱讀

百度用于抓取網(wǎng)頁的程序叫做Baiduspider - 百度蜘蛛,我們查看網(wǎng)站被百度抓取的情況主要是分析,網(wǎng)站日志里百度蜘蛛Baiduspider的活躍性:抓取頻率,返回的HTTP狀態(tài)碼


如何查看網(wǎng)站被百度抓取的情況?

查看日志的方式:

通過FTP,在網(wǎng)站根目錄找到一個日志文件,文件名一般包含log,下載解壓里面的記事本,這即是網(wǎng)站的日志,記錄了網(wǎng)站被訪問和操作的情況。

因為各個服務(wù)器和主機的情況不同,不同的主機日志功能記錄的內(nèi)容不同,有的甚至沒有日志功能。

日志內(nèi)容如下:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"   

分析:

GET /bbs/thread-7303-1-1.html   代表,抓取/bbs/thread-7303-1-1.html 這個頁面。

200  代表成功抓取。

8450  代表抓取了8450個字節(jié)。

如果你的日志里格式不是如此,則代表日志格式設(shè)置不同。

很多日志里可以看到 200 0 0和200 0  64 則都代表正常抓取。

抓取頻率是通過查看每日的日志里百度蜘蛛抓取次數(shù)來獲知。抓取頻率并沒有一個規(guī)范的時間表或頻率數(shù)字,我們一般通過多日的日志對比來判斷。當(dāng)然,我們希望百度蜘蛛每日抓取的次數(shù)越多越好。

在網(wǎng)站出現(xiàn)問題的情況下,通過查看網(wǎng)站日志,查看網(wǎng)站的HTTP返回值是否正常。


閱讀本文的人還可以閱讀:

網(wǎng)站日志在哪里?如何下載日志?


本文由夫唯SEO特訓(xùn)營編輯整理。

搜外專注SEO培訓(xùn)和SEO周邊Saas服務(wù)解決方案,10年來超過五萬學(xué)員在此獲得技術(shù)提升和人脈圈子。

SEO課程包含移動搜索、零基礎(chǔ)建站、群站SEO思維、搜外6系統(tǒng)、SEM入門等。

192期A班報名時間7月1日-7月15日,請?zhí)砑诱猩头∧⑿牛簊eowhy2021。 微信掃碼添加客服人員

我們的目標(biāo)是:讓非技術(shù)人員輕松學(xué)會互聯(lián)網(wǎng)技術(shù)。

  • 搜外會員SEO交流群(免費)

    微信掃碼添加客服人員
  • 小程序運營交流群(免費)

    微信掃碼添加客服人員
  • 搜外會員SEM競價交流群(免費)

    微信掃碼添加客服人員
  • 夫唯學(xué)員SEO交流群(VIP)

    微信掃碼添加客服人員

掃碼獲取資源

微信掃碼添加客服人員
  • SEO技術(shù)實戰(zhàn)微信群

    微信掃碼添加客服人員
  • 大站流量總監(jiān)群(審核身份)

    微信掃碼添加客服人員
  • Google獨立站英文SEO群

    微信掃碼添加客服人員
  • SEO團隊KPI管理表格

    微信掃碼添加客服人員
  • 工業(yè)品網(wǎng)站友情鏈接群

    微信掃碼添加客服人員
  • 本地生活服務(wù)業(yè)友鏈群

    微信掃碼添加客服人員

跟夫唯老師系統(tǒng)學(xué)習(xí)群站SEO
成為互聯(lián)網(wǎng)運營推廣大咖

掌握SEO技巧、建站前端、群站霸屏、SEM入門、新聞源推廣……
Processed in 4.074462 Second , 41 querys.