一個seo工作人員,特別是那些大型網(wǎng)站的seo人員來說,能獨立分析網(wǎng)站日志是一種必不可少的技能,因為大型的網(wǎng)站欄目結(jié)構(gòu)以及頁面非常的繁雜,蜘蛛也是少不了會頻繁訪問,從蜘蛛給網(wǎng)站留下的一些痕跡上面能夠掌控網(wǎng)站不少的信息,這對網(wǎng)站優(yōu)化運營是一種非常必要的參考,前面小星星的文章里面也對蜘蛛狀態(tài)碼也進行了初步的介紹,這篇文章也對網(wǎng)站日志能讀取到的信息作出了總結(jié):
分析網(wǎng)站日志能獲取到的信息總結(jié):
一、可以看出網(wǎng)站頁面有哪些搜索引擎的蜘蛛抓取
從網(wǎng)站日志里面可以看出網(wǎng)站被哪些蜘蛛所抓取,每個類型的蜘蛛也都屬于自己的特殊標(biāo)頭,各大搜索引擎的標(biāo)頭特征如下所示:
百度蜘蛛:baiduspider
谷歌蜘蛛:Googlebot
360蜘蛛:360Spider
SOSO蜘蛛:Sosospider
雅虎蜘蛛:“Yahoo! Slurp China”或者Yahoo!
有道蜘蛛:YoudaoBot,YodaoBot
搜狗蜘蛛:Sogou News Spider
MSN蜘蛛:msnbot,msnbot-media
必應(yīng)蜘蛛:bingbot
提醒:網(wǎng)站的日志里面也有可能會出現(xiàn)一些其它私人開發(fā)的抓取器所抓取,由此我們可能會發(fā)現(xiàn)一些奇怪的蜘蛛抓取痕跡。另外百度也有屬于自己的匿名蜘蛛,我們也要注意區(qū)分注意。
二、可以統(tǒng)計網(wǎng)站目錄蜘蛛抓取的總量
通過抓取總量的分析可以對比出網(wǎng)站哪個目錄更受搜索引擎的關(guān)注,一般來說蜘蛛抓取越頻繁的目錄,site網(wǎng)站此目錄的排名會相對靠前,我們也可通過目錄的蜘蛛訪問量來適當(dāng)調(diào)整目錄的結(jié)構(gòu),對于那些抓取壓力較大但是不怎么重要的目錄也可適當(dāng)縮減鏈接入口,以免阻礙給其它重要目錄的抓取。
三、網(wǎng)站頁面的抓取。
可以從中看出哪個頁面蜘蛛是否抓取了一些沒有被收錄價值的頁面,或者老是重復(fù)的抓取了這些頁面等,那么同理要先采取措施予以頻閉,要么是運用到nofollow標(biāo)簽,要么是robots文件等,這樣就會降低因為搜索引擎抓取到大量相關(guān)性低或者質(zhì)量度差的頁面而影響到頁面的權(quán)重傳遞這樣的不利影響。
四、蜘蛛平均抓取頁面的次數(shù)、頁面平均停留時間以及抓取的數(shù)量。
(1)、平均每次抓取頁面數(shù)=總抓取量/訪問次數(shù)
(2)、單頁抓取停留時間
(3)、頁面平均停留時間=總停留時間/訪問次數(shù)
從以上的分析能夠很清晰的看出蜘蛛是否頻繁關(guān)注自己的網(wǎng)站,而且抓取的頁面越多,深度越足也能反映出網(wǎng)站的活躍度高,而且在停留的時間上面也能初步看出網(wǎng)站的頁面和文章是否新穎或者原創(chuàng),這是頁面質(zhì)量度的一個體現(xiàn)。
五、可以一覽蜘蛛方面各網(wǎng)頁的狀態(tài)碼
狀態(tài)碼是網(wǎng)站日志里面最重要的一個方面了,這是蜘蛛對于網(wǎng)站頁面狀態(tài)最直觀的反映,從這些狀態(tài)碼中可以看出更多詳細(xì)的信息。
六、了解網(wǎng)站日志蜘蛛的來訪時間
對網(wǎng)站日常日志分析總結(jié)中,可以很直觀的看出每天具體是哪個時間段是蜘蛛訪問的高峰時期,我們?yōu)榱擞纤阉饕妫部梢韵鄳?yīng)調(diào)整網(wǎng)站的更新時間,爭取在蜘蛛活躍度最高的時間段更新文章,這樣對自己網(wǎng)站的收錄會有非常大的幫助,甚至還有可能達(dá)到秒收的效果!
總之,分析網(wǎng)站日志是一個非常有意義的技能,特別是網(wǎng)站建立的初期和運營遇到狀況的時候,分析日志這個方面就更是尤為重要,當(dāng)然再碰到信息量特別大的時候,單手動看效果是不好的,這里推薦光年日志分析工具,功能非常強大,基本能很好的滿足一般網(wǎng)站的分析需求。