網路日誌有哪些內容(網站日誌在哪裡看)
什麼是網站日誌
什麼是網站日誌
網站日誌對於網站建設的作用相當於監控攝像頭對我們的房間,它可以記錄下來,這一段時間裡面所有的訪客到我們家來訪問的這個記錄。
那我們一個網站每天有很多的使用者來訪問,同時每天還有很多的搜尋引擎的蜘蛛來抓取日誌,網站日誌就能夠把所有訪客訪問的情況,它用什麼瀏覽器,什麼作業系統,什麼時間點來訪問,訪問了哪些頁面?日誌能夠把這些資料全部記錄下來。
同時呢搜尋引擎的蜘蛛過來抓取,它是百度的搜尋引擎的蜘蛛,還是google的還是360的?他們過來抓取,分別是什麼時間點抓取的哪些頁面,抓取的時候返回值是什麼?是正常開啟還是打不開,所有這些資料都能夠記錄到一個叫做日誌的一個檔案裡。
網站日誌怎麼分析
1.網站日誌下載及資料解讀
分析網站日誌,我們可以瞭解搜尋引擎蜘蛛來到我們網站訪問的時候,它獲取到的資訊是什麼?網站跟搜尋引擎之間它是什麼樣的一個對話,那網站日誌怎麼進行分析,從哪裡下載到這個資料?
通過FTP訪問網站的根目錄。可以看到一個包含log的資料夾,這是存放日誌的地方。
如何檢視網站日誌
下載、解壓、開啟日誌檔案,日誌檔案內容如:
61.135.168.22 - - [11/Jan/2009:04:02:45 0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider (
http://www.baidu.com/search/spider.htm)" (注:百度,這部分為本文新增)
203.208.60.43 - - [11/Jan/2009:04:02:43 0800] "GET
/sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1;
http://www.google.com/bot.html)" (注:Google)
202.160.178.21 - - [11/Jan/2009:04:02:44 0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China;
http://misc.yahoo.com.cn/help.html)" (注:雅虎)
65.55.220.217 - - [11/Jan/2009:04:02:57 0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (
http://search.msn.com/msnbot.htm)" (注:MSN)
65.55.109.46 - - [11/Jan/2009:04:02:57 0800] "GET /sns/source/script_menu.js HTTP/1.0" 200 7219 "http:/sns/space-5755-do-blog-view-me.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)
大概就是上面這樣密密麻麻的程式碼,但是這些程式碼怎麼理解呢。比較好理解,我們看一下這一串日誌的內容。前面這個ip代表今天來訪問我們的網站,它是什麼ip?是使用者呢還是搜尋引擎蜘蛛它都有一個ip,就是把他的ip記錄下來。後面這個是一個時間點,什麼時間來訪問我們的網站?然後呢get就是抓取,抓取的哪一個檔案呢?抓取了這個檔案。
就是我們的域名下面的www.xxx.com/BBS什麼什麼,把這個檔案抓取回去。抓取回去之後呢200,這是http狀態碼,它代表抓取成功,然後後面這個數字代表抓取了多少個位元組?那200,然後這個8000多就是代表成功抓取了8000多個位元組,也就是我們一個網頁的大概的大小。那後面這一段就是代表蜘蛛,Baidu Spider就代表百度的蜘蛛,那這一句就代表這個內容是百度蜘蛛過來抓取,成功抓取了這麼多個位元組。
好,那我們再看這個上面就可以看出這個是誰的蜘蛛,yahuspider這是雅虎的它是這個時間點。然後這上面是誰的呢?google的,對吧?最下面看一下,裡面沒有看到這是哪一個具體的搜尋引擎。那它是誰?你看這個有MSIE6.0。這就說明微軟的ie6.0,這是一個使用者在來抓取和訪問的一個頁面。
所以日誌它就這樣的一個檔案,把每天每時每刻使用者和蜘蛛來抓取我們網站的所有的情況,把它記錄下來。
2.分析網站日誌工具是什麼?
這個日誌檔案,裡面看起來密密麻麻的,非常的費勁。一般人是沒法看明白的。而且如果我們的網站的訪問量非常大的話,那這個日誌往往會有幾十兆幾百兆甚至幾個G的這個大小。那我們在電腦上開啟的時候,有的時候電腦都會卡死掉。那麼就會用到網站日誌分析工具。
一般分析網站日誌我們用光年日誌工具分析.關於這個工具的使用,大家可以看一下這篇
https://jingyan.baidu.com/article/15622f240a2e6afdfcbea58a.html瞭解一下,也可以去搜外的網站上看一下有免費的教程。
3.網站日誌分析http狀態碼的解讀
那剛才我們看這個日誌的時候,看到裡面有一些剛才提到一個詞叫做http狀態碼,有看到200或者404,這個叫做HTTP狀態碼。
那這個http狀態碼,就是代表搜尋引擎蜘蛛或者使用者來訪問我們網站的時候,它是什麼樣的一個狀態?什麼樣的一個情況?200就代表成功抓取了,如果是404就代表過來抓取這個連結, 但是這個連結不存在,所以它就返回404。那狀態碼一般有200或者404,或者500等等這樣的幾個常見的數字,
我們不用瞭解特別多,只要大概的知道這麼幾個數字代表什麼?200代表成功抓取,404代表錯誤連結,500代表伺服器出問題了,大概瞭解這麼幾個資料就可以了,不需要把所有的都記住。那如果想要了解更多http狀態碼的這個知識的話,可以在百度上搜尋一下,就可以查詢到所有這些程式碼分別代表什麼意思?
什麼樣的場景下需要網站日誌分析
那麼對於一個職業網站優化人員日誌分析的能力是必須要掌握的。那什麼樣的場景下需要日誌分析,下面我們看一下.
1.比如說我們建立了一個網站,提交給搜尋引擎,後來很長時間沒看到搜尋引擎的收錄,那這個時候我們就需要下載日誌來分析一下,看搜尋引擎到底有沒有過來抓取。
2.我們網站原來可能排名很好, 後來突然間發現異常了,那我們就需要把日誌下載下來看一下搜尋引擎這段時間過來抓取我們網站的時候, 它是不是有一些異常情況。
3.網站如果被人攻擊或者入侵,那也要下載一下網站日誌來分析我們這個問題出在什麼時間點,什麼地方?
做網站日誌分析,我們採用的一個方法一般是對比法, 就是我們網站和排名都正常的情況的日誌, 和現在出問題的時候的日誌,拿出來進行對比, 採用光年日誌分析,把這個資料拿出來看一下,看問題出在哪一個目錄,或者說哪一些頁面, 然後再去針對性的去研究一下。