前言
如果把運維看做是醫(yī)生給病人看病,則日志就是病人對自己的陳述,很多時候醫(yī)生需要通過對病人的描述中得出病人狀況,是否嚴重,需要什么計量的藥,什么類型的藥。所以古人有句話叫對癥下藥,這個癥就是病人的描述加醫(yī)生的判斷,在重一點的病在加上很多的化驗。在醫(yī)生看病時病人的描述和化驗單上的數(shù)據(jù)對醫(yī)生是非常重要的。同理日志在運維中的作用也是類似的,但非常不幸,日志在很多運維中被嚴重低估,直到磁盤空間不足的時候才想到,這有個大的日志文件把他刪了,這樣可以節(jié)省空間。
GoAccess
GoAccess是一個基于終端的快速日志分析器。其核心思想是實時快速分析和查看Web服務(wù)器統(tǒng)計信息,而無需使用您的瀏覽器(如果您希望通過SSH快速分析訪問日志,或者只是喜歡在終端中工作),終端輸出是默認輸出,但它能夠生成完整的,獨立的實時 HTML報告(非常適合分析,監(jiān)控和數(shù)據(jù)可視化),以及a JSON和CSV報告。
- 所有面板和指標都定時在終端輸出上每200毫秒更新一次,在HTML輸出上每秒更新一次。
- GoAccess允許任何自定義日志格式字符串。預(yù)定義選項包括Apache,Nginx,Amazon S3,Elastic Load Balancing,CloudFront等
- 跟蹤提供請求所需的時間。如果您想跟蹤減慢網(wǎng)站速度的網(wǎng)頁,則非常有用。
- 數(shù)據(jù)持久性強,GoAccess能夠通過磁盤上的B + Tree數(shù)據(jù)庫逐步處理日志。
- GoAccess是用C語言編寫的,要運行它,你只需要將ncurses作為依賴項,它甚至還具有自己的RFC6455兼容Web Socket服務(wù)器。
- 您可以針對訪問日志文件運行它,選擇日志格式并讓GoAccess解析訪問日志并顯示統(tǒng)計信息。
- 按小時或日期確定最慢運行請求的匹配數(shù),訪問者數(shù),帶寬數(shù)和指標數(shù)。
- 多個虛擬主機,一個面板,顯示哪個虛擬主機正在消耗大部分Web服務(wù)器資源。
- 定制GoAccess以適合您自己的色彩品味。通過終端,或者只是更新HTML輸出上的樣式表。
部署方案
方案一:Yum安裝部署
yum install glib2 glib2-devel GeoIP-devel ncurses-devel zlib zlib-develyum install gcc -y
yum -y install GeoIP-update
yum install goaccess
#修改/etc/nginx/nginx.conf文件的日志存儲格式
log_format main ‘$remote_addr – $remote_user [$time_local] requesthost:”$http_host”; “$request” requesttime:”$request_time”; ‘
‘$status $body_bytes_sent “$http_referer” – $request_body’
‘”$http_user_agent” “$http_x_forwarded_for”‘;
#修改文件/etc/goaccess.conf改成goaccess格式標準對應(yīng)為
time-format %T
date-format %d/%b/%Y
log-format %h – %^ [%d:%t %^] requesthost:”%v”; “%r” requesttime:”%T”; %s %b “%R” – %^”%u”
#測試生成頁面
goaccess -f /var/log/nginx/access.log -c -a>/usr/share/nginx/html/go.html
方案二:源碼安裝部署
#yum安裝依賴包
yum install glib2 glib2-devel GeoIP-devel ncurses-devel zlib zlib-devel
yum install gcc -y
rpm -Uvh https://dl.Fedoraproject.org/pub/epel/epel-release-latest-6.noarch.rpm
yum -y install GeoIP-update
#下載goaccess源碼包,并解壓編譯安裝
wget https://tar.goaccess.io/goaccess-1.2.tar.gz
tar xzvf goaccess-1.2.tar.gz
cd goaccess-1.2/./configure –enable-geoip –enable-utf8make && make install
#修改/etc/nginx/nginx.conf文件的日志存儲格式
log_format main ‘$remote_addr – $remote_user [$time_local] requesthost:”$http_host”; “$request” requesttime:”$request_time”; ‘
‘$status $body_bytes_sent “$http_referer” – $request_body’
‘”$http_user_agent” “$http_x_forwarded_for”‘;
#修改文件/usr/local/etc/goaccess.conf改成goaccess格式標準對應(yīng)為
time-format %T
date-format %d/%b/%Y
log-format %h – %^ [%d:%t %^] requesthost:”%v”; “%r” requesttime:”%T”; %s %b “%R” – %^”%u”
#測試生成頁面
goaccess -f /var/log/nginx/access.log -c -a>/usr/share/nginx/html/go.html
#后臺實時生成數(shù)據(jù)到goaccess頁面
/usr/local/bin/goaccess /var/log/nginx/access.log -o /usr/share/nginx/html/go.html –real-time-html &
頁面解析
General Statistics:此面板提供了幾個指標的摘要,其中一些包括:有效和無效請求的數(shù)量,分析數(shù)據(jù)集所花費的時間,唯一訪問者,請求的文件,靜態(tài)文件(CSS,ICO,JPG等)HTTP引用,404s,已解析日志文件的大小和帶寬消耗。
Unique visitors:此面板顯示點擊次數(shù),唯一身份訪問者和每個日期的累積帶寬等指標。包含相同IP,相同日期和相同用戶代理的HTTP請求被視為唯一訪問者。默認情況下,它包括網(wǎng)絡(luò)爬蟲/蜘蛛。 可以使用–date-spec = hr將日期特異性設(shè)置為小時級別,這將顯示日期,例如05 / Jun / 2016:16。如果您想跟蹤小時級別的每日流量,這非常棒。
Requested files:此面板顯示W(wǎng)eb服務(wù)器上請求最多的文件。它顯示了匹配,唯一身份訪問者和百分比,以及累積帶寬,協(xié)議和使用的請求方法。
Requested static files:列出了最常用靜態(tài)文件,如:JPG,CSS,SWF,JS,GIF,和PNG文件類型,使用相同的指標作為最后的面板一起??梢詫⑵渌o態(tài)文件添加到配置文件中。
404 or Not Found:顯示與先前請求面板相同的指標,但是,其數(shù)據(jù)包含在服務(wù)器上找不到的所有頁面,或通常稱為404狀態(tài)代碼。
Hosts:此面板包含有關(guān)主機本身的詳細信息。這非常適合發(fā)現(xiàn)×××性爬蟲,并確定誰在吃你的帶寬。 擴展面板可以顯示更多信息,例如主機的反向DNS查找結(jié)果,原產(chǎn)國和城市。如果-a啟用了參數(shù),則可以通過選擇所需的IP地址,然后按Enter來顯示用戶代理列表。
Operating Systems:此面板將報告主機在到達服務(wù)器時使用的操作系統(tǒng)。它試圖提供每個操作系統(tǒng)的最具體版本。
Browsers:此面板將報告主機在訪問服務(wù)器時使用的瀏覽器。它試圖提供每個瀏覽器的最具體版本。
Visit Times:此面板將顯示每小時報告。此選項顯示24個數(shù)據(jù)點,每天一小時一個。 可選地,可以使用–hour-spec = min將小時特異性設(shè)置為十分之一水平,這將顯示小時為16:4如果您想要發(fā)現(xiàn)服務(wù)器上的流量峰值,這很好。
Virtual Hosts:此面板將顯示從訪問日志中解析的所有不同虛擬主機。如果在日志格式字符串中使用%v,則會顯示此面板。
Referrers URLs:如果相關(guān)主機通過其他資源訪問了網(wǎng)站,或者是從其他主機鏈接/轉(zhuǎn)移給您,則會在此面板中提供引用它們的網(wǎng)址。請參閱`–ignore-panel`配置文件以啟用它。 (默認禁用)
Referring Sites:此面板僅顯示主機部分,但不顯示整個URL。請求來自的URL。
Keyphrases:它報告了用于Google搜索,Google緩存和Google翻譯的關(guān)鍵字,這些關(guān)鍵字已導(dǎo)致您的網(wǎng)絡(luò)服務(wù)器。目前,它僅通過HTTP支持Google搜索查詢。請參閱`–ignore-panel`配置文件以啟用它。 (默認禁用)
Geo Location:確定IP地址在地理位置的位置。統(tǒng)計數(shù)據(jù)按大陸和國家分列。它需要使用GeoLocation支持進行編譯。
HTTP Status Codes:HTTP請求的數(shù)字狀態(tài)代碼的值。
Remote User (HTTP authentication):這是HTTP身份驗證確定的請求文檔的人員的用戶ID。如果文檔沒有密碼保護,則此部分將為“ – ”,就像前一個部分一樣。除非%e在log-format變量中給出,否則不會啟用此面板。
最后
GoAccess日志分析工具的功能還有很多,可以細分到統(tǒng)計某一天、某一個IP用戶的訪問情況,也可以統(tǒng)計某個時間段的,更可以導(dǎo)出CSV表格整理匯總分析;
詳解使用GoAccess分析Nginx的日志 http://www.sfodin.cn/Linux/2016-07/133623.htm
使用GoAccess分析Nginx的Virtual Host日志記錄 http://www.sfodin.cn/Linux/2016-07/133622.htm
CentOS 6.5下使用GoAccess工具分析Nginx網(wǎng)站日志 http://www.sfodin.cn/Linux/2017-09/147131.htm