歡迎來(lái)到智恒信-讓您工作更智能、管理更高效官方網(wǎng)站!
現(xiàn)在運(yùn)維監(jiān)控工具非常多,哪個(gè)好,哪個(gè)不好,哪個(gè)適合你,哪個(gè)不適合你,其實(shí)只有你了解了他們的特性后,才知道,接下來(lái)咱們從這里開(kāi)始講常見(jiàn)的運(yùn)維資源監(jiān)控工具。
一. 常見(jiàn)的運(yùn)維監(jiān)控工具
現(xiàn)在運(yùn)維監(jiān)控工具非常多,哪個(gè)好,哪個(gè)不好,哪個(gè)適合你,哪個(gè)不適合你,其實(shí)只有你了解了他們的特性后,才知道,所以從這里開(kāi)始講起。
1. Cacti
Cacti是一套基于PHP,MySQL,SNMP及RRDTool開(kāi)發(fā)的網(wǎng)絡(luò)流量監(jiān)測(cè)圖形分析工具。
簡(jiǎn)單的說(shuō)Cacti就是一個(gè)PHP程序。它通過(guò)使用SNMP協(xié)議獲取遠(yuǎn)端網(wǎng)絡(luò)設(shè)備和相關(guān)信息,(其實(shí)就是使用Net-SNMP 軟件包的snmpget 和snmpwalk 命令獲?。┎⑼ㄟ^(guò)RRDTOOL工具繪圖,通過(guò)PHP程序展現(xiàn)出來(lái)。我們使用它可以展現(xiàn)出監(jiān)控對(duì)象一段時(shí)間內(nèi)的狀態(tài)或者性能趨勢(shì)圖。
Cacti是很老的一款監(jiān)控工具了,其實(shí)說(shuō)它是一款流量監(jiān)控工具更合適,對(duì)流量監(jiān)控比較精準(zhǔn),但缺點(diǎn)很多,出圖不好看,不支持分布式,也沒(méi)有告警功能,所以使用的人會(huì)越來(lái)越少。
2. Zabbix
Zabbix是一個(gè)基于WEB界面的提供分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級(jí)的開(kāi)源解決方案。zabbix能監(jiān)視各種網(wǎng)絡(luò)參數(shù),保證服務(wù)器系統(tǒng)的安全運(yùn)營(yíng);并提供強(qiáng)大的通知機(jī)制以讓系統(tǒng)運(yùn)維人員快速定位/解決存在的各種問(wèn)題。
Zabbix由2部分構(gòu)成,zabbix server與可選組件zabbix agent。zabbix server可以通過(guò)SNMP,zabbix agent,ping,端口監(jiān)視等方法提供對(duì)遠(yuǎn)程服務(wù)器/網(wǎng)絡(luò)狀態(tài)的監(jiān)視,數(shù)據(jù)收集等功能,它可以運(yùn)行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平臺(tái)上。
Zabbix解決了cacti沒(méi)有告警的不足,也解決了nagios不能通過(guò)web配置的缺點(diǎn),同時(shí)還支持分布式部署,這使得它迅速流行起來(lái),zabbix也成為目前中小企業(yè)監(jiān)控最流行的運(yùn)維監(jiān)控平臺(tái)。
3. Prometheus
Prometheus是一套開(kāi)源的系統(tǒng)監(jiān)控報(bào)警框架,它既適用于面向服務(wù)器等硬件指標(biāo)的監(jiān)控,也適用于高動(dòng)態(tài)的面向服務(wù)架構(gòu)的監(jiān)控。
4. Nagios
Nagios是一款開(kāi)源的免費(fèi)網(wǎng)絡(luò)監(jiān)視工具,能有效監(jiān)控Windows、Linux和Unix的主機(jī)狀態(tài),交換機(jī)路由器等網(wǎng)絡(luò)設(shè)置,打印機(jī)等。在系統(tǒng)或服務(wù)狀態(tài)異常時(shí)發(fā)出郵件或短信報(bào)警第一時(shí)間通知網(wǎng)站運(yùn)維人員,在狀態(tài)恢復(fù)后發(fā)出正常的郵件或短信通知。
Nagios主要的特征是監(jiān)控告警,最強(qiáng)大的就是告警功能,可支持多種告警方式,但缺點(diǎn)是沒(méi)有強(qiáng)大的數(shù)據(jù)收集機(jī)制,并且數(shù)據(jù)出圖也很簡(jiǎn)陋,當(dāng)監(jiān)控的主機(jī)越來(lái)越多時(shí),添加主機(jī)也非常麻煩,配置文件都是基于文本配置的,不支持web方式管理和配置,這樣很容易出錯(cuò),不宜維護(hù)。
5. Ganglia
Ganglia是一款為HPC(高性能計(jì)算)集群而設(shè)計(jì)的可擴(kuò)展的分布式監(jiān)控系統(tǒng),它可以監(jiān)視和顯示集群中的節(jié)點(diǎn)的各種狀態(tài)信息,它由運(yùn)行在各個(gè)節(jié)點(diǎn)上的gmond守護(hù)進(jìn)程來(lái)采集CPU 、內(nèi)存、硬盤(pán)利用率、I/O負(fù)載、網(wǎng)絡(luò)流量情況等方面的數(shù)據(jù),然后匯總到gmetad守護(hù)進(jìn)程下,使用rrdtool存儲(chǔ)數(shù)據(jù),最后將歷史數(shù)據(jù)以曲線方式通過(guò)PHP頁(yè)面呈現(xiàn)。
Ganglia監(jiān)控系統(tǒng)有三部分組成,分別是gmond、gmetad、webfrontend。gmond安裝在需要收集數(shù)據(jù)的客戶端,gmetad是服務(wù)端,webfrontend是一個(gè)php的web ui界面,ganglia通過(guò)gmond收集數(shù)據(jù),然后在webfrontend進(jìn)行展示。
Ganglia的主要特征是收集數(shù)據(jù),并集中展示數(shù)據(jù),這是ganglia的優(yōu)勢(shì)和特色,ganglia可以將所有數(shù)據(jù)匯總到一個(gè)界面集中展示,并且支持多種數(shù)據(jù)接口,可以很方便的擴(kuò)展監(jiān)控,同時(shí),最為重要的是,ganglia收集數(shù)據(jù)非常輕量級(jí),客戶端的gmond程序基本不耗費(fèi)系統(tǒng)資源,而這個(gè)特點(diǎn)剛好彌補(bǔ)了zabbix消耗性能的不足。
最后,Ganglia在對(duì)大數(shù)據(jù)平臺(tái)的監(jiān)控更為智能,只需要一個(gè)配置文件,即可開(kāi)通Ganglia對(duì)hadoop、spark的監(jiān)控,監(jiān)控指標(biāo)有近千個(gè),完全滿足了對(duì)大數(shù)據(jù)平臺(tái)的監(jiān)控需求。
對(duì)于現(xiàn)在流行的微服務(wù),Prometheus的多維度數(shù)據(jù)收集和數(shù)據(jù)篩選查詢語(yǔ)言也是非常的強(qiáng)大。Prometheus是為服務(wù)的可靠性而設(shè)計(jì)的,當(dāng)服務(wù)出現(xiàn)故障時(shí),它可以使你快速定位和診斷問(wèn)題。
6. Grafana
Grafana是一個(gè)開(kāi)源的度量分析與可視化套件,通俗的說(shuō),Grafana就是一個(gè)圖形可視化展示平臺(tái),它通過(guò)各種炫酷的界面效果展示我們的監(jiān)控?cái)?shù)據(jù),如果你覺(jué)得zabbix的出圖界面不夠好看,逼格不夠高,就可以使用Grafana的可視化展示,同時(shí),Grafana支持許多不同的數(shù)據(jù)源,Graphite,InfluxDB,OpenTSDB,Prometheus,Elasticsearch,CloudWatch和KairosDB都可以完美支持。