|
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控. K. d2 T: B/ x5 x* }
# j5 q4 j7 n' W7 x/ y$ j& Y3 u9 s对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。/ e- h" T2 B/ @( X" \) I
3 m; A- a1 @# L- r& I4 a
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。6 T% x: H1 A5 [) l2 C# \) b
0 k) I$ T& [/ q1 K$ d图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
0 n- l3 F7 s' \' a) H8 ~0 V9 Q' F: x. t. Z+ H- [
6 H1 |; ^4 ?. D- r% B* J1 w' \; @0 n1 n0 U& L, z& d
图1 Ganglia的Overview界面3 ]" \: z' u6 |
* I1 w [1 ]( q1 G8 b9 P. m6 t
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。3 N' y* R# C) G2 N& }
8 ?8 o# N# |- v9 Z' F6 t4 E& P3 z5 l; }5 b: I/ _
5 A5 J# d) Y: S% [
图2 Ganglia的聚合视图和节点视图5 p) q0 Y: d; g
/ A9 S- x* H% k* e/ u
图3是CPU详细监控项目。
( X7 P! ^7 i& h9 v' i$ V& ~) k9 T# Z" G8 u
7 x7 |! D, ?8 t, H* K; ~: }' b
7 K' W6 L" \. q' H! A图3 Ganglia的CPU监控: m$ W5 j$ H ]( c, T3 I
; U( |1 o* F) P' { X6 V图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
. M) a5 V6 d: O5 P7 F, z1 V* f" _9 ~% B; {. L
* y7 Y' e, n5 o9 f3 h
图4 Ganglia监控虚拟机内存1 v% |6 S1 `4 ~4 H3 W1 d
. p( S9 L$ R& m服务与资源监控
( l( c8 u; L( J3 I* n2 z
6 K; z3 e& `2 MNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。0 M; m$ z1 {+ V2 T0 w0 U
$ v+ T2 C% C8 K$ o7 c图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
3 F$ }+ c" t9 N2 _
9 P4 X! e$ _( X
) a! `: l+ r# `# E- B' Z4 M8 d
: f3 {. \; {4 D" T8 T8 t! x4 B& |9 H图5 Nagios的连接视图
' p/ N( B) \; p% H: w; { I4 P# x8 V9 r0 |& l( w
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。" H- C2 S/ `4 \* a6 f4 ]. q$ C0 b
6 F9 B: u: u7 |8 u1 p [
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。, h* I& U% q7 q7 D- d2 R; ]0 {
2 }. O9 X& U5 c1 Z' x
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
4 k! f( P2 H: B& p8 \1 `6 v$ }
& K: n" E G6 J) s; [
+ J8 m+ t3 S; `8 H6 |7 i# M) _3 z
4 O# V/ Y$ D7 }! [; L! S8 F图6 Nagios的主机视图7 y. g4 P! X% Y
4 N6 e$ p- m" ^: M1 [2 A
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
i9 T0 o: J* N, |1 j; b# H- E
, `/ s6 j, h" P* j' S/ w0 `% j+ m; z# F( B1 r! x- I. D% O% c
图7 Nagois的服务监控视图
% ?( N2 a, `$ K1 I, }4 l. x
5 W' g: X( f2 S" ~2 w( p对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。3 h* l. a+ h8 n8 d7 w6 y
" k0 V. ?4 O5 I7 W3 p# X0 H* h
4 I- L- p1 k, ?/ O4 x k; w T+ I, c! B
消息中间件监控
: h2 b* T( Z6 D: S+ K: Y) L% f( c2 H& w# Y! A3 ~8 G
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
. H6 d2 b0 F) \) z; I% ^! o* h/ [$ e& m8 \* ?7 I
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。4 E9 K# w# W7 D% q/ o# Z7 F
" q+ X1 @) r' s+ ?5 F
5 y5 C' ]; W- e' q8 | ^$ e/ G: L, B6 H
图8 RabbitMQ的Overview视图
@8 A( `/ I/ u) g; E7 p1 l |2 E" ^
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。7 u0 f6 r& B2 V) H8 t
1 p: r. k- r- n7 ?
) |+ w" g" L3 r& L7 [) w! L- ^0 z) S
图9 RabbitMQ的连接视图
; J% e) H3 c7 a" u$ l+ v( m' _. c: o! H
图10展示了消息中间件的通道视图。
' ~/ ~" p5 P6 y3 M, G( L; F9 y8 j0 B0 L1 w7 B
2 z7 `8 Z6 ` w
0 o0 _% l5 u; e# n* u
图10 RabbitMQ的通道视图
& @, H( h, A8 t/ l, P K% r" a
" C+ \ W# W$ n/ {! l图11展示了消息中间件的交换(Exchange)视图。7 I* n: i( i) I: |8 Q
) f+ q4 C1 j) V* ~5 O
3 i( l) v' G! E7 l/ P( Y- F* a
" E8 _& k: V4 q图11 RabbitMQ的交换视图' f) g) G9 M: e3 i2 u' n) v
6 P2 g; B' ]4 @7 T5 b
图12展示了消息中间件的队列视图,并包括了统计信息。
7 M$ X- K9 X( E5 i
0 a6 @$ \; A0 a8 Z( m6 |+ Z/ F
1 y8 @/ \' ?6 q5 w H
. u4 e) p: p5 g' j$ B% P图12 RabbitMQ的队列视图/ x2 G) K" \( k* R- [
) {4 f" f1 }/ e
图13是管理员视图,可以修改密码、增加用户等。5 x W% o0 P r/ f5 w8 R* E7 L
6 ~: l! m+ \5 a" o! X
) x3 @& D$ S, c
& Q% K4 `: @4 V+ _! u, t. n! C图13 RabbitMQ的管理员视图, T( d4 d) }9 [, b z
5 [) {! P6 ?1 f1 f日志分析4 N# [$ T9 G1 c( l, T# ^
- b6 `' |; Q- c0 S
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。% P2 b" j; v- B" V: V5 w
! q2 a q6 [* ^" G) L2 t
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
5 y% H) i+ f, c3 C2 g y' ^8 f* g3 j5 _! ~# V( V0 M! M6 H$ ?
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
/ G! d* H" }3 e- w" H& u! m$ E: c5 o/ g
8 i- Z4 F: M* ?) u Q- q8 X5 b
|3 _1 D# z' B: \* D$ `" i5 V
图14 LogStash的Overview视图2 Q) q+ i( Q& h, ^ O) `
4 x5 f+ x8 ^2 H; m
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。/ [# o& m! w6 M; J& K
0 F) l1 s. [2 s* }5 Y3 J: |4 d& q' r* F% E2 t# z" \! f
; [; D2 P) M) X1 ]0 E- t- L" B0 i图15 LogStash的消息视图' W% e* r+ ?7 I4 M
3 C n' o4 B! n
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
2 N2 A* s3 j3 L$ H# p8 U" X& C
+ w% V0 g7 q8 v9 y6 U0 o+ ~" x8 d2 G; L( n1 N3 P
" S9 _/ |, {5 P8 r Q% z+ n图16 LogStash的消息过滤视图
" c6 E" a, g; I Z" U7 a* N 以上是“OpenStack企业云平台监控的示例分析
: z) T8 @4 z- c& M7 @- T" M4 x0 i: |$ \) r
2 ?" _! X0 I+ ^6 o
( T8 Y7 ?6 G" G- q
# c( i( d7 p) R$ GOpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控* c. o( w; ^2 x- }( |" a7 ?5 Q/ Y
( z8 H" l8 w) _( U对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。: W2 k7 W8 v5 A1 g4 j
% ]4 T- Z3 @( X$ R0 r; O7 _, O, }1 HGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
* ^" P0 u R6 u9 q
, }- P. G& c6 Z; l& `' w图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
8 v& z; z, R9 o6 J2 z5 J) K
4 W0 ?0 p( ?1 P- M6 H: Y+ I& s
* V0 Q% M9 N8 V! ]' Q2 e
% q/ Q! W% E' k9 S9 B图1 Ganglia的Overview界面
( h) u1 d2 ?2 v% M# [/ B$ q2 u% `0 R% G+ q/ j
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。0 Q6 r1 ? g3 e8 W, k2 A' \& j
; Q' y2 U! F& |7 S. R7 A. l9 N
0 y8 s4 Q$ W$ n& \
0 U3 I6 _4 g: w图2 Ganglia的聚合视图和节点视图5 E& k6 ] @8 V0 I, k% ]* v) ~# z
m. {9 g- | R/ k) Z图3是CPU详细监控项目。
3 c$ b8 s$ x7 s% g8 ]
+ s# j3 y/ d0 b1 I" _, @. A+ e7 P: W8 T. r
$ n, ~5 g/ ]! {; o- o" H1 S3 k图3 Ganglia的CPU监控
" z, |+ f5 y! M3 Y) Q$ ~
0 P$ q6 \2 E* b/ Y/ ?. ]& o* Q图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
" V# @% V% U3 M! E$ C
$ ]+ D$ V- X" e8 O4 y1 A* S9 Y% B/ t! B- e- }' E
图4 Ganglia监控虚拟机内存
+ h2 n1 @( o2 a- H4 [4 L. o9 Z1 L$ o" w0 @+ c
服务与资源监控6 T# g; g3 Y) h" B' n0 I1 N
, v3 @8 }& j z4 w9 x0 U* {
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
- c" x$ [/ b5 W" l
+ O( s, A2 X$ W3 m& J7 G4 D" {& g; }+ x; b图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。- _+ P0 \5 W' V" Y$ c
- k( _/ W5 `! y# L% X
4 g- }: L! |% [8 F' U% z0 O0 K
9 X" {& Q0 a7 ]8 ~$ R' Z
图5 Nagios的连接视图- H1 N9 a3 V0 e2 X
6 ~1 u* w7 p) E, w7 ~1 Y
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
5 M2 v0 R7 P7 ^! I8 ~. h w( q7 d5 A
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
- \, D' o0 `' ]8 h2 i z u2 X
, L$ c/ `% D, x+ a3 T' j! e图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
4 r' j0 o+ ~. ]+ K. m% b. h- n* v& `4 C3 u
- f! C. i5 }/ u. r2 J
5 [# E6 E! `- D9 c; }: m" M图6 Nagios的主机视图$ p2 E u' i! g
- j' w6 R6 L2 e: z
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。/ R- y% {7 b4 b
! v T; w9 W& C; `# Y) [) U
! B0 @5 x( S0 C# P$ g
+ E/ H1 F0 u' q# i图7 Nagois的服务监控视图0 t/ \0 y4 X; P1 S7 s
1 d7 }9 n& {( _; b+ d' a; Z
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
; c$ o+ b/ N7 ?% E# W! N7 P w7 B( L$ Q
: m4 U3 x K, ?. b7 y
消息中间件监控# A8 [ k2 K9 C, @3 I
& f% p7 I+ b- j$ u消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
8 ^" Q I7 p( [- H9 l% Z+ j, M. X% V; V" W0 ^
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。) Y8 ]# c4 h3 v+ ~) u
# L3 k2 k4 z7 v: N) C# _( e
/ e/ w+ H; @4 U' }+ V8 w2 ]. r# u; `# {$ \. I7 F
图8 RabbitMQ的Overview视图5 [6 n$ H6 L2 y/ U
( e% ], W8 g- F! x) M1 P图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
) @% H P/ Q2 z% }& ~/ z8 i2 F
3 x5 k& w; s1 k0 @
4 {4 P$ E$ z5 W. P图9 RabbitMQ的连接视图
4 h x+ y4 e6 A) T& H$ {& i; [/ A! S$ d+ y- ?* @ V+ k% W+ Y
图10展示了消息中间件的通道视图。
0 c7 `+ S- U3 _, F' Q3 ^4 X7 z; o: H8 _
1 T. M7 s! D7 N9 `% R
. |* D) m. O8 F. |* e% F+ B图10 RabbitMQ的通道视图' t9 i& N4 u* o( E3 G
* q# _$ O0 q" {" {
图11展示了消息中间件的交换(Exchange)视图。
: W. m' b9 M, \0 S* X7 Y% w* ?2 k6 c: N6 [; x
8 ^* P* k7 R9 T1 e7 ?3 ]
# F, }( o# b a8 h图11 RabbitMQ的交换视图3 D9 A7 U3 K! `" R/ m5 B' v( G
$ s9 e, L* I$ A3 l W, r4 D" u图12展示了消息中间件的队列视图,并包括了统计信息。
) V5 _7 C/ ]! }# ^" A, B$ W5 x
7 _$ U: V2 b8 r/ Q l
$ Q9 w) k, W, m0 d6 p( F
) V/ c L9 s# Q6 x! D# {4 z图12 RabbitMQ的队列视图+ ~* Z$ L( `4 q) h/ Z
" ]( M) M Q+ J8 ]) l
图13是管理员视图,可以修改密码、增加用户等。& x1 N) D6 A, x" F
3 h: Z" H) ?' S# u9 }) K1 u9 Q0 i; u. p w. ?$ T
$ b3 m* r; N: ~) i6 Y图13 RabbitMQ的管理员视图
, I' A U. v8 |* `$ E: O3 U
$ _6 D; L, ~% p1 p( _/ \7 ?- u6 W日志分析* ~- ~1 P8 @- [% z2 N k% z: A
) m2 ~6 K! Q& j' W2 G0 U
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。! T$ t( D/ b |' q( v( K8 M! A e
# m% w% d/ \# A8 F( Z& D( n2 _( oLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。 {% i! ?2 H* C( I3 d' V
, C' K9 m& e8 V9 X3 y- H! F图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
2 ~ l3 N0 y( G/ C
9 E6 }/ i3 S6 p# F+ o/ V" ]% Z" S+ A) r% k' R- S/ c
F$ W; r1 R+ B/ [1 B
图14 LogStash的Overview视图
Y/ p3 O# Y. Y9 x1 u$ L ^3 E+ z
: ?6 M4 j |" S% {$ d图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。% m ?& p9 @. ^
; W! ]2 i5 \ o1 \) ?: A
% p7 q+ L! E, ^; z7 P
# \4 u4 h; z( n& H
图15 LogStash的消息视图
7 G/ B8 `. x4 m& s9 N: B6 s G
: G; d( o9 j2 G2 J% p图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。/ V, v. q( @/ \& L6 b5 K* P' F9 R
" ]% o; Z4 p8 P! }: o$ R3 P f
% i8 l: m' f, ~0 M( G7 d# v8 d! z, q4 Q7 b
图16 LogStash的消息过滤视图4 ^4 d( r7 Q8 t: C: k/ U6 i! ^
以上是“OpenStack企业云平台监控的示例分析 / w6 G: w4 Y9 _
' c2 N1 [2 x1 q! d) q2 }$ b6 B
|