|
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控) W8 C# f& y2 K y. I! }6 O
; s% ?% ]7 k! r- h& D对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。8 r `/ L7 p4 P: U: B
9 }' C7 d, [0 j4 `7 f* X
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
* \& R2 F6 G. i: F! h3 ]+ A; N* U+ A2 H% k
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
2 v: f7 h/ W+ B8 y3 ?; l, N6 J) g0 t3 j4 x; j2 N0 Q3 G0 k5 O
! u# D) d! ?2 c
: G9 R0 d. X8 g! a# E图1 Ganglia的Overview界面# a/ G* i% o: H
5 k! {: S( Z6 }# @0 L: J; o" D
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
6 w2 z9 @ Q( Z4 _. c+ D* Z: n* w' @/ w4 a1 g7 l" v
7 [; C* O; Z% H' Z2 l. L O: I& y
" b3 k& ^* N: E8 A图2 Ganglia的聚合视图和节点视图
/ p |1 T- d3 h( Q0 i+ H
3 C) h i" y. a& r% k. U4 b2 `图3是CPU详细监控项目。" s4 n- w7 W5 N; o- I: z2 Q9 m
( K8 o4 {: o. |- R7 N) a/ P8 {! `& p! i4 ?" e
1 e$ z9 c+ T% \) F( T9 W' g- P. K
图3 Ganglia的CPU监控
, K5 J8 H" l# m8 w1 P' T7 T) `
+ _- L% v& A2 p2 q* J6 ^: O图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
5 L# {8 G2 p8 d4 F
2 N$ M- A, Z! }' K; {2 G2 h7 }" W/ U3 k
图4 Ganglia监控虚拟机内存! | N$ C" u2 c8 A
% |! `# p8 a7 O5 L0 Z+ F
服务与资源监控
2 l, I9 t5 i; P
7 c0 E5 E0 f3 CNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。3 u& C" ^4 h1 v) P
( X# {7 C& H" b( s, y5 z) ~) N! f图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。5 J: G- r0 E5 H
* a! s$ [$ s3 `9 [
$ I4 y, c4 r) }$ u" `7 O6 ~+ a2 B; y3 m% g* c
图5 Nagios的连接视图# v) d4 }" |+ S9 M* p: Y
) u; f; z, [, t另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
2 o5 N7 C- u. J; @" ^7 B
$ _; F2 C9 m5 u, N. E4 g. k另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
' M4 R( Y, L$ j5 b
" U' k+ D+ a( s8 Q图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。1 r. w% K0 B$ L* Z) p3 n9 T
2 k+ f: P6 `# g* F' z) w0 v
p; \7 g# d; @/ L' E$ c: n; [
" [+ i0 x9 ~) k. Y9 U3 T, O( m7 r图6 Nagios的主机视图
3 b6 l I- X: E1 Z+ m8 z1 Q1 b
$ H- i. r2 ]+ ]" g; `9 P1 P图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
/ w( M9 ~1 I. ? J2 N) h$ n" s7 R4 d( C1 l6 `* S5 b' J% l
* J( D& ~1 D* ^5 F H
( ]% k0 Y2 b- t2 t9 |图7 Nagois的服务监控视图
9 k6 P; q0 F, e, W% }1 }* K. M; w+ B/ j1 ]
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
8 x5 c7 w' t! j _. n p- N4 `8 y- q: U5 E# m
6 H: Y; c* B# n0 l" X+ e- i
消息中间件监控' _" @3 |( P& k9 r8 |* h b+ B4 y
9 c# d/ s1 X' M9 {
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
+ ~* F4 t" ^; b
- K3 P4 y6 X+ ]7 {5 W图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。2 G! ^6 A. V- c7 b0 r6 X, B! A
0 @$ e$ Y/ _* q# L' E8 Q5 R. g0 n) M! _: b2 ]/ h7 P
3 ?4 G- [6 X+ K! L图8 RabbitMQ的Overview视图
+ d4 O+ X) O1 p' B4 b/ ~+ Z& b5 a) B3 O& o1 w' m: X% H e' q
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。" X7 f( o I5 R; H9 r1 Y9 a
9 n6 V6 \0 s( H" o' @5 g4 R% M( q
' C" R9 a$ j$ z% A7 Q) o7 r2 ~# R; `+ V/ I6 n- t# i
图9 RabbitMQ的连接视图
8 N3 @+ _! n1 Q& }6 K: L- ^: ?! j6 F+ r! H3 p0 O3 A. U
图10展示了消息中间件的通道视图。9 A: H: }( V1 F: H+ W! h; c
8 b3 y7 k% ]1 `3 `2 _ F
! q" d5 B" L% t9 a
" M2 `1 q9 P, G% w! R( o图10 RabbitMQ的通道视图7 ` J, V& C5 T
3 y c' {) h/ O$ G% Y
图11展示了消息中间件的交换(Exchange)视图。
& l1 {9 {( ^! J2 H9 h6 r
, g8 {5 R, Y, |. z( Y
% R c3 u- i& {/ D. q% q8 v" r! i8 N a4 _) y i, v
图11 RabbitMQ的交换视图; H/ @) c3 R# l* y, p; h; c
: Q3 W/ ~/ y2 l2 x% ~3 o图12展示了消息中间件的队列视图,并包括了统计信息。
. h% {3 L/ [$ y, \1 F! q- O# H7 |- j$ T0 X; q G8 A7 z% Y
* O9 u4 t2 A2 Y! A, E8 `
& k; v" v6 K( S& g图12 RabbitMQ的队列视图. b M6 Q9 T. Q9 v% a
0 i8 ~ A1 p5 G7 n" T2 Q
图13是管理员视图,可以修改密码、增加用户等。9 S( m* \0 N& T4 C% ~- J4 t. y
! s; g2 t! q9 I& S. x/ p
- V& `. U E; L5 ~
( M- Q9 I. N7 q9 M9 Q- C9 ?图13 RabbitMQ的管理员视图
. z: H) z, t) _4 P8 \2 T% n( R+ P' \( Z" T' `8 r0 y
日志分析( I u' A. Y) o k
7 f. p3 L1 p: U! R' q" ?OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。% Z" ?# a6 U. v9 [; n+ c/ [" P8 x( n
0 @+ T0 O! J& C& b+ s; T
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。5 N7 B1 _; `- z+ @
/ z8 u q( ?- ]& Q4 ~图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
" G! n K6 T, I+ c9 B( C6 Q
8 C* y# j* p" I1 X7 ?' Q' f1 B2 u( P
/ c+ m( m/ S) D# S% O
图14 LogStash的Overview视图
/ ]: V2 J3 d6 }7 Y Q8 Y1 e5 s' ~
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。7 q# n8 q) b) j0 Q6 r! I
$ g* \: e3 @: `. B, n4 j! K0 O+ a
. a0 f$ U: m5 i7 b% a: J& {( X
& o% U. W: Y; o4 j( [图15 LogStash的消息视图
* m# H6 N2 [; `6 P/ K( Z4 J% J6 d8 z) u3 r7 ^
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
+ z* L4 m* C v) W- @/ J# k9 o& u/ |, U# S% t2 F( n0 R, y* s3 K0 i
3 Z/ r8 {: ~/ z5 k/ x
3 e j3 X8 V8 w3 `2 B. b+ a
图16 LogStash的消息过滤视图8 R5 y8 I. [, O. [ \
以上是“OpenStack企业云平台监控的示例分析
- k9 }# [3 B) |/ J7 |+ D
. ]0 q% T0 g+ w. m4 g3 P4 s! Y& h) j: S' t
/ |8 {, e9 C. l, ~- l: l6 ^* a% X' }4 Z! } B
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控
( I3 p9 c4 |4 t4 ^: |! w; B3 v+ h, w( c$ w
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
2 B$ t# B& i. h
. S7 w7 O' y7 p3 r3 p% {Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。, m* s8 c! t" o) W/ M4 S
7 ^& q' N5 ]7 b% V; M& D, Y! u) C
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
' S9 P" B6 _# g/ d8 H& {( D8 c1 u( ~; s @0 B1 C# Z- d0 K
$ Q2 t' A4 L9 J
) w+ i" c$ `) C& m% S图1 Ganglia的Overview界面
0 j; o6 m1 q- C6 h% m f
3 U+ i |7 H7 K' v5 K图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。. T* D4 M8 R+ o
4 `6 O0 H( D! ?5 w, [1 F0 T6 p1 e: O+ t$ a
1 K( |/ I' ^5 z( \2 w- E
图2 Ganglia的聚合视图和节点视图
9 E9 D$ ?- L1 S" U! G5 [3 Q9 U/ y: V% H$ f; l# ^" R
图3是CPU详细监控项目。) p% J# k F4 s! Z9 ~
k+ X$ x; t [# y
0 A% D' i2 |; g# ?) Z( z }! W4 k, D0 D t& N" N
图3 Ganglia的CPU监控% T+ |2 f0 t( F% f7 s
/ z% q8 w' `: V _. f" @9 L
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
. g4 o/ b& p9 v! n. g6 `$ |* Y+ g9 F3 p3 z6 ~4 m! d2 B
9 \/ F; p) C- L
图4 Ganglia监控虚拟机内存
6 w' o# m2 j l" ~+ D
/ V6 v: k6 d# t" n- M; p服务与资源监控6 T5 [, |! K% P- C: A5 H2 V* T
% Z2 a5 T- Q( i2 ]5 D3 A2 e6 @Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
& J# j( b9 x, z: s# u2 I+ _! q! m6 k8 n( p
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
* f: @" {$ z- p! x8 C! j$ B! n4 H- O% y! z' u7 U1 h1 u' C2 o
: J* T7 x( s( N9 U: u0 g
4 e4 p+ |$ @5 B6 e) Q8 n
图5 Nagios的连接视图
; m; Y7 |# k( F* e O& [1 x" `/ e/ O2 g
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。/ }5 C: T: e1 y/ j2 m8 ]/ y
- e, j! |8 b; I3 P5 x# n2 e另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。. V& R( `' V" |! x9 s2 F& E/ ~
, K+ x6 d6 U; E! [9 t) F2 v图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。 `# u4 y( }5 b3 x, e% M$ z
( |" E' S, @2 f; Y% c2 @
/ e, T& a/ b* |9 }6 H6 x
- _2 R; H8 W' j+ I9 @
图6 Nagios的主机视图
$ @7 N. G! K3 d( [! v6 C9 M$ \" M- B- f. c
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
. z9 p# U7 l2 Q7 v. n
* M% n+ ^, j6 ^8 m5 E# f0 Q/ \! W) ]9 o0 K4 M$ f
0 n# `) T& i ]7 I图7 Nagois的服务监控视图, U `5 W7 f* c4 F
3 d; A& M6 W% C+ M2 _
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。& u' l, `6 J% ]- T. ~
; N$ j0 k7 W- ^
2 p( r5 e' N) N f. U; b' R: L/ e* R! U消息中间件监控
0 k t" w( ~# p! m3 D) m2 Y4 l# P9 ], f
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。1 o1 Y/ B. |4 b) p9 p6 o V* p1 |3 k
6 `8 L# r9 {/ l; M4 L2 ~' F图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
; z; b; w* | O
+ S, P2 p& A' j- s7 m: v, y7 {; @& N
% N( n( l# b/ x/ a' r8 P- k, m2 r, k0 G
图8 RabbitMQ的Overview视图
( |0 j0 c/ ]0 B9 `+ M6 `! h) p; a0 ?6 J- C R; E! D
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。+ U, R! J6 P8 S( E! H3 ^
& w1 a/ i* H+ w6 ]! H5 r/ y3 {: |! k" ]/ c# W, p
0 C* E' d& k# d# r2 f0 M
图9 RabbitMQ的连接视图
$ A4 C. R5 L7 `$ t% v- x( H/ M
+ X |- [' a+ B" [7 c5 ~5 Q5 c图10展示了消息中间件的通道视图。
' M1 ?9 T$ u) v$ _9 c, `& p
0 x3 p2 `3 M# Y p! U+ u d: c: @- F/ A
6 ` G; J f6 v: T: H6 x
图10 RabbitMQ的通道视图' X% s" [: E+ T. p
( E3 ]* F, l8 j' H& S图11展示了消息中间件的交换(Exchange)视图。
5 O$ }" ~" s: l
% c- x: w6 ?# C7 f. q
7 E2 W9 c' N# t+ g7 ]) ]; _& L
) p. I. W0 Z) `. G图11 RabbitMQ的交换视图
& e) o% f7 e: b4 U. m+ [8 g& a; ^# ]! o8 s: C* F' W
图12展示了消息中间件的队列视图,并包括了统计信息。 Q( b! Z; t# Y: C! v6 O, a
2 `. P: Y4 y' |) H z7 m/ L3 h, i& \
! G% Z1 R. I7 b( T2 m; b5 n
' n3 J8 N- E* V# N
图12 RabbitMQ的队列视图
) Q, j; `! L, g2 N/ @5 _7 }: e8 W
5 X3 @+ O! c% W6 P3 N, Z5 [8 F5 Q图13是管理员视图,可以修改密码、增加用户等。- Q" g# j; t: t8 ?/ H b- a
1 D+ M7 @9 r+ Y4 k1 [
/ g( `2 `% [2 Q c! N
' A$ M, `; t2 f0 I( U$ i$ c" K图13 RabbitMQ的管理员视图
( x- w! L$ k# s! _" V/ S$ i! A$ e( T4 M9 y( |
日志分析# f. D/ ]5 y* A5 p- ]( D2 @
6 h' R. w, x) ]% m b& p+ B3 hOpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。
/ g2 `: o. N* F" y1 F0 b
" Q) Q) u0 [% U! yLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
8 n- L5 `8 p5 a& m r* @- Q
9 T) ]& b7 Q+ z) N' z4 M图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
& L. \2 G( Z) w w6 [9 X- H: o9 ^
# W/ A% D" l/ F1 i/ y
* Y! X: Z4 a* U( F; c6 N7 \# C# B. q' K. ^! [, c7 m
图14 LogStash的Overview视图
; T0 L/ o$ @" N+ V: M$ L- F5 Q
8 X1 ~9 L" V* ~1 a, v: z8 v! ]8 w+ Z图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
# q" N8 ~0 L3 F; T( M8 W) F/ b9 X4 N
& N ]9 e2 a; j6 @* u- J
6 @- F8 h! i3 t: j1 K% w9 {2 v
图15 LogStash的消息视图
j0 y: c7 i: m2 R) E
0 ^1 H9 g8 V" G. }' c% C) Q( [9 ~图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
* }8 X* }3 T! j% r' `2 l1 }7 ]
5 x# p7 [8 K5 E+ ?8 [: J/ f0 N) a& K/ l* {
/ J- W1 L& h% X' @% R$ g& o1 u图16 LogStash的消息过滤视图5 G2 L# C7 B2 A* y u
以上是“OpenStack企业云平台监控的示例分析
7 t$ h+ @3 p5 n; W0 b- e/ D! N7 G$ {( b. i3 g' V( k6 e: ]
|