易陆发现互联网技术论坛

 找回密码
 开始注册
查看: 614|回复: 2
收起左侧

OpenStack 高性能监控工具

[复制链接]
发表于 2022-12-15 09:55:23 | 显示全部楼层 |阅读模式
购买主题 本主题需向作者支付 2 金钱 才能浏览
 楼主| 发表于 2022-12-15 10:26:07 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控) W8 C# f& y2 K  y. I! }6 O

; s% ?% ]7 k! r- h& D对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。8 r  `/ L7 p4 P: U: B
9 }' C7 d, [0 j4 `7 f* X
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
* \& R2 F6 G. i: F! h3 ]+ A; N* U+ A2 H% k
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
2 v: f7 h/ W+ B8 y3 ?; l, N6 J) g0 t3 j4 x; j2 N0 Q3 G0 k5 O
! u# D) d! ?2 c

: G9 R0 d. X8 g! a# E图1  Ganglia的Overview界面# a/ G* i% o: H
5 k! {: S( Z6 }# @0 L: J; o" D
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
6 w2 z9 @  Q( Z4 _. c+ D* Z: n* w' @/ w4 a1 g7 l" v

7 [; C* O; Z% H' Z2 l. L  O: I& y
" b3 k& ^* N: E8 A图2  Ganglia的聚合视图和节点视图
/ p  |1 T- d3 h( Q0 i+ H
3 C) h  i" y. a& r% k. U4 b2 `图3是CPU详细监控项目。" s4 n- w7 W5 N; o- I: z2 Q9 m

( K8 o4 {: o. |- R7 N) a/ P8 {! `& p! i4 ?" e
1 e$ z9 c+ T% \) F( T9 W' g- P. K
图3  Ganglia的CPU监控
, K5 J8 H" l# m8 w1 P' T7 T) `
+ _- L% v& A2 p2 q* J6 ^: O图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
5 L# {8 G2 p8 d4 F
2 N$ M- A, Z! }' K; {2 G2 h7 }" W/ U3 k
图4  Ganglia监控虚拟机内存! |  N$ C" u2 c8 A
% |! `# p8 a7 O5 L0 Z+ F
服务与资源监控
2 l, I9 t5 i; P
7 c0 E5 E0 f3 CNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。3 u& C" ^4 h1 v) P

( X# {7 C& H" b( s, y5 z) ~) N! f图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。5 J: G- r0 E5 H

* a! s$ [$ s3 `9 [
$ I4 y, c4 r) }$ u" `7 O6 ~+ a2 B; y3 m% g* c
图5  Nagios的连接视图# v) d4 }" |+ S9 M* p: Y

) u; f; z, [, t另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
2 o5 N7 C- u. J; @" ^7 B
$ _; F2 C9 m5 u, N. E4 g. k另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
' M4 R( Y, L$ j5 b
" U' k+ D+ a( s8 Q图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。1 r. w% K0 B$ L* Z) p3 n9 T
2 k+ f: P6 `# g* F' z) w0 v
  p; \7 g# d; @/ L' E$ c: n; [

" [+ i0 x9 ~) k. Y9 U3 T, O( m7 r图6  Nagios的主机视图
3 b6 l  I- X: E1 Z+ m8 z1 Q1 b
$ H- i. r2 ]+ ]" g; `9 P1 P图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
/ w( M9 ~1 I. ?  J2 N) h$ n" s7 R4 d( C1 l6 `* S5 b' J% l
* J( D& ~1 D* ^5 F  H

( ]% k0 Y2 b- t2 t9 |图7  Nagois的服务监控视图
9 k6 P; q0 F, e, W% }1 }* K. M; w+ B/ j1 ]
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
8 x5 c7 w' t! j  _. n  p- N4 `8 y- q: U5 E# m
6 H: Y; c* B# n0 l" X+ e- i
消息中间件监控' _" @3 |( P& k9 r8 |* h  b+ B4 y
9 c# d/ s1 X' M9 {
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
+ ~* F4 t" ^; b
- K3 P4 y6 X+ ]7 {5 W图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。2 G! ^6 A. V- c7 b0 r6 X, B! A

0 @$ e$ Y/ _* q# L' E8 Q5 R. g0 n) M! _: b2 ]/ h7 P

3 ?4 G- [6 X+ K! L图8  RabbitMQ的Overview视图
+ d4 O+ X) O1 p' B4 b/ ~+ Z& b5 a) B3 O& o1 w' m: X% H  e' q
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。" X7 f( o  I5 R; H9 r1 Y9 a

9 n6 V6 \0 s( H" o' @5 g4 R% M( q
' C" R9 a$ j$ z% A7 Q) o7 r2 ~# R; `+ V/ I6 n- t# i
图9  RabbitMQ的连接视图
8 N3 @+ _! n1 Q& }6 K: L- ^: ?! j6 F+ r! H3 p0 O3 A. U
图10展示了消息中间件的通道视图。9 A: H: }( V1 F: H+ W! h; c
8 b3 y7 k% ]1 `3 `2 _  F

! q" d5 B" L% t9 a
" M2 `1 q9 P, G% w! R( o图10  RabbitMQ的通道视图7 `  J, V& C5 T
3 y  c' {) h/ O$ G% Y
图11展示了消息中间件的交换(Exchange)视图。
& l1 {9 {( ^! J2 H9 h6 r
, g8 {5 R, Y, |. z( Y
% R  c3 u- i& {/ D. q% q8 v" r! i8 N  a4 _) y  i, v
图11  RabbitMQ的交换视图; H/ @) c3 R# l* y, p; h; c

: Q3 W/ ~/ y2 l2 x% ~3 o图12展示了消息中间件的队列视图,并包括了统计信息。
. h% {3 L/ [$ y, \1 F! q- O# H7 |- j$ T0 X; q  G8 A7 z% Y
* O9 u4 t2 A2 Y! A, E8 `

& k; v" v6 K( S& g图12  RabbitMQ的队列视图. b  M6 Q9 T. Q9 v% a
0 i8 ~  A1 p5 G7 n" T2 Q
图13是管理员视图,可以修改密码、增加用户等。9 S( m* \0 N& T4 C% ~- J4 t. y
! s; g2 t! q9 I& S. x/ p

- V& `. U  E; L5 ~
( M- Q9 I. N7 q9 M9 Q- C9 ?图13  RabbitMQ的管理员视图
. z: H) z, t) _4 P8 \2 T% n( R+ P' \( Z" T' `8 r0 y
日志分析( I  u' A. Y) o  k

7 f. p3 L1 p: U! R' q" ?OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。% Z" ?# a6 U. v9 [; n+ c/ [" P8 x( n
0 @+ T0 O! J& C& b+ s; T
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。5 N7 B1 _; `- z+ @

/ z8 u  q( ?- ]& Q4 ~图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
" G! n  K6 T, I+ c9 B( C6 Q
8 C* y# j* p" I1 X7 ?' Q' f1 B2 u( P
/ c+ m( m/ S) D# S% O
图14  LogStash的Overview视图
/ ]: V2 J3 d6 }7 Y  Q8 Y1 e5 s' ~
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。7 q# n8 q) b) j0 Q6 r! I
$ g* \: e3 @: `. B, n4 j! K0 O+ a

. a0 f$ U: m5 i7 b% a: J& {( X
& o% U. W: Y; o4 j( [图15  LogStash的消息视图
* m# H6 N2 [; `6 P/ K( Z4 J% J6 d8 z) u3 r7 ^
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
+ z* L4 m* C  v) W- @/ J# k9 o& u/ |, U# S% t2 F( n0 R, y* s3 K0 i
3 Z/ r8 {: ~/ z5 k/ x
3 e  j3 X8 V8 w3 `2 B. b+ a
图16  LogStash的消息过滤视图8 R5 y8 I. [, O. [  \
以上是“OpenStack企业云平台监控的示例分析

- k9 }# [3 B) |/ J7 |+ D
. ]0 q% T0 g+ w. m4 g3 P4 s! Y& h) j: S' t

/ |8 {, e9 C. l, ~- l: l6 ^* a% X' }4 Z! }  B
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
( I3 p9 c4 |4 t4 ^: |! w; B3 v+ h, w( c$ w
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
2 B$ t# B& i. h
. S7 w7 O' y7 p3 r3 p% {Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。, m* s8 c! t" o) W/ M4 S
7 ^& q' N5 ]7 b% V; M& D, Y! u) C
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
' S9 P" B6 _# g/ d8 H& {( D8 c1 u( ~; s  @0 B1 C# Z- d0 K
$ Q2 t' A4 L9 J

) w+ i" c$ `) C& m% S图1  Ganglia的Overview界面
0 j; o6 m1 q- C6 h% m  f
3 U+ i  |7 H7 K' v5 K图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。. T* D4 M8 R+ o

4 `6 O0 H( D! ?5 w, [1 F0 T6 p1 e: O+ t$ a
1 K( |/ I' ^5 z( \2 w- E
图2  Ganglia的聚合视图和节点视图
9 E9 D$ ?- L1 S" U! G5 [3 Q9 U/ y: V% H$ f; l# ^" R
图3是CPU详细监控项目。) p% J# k  F4 s! Z9 ~

  k+ X$ x; t  [# y
0 A% D' i2 |; g# ?) Z( z  }! W4 k, D0 D  t& N" N
图3  Ganglia的CPU监控% T+ |2 f0 t( F% f7 s
/ z% q8 w' `: V  _. f" @9 L
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
. g4 o/ b& p9 v! n. g6 `$ |* Y+ g9 F3 p3 z6 ~4 m! d2 B
9 \/ F; p) C- L
图4  Ganglia监控虚拟机内存
6 w' o# m2 j  l" ~+ D
/ V6 v: k6 d# t" n- M; p服务与资源监控6 T5 [, |! K% P- C: A5 H2 V* T

% Z2 a5 T- Q( i2 ]5 D3 A2 e6 @Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
& J# j( b9 x, z: s# u2 I+ _! q! m6 k8 n( p
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
* f: @" {$ z- p! x8 C! j$ B! n4 H- O% y! z' u7 U1 h1 u' C2 o
: J* T7 x( s( N9 U: u0 g
4 e4 p+ |$ @5 B6 e) Q8 n
图5  Nagios的连接视图
; m; Y7 |# k( F* e  O& [1 x" `/ e/ O2 g
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。/ }5 C: T: e1 y/ j2 m8 ]/ y

- e, j! |8 b; I3 P5 x# n2 e另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。. V& R( `' V" |! x9 s2 F& E/ ~

, K+ x6 d6 U; E! [9 t) F2 v图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。  `# u4 y( }5 b3 x, e% M$ z
( |" E' S, @2 f; Y% c2 @
/ e, T& a/ b* |9 }6 H6 x
- _2 R; H8 W' j+ I9 @
图6  Nagios的主机视图
$ @7 N. G! K3 d( [! v6 C9 M$ \" M- B- f. c
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
. z9 p# U7 l2 Q7 v. n
* M% n+ ^, j6 ^8 m5 E# f0 Q/ \! W) ]9 o0 K4 M$ f

0 n# `) T& i  ]7 I图7  Nagois的服务监控视图, U  `5 W7 f* c4 F
3 d; A& M6 W% C+ M2 _
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。& u' l, `6 J% ]- T. ~

; N$ j0 k7 W- ^
2 p( r5 e' N) N  f. U; b' R: L/ e* R! U消息中间件监控
0 k  t" w( ~# p! m3 D) m2 Y4 l# P9 ], f
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。1 o1 Y/ B. |4 b) p9 p6 o  V* p1 |3 k

6 `8 L# r9 {/ l; M4 L2 ~' F图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
; z; b; w* |  O
+ S, P2 p& A' j- s7 m: v, y7 {; @& N
% N( n( l# b/ x/ a' r8 P- k, m2 r, k0 G
图8  RabbitMQ的Overview视图
( |0 j0 c/ ]0 B9 `+ M6 `! h) p; a0 ?6 J- C  R; E! D
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。+ U, R! J6 P8 S( E! H3 ^

& w1 a/ i* H+ w6 ]! H5 r/ y3 {: |! k" ]/ c# W, p
0 C* E' d& k# d# r2 f0 M
图9  RabbitMQ的连接视图
$ A4 C. R5 L7 `$ t% v- x( H/ M
+ X  |- [' a+ B" [7 c5 ~5 Q5 c图10展示了消息中间件的通道视图。
' M1 ?9 T$ u) v$ _9 c, `& p
0 x3 p2 `3 M# Y  p! U+ u  d: c: @- F/ A
6 `  G; J  f6 v: T: H6 x
图10  RabbitMQ的通道视图' X% s" [: E+ T. p

( E3 ]* F, l8 j' H& S图11展示了消息中间件的交换(Exchange)视图。
5 O$ }" ~" s: l
% c- x: w6 ?# C7 f. q
7 E2 W9 c' N# t+ g7 ]) ]; _& L
) p. I. W0 Z) `. G图11  RabbitMQ的交换视图
& e) o% f7 e: b4 U. m+ [8 g& a; ^# ]! o8 s: C* F' W
图12展示了消息中间件的队列视图,并包括了统计信息。  Q( b! Z; t# Y: C! v6 O, a
2 `. P: Y4 y' |) H  z7 m/ L3 h, i& \
! G% Z1 R. I7 b( T2 m; b5 n
' n3 J8 N- E* V# N
图12  RabbitMQ的队列视图
) Q, j; `! L, g2 N/ @5 _7 }: e8 W
5 X3 @+ O! c% W6 P3 N, Z5 [8 F5 Q图13是管理员视图,可以修改密码、增加用户等。- Q" g# j; t: t8 ?/ H  b- a
1 D+ M7 @9 r+ Y4 k1 [
/ g( `2 `% [2 Q  c! N

' A$ M, `; t2 f0 I( U$ i$ c" K图13  RabbitMQ的管理员视图
( x- w! L$ k# s! _" V/ S$ i! A$ e( T4 M9 y( |
日志分析# f. D/ ]5 y* A5 p- ]( D2 @

6 h' R. w, x) ]% m  b& p+ B3 hOpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。
/ g2 `: o. N* F" y1 F0 b
" Q) Q) u0 [% U! yLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
8 n- L5 `8 p5 a& m  r* @- Q
9 T) ]& b7 Q+ z) N' z4 M图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
& L. \2 G( Z) w  w6 [9 X- H: o9 ^
# W/ A% D" l/ F1 i/ y
* Y! X: Z4 a* U( F; c6 N7 \# C# B. q' K. ^! [, c7 m
图14  LogStash的Overview视图
; T0 L/ o$ @" N+ V: M$ L- F5 Q
8 X1 ~9 L" V* ~1 a, v: z8 v! ]8 w+ Z图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
# q" N8 ~0 L3 F; T( M8 W) F/ b9 X4 N
& N  ]9 e2 a; j6 @* u- J
6 @- F8 h! i3 t: j1 K% w9 {2 v
图15  LogStash的消息视图
  j0 y: c7 i: m2 R) E
0 ^1 H9 g8 V" G. }' c% C) Q( [9 ~图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
* }8 X* }3 T! j% r' `2 l1 }7 ]
5 x# p7 [8 K5 E+ ?8 [: J/ f0 N) a& K/ l* {

/ J- W1 L& h% X' @% R$ g& o1 u图16  LogStash的消息过滤视图5 G2 L# C7 B2 A* y  u
以上是“OpenStack企业云平台监控的示例分析

7 t$ h+ @3 p5 n; W0 b- e/ D! N7 G$ {( b. i3 g' V( k6 e: ]
 楼主| 发表于 2022-12-15 10:26:22 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控0 d% [7 t. ~1 y" J( [' g3 X7 P
) U0 a; L5 Z6 X5 V* ~& g) N* i" {
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
; J$ F; z9 r3 @' G+ O5 b% h
0 X  m7 U! `0 s  k4 zGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
$ ~9 d& p# D: r- \) A% B0 p  G5 j1 b9 j! [8 L7 P
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。8 o4 j! n& `: \" W

' y/ S* s0 y2 s- D' [: `                               
登录/注册后可看大图

- e# n- J' b7 H" a
+ Q0 k# P) q7 _1 e
, ]: ^5 V) V/ v- [- y- z* p图1  Ganglia的Overview界面* h4 e2 X, z' w$ m

- V# M, E- l. O6 g2 z4 T0 o图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。8 ^- B$ H  m* N  n2 J) i& J- o
% u4 Y4 e9 z. X1 s! M

: t5 m. D7 T5 M9 j                               
登录/注册后可看大图

: A2 {% g) W. ]# N- y+ _6 S7 W" J9 l# S3 V
图2  Ganglia的聚合视图和节点视图2 f( I& i# ?' |; G2 R

) o& U6 Z+ v% x4 P: C1 E7 f, _- A# R图3是CPU详细监控项目。
- M* S8 O; g0 n/ ?1 O1 m4 y8 g$ j2 X+ q2 Z' D4 h/ P* U2 d

" S1 z8 j( @! e) J2 a8 F1 c                               
登录/注册后可看大图

: v( a1 ?' \$ L4 `1 H$ ^/ p4 U1 G) F% K
图3  Ganglia的CPU监控5 |# q) C/ c. Y- q+ {9 [/ f

! X) o; R7 D/ m/ b. b图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
- C7 s3 Y/ {/ z* E$ j9 A' @! @' |( g1 L. v
$ U8 M; O7 x, g2 c; T( A$ i! Q$ T" I& W
                               
登录/注册后可看大图

& a3 Z* w( e' n图4  Ganglia监控虚拟机内存. l; n: }; M1 z& e

' U. w' |. S. ?, l3 t2 v2 R& _服务与资源监控( ^9 @/ a- \, ?- \* G

5 h( x& s- P# ]" jNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
" p6 |) y. ?8 [# m4 R' w4 \; H
( Y( f6 \; V! \+ D图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。* M7 X6 p1 f) x8 O6 j' k5 K- a5 E* ]
0 Z5 ?) e, ^. m! j
0 ]# q' \* M% C0 |1 Z( ~

$ [% _& k8 }& J! r  P2 y! y; X1 _  ~. ?                               
登录/注册后可看大图
+ c7 ]) ]0 R& ]
图5  Nagios的连接视图
1 S* K$ g" \. m- x! }
. S/ o/ _$ p: m9 n另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
0 F) {% T5 ~& P( Z" d6 n( I; ]" F3 O1 C0 f! j: S
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
8 \1 \( U. K/ M2 ~. W4 T  H& e1 T4 x6 F
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。, f( ^; q3 n* m1 y- w# A+ T
) E% M0 E2 H2 y+ y, l

7 _& d  a8 h4 g6 ~- V# r
' ]! u4 @& E* ]% M2 N7 l9 O! f4 V
                               
登录/注册后可看大图
0 g7 @, x8 ]% v! C, ]8 Q& y& u/ v& c9 ^
图6  Nagios的主机视图
! k8 R% }7 y9 h) @( Q2 ]( w) N; c6 @" G# e4 n+ x
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。4 w7 N7 G. g0 E
3 X- t' f. Q+ F8 b. g
2 ]1 C9 C% M0 C4 X$ C
: E# N: c, \* b0 i
                               
登录/注册后可看大图

% F5 \3 v* Q( U# ?图7  Nagois的服务监控视图, }0 E, ?. _  z5 ~; n  r
4 |: U. K* E! N" D
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。- }1 m* l1 K7 J% o, O: P; I" T
7 M* ?" W  F% n* g# G# H& d% E3 m

1 x: F8 W: s  F' z; G消息中间件监控
2 ]/ \! ~1 a- _3 {% y) n9 [- S! y( w* \7 x9 v0 {6 a
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。3 J0 x0 c4 @3 N+ J# G- s$ n$ X- H
% a& s8 c1 a) c" P! Q
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。( a) D$ i  q/ M8 j7 W# \) r; P

  G+ d+ ~/ l- r! [4 v
6 B+ i% _5 I& z' ^& s
                               
登录/注册后可看大图
, K: m$ C* @6 q9 H) D7 v0 d

) Q% p+ ~; j: @, X: x; v图8  RabbitMQ的Overview视图
" e( b- h( q5 d  \8 B  n8 M% W4 s! x% ^; Z
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。, @5 V# B5 x& o( D
* z. h- y; I* N
& d% U6 e5 P3 u& A- _3 W
                               
登录/注册后可看大图
$ p) ^6 N6 D' \! C1 W+ P
( l/ y9 ?$ r! H/ O! H
图9  RabbitMQ的连接视图8 q, \2 L  Q1 K3 E5 m& \" o

" c; E( Z' w0 @; F# g- ^9 s图10展示了消息中间件的通道视图。8 B% X/ r  d! j9 I

* B$ }/ E& R* f, l" k
9 @( ~5 b2 r3 T8 [8 W
                               
登录/注册后可看大图

2 m9 w# Y0 N( M$ s4 Q% P* z- J1 [
3 X. X1 y5 V4 o图10  RabbitMQ的通道视图! W) m# @4 A. R

! \/ p+ @8 R+ [( i- L图11展示了消息中间件的交换(Exchange)视图。/ ~$ i- Q( h( |' p3 `2 y  f
4 P1 W% w5 `' G9 Q8 d5 n

1 r2 A8 D) d6 f9 _( k. [2 }7 k( m                               
登录/注册后可看大图

" K5 T" O& |* z+ x- e1 C
3 j, A- h2 J  n9 C9 M: `图11  RabbitMQ的交换视图
0 n; D0 r$ Z7 _0 M# j/ A: x9 \! h# [1 V
图12展示了消息中间件的队列视图,并包括了统计信息。* ~6 ]2 R1 X% c9 R' f" R- T5 [4 q

7 d& R0 c0 b; y& g
' N- W6 X) W$ m; ]0 K* b' M9 c
8 y, E; R. w3 C1 y, H% \
                               
登录/注册后可看大图

  i  I  _% P- P  r6 h# V$ p0 `2 b图12  RabbitMQ的队列视图
( G( u! _4 H9 m  k+ p8 w
( m; M+ {0 Z/ [; B% _图13是管理员视图,可以修改密码、增加用户等。4 _: q. I- g: \5 G; W! M, u8 V
. c" C. {0 j  ~3 z/ Q
. ?5 Q- ^- D0 X. I' G
                               
登录/注册后可看大图
8 u' n$ \: Q! K$ J) E8 Q( R4 X! A

) o1 y$ D3 B8 }+ F, g图13  RabbitMQ的管理员视图
4 C# E& Q. F1 z* V1 l7 r7 ~' H: t8 L3 B" T" {) `3 b
日志分析
! p  z  F$ `" _" S2 p; ]) A4 j
+ s: h2 J4 K0 T# ^: SOpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。
: @2 s; i5 @% F4 t8 K5 `; l
5 I+ _$ H. O. Z9 l" b* dLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
/ f+ O5 m& {2 `( Q$ T& S9 P+ N9 S3 t' ~+ U/ F
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
7 w% I! V* g" Z% W+ |; L
% P0 j8 p2 {5 Y" T7 c& r
) T3 e* V& K) ?
                               
登录/注册后可看大图
0 x* }1 ^- B# ^! T8 L! I  n
' x5 n" |$ r7 P6 {0 U  w% w8 a
图14  LogStash的Overview视图# q2 R; u+ U, B2 P
2 ~$ O: x4 z6 e6 M/ b
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
4 A  k0 I: a; V/ F+ x2 T4 _3 [4 P! @" V8 V
; M4 g# f# f/ ]# y- p3 G
                               
登录/注册后可看大图
+ t/ y) B0 }7 v' i2 @7 F6 ?5 C5 R3 |

" d8 O4 ?. X  X- e; _5 I2 y) M2 B图15  LogStash的消息视图
# Y8 {7 t; D- `+ f7 N: t
$ M9 L: }: p" W0 B% d7 s图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。6 H( f; o0 @% r. |2 e# P' R! o6 k3 L
# b7 [7 P) P9 r- f3 r

6 M6 T9 m0 T( x7 t! f                               
登录/注册后可看大图

/ o2 `6 w* X0 P2 X4 |+ }
. U  g- h" x4 n8 y8 r6 P% L$ R图16  LogStash的消息过滤视图( ]: \: L$ H0 n
以上是“OpenStack企业云平台监控的示例分析
( A  |4 t$ `6 z. u2 g. v8 u
您需要登录后才可以回帖 登录 | 开始注册

本版积分规则

关闭

站长推荐上一条 /4 下一条

北京云银创陇科技有限公司以云计算运维,代码开发

QQ|返回首页|Archiver|小黑屋|易陆发现技术论坛 点击这里给我发消息

GMT+8, 2026-4-8 15:22 , Processed in 0.058741 second(s), 25 queries .

Powered by Discuz! X3.4 Licensed

© 2012-2025 Discuz! Team.

快速回复 返回顶部 返回列表