易陆发现互联网技术论坛

 找回密码
 开始注册
查看: 615|回复: 2
收起左侧

OpenStack 高性能监控工具

[复制链接]
发表于 2022-12-15 09:55:23 | 显示全部楼层 |阅读模式
购买主题 本主题需向作者支付 2 金钱 才能浏览
 楼主| 发表于 2022-12-15 10:26:07 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控. K. d2 T: B/ x5 x* }

# j5 q4 j7 n' W7 x/ y$ j& Y3 u9 s对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。/ e- h" T2 B/ @( X" \) I
3 m; A- a1 @# L- r& I4 a
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。6 T% x: H1 A5 [) l2 C# \) b

0 k) I$ T& [/ q1 K$ d图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
0 n- l3 F7 s' \' a) H8 ~0 V9 Q' F: x. t. Z+ H- [

6 H1 |; ^4 ?. D- r% B* J1 w' \; @0 n1 n0 U& L, z& d
图1  Ganglia的Overview界面3 ]" \: z' u6 |
* I1 w  [1 ]( q1 G8 b9 P. m6 t
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。3 N' y* R# C) G2 N& }

8 ?8 o# N# |- v9 Z' F6 t4 E& P3 z5 l; }5 b: I/ _
5 A5 J# d) Y: S% [
图2  Ganglia的聚合视图和节点视图5 p) q0 Y: d; g
/ A9 S- x* H% k* e/ u
图3是CPU详细监控项目。
( X7 P! ^7 i& h9 v' i$ V& ~) k9 T# Z" G8 u

7 x7 |! D, ?8 t, H* K; ~: }' b
7 K' W6 L" \. q' H! A图3  Ganglia的CPU监控: m$ W5 j$ H  ]( c, T3 I

; U( |1 o* F) P' {  X6 V图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
. M) a5 V6 d: O5 P7 F, z1 V* f" _9 ~% B; {. L
* y7 Y' e, n5 o9 f3 h
图4  Ganglia监控虚拟机内存1 v% |6 S1 `4 ~4 H3 W1 d

. p( S9 L$ R& m服务与资源监控
( l( c8 u; L( J3 I* n2 z
6 K; z3 e& `2 MNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。0 M; m$ z1 {+ V2 T0 w0 U

$ v+ T2 C% C8 K$ o7 c图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
3 F$ }+ c" t9 N2 _
9 P4 X! e$ _( X
) a! `: l+ r# `# E- B' Z4 M8 d
: f3 {. \; {4 D" T8 T8 t! x4 B& |9 H图5  Nagios的连接视图
' p/ N( B) \; p% H: w; {  I4 P# x8 V9 r0 |& l( w
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。" H- C2 S/ `4 \* a6 f4 ]. q$ C0 b
6 F9 B: u: u7 |8 u1 p  [
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。, h* I& U% q7 q7 D- d2 R; ]0 {
2 }. O9 X& U5 c1 Z' x
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
4 k! f( P2 H: B& p8 \1 `6 v$ }
& K: n" E  G6 J) s; [
+ J8 m+ t3 S; `8 H6 |7 i# M) _3 z
4 O# V/ Y$ D7 }! [; L! S8 F图6  Nagios的主机视图7 y. g4 P! X% Y
4 N6 e$ p- m" ^: M1 [2 A
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
  i9 T0 o: J* N, |1 j; b# H- E

, `/ s6 j, h" P* j' S/ w0 `% j+ m; z# F( B1 r! x- I. D% O% c
图7  Nagois的服务监控视图
% ?( N2 a, `$ K1 I, }4 l. x
5 W' g: X( f2 S" ~2 w( p对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。3 h* l. a+ h8 n8 d7 w6 y
" k0 V. ?4 O5 I7 W3 p# X0 H* h
4 I- L- p1 k, ?/ O4 x  k; w  T+ I, c! B
消息中间件监控
: h2 b* T( Z6 D: S+ K: Y) L% f( c2 H& w# Y! A3 ~8 G
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
. H6 d2 b0 F) \) z; I% ^! o* h/ [$ e& m8 \* ?7 I
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。4 E9 K# w# W7 D% q/ o# Z7 F

" q+ X1 @) r' s+ ?5 F
5 y5 C' ]; W- e' q8 |  ^$ e/ G: L, B6 H
图8  RabbitMQ的Overview视图
  @8 A( `/ I/ u) g; E7 p1 l  |2 E" ^
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。7 u0 f6 r& B2 V) H8 t
1 p: r. k- r- n7 ?

) |+ w" g" L3 r& L7 [) w! L- ^0 z) S
图9  RabbitMQ的连接视图
; J% e) H3 c7 a" u$ l+ v( m' _. c: o! H
图10展示了消息中间件的通道视图。
' ~/ ~" p5 P6 y3 M, G( L; F9 y8 j0 B0 L1 w7 B
2 z7 `8 Z6 `  w
0 o0 _% l5 u; e# n* u
图10  RabbitMQ的通道视图
& @, H( h, A8 t/ l, P  K% r" a
" C+ \  W# W$ n/ {! l图11展示了消息中间件的交换(Exchange)视图。7 I* n: i( i) I: |8 Q
) f+ q4 C1 j) V* ~5 O
3 i( l) v' G! E7 l/ P( Y- F* a

" E8 _& k: V4 q图11  RabbitMQ的交换视图' f) g) G9 M: e3 i2 u' n) v
6 P2 g; B' ]4 @7 T5 b
图12展示了消息中间件的队列视图,并包括了统计信息。
7 M$ X- K9 X( E5 i
0 a6 @$ \; A0 a8 Z( m6 |+ Z/ F
1 y8 @/ \' ?6 q5 w  H
. u4 e) p: p5 g' j$ B% P图12  RabbitMQ的队列视图/ x2 G) K" \( k* R- [
) {4 f" f1 }/ e
图13是管理员视图,可以修改密码、增加用户等。5 x  W% o0 P  r/ f5 w8 R* E7 L

6 ~: l! m+ \5 a" o! X
) x3 @& D$ S, c
& Q% K4 `: @4 V+ _! u, t. n! C图13  RabbitMQ的管理员视图, T( d4 d) }9 [, b  z

5 [) {! P6 ?1 f1 f日志分析4 N# [$ T9 G1 c( l, T# ^
- b6 `' |; Q- c0 S
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。% P2 b" j; v- B" V: V5 w
! q2 a  q6 [* ^" G) L2 t
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
5 y% H) i+ f, c3 C2 g  y' ^8 f* g3 j5 _! ~# V( V0 M! M6 H$ ?
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
/ G! d* H" }3 e- w" H& u! m$ E: c5 o/ g
8 i- Z4 F: M* ?) u  Q- q8 X5 b
  |3 _1 D# z' B: \* D$ `" i5 V
图14  LogStash的Overview视图2 Q) q+ i( Q& h, ^  O) `
4 x5 f+ x8 ^2 H; m
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。/ [# o& m! w6 M; J& K

0 F) l1 s. [2 s* }5 Y3 J: |4 d& q' r* F% E2 t# z" \! f

; [; D2 P) M) X1 ]0 E- t- L" B0 i图15  LogStash的消息视图' W% e* r+ ?7 I4 M
3 C  n' o4 B! n
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
2 N2 A* s3 j3 L$ H# p8 U" X& C
+ w% V0 g7 q8 v9 y6 U0 o+ ~" x8 d2 G; L( n1 N3 P

" S9 _/ |, {5 P8 r  Q% z+ n图16  LogStash的消息过滤视图
" c6 E" a, g; I  Z" U7 a* N
以上是“OpenStack企业云平台监控的示例分析

: z) T8 @4 z- c& M7 @- T" M4 x0 i: |$ \) r

2 ?" _! X0 I+ ^6 o
( T8 Y7 ?6 G" G- q
# c( i( d7 p) R$ G
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控* c. o( w; ^2 x- }( |" a7 ?5 Q/ Y

( z8 H" l8 w) _( U对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。: W2 k7 W8 v5 A1 g4 j

% ]4 T- Z3 @( X$ R0 r; O7 _, O, }1 HGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
* ^" P0 u  R6 u9 q
, }- P. G& c6 Z; l& `' w图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
8 v& z; z, R9 o6 J2 z5 J) K
4 W0 ?0 p( ?1 P- M6 H: Y+ I& s
* V0 Q% M9 N8 V! ]' Q2 e
% q/ Q! W% E' k9 S9 B图1  Ganglia的Overview界面
( h) u1 d2 ?2 v% M# [/ B$ q2 u% `0 R% G+ q/ j
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。0 Q6 r1 ?  g3 e8 W, k2 A' \& j
; Q' y2 U! F& |7 S. R7 A. l9 N

0 y8 s4 Q$ W$ n& \
0 U3 I6 _4 g: w图2  Ganglia的聚合视图和节点视图5 E& k6 ]  @8 V0 I, k% ]* v) ~# z

  m. {9 g- |  R/ k) Z图3是CPU详细监控项目。
3 c$ b8 s$ x7 s% g8 ]
+ s# j3 y/ d0 b1 I" _, @. A+ e7 P: W8 T. r

$ n, ~5 g/ ]! {; o- o" H1 S3 k图3  Ganglia的CPU监控
" z, |+ f5 y! M3 Y) Q$ ~
0 P$ q6 \2 E* b/ Y/ ?. ]& o* Q图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
" V# @% V% U3 M! E$ C
$ ]+ D$ V- X" e8 O4 y1 A* S9 Y% B/ t! B- e- }' E
图4  Ganglia监控虚拟机内存
+ h2 n1 @( o2 a- H4 [4 L. o9 Z1 L$ o" w0 @+ c
服务与资源监控6 T# g; g3 Y) h" B' n0 I1 N
, v3 @8 }& j  z4 w9 x0 U* {
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
- c" x$ [/ b5 W" l
+ O( s, A2 X$ W3 m& J7 G4 D" {& g; }+ x; b图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。- _+ P0 \5 W' V" Y$ c
- k( _/ W5 `! y# L% X
4 g- }: L! |% [8 F' U% z0 O0 K
9 X" {& Q0 a7 ]8 ~$ R' Z
图5  Nagios的连接视图- H1 N9 a3 V0 e2 X
6 ~1 u* w7 p) E, w7 ~1 Y
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
5 M2 v0 R7 P7 ^! I8 ~. h  w( q7 d5 A
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
- \, D' o0 `' ]8 h2 i  z  u2 X
, L$ c/ `% D, x+ a3 T' j! e图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
4 r' j0 o+ ~. ]+ K. m% b. h- n* v& `4 C3 u
- f! C. i5 }/ u. r2 J

5 [# E6 E! `- D9 c; }: m" M图6  Nagios的主机视图$ p2 E  u' i! g
- j' w6 R6 L2 e: z
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。/ R- y% {7 b4 b

! v  T; w9 W& C; `# Y) [) U
! B0 @5 x( S0 C# P$ g
+ E/ H1 F0 u' q# i图7  Nagois的服务监控视图0 t/ \0 y4 X; P1 S7 s
1 d7 }9 n& {( _; b+ d' a; Z
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
; c$ o+ b/ N7 ?% E# W! N7 P  w7 B( L$ Q
: m4 U3 x  K, ?. b7 y
消息中间件监控# A8 [  k2 K9 C, @3 I

& f% p7 I+ b- j$ u消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
8 ^" Q  I7 p( [- H9 l% Z+ j, M. X% V; V" W0 ^
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。) Y8 ]# c4 h3 v+ ~) u
# L3 k2 k4 z7 v: N) C# _( e

/ e/ w+ H; @4 U' }+ V8 w2 ]. r# u; `# {$ \. I7 F
图8  RabbitMQ的Overview视图5 [6 n$ H6 L2 y/ U

( e% ], W8 g- F! x) M1 P图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
) @% H  P/ Q2 z% }& ~/ z8 i2 F
3 x5 k& w; s1 k0 @

4 {4 P$ E$ z5 W. P图9  RabbitMQ的连接视图
4 h  x+ y4 e6 A) T& H$ {& i; [/ A! S$ d+ y- ?* @  V+ k% W+ Y
图10展示了消息中间件的通道视图。
0 c7 `+ S- U3 _, F' Q3 ^4 X7 z; o: H8 _
1 T. M7 s! D7 N9 `% R

. |* D) m. O8 F. |* e% F+ B图10  RabbitMQ的通道视图' t9 i& N4 u* o( E3 G
* q# _$ O0 q" {" {
图11展示了消息中间件的交换(Exchange)视图。
: W. m' b9 M, \0 S* X7 Y% w* ?2 k6 c: N6 [; x

8 ^* P* k7 R9 T1 e7 ?3 ]
# F, }( o# b  a8 h图11  RabbitMQ的交换视图3 D9 A7 U3 K! `" R/ m5 B' v( G

$ s9 e, L* I$ A3 l  W, r4 D" u图12展示了消息中间件的队列视图,并包括了统计信息。
) V5 _7 C/ ]! }# ^" A, B$ W5 x
7 _$ U: V2 b8 r/ Q  l
$ Q9 w) k, W, m0 d6 p( F
) V/ c  L9 s# Q6 x! D# {4 z图12  RabbitMQ的队列视图+ ~* Z$ L( `4 q) h/ Z
" ]( M) M  Q+ J8 ]) l
图13是管理员视图,可以修改密码、增加用户等。& x1 N) D6 A, x" F

3 h: Z" H) ?' S# u9 }) K1 u9 Q0 i; u. p  w. ?$ T

$ b3 m* r; N: ~) i6 Y图13  RabbitMQ的管理员视图
, I' A  U. v8 |* `$ E: O3 U
$ _6 D; L, ~% p1 p( _/ \7 ?- u6 W日志分析* ~- ~1 P8 @- [% z2 N  k% z: A
) m2 ~6 K! Q& j' W2 G0 U
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。! T$ t( D/ b  |' q( v( K8 M! A  e

# m% w% d/ \# A8 F( Z& D( n2 _( oLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。  {% i! ?2 H* C( I3 d' V

, C' K9 m& e8 V9 X3 y- H! F图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
2 ~  l3 N0 y( G/ C
9 E6 }/ i3 S6 p# F+ o/ V" ]% Z" S+ A) r% k' R- S/ c
  F$ W; r1 R+ B/ [1 B
图14  LogStash的Overview视图
  Y/ p3 O# Y. Y9 x1 u$ L  ^3 E+ z
: ?6 M4 j  |" S% {$ d图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。% m  ?& p9 @. ^
; W! ]2 i5 \  o1 \) ?: A
% p7 q+ L! E, ^; z7 P
# \4 u4 h; z( n& H
图15  LogStash的消息视图
7 G/ B8 `. x4 m& s9 N: B6 s  G
: G; d( o9 j2 G2 J% p图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。/ V, v. q( @/ \& L6 b5 K* P' F9 R

" ]% o; Z4 p8 P! }: o$ R3 P  f
% i8 l: m' f, ~0 M( G7 d# v8 d! z, q4 Q7 b
图16  LogStash的消息过滤视图4 ^4 d( r7 Q8 t: C: k/ U6 i! ^
以上是“OpenStack企业云平台监控的示例分析
/ w6 G: w4 Y9 _
' c2 N1 [2 x1 q! d) q2 }$ b6 B
 楼主| 发表于 2022-12-15 10:26:22 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
- ?4 A) c. p" [
- x' B6 Q5 A4 v! H对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
: Z/ E; y. i* V" g& w4 E$ H0 y0 D# x; L6 @( j7 a7 n2 i2 R
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
" m2 R' y0 `3 L- \8 Z' P, H: Q
3 a5 q8 S* D) G' p+ u图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
+ w. U4 c) u7 Q. W4 Z

- F* Y) E4 O5 J9 i' g. t1 J$ q6 e                               
登录/注册后可看大图

. _! v; h7 G2 ^5 `# G2 n) z3 y. [. x# n
. K5 J6 h( S% I5 o! a1 q- [
图1  Ganglia的Overview界面
8 s. r. a% M' I1 z1 ~
7 I+ n5 T0 q0 h图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。9 {6 c* z, F! P

8 r3 z3 ~4 F5 S$ n0 W3 L% R. R- f

/ H6 u- M% r- N: s+ M! o6 v                               
登录/注册后可看大图

3 L+ @) p/ C( z" l% e5 D1 [4 Y+ X& I
图2  Ganglia的聚合视图和节点视图( E$ E& M6 }  E. g. D2 l4 L+ U* y

* Y7 h2 _5 Q3 O1 ^/ W$ S) `( @图3是CPU详细监控项目。( R( D* K$ v$ i; S; V  j9 x
6 t# m$ m( D3 h9 H0 m% G' `
' `5 g0 ^+ ~! U  R
                               
登录/注册后可看大图

. N( U9 Y" S( q6 R6 ?8 ]. a. [$ z, _. D. g1 i
图3  Ganglia的CPU监控
9 w2 h# l; e0 |* _8 G: S4 l2 C3 A4 N1 t7 T2 y! y
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。( j1 M8 A0 N- n4 ~5 k" H( M! P& v; o
8 j/ P2 [+ I: o
: D: `) ^8 f- d
                               
登录/注册后可看大图
3 b. _7 N6 n0 p, g6 t
图4  Ganglia监控虚拟机内存
2 f. ]( I5 h* o( Y; t5 f, N. V: Y# D; o3 d, U5 A& T2 g
服务与资源监控+ C- @1 _1 P( K2 g$ w
& i5 W- B  U0 a6 V' W4 ^
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
" ]( S3 e' P$ G% n
4 D* R4 K8 z. `) a: F图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
+ \  `% t  p& |: v& e, H9 D* s+ K% l# Y, z8 \& G
3 Y% Q+ Y4 {" L; ]3 b$ t

# {& ~; Q, Q( {6 @4 Y7 ~                               
登录/注册后可看大图
. I5 t. s. u+ ~( I9 c: ~
图5  Nagios的连接视图
0 L/ P& N! V( B# F6 @8 x6 U  [* @* u
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。' L9 s$ H  [& t, _& a) Y; k
  n" ^. \' u0 p: }0 g( @; k+ P
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。* p% h3 ~# D; J4 Z) F

! w1 U- y+ c, r3 W图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
+ @  D- ?1 ^+ `* D$ d
3 E8 }* F6 U3 s: B9 t6 I; |  b8 v. X! O. A9 m% }
! Z: ^7 E4 D. t$ S: ~0 v
                               
登录/注册后可看大图

$ K' g4 s! y2 E+ b4 e- Q0 t图6  Nagios的主机视图( P9 m4 z$ |2 r9 N$ U: t
* i* Q& X$ q$ [' f/ v; [# P4 u0 D
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。: |  K1 C$ I" V$ X8 }7 N. D

+ w9 X$ T7 V/ U* s  b
6 }7 X9 H1 C; J

5 {4 h5 A8 }, L% F- E                               
登录/注册后可看大图

& S& z( w) L) b/ j) Y3 B图7  Nagois的服务监控视图
  e7 d& ]6 w! i( ^# m5 D) M+ [
2 |# w+ m5 o2 @! _9 l( U3 i6 `& M  ^对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。1 Y$ N. N4 k' V; V. {9 o" K/ ?8 {+ _

' \& ~" c+ D  I" y1 Y$ M! C/ E+ ?4 V  C! h# H4 E+ |
消息中间件监控
0 W- M1 i8 h& P2 I; W
4 ]0 }* {) g( g+ Y消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
* T; r, q+ h6 }/ S2 b4 c  V# X- `! Y% ]9 x1 ~& {  V" o; T
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。2 T0 d$ \. y! p+ {

) C% m7 ]4 h4 A9 }( T( x' v% W
( f4 k% j' {- _: L! K# h
                               
登录/注册后可看大图

; Y- B0 Y( g5 V" v3 H2 y+ H( ~, {, z- e2 \9 f4 B- t2 o+ _
图8  RabbitMQ的Overview视图
- B3 k& H$ W( q+ E2 x( [$ B7 i& D% u0 O4 w
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
" y6 k+ y: p2 ?( ^4 k3 G8 H* a$ h- M* n3 [. q3 q! Q% Z) W9 o

$ Q0 \+ i( q6 Y                               
登录/注册后可看大图

8 `/ T- m6 \# _3 ~" y4 T5 e- t! m
/ i. F2 L- r( T4 f9 E图9  RabbitMQ的连接视图
0 Z8 d/ N3 u9 z; b1 ?1 z* v+ s
/ K  A" B0 x6 o% Y( i图10展示了消息中间件的通道视图。
, ?# s# T8 ^" L" T, o% O" J( u% V) x: l; S' V& e3 c

: \, @5 m* @$ M/ _! A                               
登录/注册后可看大图

5 C( Q& B  Y; @9 t( n
& |. f) f) r. T' f6 F7 o) y图10  RabbitMQ的通道视图8 H& F  Q$ }; ?" A) s' S1 ^
' ]: I5 B0 i% `/ N' {# l
图11展示了消息中间件的交换(Exchange)视图。
, ?6 J9 }5 h/ R5 n* R2 ^' x6 e" X8 g9 [7 w

1 {- }& ?1 |8 g2 H                               
登录/注册后可看大图
5 s$ |5 a& }- i  s9 A

' w3 Z0 O4 p" Y) c- [$ o/ e图11  RabbitMQ的交换视图" b, D9 ~7 r0 R/ x

: p2 B( Q7 N5 w图12展示了消息中间件的队列视图,并包括了统计信息。! d" q  F& a9 }2 _; j  J# ?

& D% h; g% L( D* H% R, }' Y; ^1 o* q3 E( [$ ?" O

( Y& q4 K8 [3 d7 X6 i6 m9 N                               
登录/注册后可看大图

( S* M9 M. M$ }. W; B: G4 w图12  RabbitMQ的队列视图. l8 `' i( r0 Z& V( i' B: I- {

5 e1 H( o* }" _' }. a8 v7 d4 t图13是管理员视图,可以修改密码、增加用户等。  |  T: W0 c4 u2 ^- l; T! }+ w/ W
( [' d6 ^, ]' E$ ?/ M- `2 ~
# n5 \3 V5 C( \+ L5 I8 P* c
                               
登录/注册后可看大图
  b: l% R5 @9 r$ n8 e7 F, e

' ^& C* c( s9 Q5 n5 I/ c1 ~图13  RabbitMQ的管理员视图
- V1 F( `  u8 @. t8 u5 v5 T2 O8 G, ~, e% D
日志分析7 D( Y, \% f: u; ~3 h5 q& q
0 P3 N6 `5 A& F7 P, K7 A# ]
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。, w- e) R* ?/ o: `  l; X: X; P: q7 {

; C0 s, ]" R: [  S, |: |/ lLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。/ A7 y' e" j% T0 ?2 A
/ G3 {- H6 f9 ^3 B
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。8 E+ t0 S3 c! Y' D4 s  g9 t) l
1 H$ F+ p' G9 |9 `4 B6 p# Z; p$ |" C

( ]+ e; g, _2 ^  {/ l# r                               
登录/注册后可看大图

0 w9 L3 {% \/ s) M& x9 U( i' F
5 q/ l, A  Q8 k0 z6 P图14  LogStash的Overview视图" c; J7 \: Y& D3 U: O

! }& Y3 t  }- @7 V图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。+ O  r/ ^; I# P* [$ o4 q

) y) @" L6 @$ q- \

/ R0 j# @6 r5 H2 j) K0 E2 K! b                               
登录/注册后可看大图

6 {" h! j0 M' z* n+ j& K$ x8 |* @1 b5 N0 g& e0 f
图15  LogStash的消息视图
6 ^; D) ~* }/ h# {* z* X* E0 f0 h; h4 l( y
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。5 P# u4 \& w2 p$ C
  F6 m1 `, z# T# o
7 i. x! G8 N9 y) a
                               
登录/注册后可看大图

/ L6 M9 |. k0 F9 k. k+ \  {7 J" q/ [2 V3 ]; U# Q( `" n! C
图16  LogStash的消息过滤视图
. j9 @( g. ~8 ]
以上是“OpenStack企业云平台监控的示例分析
' v: Y3 o( m" ]! y
您需要登录后才可以回帖 登录 | 开始注册

本版积分规则

关闭

站长推荐上一条 /4 下一条

北京云银创陇科技有限公司以云计算运维,代码开发

QQ|返回首页|Archiver|小黑屋|易陆发现技术论坛 点击这里给我发消息

GMT+8, 2026-4-8 20:53 , Processed in 0.059894 second(s), 25 queries .

Powered by Discuz! X3.4 Licensed

© 2012-2025 Discuz! Team.

快速回复 返回顶部 返回列表