2015年12月15日掲載
オープン系システム運用管理ツールのこの4、5年の進化は急速で、現時点で一から学ぼうとすると全体像がつかめずに混乱してしまうおそれがあります。そこで、今回から3回にわたって、運用管理ツールの全体像および最適な選択のポイントを考えていきたいと思います。
埼玉県にある従業員約280人のEMS(Electronics Manufacturing Service)企業、YMC電子工業(仮名、以下YMC)。同社の顧問ITコンサルタントである美咲いずみ(仮名)は、週はじめのシステム部門の定例ミーティングに参加したあと、同社の山田昭(仮名)CIO兼システム部長の相談を受けるという形態のコンサルティングをしている。
その定例ミーティング中に、突然ヘルプデスクの電話が鳴ったのだった。
運用窓口担当の宮下(仮名)が「ミーティングを進めていてください」と言い慌てて電話を取る。
それから30分後。「ただいまの重大インシデントの報告をします」と、宮下が重い口を開いた。
「発生日時は本日9時28分。営業2部の山下太一さんからの電話連絡で検知したものです。内容は、山下さんが朝礼のあと本日の訪問スケジュールを確認しようと営業2部がパイロット導入している営業支援システムにアクセスしようとしたら、できなかったというもの。原因は、パイロットシステム用に用意した仮想サーバーを削除していたためです。幸いデータベースが物理的に残っていたことで、約30分で復旧を完了。影響範囲は山下さん他数名にとどまりました。仮想サーバーの削除は完全な人為的ミス、つまり私のミスだったのですが、何らかの対策を打つ必要があるのではないかと思います」
「報告ありがとう。だけど、宮下が気を付ければいいだけのことじゃないのか?」と真鍋課長(仮名)が言う。
「そうよ。最近宮下君、オペミス(オペレーション・ミスの略語)が多いんじゃない?」と木村主任が追い打ちをかけた。
宮下が黙ってしまうと、山田が助け船を出した、
「1回や2回ならまだしも、それ以上に人為的ミスが多いということは、仕組みやルールに問題があるのかもしれない。このあと美咲さんとこの件について検討するので、宮下君も入ってもらえるかな?」
「はい」 宮下は、すがるような目をして返事をした。
場所は、工場の裏庭が見える会議室。メンバーは山田CIO、美咲いずみ、そして宮下の3名。山田といずみがリラックスしているのに対して、宮下はビクビクした様子だ。
「宮下君もリラックスしろよ。」
「はい。恐縮です」
「とって食おうというわけじゃないんだ。問題解決をしようという話なんだぜ。そのためには、一番状況が分かっている宮下君が必要なんだよ」
宮下は、ようやくホッとした様子で、コーヒーに手をつけた。
「早速ですが、人為的ミスはどういう業務で多いんですか?」といずみが尋ねた。
「はい。僕も今年3年目で、1年目、2年目は業務に関係なく、本当につまらないケアレスミスが多かったと思います。真鍋課長や木村主任はその頃の印象が強いので、あのようにおっしゃったんじゃないでしょうか。ですが、僕もチェックリストや詳細手順書を作るなど再発防止に取り組んできたつもりで、実際にケアレスミスは減ってきています」
「それは立派ですね」といずみはお世辞ではなく褒めた。入社数年でそこまできちんとした取り組みができる人は少ない。
「ところが最近は傾向が変わってきました。特に多いのが、仮想サーバーの拡張・縮小・削除などに関するミスです。ただ、言い訳じゃないんですが、仮想サーバーの導入で物理サーバーが減ったのはいいのですが、仮想サーバーの数自体が多いのと、こういった変更の回数も多くて、しかも作業内容が難しいんです」
「手順化、標準化で対応できないのかね?」と山田。
「それにはトライしているんですが、いろいろなパターンがあって出し尽くせません」
いずみが引き取る。「仮想サーバーの管理は本当に複雑だと思います。仮想化やクラウド化に伴って、システム運用は高度化、複雑化したと言われています」
「ふーん。するとツールで対応するようなことなのかもしれないね。それは考えてみたの?」と山田が聞くと、宮下はこう答えた。
「それが、いろいろ調べてみたんですが、運用管理ツールの機能がとても多いのと、ツール自体もたくさんあって、比較検討しようにも頭がこんがらがって整理できないんですよ。個々の製品についての資料はネットにいくらでもあるのですが、全体像が分かるような資料があまりなく、あったとしても僕には前提知識が足りないような気がするんです」
いずみが言う。「それは仕方がないと思います。運用管理ツールの全体像を押さえようと思ったら、まずは歴史からたどらないと。宮下さんが言っている前提知識とはたぶん、運用管理ツールの歴史でしょう。解説している方々は、この25年ぐらいの運用管理ツールの歴史が何となく頭に入っているので、そのあたりを省略してしまうんでしょうね」
いずみは、自分のPC内から資料を探し、プロジェクター経由で年表風の図を表示した(下図)。
「日本でオープン系のシステムの事例が出始めたのは、1990年頃と言われています。当時は大型汎用機に端末を接続するという形態が主流だったのですが、汎用機のリソースは非常に高価であり、また端末画面の表現力もかなり貧弱でした」
「そうだったなあ」と山田が遠い目をする。
「そこで、コストダウンと業務画面の表現力向上をめざして、オープン系システムの導入が実験的に始まりました。その結果、CPUなどハードウェアのコストは確かに下がったのですが、システム運用がとても大変で、そのコストが馬鹿にならないということが分かってきました」
「なるほど。それで、1990年代には、当時大型汎用機にあった運用管理ツールの機能が次々とオープン系でも実装されたということなんだね」
「はい。ご明察です。やや例外的なのはセキュリティ管理でしょうか。これは、インターネットと接続するようになってから出てきたものです。汎用機でもすでにTCP/IP(インターネットの通信規約)には対応していましたが、インターネットと接続するという発想はあまりなかったので」
山田が大きくうなずいた。入社したときにはインターネットとの接続など当たり前になっていた宮下は、逆に驚いた様子だった。
「20年前にインターネットとの接続が始まったということは、それまで電子メールはどうしていたんですか?」
「ああ。一部の研究機関を除くと、企業で電子メールが普及し始めたのは1996年ぐらいからだよ。それ以前にもパソコン通信のメールは存在していたが、それを業務に利用している人はほとんどいなかったなあ。モデムが必要だったしね」
「モデムって何ですか」という宮下の問いに、「それはまた今度」と山田は答えた。
「今までのところをまとめると、1990年代には運用管理ツールとして基本的な機能が出そろったといえます。これが2000年代になると新たな概念が入ってきました。ITILです」といずみが続けると、宮下が質問した。「ITILって何ですか? 聞いたことはあるんですが……」
「Information Technology Infrastructure Libraryの略で、ITサービスマネジメントのベストプラクティス(成功事例)をまとめて体系化したものです」
「以前にアドバイスしてもらった『ITをサービスとして捉える』(第3回、第4回、第5回参照)ことと関連しているのかい?」と山田が尋ねる。
「はい。そのとおりです。『ITをサービスとして捉える』というのは、ITILのまさに中心概念です。そこからDevOps(開発と運用の一体化)という発想も出てきました。ITILの普及に伴って、ITサービスマネジメント支援のための機能が、続々と運用管理ツールに取り入れられていきました」
「変更管理・問題管理・リソース管理・インシデント管理など、今からみたら当たり前のことだけど、運用管理ツールに取り入れられたのは10年前ぐらいからなんだなあ」
(筆者注:インシデントとは「事件」ということ。「障害」と同義に捉える向きもあるが、障害につながりかねないが未然に防いだ事象もすべてインシデントに含むのが通常である)
「それまでも人手での管理はもちろんしていましたが、自動的にインシデントNo.を発行して、関係者にメールで通知するというようなことが当たり前になったのは、この10年ぐらいだと聞いています。私もまだ若いので、伝聞です」といずみが笑いながら言う。
いずみはさらに続ける。
「2009年頃から話題になり始めたクラウドが、2010年代に入ると企業でも実際に普及してきました。仮想化はそれ以前からありましたが、本格的な普及はやはり10年代です。そうなると、やはり管理・監視するツールが必要となり、運用管理ツールの機能として取り入れられてきました。さらにスマートフォンやタブレットなどのスマートデバイスも併せて普及し出しました。スマートデバイス向きのサービス提供にクラウドがとても向いていたからです。企業もスマートデバイスを本格的に導入し始め、そのための管理ツールも必要となってきました」
「そこまではよく分かる。もう1つの『運用自動化』というのがよく分からないなあ」と山田。宮下も横で大きくうなずく。「だって、ジョブスケジューラーなどは90年代からあるわけですしね」
「ここで言う『運用自動化』というのはジョブを自動実行するというような話ではありません。人の判断を伴う作業を効率化するという意味です。宮下さんが困っている、仮想サーバーの変更管理などは、『運用自動化』で最初にいわれるような例です」
「えっ。ホントですか? 教えてください、今すぐに」と宮下が催促すると、「そんなに慌てるなよ」と山田はたしなめ、「美咲さんも一気に説明して疲れたでしょう。ちょっと休憩してから続きをお願いします」と言った。
まとめ
日立システムズは、システムのコンサルティングから構築、導入、運用、そして保守まで、ITライフサイクルの全領域をカバーした真のワンストップサービスを提供します。