パブリッククラウド設計におけるベストプラクティスである「Well-Architected Framework」にも記載のある今注目のエンジニアリング手法「カオスエンジニアリング」を活用することで、クラウドやコンテナを活用したクラウドネイティブなシステムの堅ろう性向上につなげることが可能です。
開発中や本番稼働中のシステムに疑似障害を意図的に発生させ、ウィークポイントを把握して対策をとることで、システムの堅ろう性向上を図るエンジニアリング手法のことです。
システムに対し、意図的に障害を発生させることで、障害時のシステムの振る舞いをプロアクティブに把握することができます
システムに小さな障害を起こすことで、大きな障害にも耐えられるようにウィークポイントを炙り出すことができます
意図的に発生させた障害により問題が生じた際は、その問題を事前に修正することでシステムをより強固にしていくことができます
近年、事業や経営を取り巻く環境が急速に変化していく中で、柔軟性の高いクラウドの活用に注目が集まっています。
その中でも、クラウドとコンテナ基盤を用いて、一つのサービスを機能ごとに細分化(マイクロサービス化)し、開発、運用、改善のサイクルを短期間で繰り返しながら開発と運用を一体的に進めるシステムは、クラウドネイティブなシステムとも呼ばれ、近年急速に普及しつつあります。
クラウドネイティブなシステムは、マイクロサービスを組み合わせて利用するため、変化に強く柔軟性の高いアプリケーション開発が行えるというメリットがあります。その一方で、さまざまな基盤を活用して分散開発をすることによってシステムの構成が複雑化し、障害発生に備えた堅ろう性を確保するのが困難という課題がありました。
そのため、クラウドやコンテナを活用したシステムの堅ろう性を向上させる手法であるカオスエンジニアリングが注目されています。
AWSやMicrosoft が公開しているクラウド設計におけるベストプラクティスである「Well-Architected Framework」内でも活用が推奨されており、クラウド環境において、より洗練された、品質が高い環境構築を行っていくためのテスト手法の一つです。
「信頼性」、「運用上の優位性」というキーワードで言及されており、これらを担保していくために活用できます。
「Gremlin」は、AWS、Microsoft Azure、Google Cloud Platformなどのメジャークラウドに加え、Kubernetesなどのコンテナ基盤を活用したシステム環境に対して発生するさまざまな障害を疑似的に発生させることができるツールです。
例えば、特定のコンテナに障害が発生した場合に、システム全体にどのような影響が出るか、クラウド基盤に障害が発生した時にどのような挙動になるのかなどを、実際のシステム環境を用いてテストすることが可能になります。これにより、さまざまな障害に対するシステムの耐久性や、復旧までの時間などを把握できるようになります。また、そこで把握した問題点を改善することによって、システムの堅ろう性を高めることができるようになります。
例えば、次のような一般的に利用されている環境でGremlinの活用が可能です。
日立システムズは、グレムリン社のカオスエンジニアリングツール「Gremlin」の販売開始を皮切りに、クラウドやコンテナの堅ろう性を検証・評価するコンサルティングサービスなど、関連するサービスを順次、提供していきます。
日立システムズは、AWSやMicrosoft Azureなどのクラウドや、コンテナプラットフォームである「Kubernetes」などのコンテナ技術に長けた人財の育成に注力しています。
2019年11月に全社横断組織「BCCoE(Business Cloud Center of Excellence)」を設立し、多様な業種のクラウド先進事例やノウハウ、設計ガイドラインなどを収集・一元化。
先進事例を基に各種サービスをパッケージ化(標準体系化)し、適切なマルチクラウド環境やクラウドネイティブな環境を迅速に実現するソリューション「Gateway for Business Cloud」を提供中。
こうしたクラウド・コンテナ技術に長けた人財や蓄積したナレッジ、関連サービスなどを活用し、お客さまのクラウド、コンテナ基盤の改善やデジタル技術を活用した経営革新を幅広く支援しています。
* 本ページに記載されている会社名、製品名は、それぞれの会社の商標または登録商標です。
日立システムズは、システムのコンサルティングから構築、導入、運用、そして保守まで、ITライフサイクルの全領域をカバーした真のワンストップサービスを提供します。