OverFlow

Business Performance Monitoring

銀行ITシステムにビジネス・モニタリングを導入する際の課題

Other Languages

前回の議論では、一般的なビジネス指標とモニタリング・ルールを特定した。しかし、主に以下の分野において、導入時にいくつかの困難が生じる:

1. 基本的な取引情報の取得

トランザクションを効果的にモニタリングするためには、システムは各トランザクションのデータ(依頼システム、トランザクションコード、重要なトランザクションフラグ、サービスシステム、処理ノード、開始時刻と終了時刻、シリアル番号、機関、金額、サービスシステムのリターンコード、本システムのリターンコードなど)を正確に収集しなければならない。残念ながら、多くのシステムは、サービスシステムのリターンコードのような完全な基本情報を提供できない。生産システムが当初このフィールドを記録するように設計されていなかった場合、それを提供することは困難である。このデータがなければ、サービスシステムのトランザクション成功率を計算することは不可能である。さらに、すべてのシステムがトランザクションの詳細データをモニタリング・システムに提供するため、データ量が多くなり、モニタリング・システムの処理パフォーマンスが低下する。

2. 本番システムの開発仕様

監視ルールはすべての本番システムに適用されるため、本番システム開発の標準化・標準化は必須である。例えば、トランザクションコードパラメータに強く依存しなければならない。これを実現するために、トランザクションコードパラメータは、要求システム、トランザクションコード、トランザクション名、サービスシステム、財務フラグ、ビジーフラグ、アイドルフラグなどの詳細を含むべきである。理想的には、一つのトランザクションコードは一つの機能のみを実行すべきである。例えば、トランザクションコードA009は非標準の機能分解を持ち、アトミックトランザクションコードA009プログラムは内部で機能分岐のためにsub_typeのようなフィールドを使用する。その結果、1つのトランザクションコードが複数のビジネス機能を実装することになり、A009のビジネス機能を明確に記述することが難しくなる。

開発コードを標準化することも重要な課題である。アラームトリガーの精度は、本番システムが提供するレスポンスコードとログ記録に依存する。X銀行の中央清算システムに取り組んでいたとき、筆者は典型的な応答コードに遭遇した: 201999-システム・エラー。このエラーは通常、プログラムが技術的な観点から処理できず、原因も特定できない深刻なシステム障害を示している。しかし、このレスポンス・コードは毎日約80万回返され、その結果、1日全体の取引成功率は90%未満となっている。さらに、リターンコードには複数の用途がある場合がある。例えば、リターンコードR00001は "No record found "を意味するはずだが、開発者はこれをカスタマイズして "Insufficient balance"(残高不足)、"Card number xxx error"(カード番号xxxのエラー)、"Address error"(住所エラー)、あるいはその逆の "Query returned xxx records"(クエリでxxxレコードが返された)のような意味にすることもできる。このような場合、リターンコードはトランザクションが成功したかどうかを判断できない。この問題は、トランザクション・コード・レベルまで掘り下げたビジネス・モニタリングでは、トランザクション量が少なく、リターン値に対する感度が高いほど顕著になる。リターンコードの標準化が急務である。

ログの仕様には、エラーログの標準化も含まれるべきである。正確なログ監視アラームは、標準化されたログ記録にかかっている。そうでなければ、誤ったアラームやアラームの見逃しが頻繁に発生する可能性がある。

3. 数多くの実行パラメータの設定

前述の課題が解決されたとしても、運用担当者は継続的に様々な実行パラメータを微調整しなければならない。ビジネスクラスのモニタリングでは、トランザクションコードごとに、ビジネス成功率、システム成功率、サージ比率、ドロップ比率、インジケータ逸脱ベースライン比率、異常トランザクション数などのパラメータ設定が必要である。これらのパラメータは、トランザクションコードの実行状況を記述する。大規模なシステムになると、多くのトランザクションコードが存在し、トランザクションコードのパラメータだけでも数万個の実行パラメータを長期的に調整する必要がある。しかし、パラメータ設定ルールが確立されていれば、ベースラインの稼動状況に基づいて自動的に稼動パラメータを修正するアルゴリズムを設計することができる。

監視システムの設計は難しくないが、監視をよりビジネスに関連させ、ビジネス監視の価値を十分に引き出し、IT保守からIT運用への変革を推進することが課題である。

元記事


Netis specializes in Business Performance Analysis (BPC) and Network Performance Monitoring (NPM). Each day, our transaction monitoring solutions ensure the smooth completion of over 30 billion transactions. We prioritize the security and autonomy of systems and data. Utilizing real-time analysis through network traffic mirroring, we ensure zero intrusion into business operations, without the need for any agent installations. Headquartered in Shanghai, China, Netis is a global software company renowned for its high-performance, cost-effective products. If you're interested in our offerings, please don't hesitate to reach out. We eagerly await your trial and partnership.
For further details, visit: www.netis.com/en/
Contact me via email at: dennis.li@netis.com

銀行ITシステム向けビジネスモニタリング指標の構築

Other Languages

金融業界が成長し続ける中、銀行のサービスや情報システムの構成が複雑化しています。技術だけに頼ったモニタリングでは問題の特定が難しくなっており、ビジネスの動きを直接反映する技術非依存のモニタリング戦略への需要が高まっています。運用の実績とビジネスモニタリングへの深い理解に基づき、著者はビジネスモニタリングに不可欠な指標とルールに焦点を当てています。

モニタリングの進化

 

初期段階: IT運用チームがモニタリングの指標、ルール、パラメータを手動で設定します。よくある方法は、Zabbixのようなシステムでスクリプトを設定し、特定の閾値を基準にアラートを発することです。

標準化段階: モニタリングの指標とルールが標準化され、IT運用チームが運用パラメータの管理を行います。この段階では、様々なシステム間での互換性と一貫性を確保するために、モニタリングの基準を組織化し、標準化します。

自動化段階: モニタリングシステムが自動的に指標、ルール、最適な運用パラメータを決定します。これは、システム自体と生産システムのパフォーマンス分析に基づき、ITスタッフの手動介入を減らします。

この議論では、ビジネス活動への洞察から導かれた汎用的なモニタリング指標とアラートルールの設定を、特に重要な標準化段階に焦点を当てて提案しています。

銀行サービス監視のためのキーメトリクスとアラートルール

 

銀行情報システムは、そのトランザクションコードやインターフェースによって定義され、リターンコード、トランザクション量、応答時間といった特徴があります。本ガイドでは、これらの特性に基づく重要な監視指標とアラートルールを紹介し、効果的なビジネス監視のための参考情報を提供します。

1. トランザクション成功率

システム監視における基本となるメトリクスはトランザクションの成功率で、システムの基本的な健康状態を評価するのに不可欠です。従来の成功率の監視では、システム的なエラー(例えば、ネットワークの問題やファイルアクセスのエラーなど)がない場合にトランザクションを成功とみなします。しかし、システムエラーがないからといって、ビジネスプロセスの問題がないとは限りません。例えば、トランザクションA001「クエリポスティング」は通常「レコード未発見」を示しますが、ポスティングの異常な増加は潜在的な問題を示唆します。これは、システムの成功率とビジネスの成功率を区別する必要があることを示しています。システムの成功率は技術的な失敗を評価し、ビジネスの成功率は期待されるビジネスリターンコードとのトランザクション結果を測定します。この細かい視点により、単純な成功率を超え、各トランザクションに対する特定の期待結果を考慮に入れたより正確な監視が可能になります。

图片

図1: トランザクション成功率ページ

2. サービスシステムトランザクション成功率

銀行システムの特徴的な点は、各トランザクションに対して呼び出しシステムとサービスシステムがはっきりと区別されていることです。サービスシステムのパフォーマンスを把握することは、問題の特定に不可欠です。トランザクションがどのサービスシステムを呼び出しているかを単に特定することから始めます。特定のサービスシステムに関連するトランザクションの成功率を分析することで、その信頼性に関する洞察が得られます。サービスシステム内の個々のトランザクションコードを評価することで、さらに詳細な診断が可能になります。

3. ノードが静かになるとき:トランザクションなしアラーム

高頻度取引の世界では、驚くべきことに何も起こらない時に警告を設定する賢い方法があります。賑わう市場が突然静まり返ることを想像してみてください。このアラームは、特定のノードで設定された期間内に特定のトランザクションが発生しない場合に鳴ります。これは「行動の欠如」警告のようなものです。毎日友人からの連絡を期待していて、それが来ないと心配するようなものです。しかし、いつその連絡(またはトランザクション)を期待するかを把握するのは簡単ではありません。忙しい時間帯と静かな時間帯は、週末と平日のように異なります。すべてのトランザクションの流れを追跡し、今起こるべきものを見つけ出すことが重要です。こうして、「ラッシュアワー」と「オフタイム」の概念が導入されます。例えば、平日の午前8時から午後7時をピークタイムとして設定します。トランザクションコードA002が一日中活発な場合、休むことなく監視されます。しかし、A003がラッシュ時間にのみ活動する場合、静かな時間には休息が与えられます。そして、A004は?もし一日中ほとんど活動がなければ、監視されずに放置されます。

4. 突然の変動:取引量の津波を検知

取引は通常、川の流れのように円滑に進みます。しかし、システムに問題が発生すると、この流れは洪水か干ばつに変わることがあります。こうした急激な変化を素早く察知することが非常に重要です。例えば、午後の忙しい時間に取引A005の動きを追跡し、「通常の」日と比較して変化を計測します。変化が通常の範囲(0.8から1.2倍程度)内であれば問題ありませんが、0.4に落ち込んだり1.6に急上昇したりすると、警報を発する必要があります。ただし、頻度が低い取引では、小さな変動でも大きな波のように感じられることがあります。

5. 脈拍のモニタリング:異常な取引量の追跡

個々のコードのレベルで取引の成功率を詳細に調べると、低頻度または非常に高頻度の取引では、この方法がうまく機能しないことがわかります。低頻度の取引では警報が頻繁に発生し、超高頻度の取引では問題が見逃されがちです。

例えば、10分間に10,000回の取引を行うA006は、50回の障害で成功率が0.5%低下するかもしれませんが、これは表面上小さな変動ですが、重大な問題を引き起こす可能性があります。一方、同じ期間に2回の取引を行うA007では、たとえ1回の障害でも重大な影響を与える可能性があります。解決策として、各取引の特性に応じて警告の閾値を設定します—A006は10回以上の問題で、A007は1回の問題で警告します。また、処理ノードからサービスシステムまで、問題のあった取引の詳細を一覧表示するダッシュボードがあれば、緊急時の問題解決が格段に容易になります。

6. 時間の制約:予想を超える応答時間の遅延

銀行システムは、いかによく機能する機械であっても、遅れたり、停止することがあります。従来の監視では応答速度に注目しますが、アラームの基準値ギリギリでの遅延はどうでしょうか?特に高トラフィックの取引では、わずかな遅延も必ずしも問題を示すわけではありません。

解決策としては、通常から逸脱する応答時間を持つ取引に注目し、サイクルごとにチェックしましょう。例えば、A008が通常300msで処理される場合、600msや900msまで時間がかかると問題があるかもしれません。一つのサイクルでこのような例外が3回発生したら、警告を発する時期かもしれません。

7. 終日処理と帳簿管理

銀行システムの日の終わりの幕引きとしての終日プロセスは、翌朝のスムーズなスタートのための鍵です。監視は簡単です:日末に設定された取引は、決められた時間内に開始し、成功を示すシグナルで終了する必要があります。そして、帳簿を正確に保つことについては、一貫性が最も重要です。わずかな数値の不一致は、通常業務を続けるための合図です。

これで、賢く敏感なビジネス監視ツールを構築する探求を終えます。これらのコンセプトを実生活に持ち込む際の技術的な挑戦に焦点を当てた次回の内容をお楽しみに。

原文のリンク: https://mp.weixin.qq.com/s/qlvqPsz2fX0AyxMdXdVzxw


Netis specializes in Business Performance Analysis (BPC) and Network Performance Monitoring (NPM). Each day, our transaction monitoring solutions ensure the smooth completion of over 30 billion transactions. We prioritize the security and autonomy of systems and data. Utilizing real-time analysis through network traffic mirroring, we ensure zero intrusion into business operations, without the need for any agent installations. Headquartered in Shanghai, China, Netis is a global software company renowned for its high-performance, cost-effective products. If you're interested in our offerings, please don't hesitate to reach out. We eagerly await your trial and partnership.
For further details, visit: www.netis.com/en/
Contact me via email at: dennis.li@netis.com

高頻度取引システムの監視

Other Languages

取引システムが進化する過程で、トレーダーは常に速さを追求してきました。量的取引が普及するにつれて、トレーダーからはさらに速いシステムへの要望が強まっています。

高頻度取引システムが直面する監視の課題

 

高頻度取引システムの登場により、アプリケーション運用管理の難易度が一層増し、運用監視ツールは監視の精度、製品性能、そして安定性に対して非常に高い要求に応える必要があります。

  • ナノ秒レベルの監視精度が求められる:高頻度取引では、注文を迅速に処理し、市場情報を低遅延で反映する必要があり、通常、取引処理速度はマイクロ秒レベルで保たれています。しかし、従来の監視ツールでは、このようなマイクロ秒やナノ秒レベルの測定精度を実現することが難しく、高頻度取引システムの速度要求に応えることができません。
  • 専門的なプロトコル解析の必要性:従来の監視ツールでは、多岐にわたるビジネスシステムの解析能力に欠け、主要な高頻度取引システムを自動で解析することができません。
  • システム性能への影響を最小限に抑える:ログやコード挿入などの従来型ツールは、システム性能を低下させ、安定性に悪影響を及ぼします。これらのツールでは、高頻度取引システムの精密な監視が難しいです。

このため、運用管理部門は、高い精度、性能、そして強力な解析能力を備えた監視ツールを使用することが求められます。これにより、障害対応の難しさ、原因特定の困難さ、分析の複雑さなど、運用上の課題を解決し、高頻度取引システムが最高速度で稼働できるよう保証します。

BPC高頻度取引版の新時代へ

 

長年にわたる信頼と実績を誇るNetis BPCは、証券業界におけるビジネスの継続性を保証し続けています。バイパス配置によるネットワークトラフィックの収集から、四つの重要指標、インテリジェントアラート、取引の追跡、多角的な分析機能まで、Netis BPCは業界のニーズに応えてきました。今回、ナノ秒単位の監視能力を備えた「BPC高頻度取引版」をリリースし、高頻度取引システムへの全面的なサポートを強化します。

先進のナノ秒タイムスタンプ技術

高頻度取引では、マイクロ秒単位で測定される遅延時間が重要な役割を担います。これに対応するため、「BPC高頻度取引版」は、マイクロ秒レベルからナノ秒レベルへの大幅な精度向上を実現。この高精度なタイムスタンプにより、取引の各ステージの所要時間や全体の取引時間を素早く算出し、遅延が発生した際には迅速に警告を発します。さらに、遅延と処理能力のバランスを示し、問題の原因を特定する機能も備えています。

ビジネスを中心とした監視の視点

「BPC高頻度取引版」は、ビジネスプロセスに沿った監視を実現します。具体的には、サービスのフローチャートを用いてシステム間の繋がりを分析し、コアなミドルウェアや取引所のコンポーネントの状態をリアルタイムでチェックします。取引量や応答速度など、重要な指標を提供し、運用担当者が迅速に問題を解決できるよう支援します。

%E6%99%BA%E8%83%BD%E6%95%85%E9%9A%9C%E5%91%8A%E8%AD%A6-scaled.jpg

図 1:サービスパスの概観

多段取引追跡機能

この多段取引追跡機能により、一つの注文を取引プロセス全体で、重要な各ステップにおけるデータと賢くリンクさせることができます。ボタン一つで、注文が各ステップでどれだけの時間を要しているかなど、具体的な情況を一目で分析することが可能になります。

「BPC高頻度取引版」は、高頻度の取引注文のリクエスト、注文の内部からの返答、取引所からの応答メッセージなどをすべて、迅速に解析します。高性能ネットワークカードによる高精度タイムスタンプを使用して、取引プロセス全体の所要時間(注文リクエストから取引所の応答まで)やミドルウェア処理時間(注文リクエストと注文の内部返答)などの指標を算出し、運用保守スタッフが詳細な分析を行えるよう支援します。さらに、実際の運用保守シーンに合わせて、証券の秒単位監視ビューを柔軟に構築できます。 图片

図 2:多段取引追跡機能

主要な高頻度取引システムの全面サポートと迅速な監視の実現

Netisのトップレベルのデコード技術を基盤に、「BPC高頻度取引版」は、恒生、華銳、頂点などの主要な高頻度取引システムに完全対応しており、上海証券取引所深セン証券取引所のグループブロードキャスト、プライベートマーケットデータ配信システムなど、取引所の市場システムを幅広くサポートしています。BPCは、柔軟なカスタムデコードを提供し、サードパーティプロトコルデコードの要件に迅速に対応することが可能です。


Netis specializes in Business Performance Analysis (BPC) and Network Performance Monitoring (NPM). Each day, our transaction monitoring solutions ensure the smooth completion of over 30 billion transactions. We prioritize the security and autonomy of systems and data. Utilizing real-time analysis through network traffic mirroring, we ensure zero intrusion into business operations, without the need for any agent installations. Headquartered in Shanghai, China, Netis is a global software company renowned for its high-performance, cost-effective products. If you're interested in our offerings, please don't hesitate to reach out. We eagerly await your trial and partnership.
For further details, visit: www.netis.com/en/
Contact me via email at: dennis.li@netis.com

ビジネスパフォーマンスモニタリングを上品に実現する方法

Other Languages

現代では、多種多様なモニタリングツールが溢れています。しかし、どのようにしてこれらの複雑さを簡潔にし、ユーザーがビジネスパフォーマンスのモニタリングをスマートに実行できるようサポートするのでしょうか?

1. ビジネス中心のモニタリング視点

 

モニタリング指標と目的の違いを考慮すると、アプリケーションパフォーマンスモニタリング製品の警告ロジックもさまざまです。これは大きく「下から上へ」のアラームと「上から下へ」のアラームの二つに分けられます。「下から上へ」のアプローチでは、データパケットのヘッダーなどの基底データにアラームポイントを設け、アプリケーションやサービスの利用状況を評価し、最終的にどのビジネスプロセスに問題があるのかを特定します(例:DNSエラーや応答遅延など)。一方、「上から下へ」のアプローチでは、ビジネスのアプリケーションノードやネットワークノードの一部を監視し、上層の集約データに基づく警告指標を設定し、トップレベルのビジネス問題から深掘りしていきます。底層データの誤報が多く、解析が困難なため、「下から上へ」のアプローチは時間も精度も要求されます。しかし、「上から下へ」のアプローチによる警告設定は、システムやサービスが障害を起こした瞬間に迅速に警告を発することができ、ビジネスを中心とした運用構造においては特に価値があります。

002316seeudyfefdc8nldk.jpg

図1:知識階層図

Netis BPCは技術面で「上から下へ」のモニタリングアプローチを採用しています。エンドツーエンドのモニタリングを通じて、マクロレベルからミクロレベルまでの深い洞察力を実現し、ビジネスを中心とした視点で運用と運営の間の壁を取り除きます。これにより、モニタリングとビジネス視点が一体化され、警告指標の精度と可読性を高めることができます。

2. ユーザー中心のデザイン哲学

 

ピアノの鍵盤を使って時間を表現し、四つのセクションでビジネスのキー指標を視覚化することは、Netis BPCのデザインの核心をなします。 图片

図2:Netis BPCにおける故障アラートと位置特定でのピアノの鍵盤と四つのセクションの活用

なぜピアノの鍵盤一つが1分を象徴するのでしょうか?

ユーザーにビジネスの動きをリアルタイムで感じさせる一方で、反復的でストレスの多い作業をなるべくエレガントにリラックスして行えるように、Netisは時間を表すためにピアノの鍵盤を選びました。BPCは、異なる色でビジネス状況を示す1分間隔のタイムラインを通して時間を具体化します。利用者はピアノを弾くようにマウスで鍵盤上を動かし、情報とのインタラクションを楽しみます。特定の時間断片にマウスがフォーカスされると、該当の鍵盤は拡大表示されます。これらの細かなデザインは、ユーザーが情報を精確に取得できるよう配慮されています。

また、分単位のアラート設定は、アラートの即時性とコストのバランスを考慮して選択されました。金融クライアントの広範な実践に基づき、Netisはアラートの粒度が細かすぎると、大量で重複するアラートが増加することを発見しました。一方、粒度が粗すぎると、アラートがタイムリーでなく、遅延や見逃しが生じる可能性があります。そのため、Netisの製品専門家は、1分をアラートの粒度として採用し、これがピアノの鍵盤一つが1分を表す理由となりました。

分単位の粒度でのアラートはほとんどのシナリオに適していますが、特定の業界ではまだ要求を満たしていません。例えば、証券取引では、株取引の監視により高いリアルタイム性が求められます。ある特定の特徴が現れた瞬間をもって故障とみなす場合があり、例として、1秒以内に10回の特定イベントが連続して発生するか、1回の取引の長さが10ミリ秒を超えるなど、アラートのトリガー条件を定義できます。これにより、Netis BPCは秒単位でイベントの特徴に基づくアラートを発動する、第二のアラートモードを導入しました。

黄金指標をどのように表示するか

Netisの製品専門家は、取引量がアプリケーションサービスの負荷に正比例し、応答率がシステムの健全性に正比例し、成功率がビジネスの健全性に正比例し、取引応答時間が顧客体験に逆比例することを発見しました。金融業界の特徴に基づき、Four Golden Signals、RED、USE指標を横断的に比較分析した結果、取引量、応答率、応答時間、成功率をNetis BPCの四つの黄金指標として採用しました。

ユーザー中心の設計理念に立ち、ユーザーにこれらの黄金指標を明瞭かつ直感的に提示し、優れたユーザー体験を提供する方法を模索しました。その結果、製品専門家とユーザー体験デザイナーの広範な分析、仮設、実験、検証を経て、業界で初めての四つのセクションがあるグリッドデザインが誕生しました。

この四つのセクションデザインのインスピレーションは、Netisの共同創設者兼チーフプロダクトオフィサー、Wizardがニューヨークのモダンアートミュージアムを訪れた際に得られました。展示では、方形を使って当時のアメリカの地理や人口情報などを明瞭に示し、四つの方形を組み合わせたグリッドが、アプリケーションコンポーネントやネットワークの概念と見事に一致していました。これは、最重要情報の提示において、完全さよりも視聴者が重要な情報を正確に把握できるようにすることの大切さを教えてくれました。情報案内板、高速道路の案内板、交通標識など、日常生活の中で至る所に見られるこのアプローチを観察し、アラート情報を迅速に得たいというユーザーのニーズと現実のIT環境を組み合わせ、古典的なグリッドデザインを開発しました。 图片

図3:ニューヨークモダンアートミュージアムにおける古典的なグリッドデザイン:

图片

図4:Netis BPCにおける古典的なグリッドデザイン:

BPC製品は、ユーザーの要求を正確に理解し、製品を精緻にデザインするこ

とから生まれました。顧客の視点からアラートの必要性を見極め、機能デザインを通じてアラート指標を提示し、ユーザー体験の観点からピアノの鍵盤とグリッドをデザインしました。人間とサービスを中心としたこのアプローチは、Netisがソフトウェア製品を創造する過程で、ユーザーの課題を理解し、彼らが製品を使うことで、製品の機能価値とユーザー側の価値を統合するのに貢献しています。

 

 

Netis specializes in Business Performance Analysis (BPC) and Network Performance Monitoring (NPM). Each day, our transaction monitoring solutions ensure the smooth completion of over 30 billion transactions. We prioritize the security and autonomy of systems and data. Utilizing real-time analysis through network traffic mirroring, we ensure zero intrusion into business operations, without the need for any agent installations. Headquartered in Shanghai, China, Netis is a global software company renowned for its high-performance, cost-effective products. If you're interested in our offerings, please don't hesitate to reach out. We eagerly await your trial and partnership.
For further details, visit: www.netis.com/en/
Contact me via email at: dennis.li@netis.com

クラウドネットワークトラフィック収集分析白書(2022)

Other Languages

IDCの調査によれば、今後2年間で、ほとんどの企業はハイブリッドクラウドやマルチクラウドを組み合わせて、クラウドネイティブプラットフォームを構築する方針を選択する見込みです。企業のクラウドアプリケーションが拡大するにつれ、予想以上にクラウド内の東西方向のデータトラフィックが増加しており、これを正確に収集・管理することが共通の課題となっています。これに対して、Gartnerは「IT意思決定者はトラフィック収集・分析方法を見直し、ハイブリッドクラウド環境で必要とされる可視性を提供することで、将来のパフォーマンス監視と管理を実現すべきだ」と勧告しています。

Netisでは、クラウドネットワークトラフィックの可観測性分析をクラウドネイティブ及びハイブリッドクラウド環境のパフォーマンス監視と管理を改善する有効な手法の一つと考えています。高性能で、あらゆるシナリオをカバーし、アプリケーションを侵害しないトラフィック収集及び処理技術を利用して、多様な環境とアーキテクチャ下でクラウドネットワークトラフィックを可視化し、最終的にクラウドネットワークの全面的な可視性を実現することが可能です。企業がこれらの問題を解決する手助けとして、Netisは《クラウドネットワークトラフィック収集分析白書(2022)》を発表しました。この白書は、クラウド時代の挑戦、クラウドネットワークトラフィックの可観測性の価値、クラウドネットワークトラフィック収集及び可観測性分析のアーキテクチャと技術、導入ソリューション、典型的な使用例及び業界ベストプラクティスなど、6つの章から構成されており、各業界のユーザーがクラウドへの移行をスムーズに進めるための最適な解決策を提供します。

白書の主要な観点は以下の通りです:

1. 主要な機能

  • 多様な環境対応:

    様々な環境へのサポート:主要なオペレーティングシステム、主流のチップセット、そして主要な仮想化やコンテナ化環境をサポートしています。

    マイクロサービス対応:マイクロサービスアーキテクチャのもとでの様々なデプロイメント形態や、多種多様なコンテナランタイムに対応しています。

  • 広範な機能:

    データパケットの処理:データパケットの収集、フィルタリング、配信、トリミング、重複排除など、主要な機能を提供しています。

    FlowとTelemetry機能:クラウドネットワークトラフィックを可視化するためには、収集された生データパケットを前処理し、Flowログを生成し、Telemetryのサポートが必要です。

    データパケット染色:収集された生データパケットに対して、ビジネス、ネットワーク、セキュリティの各シナリオに関連した情報を注入する染色機能をサポートしています。

    TCPによるデータ転送:収集したデータパケットの信頼性の高い転送を保証するために、TCPプロトコルを用いた転送をサポートしています。

  • ビジネスへの影響なし:ビジネス運用に一切の変更を加えることなく、影響を与えずに機能します。

  • 自己管理機能:管理ダッシュボードの統合、収集器の稼働状態のモニタリング、自動監視、自動回復、可視化などを含む、自己管理機能を備えています。

  • スケーラビリティ:需要に応じて動的に拡張・縮小することが可能です。

2. 主要技術

  • 収集技術について:

    対応シナリオ:アプリケーションの視点からは、公共クラウドプライベートクラウドの2つの主要なシナリオに分類されます。技術的な視点からは、VM仮想マシン)とContainer(コンテナ)の2つの主要な技術に分けられます。

    対応能力:トラフィック収集は、様々なシナリオに対応し、それぞれの状況に応じた適切な収集手段を取るべきです。また、混在環境での層別トラフィック収集後には、一元化された管理プラットフォームが求められます。

  • 多層処理/vTAP:Netisは、「クラウド内発生、クラウド内処理」のアプローチに基づき、層別収集、層別処理、層別加工、層別管理を実行し、膨大な管理対象と大量のトラフィックに対応しながら、より詳細で包括的な可観測性の構築を提唱しています。

  • 基盤となる収集技術:クラウドの基盤環境は多岐に渡り複雑であるため、最大限の収集性能と効率を実現するには、異なる環境に適した収集技術を選択する必要があります。

  • 独立環境への対応:クラウドネットワークのトラフィック収集と可観測性分析では、ARMアーキテクチャのCPUやカスタマイズされたオペレーティングシステムなど、自主化されたサーバー環境をサポートする必要があります。

  • Flowサポート:消費シナリオに基づく細かいFlowの流れの統計能力は、ネットワーク、アプリケーション、セキュリティなどの関連するアプリケーションシナリオに適用され、クラウドネットワークコストとのバランスを取りながら、価値の問題を効果的に解決します。

  • Telemetry能力:Open Telemetryを活用することで、クラウドネットワークのトラフィック消費を大幅に削減しつつ、可観測性の能力を高めることが可能です。

3. デプロイメントの計画

主に以下の5つのタイプがあります:全体的な収集器のデプロイメント、ホストマシンのトラフィック収集、仮想マシントラフィック収集、コンテナ環境でのトラフィック収集、そしてvTAPを用いたトラフィックの分流。これらの各デプロイメント方式については、白書で詳しく説明されています。

4. 典型的な適用シナリオ

  • セキュリティシナリオ:信頼できるクラウドネットワークのトラフィック収集システムにより、クラウド内のビジネスサーバーのトラフィックを正確かつ動的に抽出することが可能になります。

    状況感知:クラウド化された作業負荷により、ビジネスの内部セキュリティ状況についての深い理解が必要とされ、これはクラウドトラフィックの正確な分析に基づくセキュリティプローブやエンジンに依存します。

    レベル保護2.0:信頼性の高いクラウドネットワークトラフィック収集を通じて、クラウド内のビジネスサーバーのトラフィックを正確かつ動的に抽出することで、クラウド上でのレベル保護2.0の基準を満たすことができます。

  • BPM/APM:Netisは、BPMがネットワークトラフィックを通じて迅速にユーザー体験の問題を発見し特定でき、APMのアプリケーションコード分析能力と組み合わせることで、問題の根本原因を解析し、クラウドでの観測可能性を提供する新しいアプローチを提供しています。

  • NPMD:従来の環境と異なり、クラウド上でのネットワーク監視では、AZ、VPC、サービスなどの情報を取り入れ、クラウド上でのトポロジー分析と多層的なセッションレベルの追跡能力を強化する必要があります。

    クラウド上のトポロジー分析:クラウドネットワークのトポロジーを常に把握するために、クラウドトラフィックの可視化収集とその染色技術が必要であり、これによってクラウドのダイナミックな変更に適応できます。また、トラフィックの圧縮と流量混雑の回避のために、可視化収集による流量データの出力が必要です。

    多層的セッションレベル追跡:クラウド上でのネットワーク分析では、セッションレベルの追跡能力が必要とされ、これはクラウドトラフィックの可視化収集とその染色技術による多層的追跡によって実現されます。

  • データベースの運用とセキュリティ:分散データベースアーキテクチャの登場により、クラウド上のデータベースは従来の監視方法に新たな要求を提示しています。データノードとアクセスノード間の頻繁な相互訪問により、問題が発生しやすくなっています。クラウドトラフィックの可視化収集を通じて、クラウド上の分散データベースの監視を構築することは、より適切な選択です。

こちらからダウンロード


Netis specializes in Business Performance Analysis (BPC) and Network Performance Monitoring (NPM). Each day, our transaction monitoring solutions ensure the smooth completion of over 30 billion transactions. We prioritize the security and autonomy of systems and data. Utilizing real-time analysis through network traffic mirroring, we ensure zero intrusion into business operations, without the need for any agent installations. Headquartered in Shanghai, China, Netis is a global software company renowned for its high-performance, cost-effective products. If you're interested in our offerings, please don't hesitate to reach out. We eagerly await your trial and partnership.
For further details, visit: www.netis.com/en/
Contact me via email at: dennis.li@netis.com

Netis NPMが顧客のIPv6移行を支援

Other Languages

背景

2021年7月、中国の中央ネット情報弁公室、国家発展改革委員会、および工業情報化部は、インターネットプロトコル第6版(IPv6)の大規模な展開と応用を加速するためのガイドラインを共同で発表しました。このガイドラインでは、金融機関のIPv6への移行を推し進め、一般公衆に対する金融サービスのインターネットアプリケーションのIPv6サポートを継続的に強化し、IPv6の監視と運用体系を整備することを、IPv6の展開と応用の主要な任務として強調しています。

事例紹介

ある銀行は、この呼びかけに積極的に応答し、IPv6への移行作業に全力を尽くしました。2022年初頭までに、インターネットに接続されたネットワークセグメントでは、IPv4IPv6のデュアルスタック輸送ネットワークが確立され、ウェブサイト、オンラインバンキング、モバイルバンキング、WeChatバンキングなどの一般公衆向けサービスのアプリケーションはIPv6サポートを強化しました。IPv4IPv6のデュアルスタックネットワークの運用能力を向上させ、運用体系を整備するために、この銀行は従来のネットワーク運用の基盤に、業界をリードする全トラフィックネットワーク分析システム(Netis NPM)を導入し、インターネット関連のアプリケーションおよび重要なネットワークセグメントのトラフィックをリアルタイムで監視しました。

価値提案

  • ネットワークトラフィックの視覚化:ネットワークの構造と内容を迅速に直感的に把握し、ネットワーク内の商業価値を深掘りするための基礎を築きます。
  • サービスパスの業務視点図:従来のネットワークとアプリケーション運用の間の壁を取り払います;
  • インターネットアプリケーションのIPv4IPv6比較:IPv4IPv6のアクセス数やパフォーマンス指標をリアルタイムで確認し、ネットワークリソースを動的に調整してアプリケーションのニーズに迅速に対応します;
  • ネットワーク異常の迅速な特定と警告:障害対応時間を短縮し、ネットワークサービス品質を向上させます。

1. Netis NPM、一体型ネットワークトラフィック管理プラットフォーム

トラフィックを分析するこのシステムは、成熟したネットワークミラーリング技術を使用してネットワークトラフィックをリアルタイムでネットワーク分流器(TAP)へコピーし、TAPがトラフィックを集約、タグ付け、そして異なるバックエンドプローブデバイスに配信することで、指定トラフィックを効率的に管理します。これらのプローブデバイスはネットワークトラフィックを分析し、その結果を一元化された管理プラットフォームで統合して表示します。 图片 図 1:Netis NPMの論理的配置アーキテクチャ インターネットの専用線出口やセキュリティ機器の前後にあるスイッチを対象に行わ

れる全トラフィック分析を通じて、IPv4IPv6それぞれの状態をリアルタイムで把握できる独立した可視化ビューが構築されます。これにより、運用担当者はネットワークの日々の状態を迅速かつ正確に理解することが可能になります。 图片 図 2:特定のIPv4専用線出口のリンクビュー-アプリケーションのパフォーマンス指標 图片 図 3:特定のIPv4専用線出口のリンクビュー-ネットワーク負荷 图片 図 4:特定のIPv6専用線出口のリンクビュー-ネットワーク負荷

2. サービスパスビジュアライゼーション(SPV)、アプリケーション視点でネットワークを見る新しい視点

日々の運用ではネットワークとアプリケーションが別々のチームによって管理されており、問題が発生すると、それぞれが独立して対応することが故障特定と解決の速度を遅らせています。Netis NPMはこの問題に対して一石を投じ、サービスパスビジュアライゼーション(SPV)という独自の技術で、ビジネス視点からエンドツーエンドの監視体系を構築し、アプリケーションの視点からネットワークを評価します。SPVは、負荷、ネットワークパフォーマンス、アプリケーションパフォーマンス、アプリケーション可用性の四つの側面からアプリケーションのネットワーク状態を描き出し、問題が発生した際には運用担当者が迅速に原因を突き止め、障害を解消するための支援を提供します。 图片 図 5:Netis NPMによるビジネス視点でのサービスパスの可視化

3. 一画面で把握:IPv4IPv6のネットワーク指標の対比

インターネットの出口で、特定の銀行はNetis NPMの高度なディスプレイを利用して、IPv4IPv6の出口専用線のネットワーク指標を比較するカスタムディスプレイを作成しました。これにより、インターネット出口の状況をリアルタイムで管理し、ユーザーエクスペリエンスを大幅に向上させています。 图片 図 6:Netis NPMのディスプレイ画面

公衆に提供される重要なビジネスシステム向けに、日次、週次、月次レポートをカスタマイズし、必要に応じて監督機関への報告を行います。

图片

図 7:重要ビジネスのための週次レポート

Netis製品はIPv6ビジネス分析を包括的にサポートし、顧客のIPv6ビジネスが安定して運用されることを効果的に保証します。


At Netis, we're at the forefront of analyzing business(APM) and network performance(NPM), ensuring that over thirty billion transactions run smoothly every day. Our commitment to system and data security is paramount, and we pride ourselves on our ability to conduct real-time analysis through network traffic mirroring. This means we can get the job done without the need for any agents or disruptions to your existing operations. Based in Shanghai, China, Netis is a global software company known for its high-performance products and cost-effective solutions. Interested in what we offer? Don't hesitate to get in touch. We're excited about the possibility of working together and welcoming new partners.
Discover more at: www.netis.com/en/
Or drop me a line directly: dennis.li@netis.com

ユーザーケース:金融プライベートクラウドハイブリッドアーキテクチャにおけるインテリジェントビジネスパフォーマンスモニタリング

Other Languages

  •  

情報システム運用の核心基盤として、金融機関のITインフラはデジタル変革と技術独立の二重の挑戦に直面しています。これに対応するため、金融プライベートクラウドは金融機関にとって魅力的な選択肢となっています。最近、ある都市銀行は、金融テクノロジーを活用したビジネスモデルとしてプライベートクラウドの開発に注力しており、金融クラウド基盤設備・サービス、シナリオベースの金融イノベーションクラウドネイティブビジネスシステム開発などの分野で先進クラウドプロバイダーと共に研究・技術開発を進めています。これにより、重要なビジネスシステムを継続的に金融プライベートクラウドに配置または移行させることができました。この取り組みは、ビジネスの迅速な対応能力、リソースコストの最適化、セキュリティ性能の向上など、多くの利点をもたらしました。しかし、運用管理にも新たな挑戦をもたらしています。

  1. クラウドサーバー/コンテナクラウドを含むハイブリッドクラウドアーキテクチャを越えて、トラフィックを統一的に収集・管理する方法は?

  2. ハイブリッドアーキテクチャ下ではビジネスのアクセス関係が複雑になり、モニタリングの盲点が出現しやすい。

  3. クラウド環境では、障害がより隠れがちで、特定が難しくなります。

  4. ハイブリッドクラウドアーキテクチャ下で、運用管理を統一し、効率を高める方法は?

これらの挑戦に直面し、Netisと当該都市銀行は協力して「金融プライベートクラウドハイブリッドアーキテクチャインテリジェントビジネスパフォーマンスモニタリングソリューション」を共同開発しました。この取り組みは、困難に立ち向かい、問題を解決するための一歩を踏み出しています。

挑戦1:ハイブリッドクラウドトラフィック収集の難しさ

都市銀行が金融プライベートクラウドを展開するにつれて、クラウドサーバーやコンテナクラウドへのビジネスシステムの配置や移行が増えています。ハイブリッドクラウドトラフィックを安全かつ効率的に収集し、クラウド外の伝統的な環境と統合して、一元管理することは、直面する最初の大きな課題です。Netisはユーザーの実際の使用シナリオに応じて、さまざまな探知器の配置(バイパス探知器とホスト探知器の組み合わせ)を提案し、ハイブリッドクラウドトラフィック収集を効果的に実現しました。さらに、インテリジェントなトラフィック収集プラットフォーム(Cloud Probe Manager)を通じて収集器を一元管理し、クラウド外とハイブリッドクラウドから収集したトラフィックをNetisのビジネスパフォーマンス管理(BPC)へと統合しています。

図1:モニタリングソリューション配置図

挑戦2:ハイブリッドクラウド構成でのビジネスフロー整理の難点

クラウドシステムが充実してくるにつれ、従来の環境とクラウド環境が共存する中で、ビジネスフローの整理がますます重要になっています。BPC(ビジネスパフォーマンスコントローラー)が解析する相互接続データを基に、自動的にビジネスプロセスを探索し、すべてのビジネスシステムのサービスパスをリアルタイムで視覚化することが可能になります。これにより、同じノード上のアプリケーションを賢く統合し、該当する都市銀行のクライアントがビジネスシステム内の各アクティビティのサービスノードとビジネスアプリケーションを明確に理解し、全ビジネスパスを検証し、システム内の盲点を解消し、技術部門がビジネスシステムを深く理解するのに役立ちます。

図2:SPVDによるビジネスフローの自動整理

挑戦3:混在クラウド構成での障害対応の複雑さ

クラウドアーキテクチャの柔軟な連携やアプリケーションノードの動的な変更などにより、クラウド環境では障害が表面化しにくく、原因の特定がより困難になります。このため、従来のシステムに比べて、クラウド上でのビジネスシステムの障害対応は一層難易度が高くなります。適切なツールがない場合、障害の警告が遅れたり、原因の特定が不正確になったり、分析が不正確になったりして、ビジネスシステムの運用に深刻な影響を及ぼし、最終的には顧客へのサービスにも影響を与えかねません。 安定したクラウドサービスを提供するため、Netisは、頻繁に発生する代表的な障害に対応するための監視アラームプリセットを設定し、重要な金融取引の障害を監視しています。自動障害特定機能と原因分析機能を併用し、障害の影響度を正確に評価します。これにより、障害の根本原因となるノードと異常な指標を迅速に特定し、クラウドサービスのメンテナンス反応速度を従来の環境に匹敵するレベルに維持しています。


図 3:インテリジェントアラームシナリオとアラームのトリガー

挑戦4:混在クラウド構成における運営管理の複雑さ

この都市型商業銀行がクラウドサービスプロバイダーとの連携を深めた結果、金融専用クラウドは新たなフェーズに突入しました。これにより、混在クラウドアーキテクチャを基盤とする運営管理作業が、技術運用部門の中核的な課題に浮上しています。これに対応するため、統合型インテリジェント監視プラットフォームの開発は必須となりました。Netisのビジネスパフォーマンス管理(BPC)は、混在クラウドおよび従来型環境を一つの監視インターフェースに統合し、盲点なしで端末間、プロセス全体を通じた監視を実現します。これにより、銀行の運営管理要件を満たし、運営効率を大幅に向上させました。

図 4:サービス全体のパス-クラウド内外での一体型監視

Netisビジネスパフォーマンス管理(BPC)のマルチレイヤートラッキング機能は、顧客にとって大きなメリットを提供します。この機能により、ビジネスのシリアルナンバーを使って、クラウド内外で異なるシステム間のトラッキングが容易になり、顧客はビジネスプロセスを端から端まで一貫してモニタリングできるようになります。


図5:マルチレイヤートラッキングを使用した一貫したトランザクションモニタリング

さらに、Netis BPCの進化したアプリケーションパフォーマンスメトリクスコンポーネントは、ビジネスシステム全体の状況をリアルタイムで把握することを可能にします。視覚的なインターフェースを通じて、運用チームが重視するさまざまな指標を効果的に表示し、パフォーマンスの監視を直感的に理解できるようにします。アプリケーションパフォーマンスの「5つの重要指標」と多様なビジネス視点を曲線図、円グラフ、棒グラフでリアルタイムに示し、アプリケーションレイヤーのビューやスナップショット、多次元の統計分析、取引の追跡などを含む豊富な機能を提供します。

図 6:Netis BPCによるビジネスとパフォーマンスの洞察


At Netis, we're at the forefront of analyzing business(APM) and network performance(NPM), ensuring that over thirty billion transactions run smoothly every day. Our commitment to system and data security is paramount, and we pride ourselves on our ability to conduct real-time analysis through network traffic mirroring. This means we can get the job done without the need for any agents or disruptions to your existing operations. Based in Shanghai, China, Netis is a global software company known for its high-performance products and cost-effective solutions. Interested in what we offer? Don't hesitate to get in touch. We're excited about the possibility of working together and welcoming new partners.

Discover more at: www.netis.com/en/

Or drop me a line directly: dennis.li@netis.com