Google Cloud、生成AIアプリケーション向けネットワーク機能強化を発表

Google Cloudは、生成AIアプリケーション向けに強化されたネットワーク機能に関する記事を公開しました。
生成AIは従来のWebアプリケーションとは異なるトラフィックパターンを示すため、企業は独自の課題に直面しています。例えば、生成AIアプリケーションは、そのマルチモーダルな性質上、予測不可能な要求/応答時間、GPUやTPUの計算時間の独占などが挙げられます。
Google Cloudは、これらの課題に対応するため、Vertex AIに組み込まれているいくつかの新しいネットワーク機能を発表しました。これらの機能強化は、Cloud Networkingでも利用できるため、使用するLLMプラットフォームに関係なく使用できます。
記事では、生成AIアプリケーション向けに強化されたネットワーク機能として、以下の内容が紹介されています。
* Cross-Cloud Networkによる高速なAIトレーニングと推論:Cross-Cloud Networkは、クラウド間の安全かつ信頼性の高いデータ転送を提供し、生成AIモデルのトレーニングに必要な大量のデータを移動するのに役立ちます。
* AIアプリケーション向けの専用ソリューションであるModel as a Service Endpoint:Model as a Service Endpointは、モデル作成者がアプリケーション開発チームが利用するサービスとしてモデルを提供できるようにするアーキテクチャのベストプラクティスです。
* カスタムAI対応負荷分散による推論レイテンシの最小化:Cloud Load Balancingは、カスタム指標に基づいてトラフィックを分散できるようになり、アプリケーションレベルのカスタム指標をOpen Request Cost Aggregation(ORCA)標準を使用する応答ヘッダーでCloud Load Balancingに報告できるようになりました。
* AI推論アプリケーション向けの最適化されたトラフィック分散:Cloud Networkingには、生成AIアプリケーションの信頼性、有効性、および効率を高めるための多くの組み込み機能があります。
* サービスエクステンションによる生成AIサービスの強化:Service Extensions呼び出しがGoogle Cloud Application Load Balancerで一般提供され、年内にCloud Service Meshでも利用できるようになります。
これらの機能強化により、生成AIアプリケーションの構築とデプロイがより簡単かつ効率的になります。
今回の発表は、生成AIの普及を促進する上で重要な役割を果たすでしょう。Google Cloudのネットワーク機能強化により、企業は生成AIの可能性を最大限に引き出すことができます。
参照元サイト:Exploring Google Cloud networking enhancements for generative AI applications