AI エージェントの AI エンジンを理解する
この記事では、スクリプト化された AI エージェントと自律型 AI エージェントで使用できるさまざまな AI エンジンの概要と、それぞれの独自の機能について詳しく説明します。 この記事では、これらの AI エンジンがどのように動作するか、またそれが最も効果的に適用される具体的なシナリオについて説明します。
AI エンジンは、AI エージェントを駆動するための重要なコンポーネントです。 ユーザ入力 (テキストと音声) を処理し、ユーザの意図を理解して、適切な応答を生成します。
管理者は、スクリプト化された AI エージェントの動作に最適な AI エンジンを選択できます。
AI エンジンのコンポーネント
コア コンポーネントはスクリプト化された AI エージェントに関連していますが、その機能は若干異なります。
- 自然言語理解 (NLU): NLU コンポーネントは、顧客の入力をスクリプトで定義されたインテントにマッピングします。 フレームワーク内で顧客の入力を認識します。
- ダイアログ管理: このコンポーネントは、スクリプトに従って会話の流れを管理します。 これにより、エージェントが定義されたパスに従い、認識された意図とコンテキストに基づいて正しい応答を提供することが保証されます。
- 応答の取得: このコンポーネントは、スクリプトで構成された応答を配信します。
音声ベースのインタラクションの場合、上記のコンポーネントに加えて、AI エンジンには ASR (自動音声認識) と TTS (テキスト読み上げ) も含まれます。
適切なエンジンの選び方
- Webex AI Pro 1.0(Swiftmatch 付き)
この AI エンジンは、入力を事前定義されたインテントに正確にマッピングしながら多様なユーザ表現を管理する AI エージェントの開発に最適であり、さまざまなシナリオにわたって一貫性と信頼性の高いインタラクションを確保します。 以下の場合に役立ちます:
- より小さなトレーニング データ セットの処理: トレーニング データ セットに含まれる発話がインテントごとに 10 件未満の場合、このエンジンの方が適しています。
- 多言語スクリプト エージェント: これは、複数の言語での会話を処理するエージェントを作成する場合に適しています。
- ある程度の「スマート マッチング」を備えたスクリプト エージェント: 応答はスクリプト化されていますが、この AI エンジンは、フレーズが正確でなくても、ユーザ入力を最も近い意図に一致させることで自然な感覚を提供します。
利点: 入力のバリエーションに対応し、トレーニング データ セットが小さいほど効率がよくなり、多言語サポートがあり、スマート マッチングをサポートします。
制限事項: Swiftmatch は強力な自然言語理解能力に優れています。 ただし、スクリプトでユーザ入力とインテントを一致させる柔軟性(言い回しのバリエーションを許容)が求められる場合、Swiftmatch では多様なトレーニング データを使用した追加のデータ構成が必要になることがあります。 正確かつ厳密なマッチングを実現するように設計されているため、バリエーションの取り扱いが難しくなる可能性があります。
- Webex AI Pro 1.0(MindMeld 搭載)
この AI エンジンは、複雑で多段階の会話フローを備えたスクリプト エージェントに最適です。 以下の場合に役立ちます:
- 中規模のトレーニング データ セットの処理: トレーニング データ セットに含まれる発話がインテントごとに 20 未満の場合、このエンジンがより適しています。
- 複雑なスクリプト ワークフロー: スクリプトに複数のステップ、条件、または分岐ロジックが含まれる場合、MindMeld はそれらの複雑なフローを管理できます。
- 多言語スクリプトエージェント: MindMeld は複数の言語をサポートしています。
- 役割とエンティティの分類を実行します: 文の部分と重要な詳細を識別することでユーザ入力の理解を深め、応答の精度と関連性を向上させます。
利点: 複雑なスクリプト フローに適しており、中規模のデータ セットに適しており、多言語サポートがあり、RASA よりも正確で、基本的な意図分類のための簡単で効率的な選択肢です。
制限事項: MindMeld は、プラットフォームの既存の制限内で複雑なフローを処理できますが、構造化された会話に適しています。 スクリプトで非常に柔軟かつ動的なダイアログ管理が求められ、会話フローが顧客の入力に基づいて大幅に変化する場合は、MindMeld が事前定義されたフローに依存することで制限が生じる可能性があります。 スクリプトが書かれた設定であっても、自由形式や予測不可能な会話にはあまり適していません。
- Webex AI Pro 1.0 (RASA あり)
この AI エンジンは、カスタマイズ可能なダイアログ管理と強力な AI 機能を備え、柔軟で多段階の会話フローを必要とするスクリプト エージェントの構築に最適です。 以下の場合に役立ちます:
- 大規模なトレーニング データ セットの処理: トレーニング データ セットにインテントごとに 25 を超える発話がある場合、このエンジンがより適しています。
- 役割とエンティティの分類を実行します: 文の部分と重要な詳細を識別することで顧客入力の理解を深め、応答の正確性と関連性を向上させます。
利点: 正確な結果を表示し、単純なスクリプトから複雑なスクリプトまで適しており、大規模なトレーニング データ セットやより複雑なシナリオに適しています。
制限事項: より多くのトレーニング データが必要であり、トレーニングに時間がかかります。
AI エンジンは、音声テクノロジー (ASR/TTS)、大規模言語モデル (LLM)、インテリジェント ガードレール、専門的に作成されたシステム プロンプトを AI Agent Studio の 1 つの選択肢に統合します。
新しい AI エージェントを作成するときは、独自のニーズに合わせてカスタマイズされた複数の AI エンジンから選択できます。
自律 AI エージェントは現在、次の 2 つの AI エンジン選択オプションを提供しています。
- Webex AI プロ 1.0: グローバル言語サポートと人間のようなインタラクションにより、ほとんどのコンタクト センターのユース ケースに最適です。 サポートされている言語と音声のリストを表示するには、 サポートされている言語と音声 記事。
- Webex AI Pro-US 1.0 : 強化された人間のような会話エクスペリエンスを必要とするシナリオに最適です。英語のみでご利用いただけます。
適切なエンジンの選び方
- 言語サポート : Webex AI Pro-US 1.0 は英語のみで利用可能ですが、Webex AI Pro 1.0 はベータ版で英語とその他のさまざまな言語をサポートしています。
- 地域制限: Webex AI Pro-US 1.0 は米国のお客様のみが利用できますが、Webex AI Pro 1.0 は世界中で利用できます。
- 音声体験: Webex AI Pro-US 1.0 は強化された人間のような会話エクスペリエンスを提供しますが、音声の種類は少なく制限されています。一方、Webex AI Pro 1.0 は、さまざまなアクセントで人間のような対話を行うために幅広い音声を提供します。
- 中間メッセージ: Webex AI Pro-US 1.0 は、独自のモデルを使用してより迅速な中間メッセージを生成するように最適化されています。 Webex AI Pro 1.0 は、LLM を使用して、よりコンテキストに応じた中間応答を生成します。