AI エージェントの AI エンジンを理解する

AI エンジンは、AI エージェントを駆動するための重要なコンポーネントです。ユーザ入力 (テキストと音声) を処理し、ユーザの意図を理解して、適切な応答を生成します。

スクリプト化された AI エージェント
自律型 AI エージェント

管理者は、スクリプト化された AI エージェントの動作に最適な AI エンジンを選択できます。

AI エンジンのコンポーネント

コアコンポーネントはスクリプト化された AI エージェントに関連していますが、その機能は若干異なります。

自然言語理解 (NLU): NLU コンポーネントは、顧客の入力をスクリプトで定義されたインテントに対応付けます。フレームワーク内で顧客の入力を認識します。
ダイアログ管理: このコンポーネントは、スクリプトに従って会話の流れを管理します。これにより、エージェントが定義されたパスに従い、認識された意図とコンテキストに基づいて正しい応答を提供することが保証されます。
応答の取得: このコンポーネントは、スクリプトで構成された応答を配信します。

音声ベースのインタラクションの場合、上記のコンポーネントに加えて、AI エンジンには ASR (自動音声認識) と TTS (テキスト読み上げ) も含まれます。

適切なエンジンの選び方

Webex AI Pro 1.0 (Swiftmatch を使用)
この AI エンジンは、入力を事前定義されたインテントに対して正確にマッピングしながら多様なユーザ表現を管理する AI エージェントの開発に最適であり、さまざまなシナリオにわたって一貫性と信頼性の高いインタラクションを確保します。以下の場合に役立ちます:
- より小さなトレーニングデータセットの処理: トレーニングデータセットに含まれる発話がインテントごとに 10 未満の場合、このエンジンの方が適しています。
- 多言語スクリプトエージェント: これは、複数の言語での会話を処理するエージェントを作成するのに適しています。
- ある程度の「スマートマッチング」を備えたスクリプトエージェント: 応答はスクリプト化されていますが、この AI エンジンは、表現が正確でなくても、ユーザ入力を最も近い意図に一致させることで自然な感覚を提供します。
利点: 入力のバリエーションに対応し、トレーニングデータセットが小さいほどパフォーマンスが向上し、多言語サポートがあり、スマートマッチングをサポートします。
制限事項: Swiftmatch は強力な自然言語理解能力に優れています。ただし、スクリプトでユーザ入力とインテントを柔軟に一致させる必要がある場合（言い回しのバリエーションを許容する）、Swiftmatch では多様なトレーニングデータを使用した追加のデータ構成が必要になることがあります。正確かつ厳密なマッチングを実現するように設計されているため、バリエーションの取り扱いが難しくなる可能性があります。
Webex AI Pro 1.0 (MindMeld を使用)
この AI エンジンは、複雑で複数ステップの会話フローを備えたスクリプトエージェントに最適です。以下の場合に役立ちます:
- 中規模のトレーニングデータセットの処理: トレーニングデータセットに含まれる発話がインテントごとに 20 未満の場合、このエンジンの方が適しています。
- 複雑なスクリプトワークフロー: スクリプトに複数のステップ、条件、または分岐ロジックが含まれる場合、MindMeld はそれらの複雑なフローを管理できます。
- 多言語スクリプトエージェント: MindMeld は複数の言語をサポートしています。
- 役割とエンティティの分類を実行します: 文の部分と重要な詳細を識別することでユーザ入力の理解を深め、応答の精度と関連性を向上させます。
利点: 複雑なスクリプトフローに適しており、中規模のデータセットに適しており、多言語サポートがあり、RASA よりも正確で、基本的な意図分類のための簡単で効率的な選択肢です。
制限事項: MindMeld は、プラットフォームの既存の制限内で複雑なフローを処理できますが、構造化された会話に適しています。スクリプトで非常に柔軟かつ動的なダイアログ管理が求められ、会話フローが顧客の入力に基づいて大幅に変化する場合は、MindMeld が事前定義されたフローに依存することで制限が生じる可能性があります。スクリプトが書かれた設定であっても、自由形式や予測不可能な会話にはあまり適していません。

AI エンジンは、音声テクノロジー (ASR/TTS)、大規模言語モデル (LLM)、インテリジェントガードレール、専門的に作成されたシステムプロンプトを AI Agent Studio の 1 つの選択肢に統合します。

新しい AI エージェントを作成するときは、独自のニーズに合わせてカスタマイズされた複数の AI エンジンから選択できます。

自律 AI エージェントは現在、2 つの AI エンジン選択オプションを提供しています。

Webex AI Pro 1.0: グローバル言語サポートと人間のようなインタラクションにより、ほとんどのコンタクトセンターのユースケースに最適です。サポートされている言語と音声のリストを表示するには、「サポートされている言語と音声」の記事を参照してください。
Webex AI Pro-US 1.0: 強化された人間のような会話エクスペリエンスを必要とするシナリオに最適です。英語のみで利用可能です。

AI エンジンのコンポーネント

大規模言語モデル: 高度なインテリジェンスで AI エージェントを強化し、複雑なクエリを理解し、一貫した応答を生成し、アクションを実行したり、知識ベースから回答したりできるようにします。
ガードレール: 明確な境界を設定し、不適切なコンテンツを防止し、ブランドの安全性を維持することで、責任ある AI インタラクションを可能にします。
音声テキスト変換 (ASR/STT): 話し言葉をテキストに変換し、AI エージェントが人間の音声を理解できるようにします。
テキスト読み上げ（TTS） : テキストを自然で人間のような音声に変換し、AI エージェントが明瞭かつ魅力的にコミュニケーションできるようにします。
暫定対応モデル: ユーザのクエリに対して即座にリアルタイムで応答し、応答性が高くスムーズなユーザエクスペリエンスを実現します。
TURN 予測モデル: ユーザが話し終えたタイミングをインテリジェントに予測し、自然な会話の流れを促進します。
スタンドアロンクエリジェネレータモデル: 文脈に関連しない、不完全な、または口語的な入力 (例:「金利」) を、完全な自己完結型のクエリ (例:「Home ローンの金利はいくらですか?」) に変換し、より正確な検索と応答生成を可能にします。

適切なエンジンの選び方

言語サポート : Webex AI Pro-US 1.0 は英語のみで利用可能ですが、Webex AI Pro 1.0 はベータ版で英語とその他のさまざまな言語をサポートしています。
地域制限: Webex AI Pro-US 1.0 は米国のお客様のみが利用できますが、Webex AI Pro 1.0 は世界中で利用できます。
音声体験: Webex AI Pro-US 1.0 は強化された人間のような会話エクスペリエンスを提供しますが、音声の種類は少なく制限されています。一方、Webex AI Pro 1.0 は、さまざまなアクセントで人間のような対話を行うために幅広い音声を提供します。

AI エージェントの AI エンジンを理解する

AI エンジンのコンポーネント

適切なエンジンの選び方

AI エンジンのコンポーネント

適切なエンジンの選び方

小規模企業

エンタープライズ

デバイス

次のためのソリューション:

リソース

会社