IFの種類

ドコモAIエージェントAPIで利用することのできるIFの種類とについてご説明します。

概要

エージェントとの会話IFは、テキスト入力と音声入力を利用シーンに応じて切り替えることができます。

エージェントには音声&テキストテキストのみの2タイプをご利用頂けます。

※エキスパートエージェントは呼び出されるメインエージェントが適用しているタイプに従います。

LINEやWowTalkなどのチャットアプリにおける企業アカウントでの利用や、自社WebサイトのQ&Aサポート用チャットボットなどを作成したいケースではテキスト入力が適しており。画面のないデバイスや、ハンズフリーで操作させたいアプリケーションなどでは音声入力が適しています。

シーンに適切な会話IFを選択することで、サービスにおけるユーザの利便性がより高まる体験をデザインしましょう。

音声&テキスト タイプ

メインエージェントに対して音声認識またはテキスト文による発話入力が行えるタイプになります。
また、メインエージェントからのレスポンス内容は、テキスト文とそれを音声化したデータで返されます。
このタイプはドコモより提供する音声制御ライブラリまたはSpeak SDKを用いて対話疎通を行います。

テキストのみ タイプ

メインエージェントに対してテキスト文による発話入出力が行えるタイプになります。
このタイプはText Gatewayを用いて対話疎通を行います。
また、トークアプリ連携機能としてLINEやWebUI等との連携が可能です。

メインエージェントの機能差

音声&テキスト テキストのみ
テキスト
音声認識
音声合成
疎通方式 ドコモ提供
対話ライブラリ※1
Speak SDK Text Gateway※2
音声制御ライブラリ

※1: 対話ライブラリに関する詳細な情報はこちらをご参照ください。
※2: Text Gatewayに関する詳細な情報はこちらをご参照ください。

提供対話ライブラリの機能比較

Speak SDK 音声制御ライブラリ
機能区分 音声認識
テキスト対話
音声合成
キーワードウェイクアップ
エコーキャンセル
ノイズキャンセル
ローカル音声認識
提供区分 サンプル提供 有償提供
ソフトウェアサポート 無し 有り

dアカウント(./個社ID)でログインする

UDSには共通UDSと個社UDSの2種を選択できます。
UDSの機能に関する情報は以下を参照してください。

共通UDS:各企業が共用する開かれたUDS

最終的に使う人:エンドユーザ
公開されるエージェント:個社UDSを利用していない企業すべてのエージェント

個社UDS:利用企業ごとに閉じられたUDS

最終的に使う人:エンドユーザ
公開されるエージェント:個社UDSを利用している企業のエージェント

共通UDS 個社UDS
ログインアカウント dアカウントのみ 多様なアカウント
公開されるエージェント 共通UDSを利用する企業のものすべてが公開 個社UDS利用企業のエージェントのみ公開