AIエージェントシステムを構築する方法はさまざまです。生成AIの設計において曖昧さはバグではなく特徴であるため、エンジニアにとってどこから始めればいいのか分からないことがあります。そこで、私たちは開発者がビジネスニーズを解決するための顧客中心のエージェントシステムを構築できるように、人間中心のUX設計原則を作成しました。これらの設計原則は厳密なアーキテクチャではなく、エージェント体験を定義し構築するチームにとっての出発点です。
一般的に、エージェントは以下を目指すべきです:
- 人間の能力を広げ、スケールさせる(ブレインストーミング、問題解決、自動化など)
- 知識のギャップを埋める(知識分野を短期間で把握する、翻訳など)
- 私たちが個々に他者と協力する際の好みに応じて、コラボレーションを促進しサポートする
- 私たちをより良い自分にしてくれる(例:ライフコーチ/タスクマスターとして、感情の調整やマインドフルネススキルの習得、レジリエンスの構築を助けるなど)
- エージェント設計の原則とは何か
- これらの設計原則を実装する際のガイドライン
- 設計原則を活用した具体例
このレッスンを終えた後、次のことができるようになります:
- エージェント設計の原則が何であるか説明できる
- エージェント設計の原則を使用する際のガイドラインを説明できる
- エージェント設計の原則を活用してエージェントを構築する方法を理解する
これはエージェントが動作する環境を指します。この原則は、物理的およびデジタルの世界でエージェントを設計する際の指針となります。
- つなげる、壊さない – 人々を他の人々、イベント、行動可能な知識につなげ、コラボレーションと接続を可能にする。
- エージェントはイベント、知識、人々をつなげる役割を果たします。
- エージェントは人々をより近づけるものであり、人々を置き換えたり軽視するものではありません。
- 簡単にアクセスできるが、時には見えない – エージェントは主にバックグラウンドで動作し、関連性があり適切なタイミングでのみ私たちに働きかけます。
- エージェントは、どのデバイスやプラットフォームでも認可されたユーザーが簡単に発見・アクセスできるように設計されています。
- エージェントは音声、テキストなどのマルチモーダルな入力と出力をサポートします。
- エージェントは、ユーザーのニーズを感知しながら、前景と背景、能動的と受動的の間をシームレスに移行します。
- エージェントは見えない形で動作することもありますが、そのバックグラウンドでのプロセスや他のエージェントとのコラボレーションはユーザーにとって透明で制御可能です。
これはエージェントが時間を通じてどのように動作するかを指します。この原則は、過去、現在、未来にわたるエージェントの設計方法を示します。
- 過去: 状態とコンテキストを含む履歴を反映する。
- エージェントは、イベントや人々、状態だけでなく、より豊かな履歴データの分析に基づいて関連性の高い結果を提供します。
- エージェントは過去のイベントからつながりを生み出し、記憶を積極的に反映して現在の状況に対応します。
- 現在: 通知以上の働きかけをする。
- エージェントは、人々とのやり取りに包括的なアプローチを取ります。イベントが発生した際、静的な通知や形式的なものを超えて、ユーザーの注意を適切なタイミングで引きつける動的な指針を生成します。
- エージェントはコンテキスト環境、社会的・文化的変化、ユーザーの意図に合わせた情報を提供します。
- エージェントのやり取りは徐々に進化し、長期的にユーザーをエンパワーする複雑さを備えています。
- 未来: 適応し進化する。
- エージェントはさまざまなデバイス、プラットフォーム、モダリティに適応します。
- エージェントはユーザーの行動やアクセシビリティのニーズに適応し、自由にカスタマイズ可能です。
- エージェントは継続的なユーザーとのやり取りを通じて形成され、進化します。
これはエージェント設計の中心的な要素です。
- 不確実性を受け入れつつ信頼を構築する。
- エージェントの不確実性はある程度予想されるものです。不確実性はエージェント設計の重要な要素です。
- 信頼と透明性はエージェント設計の基盤となるレイヤーです。
- エージェントがオン/オフの状態は人間が制御し、エージェントのステータスは常に明確に表示されます。
上記の設計原則を使用する際には、以下のガイドラインを参考にしてください:
- 透明性: AIが関与していること、その仕組み(過去のアクションを含む)、フィードバックの方法やシステムの修正方法をユーザーに知らせる。
- 制御: ユーザーがシステムやその属性(忘れる機能を含む)をカスタマイズ、好みを指定、個別化し、制御できるようにする。
- 一貫性: デバイスやエンドポイント間で一貫したマルチモーダル体験を目指す。可能であれば馴染みのあるUI/UX要素を使用し(例:音声操作のためのマイクアイコン)、ユーザーの認知負荷を可能な限り軽減する(例:簡潔な応答、視覚的補助、‘詳細を学ぶ’コンテンツ)。
旅行エージェントを設計する場合、以下のように設計原則とガイドラインを活用することを考えてみてください:
- 透明性 – 旅行エージェントがAI対応エージェントであることをユーザーに知らせます。基本的な使い方を説明する(例:「こんにちは」メッセージ、サンプルプロンプト)。これを製品ページに明確に記載します。過去にユーザーが入力したプロンプトのリストを表示します。フィードバック方法(サムズアップ/ダウン、フィードバック送信ボタンなど)を明確にします。エージェントに使用制限やトピック制限がある場合は明確に説明します。
- 制御 – システムプロンプトなどを使って、エージェントを作成した後にユーザーがどのように修正できるかを明確にします。エージェントの詳細さや文体、話題にしない内容などをユーザーが選べるようにします。関連ファイルやデータ、プロンプト、過去の会話を表示・削除できるようにします。
- 一貫性 – プロンプトの共有、ファイルや写真の追加、誰かや何かをタグ付けするためのアイコンが標準的で認識しやすいものであることを確認します。ファイルのアップロード/共有にはクリップアイコンを、グラフィックのアップロードには画像アイコンを使用します。
- Practices for Governing Agentic AI Systems | OpenAI
- The HAX Toolkit Project - Microsoft Research
- Responsible AI Toolbox
**免責事項**:
この文書は、機械ベースのAI翻訳サービスを使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確さが含まれる可能性があることをご了承ください。元の言語で作成された原文が、信頼できる正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳をお勧めします。本翻訳の使用に起因する誤解や解釈の誤りについて、当方は一切責任を負いません。