
ML_Bear
@MLBear2
OpenAIがAgent関連で色々発表しました! 個人的には、本で紹介したけど全然流行らなかったAssistantsAPIが「ResponsesAPI」として奇跡の復活を遂げたのが驚きでした😇 他にもLangSmith的な可視化ツールも搭載するAgents SDKの発表や、WEB検索のツールなど見どころも多かったです。 詳細をスレに↓
【Responses API】 ・Chat Completion APIにツール機能や画像分析機能を付与した新しいAPI ・後述のWEB検索ツールなどを簡単に組み込める ・1回のAPI呼び出しで複数のツールと数回のモデル動作を使用して複雑なタスクを解決できるようになる (簡単なエージェントが動いているのとほぼ同義だと思う)
・Chat Completions APIは今後も継続的にサポートされるのでツール不要の場合はこちらも使用可能 ・ただし新しくプロジェクトを始める場合はResponses APIから始めることを勧めるとのこと。 ・ResponsesAPIとの比較表は下図の通り。 ・AssistantsAPIは2026年半ばに廃止予定(移行ガイド提供予定)
【WEB検索ツール】 ・gpt-4oとgpt-4o-miniで利用可能なWEB検索ツール ・最新の情報を明確な「引用付き」で取得可能 ・ショッピングアシスタント、研究アシスタント、旅行予約など多様なユースケースを想定 ・SimpleQAベンチマークで高い精度を記録 ・費用: 1000検索あたり25-30ドル
【ファイル検索ツール】 ・企業や個人の文書データを効率的に検索するツール ・Assistants APIについていたものと似てると思う ・組み込みのクエリ最適化とリランキングがあり複雑な設定が不要 ・さまざまなファイルタイプに対応
【コンピュータ操作ツール】 ・AIがマウス・キーボードを使ってPC操作を自動化 ・Operatorと同じCUAモデルでブラウザやアプリを操作 ・レガシーシステムもAPI不要で自動化可能に ・Tier3-5の開発者向けに研究プレビューとして提供開始 ・費用 (1M token): 入力: $3, 出力$12
【Agents SDK】 ・実験的なSDK「Swarm」を大幅に改善したもの ・マルチエージェントワークフローの実装を簡素化 ・LangSmith的な可視化ツールも使用可能 ・Python対応済み、Node.js対応予定 ・他社モデルとも互換性あり (Chat Completion APIが必要)
Agent SDKの主な機能は以下の通り ・Agents:明確な指示と組み込みツールを持つLLM ・Handoffs:エージェント間の制御移行 ・Guardrails:入出力検証のための安全チェック。Moderation API も使用可能。 ・Tracing:LangSmith的な可視化・デバッグ機能
【今後の展開】 ・エージェントはすぐに労働力の不可欠な部分になる ・今回のリリースは最初の構成要素にすぎない ・今後、APIのより深い統合や、エージェントのデプロイ、評価、最適化のための新ツールを提供予定 ・シームレスなプラットフォーム体験の提供を目指す
【参考資料】 New tools for building agents https://openai.com/index/new-t... Agents https://platform.openai.com/do... Agents SDK https://platform.openai.com/do... Responses vs. Chat Completions https://platform.openai.com/do...
公式Devアカウントのこのスレもわかりやすいと思います😇 https://x.com/OpenAIDevs/statu...