OpenAIがAIエージェントを構築・運用するためのSDK「Agents SDK」の次世代アップデートを発表しました。エージェントがファイル操作・コード実行・コマンド操作などを安全かつ効率的に行えるようになっています。

The next evolution of the Agents SDK | OpenAI

https://openai.com/index/the-next-evolution-of-the-agents-sdk/





今回のアップデートでは、エージェントがPC上のファイルやツールを横断して作業できるようにするための制御機構である「ハーネス」の性能が向上し、作業を安全に実行するためのサンドボックス実行機能が追加されました。

従来、エージェントを構築するには「再試行」「認証」「状態管理」「例外処理」などを開発者が管理する必要がありました。ツールとの連携を行いたい場合は開発者が自分でツールとの接続コードを記述する必要があり、ツールの数が増えるほど保守の手間も増加していました。



更新されたAgents SDKでは、従来開発者が行っていた多数の作業をSDKに任せられるとのこと。「ループ、ツール、そして中断しても再開できる実行環境の維持は、私たちがやります」と説明が書かれています。



エージェントにはファイルの読み書きや依存関係のインストール、コードの実行、ツールの安全な使用などを行うための作業スペースが必要です。更新されたAgents SDKにおいてネイティブなサンドボックス実行がサポートされたため、開発者は自力で構築する手間を省くことが可能になりました。

サンドボックス実行においてはBlaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercelに組み込みサポートが用意されているほか、開発者が独自のサンドボックスを作成することもできるとのこと。移植可能性を高めるためのマニフェスト抽象化が導入されているため、ローカルプロトタイプの開発から本番環境への展開まで一貫した方法でエージェントの実行環境を構築できます。

また、新たなAgents SDKではハーネスと実行環境が分離されています。

実行環境であるサンドボックス内にハーネスが存在する場合、プロンプト注入攻撃などによって問題のあるコードが生成された場合、ハーネス自体まで乗っ取られてしまう危険があります。



ハーネスをサンドボックスから分離することで、セキュリティ面での安全を確保できるだけでなく、サンドボックスの状態を保存しておけば作業が中断した場合でもサンドボックスを復元して再開することが可能です。また、ハーネス1つに対して複数のサンドボックスを作成することで作業を並列化して進められるようにもなります。



Agents SDK自体の使用は無料で、エージェントが使用したトークンやツールの標準的な使用料金がかかるとのこと。

更新されたAgents SDKは、記事作成時点ではPython版のみ提供されていますが、今後TypeScriptでも提供予定とのこと。さらに「コードモード」や「サブエージェント」など追加の機能のリリースも予定されているとのことです。