AIスタートアップのAdeptが、デジタルツールを使用するように訓練された大規模なTransformerモデル「ACT-1」を発表しました。ACT-1はブラウザで何が起こっているかを監視し、クリック・入力・スクロールなどの特定アクションを実行できるChrome拡張機能に接続されており、操作を自動化できます。

ACT-1: Transformer for Actions

https://www.adept.ai/act

ACT-1は、ユーザーの高度な要求を受け止め、それを実行することができます。ユーザーはテキストボックスにコマンドを入力するだけで、あとはACT-1が実行します。

ACT-1への指示は、ブラウザ上に表示されるポップアップに英語で入力して行います。例えば「ヒューストンで4人家族が住む家を探してほしい、予算は60万ドル(約8400万円)」と入力します。



すると、物件の検索サイトでヒューストンが検索され……



条件入力欄に「価格上限 60万ドル」と自動で入力されます。



予算内で最も検索ランクの上に表示されている物件が表示されました。



また、Wikipediaのトップページを開いた状態でACT-1に「『スター・ウォーズ』でメイス・ウィンドゥを演じた俳優は何歳?」と質問します。



すると、Wikipediaでメイス・ウィンドゥの記事が表示され……



記事内のリンクから、サミュエル・L・ジャクソンの記事に飛びます。



ACT-1は記事の内容から、「彼は73歳です」と回答しました。



他にもGoogleスプレッドシートを使えば、スプレッドシートの処理も自動で行ってくれます。



AdeptによればACT-1はまだ開発途上ですが、以下の目標を掲げているとのこと。

・コンピューターとのやり取りをGUIではなく自然言語を用いて行えるようにする。

・初心者でも簡単に使えるようにし、誰でも高度な機能にアクセスできるようにする。

・ドキュメントやマニュアル、FAQをACT-1のような機械学習用モデルのためのものとし、人が読むためのものにしない。

・ブラウジングだけではなく、医薬品の設計やエンジニアリングにAIを応用する。

Adeptは「ACT-1のようなシステムが、人ができることを変えてくれることにわくわくする一方で、使い方を誤ったり、ユーザーの嗜好とずれたりすると、人に損害を与える可能性があることもはっきりと認識しています。私たちの目標は、大規模な人間のフィードバックを中心とした企業を作ることです。モデルは、ユーザーの好みをどれだけ満たしているかで評価され、私たちの製品がより洗練され負荷がかかるようになると、AIがどれだけ機能しているかを繰り返し評価することになります。誤用に対抗するため、機械学習技術を慎重かつ段階的に展開していく予定です」とコメントしました。