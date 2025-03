Blueskyのジェイ・グレイバーCEOが2025年3月10日に、「自分のデータを生成AIの学習に用いることを許可するか否か明示できる仕組み」を開発中であることを明かしました。Bluesky is weighing a proposal that gives users consent over how their data is used for AI | TechCrunchhttps://techcrunch.com/2025/03/10/bluesky-is-weighing-a-proposal-that-gives-users-consent-over-how-their-data-is-used-for-ai/

Blueskyは2024年11月16日に「Blueskyではユーザーが投稿したコンテンツをAI学習に使用することはない」と明言しています。しかし、Blueskyはすべての投稿をオープンな状態に保つ仕組みを採用しており、技術的には誰でもBlueskyの全投稿を取得してAIのトレーニングに使用することが可能です。そのため、「Bluesky運営元がAIのトレーニングを行わないからといって、投稿がAIのトレーニングに使われないわけではない」という状況が生じていました。BlueskyがX(旧Twitter)とは異なり「投稿をAIのトレーニングに利用することはない」と表明 - GIGAZINEそんな中、2024年11月26日には「Bluesky上の投稿100万件を取得して作成したAI学習用データセット」がAIプラットフォームのHugging Faceで公開され、第三者がBlueskyユーザーのコンテンツを使ってAIシステムをトレーニングできることが証明されました。なお、当該データセットは記事作成時点で公開停止されています。「Bluesky運営元はユーザーの投稿をAI学習に使わないが第三者はAI学習できてしまう」という実例が登場、BlueskyのAPI経由で100万投稿分のデータセットがHugging Faceで公開されてしまう - GIGAZINEこうした状況を受け、2025年3月に開催されたクリエイティブカンファレンス「SXSW 2025」の中でグレイバーCEOは「Blueskyはパートナーと協力して、生成AIのトレーニングのためにデータをどのように使用するか、または使用しないかについてユーザーが意思表示できる仕組みを開発中です」と説明しています。なお、グレイバーCEOの発言は33分30秒頃から確認可能です。Bluesky's CEO on the Future of Social Media | SXSW LIVE - YouTubeさらにグレイバーCEOは「このフレームワークにより、ユーザーは自身のコンテンツをAIのトレーニングにどの程度使用できるかを指定可能になります。私たちはユーザーの選択を信頼しています」「開発中のフレームワークは、ウェブサイトが検索エンジンにスクレイピングを許可するか否かを明示する方法に似ています。多くのウェブサイトはインターネット上で公開されています。しかし、サイト内にrobots.txtを含めることでクローラーによるスクレイピングを防止することが可能です」と述べました。Blueskyは2024年11月にも「コンテンツのAI学習への利用に同意するか否かを明示する仕組み」を開発中であることを報告しており、その際にも「robots.txt」のような形態での導入を検討していることを伝えていました。Blueskyが「AI学習への同意or不同意」を明示できる仕組みを開発中、AI開発者がユーザーの意向に従うかは未知数 - GIGAZINEなお、Blueskyはデータの学習可否を明示する機能の詳細を以下のリンク先で公開しています。proposals/0008-user-intents at main · bluesky-social/proposals · GitHubhttps://github.com/bluesky-social/proposals/tree/main/0008-user-intentsまた、以下のリンク先で機能に関する議論に参加できます。Proposal: User Intents for Data Reuse · bluesky-social/atproto · Discussion #3617 · GitHubhttps://github.com/bluesky-social/atproto/discussions/3617