Slackがユーザーの明示的な許可なくメッセージなどをAIトレーニングに利用していることが判明

2024年5月20日 14時15分

Slackが、ユーザーのメッセージやデータ、ファイル、その他のコンテンツを機械学習モデルのトレーニングに利用していることが明らかになりました。プライバシーポリシーが変更されたのは2023年9月のことでしたが、ユーザーの多くはそのことに気付いておらず、ユーザーから明示的に許可を得ることなくデータをトレーニングに使っていた実情があると指摘されています。

Slack Trains Some of Its AI-Powered Features on User Messages, Files | PCMag

https://www.pcmag.com/news/slack-trains-ai-powered-features-on-user-messages-files

Slack has been using data from your chats to train its machine learning models

https://www.engadget.com/yuck-slack-has-been-scanning-your-messages-to-train-its-ai-models-181918245.html

Slack under attack over sneaky AI training policy | TechCrunch

https://techcrunch.com/2024/05/17/slack-under-attack-over-sneaky-ai-training-policy/

Slack users horrified to discover messages used for AI training | Ars Technica

https://arstechnica.com/tech-policy/2024/05/slack-defends-default-opt-in-for-ai-training-on-chats-amid-user-outrage/

高性能なAIを支えるのは高品質かつ膨大な量のデータですが、専門家からは2026年までに学習データが枯渇する恐れがあるという指摘があります。

2026年までにAIのトレーニングに使うデータが枯渇する「データ不足問題」とは？ - GIGAZINE

このため、たとえば動画生成AIの「Firefly」を抱えるAdobeは、報酬を出して動画素材の提供を呼びかけています。

Adobeが動画生成AIのトレーニング用コンテンツ収集のため「動画1分に最大1000円超」の報酬を用意 - GIGAZINE

一方で、ユーザーがコンテンツを投稿する仕組みになっているプラットフォームは、投稿されたコンテンツをトレーニングに利用する動きを見せています。

写真共有サイト「EyeEm」が「投稿された写真はAIトレーニングに利用する」と表明 - GIGAZINE

2023年9月に改定されたSlackのプライバシーポリシーはまさにこの動きに該当するもので、「AI・機械学習モデルを開発するため、Slackに送信された顧客データ(メッセージ、データ、ファイルなど)を分析する」と記されています。

一方で、「Slack AI」のページには「お客さまのデータは、お客さまのものです。そのデータが Slack AI のトレーニングに使用されることはありません」との文言があり、ポリシーと一致しないように見えます。

こうした点について指摘があり、Slackは2024年5月17日にポリシーの文言を改めたことを表明しました。

How Slack protects your data when using machine learning and AI | Slack

https://slack.com/intl/ja-jp/blog/news/how-slack-protects-your-data-when-using-machine-learning-and-ai

Slackによれば「業界標準のプライバシー保護機械学習技術」を使用しており、この機械学習モデルは「顧客データを再現できるようなトレーニングはしない」とのこと。

また、Slack AIはサードパーティーの大規模言語モデルを活用した製品であり、この言語モデルのトレーニングにSlackの顧客データは使われていないとのことです。

なお、データをトレーニングに利用されたくない場合はオプトアウトすることが可能ですが、会社や組織で利用している場合、ユーザー個人によるオプトアウト設定はできず、Slackの管理担当者にオプトアウトを依頼する必要があります。