
世界中で数千人が自身のアイデンティティを売却してAIの学習に供していますが、その代償とは何でしょうか?
TechFlow厳選深潮セレクト

世界中で数千人が自身のアイデンティティを売却してAIの学習に供していますが、その代償とは何でしょうか?
AI企業のデータへの渇望と世界経済格差が重なることで、不均衡な取引が生み出されています。
著者:The Guardian
翻訳・編集:TechFlow
TechFlow解説:本調査報道は、急速に拡大しているグレーゾーン産業を明らかにしています。世界中で数千人が、自身の声・顔・通話記録・日常の動画を販売し、AIモデルの学習データとして提供することで収入を得ています。
これは単なる「プライバシー問題」に関する抽象的な議論ではありません。実在する人物、明確な金額、そして現実の被害が伴う調査です——ある俳優が自分の顔を売却した後、Instagram上で「自分」が不明な医療製品の宣伝動画に出演しているのを発見しました。コメント欄では、彼の「容姿」について評価するユーザーもいました。
AI企業のデータへの渇望と、世界規模の経済格差が重なり合った結果、今まさに不均衡な取引が進行しています。
全文は以下の通り:
昨年のある朝、南アフリカ・ケープタウン在住のヤコブス・ルウ(Jacobus Louw)氏はいつものように散歩に出かけ、沿道でカモメに餌を与えました。ただ今回は、歩道を歩く自分の足元や視界を数本の動画に収めました。この動画制作により、彼は14米ドル(同国最低賃金の約10倍、27歳の若者が1週間の半分の食費として使う金額に相当)を稼ぎ出しました。
この作業は、Kled AIというアプリ上で実施された「都市内ナビゲーション」タスクでした。Kled AIは、ユーザーが写真や動画などのデータをアップロードし、AIモデルの学習に活用することに対し報酬を支払うアプリです。わずか数週間の間に、ルウ氏は日常生活で撮影した写真や動画を次々とアップロードし、50米ドルを稼ぎ出しました。
数千マイル離れたインド・ランチでは、22歳の学生サヒル・ティッガ(Sahil Tigga)氏が、Silencioというアプリを通じて定期的に収入を得ています。Silencioは、AI学習向け音声データをクラウドソーシングするアプリで、スマートフォンのマイクにアクセスし、レストラン内や混雑した交差点などの環境音を収録します。またサヒル氏は自身の声の録音もアップロードしています。さらに、Silencioの地図上にまだ登録されていないホテルロビーなど、特異なシーンを意図的に訪問してデータを収集します。こうした活動により、彼は月額100米ドル以上を稼ぎ、食費の全額をまかなえるようになりました。
シカゴでは、18歳の溶接見習いラメリオ・ヒル(Ramelio Hill)氏が、会話型AI学習プラットフォーム「Neon Mobile」に自身と友人・家族との個人的なスマホチャット記録を販売し、数百米ドルを獲得しました。1分あたり0.50米ドルの報酬です。ヒル氏にとって、この判断は単純明快でした。「テクノロジー企業はすでに私の膨大な個人データを掌握している。ならば、せめてその恩恵を自分も受けよう」と考えたのです。
こうした「AI学習ギグワーカー」——周囲の風景、自身の写真・動画・音声をアップロードする人々——は、今まさに世界規模の新たな「データ・ゴールドラッシュ」の最前線に立っています。シリコンバレーのAI企業が、オープンインターネットから自動収集可能な範囲を超えて高品質な人間由来データを必要としている中、この需要を満たすためのデータ市場産業が急成長しています。ケープタウンからシカゴへと広がるこの潮流の中で、数千人が自らの生体認証情報(バイオメトリクス)および極めて私的なデータを、次世代AI技術へと微細なライセンス形態で提供しています。
しかし、この新しいギグ経済には代償が伴います。わずか数米ドルで売却された背後で、これらのデータ提供者は、将来的に自らのスキルを陳腐化させかねない産業に燃料を供給すると同時に、ディープフェイク、なりすまし詐欺、デジタル搾取といったリスクに自らをさらしています——それらの危険性については、彼ら自身もようやく理解し始めたばかりなのです。
AIの歯車を回し続けるために
ChatGPTやGeminiなどのAI言語モデルは、継続的な性能向上のために莫大な学習データを必要としていますが、今や「データ枯渇」に直面しています。最も広く使われる学習データセットであるC4、RefinedWeb、Dolmaは、ネット上の最高品質データの約4分の1を占めていますが、現在、生成AI企業によるこれらのデータの利用が制限され始めています。研究者らは、AI企業が新規かつ高品質なテキストデータをすべて使い果たしてしまうのは、最早2026年になる可能性があると推定しています。一部の研究室では既に、AI自身が生成した合成データをフィードバック学習に活用し始めていますが、このような再帰的プロセスは、誤りだらけの「ゴミ」データを増幅させ、最終的にはモデルの崩壊を招く恐れがあります。

こうした状況において、Kled AIやSilencioといったアプリが登場します。こうしたデータ市場では、何百万人もの人々が自らのアイデンティティデータを売却し、AIの「飼育」と「訓練」に貢献しています。Kled AI、Silencio、Neon Mobileに加え、AI学習者には他にも多数の選択肢があります:著名なインキュベーターY-Combinatorが支援するLuel AIは、多言語対話データを1分あたり約0.15米ドルで取得;ElevenLabsは、ユーザー自身の声をデジタルクローン化し、基本料金として1分あたり0.02米ドルで第三者にライセンス提供することを可能にしています。
ロンドン・キングス・カレッジ経済学教授のボウケ・クライン・テーゼリンク(Bouke Klein Teeselink)氏は、「AI学習ギグワーカー」という新たな職種が、今後大幅に拡大していくだろうと指摘しています。
AI企業は、人々に対してデータ利用の許諾料を支払うことで、単にウェブクローリングに頼るだけでは避けられない著作権紛争を回避できると、テーゼリンク氏は述べます。AI研究者のヴェニアミン・ヴェセロフスキー(Veniamin Veselovsky)氏によれば、こうした企業はまた、システムに新しい・改良された振る舞いをモデル化するために高品質なデータを必要としています。「現時点では、人間由来のデータこそが、モデルの分布外からサンプリングするための『黄金標準』です」と、ヴェセロフスキー氏は補足します。
これらの機械を駆動する「人間」——とりわけ発展途上国の人々——は、しばしばこの収入を必要とし、他に選択肢がほとんどありません。多くのAI学習ギグワーカーにとって、この仕事は経済的格差に対する現実的な応答です。失業率が高く、自国通貨の価値が下落している国では、米ドルでの収入を得ることは、地元の仕事よりも安定・有利であることが多くあります。また、一部の人は初級レベルの就労機会さえ得られず、生活のためAI学習に従事せざるを得ません。比較的裕福な国であっても、生活コストの上昇は「自分自身を売却する」ことを、合理的な財務的選択肢にしています。
ケープタウン在住のAI学習ギグワーカー、ルウ氏は、この仕事に伴うプライバシー上の代償を十分に理解しています。収入は不安定であり、月々の支出全額を賄えるほどではありませんが、それでも彼はこの条件を受け入れて収入を得ています。長年にわたり神経系疾患を患い、就労できなかった彼ですが、AIデータ市場(Kled AIを含む)で得た収入によって500米ドルを貯め、スパトレーニングコースに参加し、マッサージ師としてのキャリアをスタートさせました。
「南アフリカ人にとって、米ドルで支払われることは、他の人が想像するよりずっと価値がある」と、ルウ氏は語ります。
オックスフォード大学インターネット地理学教授で『機械に餌を与える(Feeding the Machine)』の著者、マーク・グレアム(Mark Graham)氏は、発展途上国の人々にとって、この収入が短期的には実利的意義を持つと認めつつも、「構造的には、この仕事は不安定で、昇進の余地がなく、実質的に行き止まりである」と警告しています。
グレアム氏はさらに、AIデータ市場は「賃金の競争的引き下げ」と「人間データへの一時的な需要」に依存していると指摘します。こうした需要が移転すれば、「労働者は一切の保障を持たず、転職可能なスキルもなく、安全網もありません」と述べています。
グレアム氏は、「唯一の勝者は、北半球のプラットフォームであり、そこがすべての持続的価値を独占する」と断じています。

無制限のライセンス
シカゴ在住のAI学習ギグワーカー、ヒル氏は、Neon Mobileに自身の個人携帯電話通話記録を販売することについて複雑な思いを抱いています。約11時間分の通話内容で200米ドルを稼ぎましたが、彼によると、このアプリは頻繁にサービス停止を繰り返し、支払いも遅延することが多いとのこと。「Neonは常に怪しいと感じていましたが、請求書の支払いに充てる小遣いを少しでも増やしたい一心で、使い続けました」とヒル氏は語ります。
しかし今、彼はそのお金が本当に「簡単」に手に入るものだったのか、改めて問い直し始めています。昨年9月、TechCrunchが誰でもユーザーの電話番号・通話録音・文字起こし記録にアクセス可能なセキュリティ脆弱性を発見した直後、Neon Mobileはリリースから数週間でサービスを終了しました。ヒル氏によれば、Neon Mobileはこの事実を一度も彼に通知しなかったといい、現在では自身の声がインターネット上で悪用されるのではないかと心配しています。
スタンフォード大学「人間中心AI研究所」のデータ・プライバシー研究員、ジェニファー・キング(Jennifer King)氏は、AIデータ市場が「ユーザーのデータがどのように・どこで使用されるかを明確に示していない」ことに懸念を表明しています。彼女はさらに、「自身の権利を理解しておらず、それを基に交渉もできない消費者は、自分のデータが、好ましくない・理解できない・予期しない方法で再利用されるリスクに晒されている。しかも、その際には事実上、何の救済手段も存在しない」と補足しています。
AI学習ギグワーカーがNeon MobileやKled AIでデータを共有する際、彼らが与えるのは「全世界規模・独占的・不可撤回・譲渡可能・ロイヤリティフリー」の無制限ライセンスであり、プラットフォームはその肖像を販売・利用・公に表示・保存することに加え、それらをもとに派生作品を作成することまで許可されます。
Kled AI創業者アヴィ・パテル(Avi Patel)氏は、当社のデータ利用契約はAI学習および研究目的に限定していると説明します。「このビジネスモデル全体は、ユーザーの信頼に依存しています。貢献者が自らのデータが悪用される可能性があると感じれば、プラットフォームは機能しません」。同氏は、データセットの販売前に購入者を審査し、「意図が疑わしい」組織(たとえばポルノ産業や、当社が信頼関係を損なうと考えるような方法でデータを利用する可能性がある政府機関など)との提携を避けると述べています。
Neon Mobileは取材へのコメントを拒否しました。
ロンドン・シティ大学セントジョージ校法学教授エンリコ・ボナディオ(Enrico Bonadio)氏は、こうした契約条項により、プラットフォームおよびその顧客が「ほぼ何でも自由に、永久に、追加報酬なしで、寄稿者は実質的に同意を取り消したり再交渉したりする手段も持たずに、当該資料を扱うことができる」と指摘しています。
さらに懸念されるリスクとして、提供者のデータがディープフェイクやなりすまし詐欺に悪用されることがあります。データ市場は、販売前に氏名や位置情報などの識別情報を削除すると主張していますが、ボナディオ氏によれば、「生体認証情報に固有のパターンは、本質的に意味のある匿名化が極めて困難です」。
売り手の後悔
仮にAI学習ギグワーカーが、データ利用方法についてより詳細な保護条項を交渉できたとしても、後に後悔する可能性は残ります。2024年、ニューヨーク在住の俳優アダム・コイ(Adam Coy)氏は、AI動画編集ソフト「Captions」(現在はMirageに名称変更)に自身の肖像を1,000米ドルで売却しました。契約では、彼のアイデンティティは政治目的やアルコール・タバコ・ポルノ関連商品のプロモーションには使用されず、ライセンス期間は1年と定められていました。
Captionsは取材へのコメントを拒否しました。
その後間もなく、アダム氏の友人たちが、ネット上で発見した動画を次々と彼に転送し始めました。それらは、アダム氏の顔と声をAIで再現したもので、再生回数は数百万に達していました。そのうちの一つはInstagramに投稿された動画で、アダム氏のAI複製体が「膣科医」と名乗り、妊娠・出産後の女性向けに未承認の医療サプリメントを宣伝していました。
「これを他人に説明するのは、とても恥ずかしかった」とコイ氏は語ります。
「コメント欄が奇妙だったのは、人々が私の容姿を評価していたからです。でも、それはまったくの別人だったのです」と、コイ氏は付け加えます。「当時私が考えていたのは、いずれにせよ大多数のモデルはネットからデータや肖像をクロールするのだから、せめて報酬を得ようと思ったのです」。
コイ氏は、その後AIデータ関連のギグワークを一切受けていません。彼は、「ある企業が非常に大きな報酬を提示する場合にのみ、再び検討する」と述べています。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












