ラプサス$、四万人分のAI協力者の生体データを流出

恐喝グループLapsus$は2026年4月4日、AIモデルトレーニングの請負業者を募集するプラットフォームMercorの4万人以上の協力者からなる生体認証データを含む4テラバイトのファイルを公開した。この漏洩には音声録音、書類スキャン、確認用自撮り写真が含まれており、音声パターンを恒久的な生体認証識別子として使用することについて警告を怠ったとして、10日間で5件の集団訴訟が提起されている。

暗号化されたファイルとぼやけた自撮り写真が表示されたコンピューター画面。壊れた南京錠とデジタル指紋が、サイバー脅威の暗い背景に浮かんでいる。

15秒のサンプルで音声クローン作成 🎙️

技術的なリスクは、高品質な音声クローン作成には15秒のクリアな音声があれば音声アイデンティティを複製できる点にある。最適な条件下で2～5分間のMercorの録音は、合成音声モデルを生成するのに十分な素材を提供する。これにより、各ファイルはなりすましのベクターとなり、影響を受けた人々は自分の音声パターンを取り消すことができない。パスワードや物理的なトークンとは異なり、音声生体認証には変更メカニズムがなく、恐喝や自動化された電話詐欺に対する潜在的な被害を拡大させる。

あなたの声はもうあなたのものではない、それはトレーニングファイルだ 🤖

この事件で最も興味深いのは、影響を受けた人々がAIモデルのトレーニングに携わっていたのに、今や彼ら自身が別の種類の人工知能のための非自発的なデータセットとして機能していることだ。Mercorはアルゴリズムを改善するためにはっきりと話すよう求めたが、彼らの声が二度とプライベートなものではなくなることについては言及するのを忘れていた。15秒の録音があれば、どんなオープンソーススクリプトでも、請負業者がローンを申請するふりをすることができる。少なくとも、自撮り写真で顔を盗まれた場合はサングラスをかければいいが、声に関しては沈黙を守るしかない。