スタンフォード大学、インペリアル・カレッジ・ロンドン、インターネットアーカイブによる研究で、2022年以降、新しく作成されたウェブサイトの3分の1以上に人工知能によって生成されたコンテンツが含まれていることが明らかになりました。2025年5月までのサンプルを対象としたこの分析では、合成テキストを検出するためにソフトウェアPangram v3が使用されました。ウェブは加速的なペースで自動化されています。🌐
Pangram v3: 合成の痕跡を暴く検出器 🤖
言語モデル特有の言語パターンを識別するために開発されたソフトウェアPangram v3は、膨大な量のページ群を分析しました。AI生成コンテンツはブログやアフィリエイトサイトだけでなく、フォーラムやニュースポータルにも蔓延していることが判明しました。この検出器の精度により、人間のテキストと合成テキストを低い誤差範囲で区別することが可能ですが、高度なモデルは依然としてその任務を困難にしています。
もうすぐ、何がAIでないかを知るためのAIが必要になるでしょう 😅
興味深い事実です:ますます多くのウェブサイトが自動で作成されていますが、誰もそれらを読んでいないようです。まもなく、機械によって生成された記事で溢れたインターネットが、新しい機械を訓練するために他の機械によって読まれるようになるでしょう。そのループの中で、人間はパーティーに遅れて到着し、パンくずしか見つけられないあの友人のようになるでしょう。少なくとも、私たちは下手なジョークを言うことにおいてはまだ優れています。