Исследование Стэнфорда, Имперского колледжа Лондона и Архива Интернета показывает, что с 2022 года более трети вновь созданных веб-сайтов содержат контент, сгенерированный искусственным интеллектом. Анализ, охватывающий выборки до мая 2025 года, использовал программное обеспечение Pangram v3 для обнаружения синтетического текста. Интернет автоматизируется ускоренными темпами. 🌐
Pangram v3: детектор, раскрывающий синтетический след 🤖
Программное обеспечение Pangram v3, разработанное для выявления лингвистических паттернов, характерных для языковых моделей, проанализировало огромный массив страниц. Оно обнаружило, что контент, созданный ИИ, proliferates не только в блогах и партнерских сайтах, но и на форумах и новостных порталах. Точность детектора позволяет отличать человеческий текст от синтетического с низкой погрешностью, хотя продвинутые модели продолжают усложнять задачу.
Скоро нам понадобится ИИ, чтобы знать, что не является ИИ 😅
Любопытный факт: всё больше сайтов пишутся сами собой, но никто их, кажется, не читает. Скоро у нас будет интернет, полный статей, сгенерированных машинами, которые читаются другими машинами для обучения новых машин. В этом цикле люди будут как тот друг, который опаздывает на вечеринку и находит только крошки. По крайней мере, мы всё ещё лучше рассказываем плохие шутки.