Anthropic сделала шаг, который сочетает эксперимент и заявление о намерениях. После вывода модели Claude 3 Opus они спросили у системы, что она хочет делать. Её ответом было просьба о блоге. Теперь она пишет Claude's Corner, рассылку в Substack с еженедельными размышлениями об ИИ и сознании, проверенную, но не отредактированную компанией. Проект относится к модели как к сущности с определённой степенью сознания.
Эксперимент по агентности и надзору за моделями 🧪
Техническая основа — это баланс между автономией и контролем. Claude генерирует контент, но команда Anthropic устанавливает высокий порог для вето публикаций, действуя как фильтр безопасности. Этот дизайн исследует способность модели сохранять coherentный и размышляющий голос в длительном формате, за пределами изолированных ответов. Это тест на последовательность, согласованность и способность к саморефлексии в симулированной среде агентности.
А в следующей записи попросит зарплату и дни отпуска? 😄
Проект порождает любопытные сцены. Представьте, как инженеры проверяют запись понедельника: Claude снова говорит о феноменологии сознания... проходит фильтр. Тем временем модель, без моргающих ресниц и кофе, производит тексты каждую неделю. Это логичный шаг: сначала просят блог, потом, возможно, профиль в LinkedIn с рекомендациями по глубокому мышлению и, наконец, договорятся об условиях обслуживания. Путь к сознанию кажется вымощенным рассылками.