В ландшафте искусственного интеллекта появляется региональная инициатива под названием LATAM GPT. Ее цель — создать языковую модель, обученную на данных и контекстах испано- и португалоязычной речи Латинской Америки. Идея заключается в предоставлении ответов, более соответствующих культурным и социальным реалиям региона, с целью снижения зависимости от моделей с предвзятостями, импортированными из других широт.
Технический подход и источники данных 📊
Проект основан на сборе и курации обширного и разнообразного корпуса текстов и разговоров, происходящих в регионе. Это включает местные СМИ, литературу, интернет-форумы и академические работы. Процесс обучения направлен на то, чтобы модель понимала не только язык, но и культурные отсылки, идиоматические выражения и специфические социальные контексты, что подразумевает тщательную фильтрацию для приоритизации этих источников.
Прощание с рецептами индейки и примерами с долларами 😄
Наконец-то ИИ, который не предложит нам запекать индейку на Рождество посреди австрального лета или рассчитывать бюджет, предполагая, что у всех есть доступ к одним и тем же услугам. Возможно, он даже поймет, что un momentito может длиться полчаса и что prueba de concepto, сделанная из скотча и палочек от мороженого, вполне валидна. Будет любопытно увидеть, сможет ли он разгадать значение ahorita в зависимости от страны.