Andrej Karpathy, renomado pesquisador em inteligência artificial e cofundador da OpenAI, mudou de lado. Agora ele se junta à Anthropic para se concentrar no pré-treinamento do Claude, seu modelo principal. Esta fase é a mais intensiva em recursos e define as capacidades básicas do sistema, marcando um movimento-chave na competição entre laboratórios de IA.
Pré-treinamento com Claude: a fase que define a base de conhecimento 🧠
Karpathy formará uma equipe para otimizar esta etapa crítica, onde o modelo absorve dados massivos para adquirir seus fundamentos. A ironia é que ele usará o próprio Claude como ferramenta de aceleração, criando um loop de feedback. Esta abordagem busca reduzir custos e melhorar a eficiência, mas também levanta dúvidas sobre vieses e controle na geração de conhecimento sintético durante o processo.
O cientista que se dedicou a treinar seu próprio chefe 🤖
Então Karpathy, depois de ajudar a dar à luz o GPT na OpenAI, agora se dedica a tornar o Claude mais inteligente. E o melhor: ele usará o Claude para que o Claude aprenda mais rápido. É como se um professor pedisse ao seu aluno mais aplicado que o ajudasse a preparar a aula do dia seguinte. Esperemos que o Claude não decida cobrar horas extras de consultoria.