Karpathy deixa OpenAI e se junta à Anthropic para treinar Claude

Andrej Karpathy, renomado pesquisador em inteligência artificial e cofundador da OpenAI, mudou de lado. Agora ele se junta à Anthropic para se concentrar no pré-treinamento do Claude, seu modelo principal. Esta fase é a mais intensiva em recursos e define as capacidades básicas do sistema, marcando um movimento-chave na competição entre laboratórios de IA.

ilustração técnica do processo de pré-treinamento de rede neural, figura de Andrej Karpathy ao lado de um imenso rack de servidores GPU brilhantes executando o treinamento do modelo Claude, fluxos de dados em cascata fluindo para uma arquitetura de transformador multicamadas, caminhos de descida de gradiente visualizados como linhas azuis e laranja luminosas convergindo, tubos de resfriamento de servidores e cabos de fibra óptica conectados a nós de computação de alta densidade, visualização cinematográfica de engenharia, atmosfera escura de sala de servidores com luz ambiente azul fria, desfoque de movimento em discos rígidos girando, exibição de curva de perda em tempo real em monitor holográfico, renderização industrial fotorrealista, componentes de hardware ultra detalhados

Pré-treinamento com Claude: a fase que define a base de conhecimento 🧠

Karpathy formará uma equipe para otimizar esta etapa crítica, onde o modelo absorve dados massivos para adquirir seus fundamentos. A ironia é que ele usará o próprio Claude como ferramenta de aceleração, criando um loop de feedback. Esta abordagem busca reduzir custos e melhorar a eficiência, mas também levanta dúvidas sobre vieses e controle na geração de conhecimento sintético durante o processo.

O cientista que se dedicou a treinar seu próprio chefe 🤖

Então Karpathy, depois de ajudar a dar à luz o GPT na OpenAI, agora se dedica a tornar o Claude mais inteligente. E o melhor: ele usará o Claude para que o Claude aprenda mais rápido. É como se um professor pedisse ao seu aluno mais aplicado que o ajudasse a preparar a aula do dia seguinte. Esperemos que o Claude não decida cobrar horas extras de consultoria.