ArXiv, o repositório de referência para pesquisas preliminares, decidiu tomar medidas diante da avalanche de trabalhos acadêmicos criados com inteligência artificial de baixa qualidade. A plataforma implementará filtros e revisões mais rigorosas para detectar conteúdo automatizado que carece de rigor científico. A medida busca preservar a utilidade do serviço para a comunidade de pesquisadores.
Filtros técnicos contra o ruído algorítmico 🛡️
Os administradores do ArXiv planejam integrar ferramentas de detecção de padrões linguísticos repetitivos e estruturas argumentativas genéricas, comuns em textos gerados por modelos de linguagem. Espera-se que esses filtros automatizem a identificação de submissões suspeitas antes da revisão humana. O desafio técnico reside em distinguir entre um rascunho legítimo com redação deficiente e um texto fabricado por IA sem conteúdo original. A comunidade científica tem debatido se essas medidas poderiam afetar autores não nativos do inglês.
A IA escrevendo artigos sobre como detectar artigos de IA 🤖
O mais irônico nisso tudo é que muitos dos artigos que propõem métodos para detectar textos gerados por IA provavelmente foram redigidos pela mesma tecnologia que tentam combater. É o equivalente acadêmico de um policial que se disfarça de criminoso para pegar outros criminosos, só que aqui todos usam a mesma fantasia. Enquanto isso, os pesquisadores de carne e osso se perguntam se seu próximo artigo será rejeitado por soar muito robótico.