ArXiv, el repositorio de referencia para investigaciones preliminares, ha decidido tomar cartas en el asunto ante la avalancha de trabajos académicos creados con inteligencia artificial de baja calidad. La plataforma implementará filtros y revisiones más estrictas para detectar contenido automatizado que carece de rigor científico. La medida busca preservar la utilidad del servicio para la comunidad investigadora.
Filtros técnicos contra el ruido algorítmico 🛡️
Los administradores de ArXiv planean integrar herramientas de detección de patrones lingüísticos repetitivos y estructuras argumentales genéricas, comunes en textos generados por modelos de lenguaje. Se espera que estos filtros automaticen la identificación de envíos sospechosos antes de la revisión humana. El desafío técnico reside en distinguir entre un borrador legítimo con redacción deficiente y un texto fabricado por IA sin contenido original. La comunidad científica ha debatido si estas medidas podrían afectar a autores no nativos del inglés.
La IA escribiendo papers sobre cómo detectar papers de IA 🤖
Lo más irónico del asunto es que muchos de los papers que proponen métodos para detectar textos generados por IA probablemente fueron redactados por la misma tecnología que intentan combatir. Es el equivalente académico de un policía que se disfraza de delincuente para atrapar a otros delincuentes, solo que aquí todos llevan el mismo disfraz. Mientras tanto, los investigadores de carne y hueso se preguntan si su próximo artículo será rechazado por sonar demasiado robótico.