MR-RLVR mejora el razonamiento matemático en modelos de lenguaje

Versión para imprimir