CurvSSL:自监督学习中的局部几何

发布于 2026年02月27日 | 从西班牙语翻译
Diagrama 3D que muestra un manifold de datos con regiones de alta curvatura resaltadas en colores cálidos, junto a embeddings proyectados en una hiperesfera unitaria con líneas que conectan vecinos más cercanos.

CurvSSL:自监督学习中的局部几何

自监督学习领域刚刚获得了重大推动,CurvSSL是一种创新方法,明确融入了数据流形的局部几何。传统非对比方法忽略了这一基本方面,而CurvSSL保留了标准的双视图架构,但引入了基于曲率的正则化器,捕捉了基本的几何属性🧠。

嵌入空间中的曲率机制

每个嵌入被视为一个顶点,其离散曲率通过在单位超球面上的余弦交互与k个最近邻计算。核变体在具有可重现核的Hilbert空间中操作,从局部Gram矩阵推导曲率。这些测量通过受Barlow Twins启发的损失函数在视图间同步,该函数减少冗余,同时确保对增强的不变性和几何一致性🔄。

方法的主要特性:
  • 通过单位超球面上的余弦关系计算离散曲率
  • 在具有可重现核的Hilbert空间中操作的核变体
  • 对齐并去相关不同视图间曲率的损失
曲率已超越3D设计领域,成为机器学习的基本盟友,证明了在嵌入空间中定义良好的曲线也具有魅力。

实验评估和比较

基准数据集如MNIST和CIFAR-10上使用ResNet-18进行的测试显示,CurvSSL产生了与Barlow Twins和VICReg等成熟方法相当或优越的结果。这些发现证实了局部几何信息有效地补充了纯统计正则化器,提供了对数据内在结构更丰富的视角📊。

实验证明的优势:
  • 与成熟方法相比具有竞争性或优越性能
  • 几何信息与统计正则化器之间的有效整合
  • 对数据内在结构的更好捕捉

方法的影响和未来

融入明确的局部几何代表了自监督学习中的重大概念进步。CurvSSL不仅提高了实际性能,还丰富了我们对模型如何通过考虑数据底层几何结构来学习更有意义表示的理论理解。这种统计与几何的混合方法有望在表示学习研究中开辟新方向🚀。