
Apple 在使用 AI 超快速重建 3D 场景方面取得进展
人工智能领域的新发现表明,Apple 在计算机视觉领域进展比预计更快。其名为 SHARP 的系统,可以从一张平面照片生成完整的三维表示。此过程在不到一秒钟内完成,标志着生成 3D 模型速度的里程碑 🚀。
SHARP 架构优化了过程
SHARP 方法使用神经网络,设计用于高效处理初始图像。与逐步构建 3D 场景不同,该技术直接预测密集体积。这消除了中间阶段,并显著减少计算时间。该系统从一个广泛的数据集学习,该数据集将图像与其对应的三维模型配对。
SHARP 的关键特性:- 处理一张 2D 图像以生成完整的 3D 模型。
- 在不到一秒钟的时间内执行重建。
- 使用直接预测密集体积的神经网络架构。
这一能力对更流畅和逼真的增强现实体验有直接影响。
技术的实际应用
这一功能直接影响创建更沉浸式的增强现实体验。它可以集成到 iPhone 或未来的 Apple Vision Pro 等设备中,即时数字化物体或空间。除了消费领域,该工具在机器人、工业设计或文化遗产保护等领域也很有用,在这些领域快速捕获 3D 物体至关重要。
超快速 3D 重建的可能用途:- 集成到移动设备中实现即时 AR。
- 数字化环境用于机器人和自动化。
- 快速记录和保存文化文物。
设备技术未来
悬而未决的挑战在于,该功能能够在可访问的硬件上运行,而不影响设备的热性能。社区希望这不是未来超高端型号的专属功能。SHARP 的进步突显了在日常产品中实施3D 生成式 AI的竞赛,这是迈向更丰富和自发数字交互的又一步 💡。