Resultados 1 al 1 de 1

Zonas manipulables en modelos 3D a partir de pistas acústicas

  1. #1
    Fecha de ingreso
    Apr 2002
    Mensajes
    35,319

    Zonas manipulables en modelos 3D a partir de pistas acústicas

    Un nuevo sistema de investigación llamado AV-AG identifica y segmenta en una imagen las zonas precisas donde se puede manipular un objeto, usando únicamente el sonido de la acción asociada. A diferencia de los métodos que se basan en texto o vídeo, el audio ofrece pistas semánticas inmediatas que no dependen de que el objeto esté completamente visible. Esto permite ubicar regiones de interacción incluso cuando hay ambigüedad visual u oclusiones. Para desarrollar esta capacidad, se creó el primer conjunto de datos AV-AG, que incluye sonidos de acciones, imágenes de objetos y anotaciones detalladas a nivel de píxel que señalan las partes que se pueden usar. También contiene un subconjunto de objetos no vistos para evaluar cómo generaliza el sistema a casos nuevos.


    El modelo AVAGFormer combina audio y visión

    El modelo que procesa esta información, denominado AVAGFormer, fusiona las señales de audio y visión mediante un mezclador transmodal que se condiciona semánticamente. Este módulo integra las pistas acústicas con los datos visuales de forma coherente. Luego, un decodificador de dos cabezas predice las máscaras de segmentación con precisión, logrando resultados que superan a los métodos previos en esta tarea. La arquitectura demuestra que el sonido puede guiar efectivamente la comprensión visual de cómo interactuamos con los objetos, abriendo nuevas vías para analizar escenas.

    Aplicaciones potenciales en workflows 3D y simulación

    Para los usuarios de foro3d.com, este enfoque aporta perspectivas útiles en flujos de trabajo donde analizar la interacción es clave. Podría generar o asistir en la creación de máscaras de contacto o zonas manipulables en modelos 3D a partir de pistas acústicas. También puede mejorar simulaciones físicas al identificar automáticamente puntos de agarre realistas. En sistemas de animación y rigging, enriquece la información sobre cómo se usan los objetos. Además, facilita herramientas de texturizado o layout que detectan superficies funcionales, e inspira nuevos plugins que combinen audio y visión para aumentar la coherencia entre acciones, sonidos y animaciones en escenas 3D.

    Así que la próxima vez que tu personaje 3D agarre una taza por el asa en lugar de por el fondo hirviendo, quizá le debas agradecer a un sonido de sorbo.
    |Agradecer cuando alguien te ayuda es de ser agradecido|

Temas similares

  1. General DreamFusion genera modelos 3D a partir de texto
    Por 3dpoder en el foro Modelado
    Respuestas: 1
    : 02-04-2023, 22:00
  2. General Fotogrametria: obtencion de modelos 3d a partir de fotografías
    Por vanselm66 en el foro Programas de Diseño 3D y CAD
    Respuestas: 17
    : 13-02-2017, 16:23
  3. General Modelos 3d a partir de modelos 2d
    Por Evilsould en el foro Modelado
    Respuestas: 1
    : 14-01-2014, 09:02
  4. Modelos 3d a partir de fotografías con Autodesk 123d
    Por 3dpoder en el foro Programas de Diseño 3D y CAD
    Respuestas: 5
    : 21-02-2013, 16:45
  5. YafRay Yafray zonas muy oscuras y zonas muy iluminadas entre demás cuestiones
    Por Pinucset en el foro Render, Iluminación y Cámaras
    Respuestas: 5
    : 18-10-2005, 01:02

Etiquetas para este tema