- 21/05/2023 21:02
La técnica permite "arrastrar" cualquier punto de la imagen para llegar con precisión a los puntos objetivo de manera interactiva con el usuario. Recientemente, un grupo de investigadores publicó un artículo que presenta DragGAN, una innovadora técnica para manipular imágenes generadas.
Este método permite a los usuarios arrastrar puntos de forma interactiva en las imágenes para lograr un posicionamiento preciso en los puntos de destino.
El método consta de dos componentes clave. El primero es la supervisión de movimiento basada en funciones, que guía el movimiento del punto de control hacia la posición deseada. El segundo componente implica un nuevo enfoque de seguimiento de puntos que utiliza características discriminatorias de una GAN para localizar continuamente las posiciones de los puntos de control.

Deformar imágenes de manera flexible
Con DragGAN, las personas pueden deformar imágenes de manera flexible mientras mantienen un control total sobre la ubicación de los píxeles. Esto permite la manipulación de diversas categorías, como animales, automóviles, humanos, paisajes, entre otros, lo que posibilita ajustes en la pose, la forma, la expresión y el diseño.
Según el equipo, estas manipulaciones se realizan en una variedad de imágenes generativas aprendidas de una GAN, lo que tiende a producir resultados realistas incluso en escenarios desafiantes como alucinaciones de contenido ocluido y formas deformantes que siguen constantemente la rigidez del objeto.
Tanto las comparaciones cualitativas como las cuantitativas demuestran la ventaja de DragGAN sobre enfoques anteriores en las tareas de manipulación de imágenes y seguimiento de puntos.
Tienes más información en su página: [URL]https://huggingface.co/papers/2305.10973[/URL].
Este método permite a los usuarios arrastrar puntos de forma interactiva en las imágenes para lograr un posicionamiento preciso en los puntos de destino.
El método consta de dos componentes clave. El primero es la supervisión de movimiento basada en funciones, que guía el movimiento del punto de control hacia la posición deseada. El segundo componente implica un nuevo enfoque de seguimiento de puntos que utiliza características discriminatorias de una GAN para localizar continuamente las posiciones de los puntos de control.

Deformar imágenes de manera flexible
Con DragGAN, las personas pueden deformar imágenes de manera flexible mientras mantienen un control total sobre la ubicación de los píxeles. Esto permite la manipulación de diversas categorías, como animales, automóviles, humanos, paisajes, entre otros, lo que posibilita ajustes en la pose, la forma, la expresión y el diseño.
Según el equipo, estas manipulaciones se realizan en una variedad de imágenes generativas aprendidas de una GAN, lo que tiende a producir resultados realistas incluso en escenarios desafiantes como alucinaciones de contenido ocluido y formas deformantes que siguen constantemente la rigidez del objeto.
Tanto las comparaciones cualitativas como las cuantitativas demuestran la ventaja de DragGAN sobre enfoques anteriores en las tareas de manipulación de imágenes y seguimiento de puntos.
Tienes más información en su página: [URL]https://huggingface.co/papers/2305.10973[/URL].
[video=youtube_share;YSDLhNrPaUU]https://youtu.be/YSDLhNrPaUU[/video]

