DragGAN

DragGAN is een nieuwe techniek voor beeldmanipulatie waarmee gebruikers elementen van een afbeelding kunnen aanklikken en slepen om hun uiterlijk te wijzigen.

Deze techniek onderscheidt zich van traditionele beeldvervormingstools door AI-algoritmen te gebruiken om het onderliggende object te regenereren. Ontbrekende informatie wordt hierbij door de AI gegenereerd. Het potentieel voor het aanpassen van pose, vorm, expressie en lay-out is vrijwel onbeperkt.

De techniek bestaat uit twee hoofdcomponenten: op functies gebaseerde bewegingssupervisie en een nieuwe point-tracking-benadering. De eerste helpt bij het verschuiven van punten in de afbeelding naar de gewenste positie en de tweede punten naar de gewenste positie, terwijl de laatste gebruik maakt van de GAN (Generative Adversarial Network) om de afbeelding altijd consistent te houden.

Het mooie van deze techniek is de user interface. Afbeeldingen kunnen op een heel intuïtieve manier bewerkt worden.

Een video zegt meer dan een miljoen woorden:

Vorige post: Prompt Engineering