Ново AI изследване на дава възможност за бързи и сложни манипулации на изображенията

Стефан Николов Последна промяна на 22 May 2023 в 10:48 1285 0

Снимка Изследователски екип

Може ли стар смартфон да стане част от център за данни

14/06/2026

Google ще използва данните от Google Lens, Search Live и Translate за обучение на своя AI

Прилича на инструмента за деформация на Photoshop, но е много по-мощен. При него не просто размествате и променяте пикселите, а използвате изкуствен интелект, за да генерирате отново основния обект. Можете дори да завъртате изображенията, сякаш са 3D обекти.

Нищо още не е приключило: способността на AI инструментите да манипулират по много сложен начин изображенията продължава непрекъснато да расте. Показаният на основното изображение пример е само част от една изследователска статия, но е много впечатляваща, понеже дава възможност на потребителите чрез кликване просто да изберат някоя област в например снимка, и просто да преместват чрез плъзгане нейните елементи, за да променят външния вид на заснетото лице.

На пръв поглед това не изглежда кой знае колко вълнуващо, но само погледнете примерите по-долу, за да добиете представа за уменията на тази интересна система, базирана на изкуствен интелект (AI).

Можете не само да променяте размера на някой автомобил, но и да да направите усмихнат намръщения човек само чрез кликване и плъзгане на неговите устни. Друга интересна особеност е, че можете да завъртате обекта на снимката сякаш е 3D модел. Изследователският екип показва няколко клипа, при които се виждат корекциите на отраженията в езеро, промяната във височината на планинска верига, като всичко става само с няколко кликвания.

Тези видеоклипове са взети от началната страница на изследователския екип, която понякога се срива поради огромния трафик. Екипът създал всичко това подчертава, че най-интересното в тази технология не е само манипулирането на изображенията, а възможностите на специализирания потребителски интерфейс. От известно време можем да използваме AI инструменти, като например GAN за генериране на реалистични изображения чрез текстово описание, но на тези методи им липсва гъвкавост и прецизност. Така например, можете да дадете заявка на един подобен AI генератор на изображения да създаде реалистична "снимка" на лъв в саваната. Разбира се, той ще генерира това изображение, но то едва ли ще е в точно желаната от вас поза.

Новият модел, който получи името DragGAN, предлага много по-добро решение. Интерфейсът е съвсем същият като на традиционното деформиране на изображенията, но вместо да размества, размазва и променя пикселите, AI моделът генерира обекта наново.

Засега това е само една демонстрация, която не дава възможност за цялостна оценка на тази интересна нова технология. Все още няма как да се оцени доколко реалистични са получените окончателни изображения и не може да се провери какво се случва с видеоклиповете с ниска разделителна способност. Но това е един съвсем нов подход за по-достъпно, по-лесно и по-реалистично манипулиране на изображенията.