Google представи новото поколение на своите алгоритми за генериране на видео и изображения. Те са значително подобрени спрямо своите предшественици и показват амбицията на компанията да се конкурира много активно с OpenAI и останалите подобни предложения.
AI платформата за генериране на видео се казва Veo 2. Тя е част от услугата VideoFX, която пък е внедрена в някои от другите платформи на Google, например YouTube. Veo 2 ще може да генерира видео с по-висока резолюция и качество, в повече теми и стилове.
Обърнато е внимание на по-реалистичното движение на хората и обектите, така че да спазват максимално добре законите на физиката. Veo 2 „разбира уникалния език на кинематографията“, казва Google. Затова създателите на съдържание могат да бъдат много специфични в командите си към алгоритъма, включително да описват с какъв обектив да бъде „заснето“ видеото, какви ефекти да бъдат добавяни и в какъв жанр да е цялостният стил на клипа. Може да се поискат и най-дребните детайли като описание на движението на камерата, ъгъл на заснемане и др.
Крайният резултат може да е с резолюция до 4K и „няколко минути“ продължителност. Колко точно зависи от различни фактори, но все още не могат да се генерират дълги формати. Veo 2 е част от VideoFX, но не всички потребители ще могат да го използват веднага. Компанията планира постепенно да увеличава броя им, а догодина ще го внедри в YouTube Shorts и другите си продукти.
AI алгоритъмът за генериране на изображения се казва Imagen 3. За разлика от Veo 2, той ще е достъпен глобално в над 100 държави доста по-бързо. Постепенното му активиране вече започна, като Imagen 3 е внедрен в ImageFX и може да бъде използван през Google Labs. За съжаление България и ЕС като цяло все още не са включени в списъка, заради продължаващия анализ на Google на новия Закон за AI в Европа, който предвижда специални изисквания за някои от алгоритмите.
Imagen 3 има подобрения в уменията си да композира изображенията, обръща повече внимание на баланса на светлината, може да променя фокуса и да акцентира над определен обект. Алгоритъмът ще се справя по-добре и с повече стилове. Може да рендерира изображения с висока степен на реалистичност и повече детайли, а също така и да създава картини в различни жанрове, включително аниме.
Google пуска и новия си експеримент – услугата Whisk. Тя използва комбинация от Imagen 3 и възможностите на Gemini да разбира изображения и да ги описва. Основната възможност на Whisk е да генерира изображения не по текстови команди и описания, а чрез други снимки и картини.
Потребителят може да качи едно или няколко изображения в Whisk и алгоритъмът ще създаде различни версии и колажи. Gemini автоматично ще разпознава и описва какво има в картините и ще подава информацията към Whisk. Засега функцията е експериментална и налична само в САЩ. Google предупреждава, че тя може да създава кадри, които са „различни от очакваното“. Затова потребителят ще може да вижда как Gemini е описал кадъра и да редактира описанието, за да получи желания резултат.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
Няма коментари към тази новина !
Последни коментари