OpenAI представи нова версия на своя генератор на изображения DALL-E и обяви плановете си да го интегрира в ChatGPT. Според разработчиците DALL-E 3 може "значително по-добре да разбира заявките", да анализира сложните инструкции и да генерира "изключително подробни и точни изображения" в сравнение със своя предшественик.
"Сегашните генератори на изображения обикновено игнорират немалка част от думите или описанията, като принуждават потребителите да изучават възможностите на текстовия промпт. DALL-E 3 бележи крачка напред в способността ни да създаваме изображения, които прецизно отговарят на зададената от вас заявка", се казва в описанието на новия генератор на изображения от OpenAI.
Моделът също така е в състояние по-добре да се справя с фините детайли, като например човешките ръце, които са трудни за изкуствения интелект. Дори при съвсем същите заявки резултатите на DALL-E 3 са много по-добри от тези на DALL-E 2, отбелязват разработчиците. DALL-E 3 ще може точно да представя дадена сцена с конкретни обекти и да взема предвид по какъв начин те са свързани помежду си, както е показано на изображението по-долу.
Изданието PCmag допълва, че OpenAI възнамерява да интегрира DALL-E 3 в чатботовете ChatGPT Plus и Enterprise в най-близко бъдеще. Комбинирането на езиковите умения на чатбота с генератора на изображения ще създаде още по-точни изображения и ще предостави още повече възможности за прецизиране на заявката, ако първият получен резултат не е този, който потребителят е очаквал.
"При задаване на запитване ChatGPT автоматично ще генерира персонализирани подробни подсказки за DALL-E 3, въз основа на които ще създаде изображение. Ако полученото изображение е по вкуса на потребителя, но не представя точно заявката, то може да бъде променено само с няколко допълнителни уточняващи думи", казва OpenAI.
DALL-E 3 вече е в стадий на изследователска предварителна версия и ще стане достъпен за абонатите на ChatGPT Plus и Enterprise през октомври чрез приложен програмен интерфейс. Да напомним, че използването на DALL-E 2 е платено, а месечният абонамент за същия
ChatGPT Plus струва 20 долара. Към момента единственият голям чат бот с изкуствен интелект, който предлага безплатен вграден генератор на изображения, е Bing Chat AI на Microsoft. Между другото, той е базиран на мощния езиков модел GPT-4 на OpenAI.
"Както и при DALL-E 2, изображенията, генерирани с DALL-E 3, ще бъдат собственост на потребителя и няма да се нуждаят от разрешение за препечатването, продажбата или разпространението им", уточняват от OpenAI.
Компанията също така отбеляза, че DALL-E 3 включва инструменти за ограничаване създаването на определени изображения. Така например генераторът на изображения ще отхвърля заявките с имена на публични личности или "вредни пристрастия", за да се намали рискът от разпространение на пропаганда и дезинформация. Разработчиците тестват и класификатор на произхода - инструмент, който ще им позволи да определят дали дадено изображение е генерирано от невронна мрежа. И накрая, новият DALL-E няма да генерира изображения в стила на актуалните живи и креативни художници.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
Няма коментари към тази новина !
Последни коментари