OpenAI представи генератора на изображения Dall-E 3 и скоро ще го интегрира в ChatGPT

Стефан Николов Последна промяна на 25 септември 2023 в 13:00 348 0

Dall-E 3

Снимка Dall-E 3/OpenAI

OpenAI представи генератора на изображения Dall-E 3 и скоро ще го интегрира в ChatGPT

OpenAI представи нова версия на своя генератор на изображения DALL-E и обяви плановете си да го интегрира в ChatGPT. Според разработчиците DALL-E 3 може "значително по-добре да разбира заявките", да анализира сложните инструкции и да генерира "изключително подробни и точни изображения" в сравнение със своя предшественик.

"Сегашните генератори на изображения обикновено игнорират немалка част от думите или описанията, като принуждават потребителите да изучават възможностите на текстовия промпт. DALL-E 3 бележи крачка напред в способността ни да създаваме изображения, които прецизно отговарят на зададената от вас заявка", се казва в описанието на новия генератор на изображения от OpenAI.

Моделът също така е в състояние по-добре да се справя с фините детайли, като например човешките ръце, които са трудни за изкуствения интелект. Дори при съвсем същите заявки резултатите на DALL-E 3 са много по-добри от тези на DALL-E 2, отбелязват разработчиците. DALL-E 3 ще може точно да представя дадена сцена с конкретни обекти и да взема предвид по какъв начин те са свързани помежду си, както е показано на изображението по-долу.

Изданието PCmag допълва, че OpenAI възнамерява да интегрира DALL-E 3 в чатботовете ChatGPT Plus и Enterprise в най-близко бъдеще. Комбинирането на езиковите умения на чатбота с генератора на изображения ще създаде още по-точни изображения и ще предостави още повече възможности за прецизиране на заявката, ако първият получен резултат не е този, който потребителят е очаквал.

"При задаване на запитване ChatGPT автоматично ще генерира персонализирани подробни подсказки за DALL-E 3, въз основа на които ще създаде изображение. Ако полученото изображение е по вкуса на потребителя, но не представя точно заявката, то може да бъде променено само с няколко допълнителни уточняващи думи", казва OpenAI.

DALL-E 3 вече е в стадий на изследователска предварителна версия и ще стане достъпен за абонатите на ChatGPT Plus и Enterprise през октомври чрез приложен програмен интерфейс. Да напомним, че използването на DALL-E 2 е платено, а месечният абонамент за същия

ChatGPT Plus струва 20 долара. Към момента единственият голям чат бот с изкуствен интелект, който предлага безплатен вграден генератор на изображения, е Bing Chat AI на Microsoft. Между другото, той е базиран на мощния езиков модел GPT-4 на OpenAI.
"Както и при DALL-E 2, изображенията, генерирани с DALL-E 3, ще бъдат собственост на потребителя и няма да се нуждаят от разрешение за препечатването, продажбата или разпространението им", уточняват от OpenAI.

Компанията също така отбеляза, че DALL-E 3 включва инструменти за ограничаване създаването на определени изображения. Така например генераторът на изображения ще отхвърля заявките с имена на публични личности или "вредни пристрастия", за да се намали рискът от разпространение на пропаганда и дезинформация. Разработчиците тестват и класификатор на произхода - инструмент, който ще им позволи да определят дали дадено изображение е генерирано от невронна мрежа. И накрая, новият DALL-E няма да генерира изображения в стила на актуалните живи и креативни художници.

Всички новини
Най-четени Най-нови
За писането на коментар е необходима регистрация.
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!

Няма коментари към тази новина !