ChatGPT вече може да вижда, чува и говори

Стефан Николов Последна промяна на 26 септември 2023 в 19:23 704 0

ChatGPT

Снимка Matheus Bertelli/Pexels

ChatGPT вече може да вижда, чува и говори

OpenAI обяви нови функции за своя чатбот ChatGPT, който вече може да "вижда, чува и говори", по-точно да разбира произнесените думи, да отговаря със синтетичен глас и да обработва изображения. Това е най-голямата актуализация от представянето на GPT-4 насам.

Потребителите могат да преминат към гласови разговори в мобилното приложение ChatGPT и да избират от пет различни синтетични гласа, на които ботът да отговаря. Те също така ще имат възможност да споделят изображения с ChatGPT и да маркират области за анализ, като например да зададат въпроса: "Какви са тези облаци?".

Новите функции ще станат достъпни за платените потребители през следващите две седмици. Гласовите функции ще бъдат налични само в приложенията за iOS и Android, докато обработката на изображения ще бъде достъпна на всички платформи.

Тази актуализация идва на фона на засилващата се конкуренция в областта на изкуствения интелект между пазарни лидери като OpenAI, Microsoft, Google и Anthropic. Технологичните гиганти се стремят да представят не само нови чатботове, но и нови функции.

По-рано тази година Microsoft увеличи инвестицията си в OpenAI с още 10 млрд. долара, което я превърна в най-голямото инвестиционно споразумение в областта на изкуствения интелект за годината. През април стартъпът осъществи продажба на акции за 300 млн. долара, като пазарната капитализация на компанията е между 27 и 29 млрд. долара.

Но някои експерти изразиха загриженост относно синтетичните гласове, създадени с помощта на AI, които биха могли да се използват за създаване на убедителни дийпфейкове. OpenAI потвърди тези опасения, като заяви, че синтетичните гласове са създадени с помощта на актьори, с които компанията директно е работила, а не са събрани от случайни хора.

В съобщението липсва достатъчно информация за това как OpenAI ще използва гласовите данни на потребителите и как компанията ще защити тези данни. В това отношение OpenAI официално заяви, че не съхранява аудиозаписите и не ги използва за подобряване на моделите, но транскрипциите се третират като входни данни и могат да се използват за подобряване на големите езикови модели.

В същото време се появиха и инструкции за гласовото въвеждане в ChatGPT, които са съвсем лесни. За да започнете да използвате глас, трябва да отидете в Settings → New Features в мобилното приложение и да изберете voice conversations. След това трябва да докоснете бутона със слушалките, разположен в горния десен ъгъл на главния екран, и да изберете един от петте предложени гласа.

Функцията е базирана на нов модел, който успешно превръща текста в реч. Според OpenAI, той е способен да генерира правдоподобен звук от текст и няколко секунди аудио.

Всички новини
Най-четени Най-нови
За писането на коментар е необходима регистрация.
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!

Няма коментари към тази новина !