ChatGPT трябва да отиде на училище, но ще плати ли OpenAI

Стефан Николов Последна промяна на 05 юни 2023 в 10:58 534 0

Chatbot school

Снимка Pch.vector/Freeepik

ChatGPT трябва да отиде на училище, но ще плати ли OpenAI

От данните, използвани за обучение на изкуствен интелект, могат да се печелят много пари. Това може да направи следващия ChatGPT по-скъп, но и по-доминантен. Въпреки цялата интелигентност, която се приписва на ChatGPT, този чатбот е на ниво домашно обучение. Компанията OpenAI, която го създаде, го обучи и тренира с информацията от необятния и противоречив интернет и именно това е една от причините ChatGPT да прави толкова много смущаващи и може да се каже дори неудобни грешки. Наскоро виден адвокат написа пледоарията си за пред съда с помощта на ChatGPT, в която се цитират цели шест съдебни дела, но се оказа, че чатботът си ги е измислил.

По какъв начин ChatGPT може да стане по-точен? Лесно – трябва да бъде изпратен в "колеж", където да бъде обучен с помощта на по-качествени данни.
Bloomberg допълва, че това създава примамлива възможност за нов източник на приходи за издателите и всички други компании, притежаващи стойностни и достоверни текстове, които могат да се използват за обучение на езиковита модели. Това ще струва скъпо на OpenAI, но същевременно може да засили господството на компанията на Сам Алтман, заедно с Google, Meta Platforms Inc. и шепа други големи компании, които създават т.нар. базисни модели. Именно те могат да станат малцината богати компании, които са в състояние да си позволят да плащат за висшето образование на изкуствения интелект (AI).

OpenAI запази и продължава да пази в тайна данните, с които е обучен и трениран новия GPT-4. Но за предишните версии е добре известно, че е използвана онлайн информация, включваща хиляди самостоятелно публикувани книги, голяма част от които са романтична и фантастична литература. Учените са открили, че редица популярни книги, започнали своя път онлайн, като например поредицата за Хари Потър, вероятно са били използвани в обучението на GPT-4. Това доведе до оживени дискусии в света на книгоиздаването, като издателите започнаха съвсем сериозно да се питат дали техните обширни, интересни и удивителни архиви не могат са използват като тренировъчна площадка за обучение на следващото поколение изкуствен интелект. Разбира се, ако AI компаниите са готови да си плащат.

И наистина, какви по-добри професори за ChatGPT може да има освен платените академични учебни материали, технологичните издания и многобройните материали от сферата на бизнеса, медицината, правото, икономиката и т.н.?

От месеци не стихва скандалът в AI сферата за това, че голяма част от данните за обучението на новия GPT-4 идва от Reddit. В крайна сметка миналия месец този форум-социална мрежа заяви, че ще започне да таксува компаниите, които използват неговото съкровище от разговори. По всичко личи, че Reddit ще успее да се наложи и да започне да прави пари от споделянето на своите бази данни. Това веднага накара книгоиздателите да се запитат дали не могат да направят същото.

Това съвсем не са празни приказки, защото на OpenAI може да се наложи да започне да търси информация за обучението на следващата итерация на своя ChatGPT извън пределите на обществения интернет. Това е важно, понеже след като ChatGPT се превърна в глобална сензация, данните от обществения интернет започнаха да се изкривяват от нахлулия спам с нежелана информация. По същия начин CEO спамът изкривява резултатите на Google. Ето защо на OpenAI ще се наложи да търси по-различна и по-достоверна информация, за която обаче ще трябва да си плаща.

В известен смисъл всичко това може да създаде един процъфтяващ пазар на данни за обучение на изкуствени интелекти. След година или две можем да видим повечето от големите застрахователни фирми, банки и медицински компании, които купуват и продават данни за изграждане на специализирани алтернативи на ChatGPT, които работят великолепно, но само в една конкретна област.

Всички новини
Най-четени Най-нови
За писането на коментар е необходима регистрация.
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!

Няма коментари към тази новина !