
OpenAI пусна изследователска предварителна версия на Operator (Оператор). Това е инструмент за уеб автоматизация, който използва нов модел на ИИ, наречен Computer-Using Agent (CUA), за управление на компютри чрез визуален интерфейс. Системата изпълнява задачи, като разглежда и взаимодейства с екранни елементи като бутони и текстови полета, подобно на начина, по който би го направил човек.
Операторът е достъпен от днес за абонатите на плана ChatGPT Pro на адрес operator.chatgpt.com, но все още не е наличен в нашия регион. По-късно компанията планира да разшири обхвата за потребителите на Plus, Team и Enterprise. OpenAI възнамерява да интегрира тези възможности директно в ChatGPT, а по-късно да пусне CUA чрез своя API за разработчици.
Операторът наблюдава съдържанието на екрана, докато използвате компютъра си, и изпълнява задачи чрез симулирани въвеждане на данни от клавиатурата и мишката. Агентът за използване на компютъра обработва екранни снимки, за да разбере състоянието на компютъра, и след това взема решения за щракване, писане и превъртане въз основа на наблюденията си.
За да използва компютъра ви така, както бихте го направили вие, агентът работи в няколко стъпки. Първо, той прави екранни снимки, след което анализира тези с GPT-4o, за да обработи суровите данни. След това определя какви действия да предприеме и ги осъществява. Тази схема позволява на системата да се възстановява от грешки и да се справя със сложни задачи в различни приложения.
Въпреки това технологията зад Operator е все още сравнително нова и далеч не е съвършена. Съобщава се, че моделът се справя най-добре с повтарящи се уеб задачи като създаване на списъци за пазаруване или плейлисти. Според данните от вътрешните тестове на OpenAI той се затруднява повече с непознати интерфейси като таблици и календари и се справя зле със сложното редактиране на текст (с 40 % успеваемост).
С тази предварителна версия OpenAI се надява да събере обратна връзка от потребителите и да усъвършенства възможностите на системата. Компанията признава, че CUA няма да работи надеждно във всички сценарии, но планира да подобри надеждността ѝ в по-широк кръг от задачи чрез потребителски тестове.
От OpenAI твърдят, че са вградили множество механизми за контрол на безопасността, които изискват потвърждение от потребителя преди извършването на чувствителни действия като изпращане на имейли или извършване на покупки. Операторът също така има ограничения за това какво може да разглежда, определени от OpenAI. Той няма достъп до определени категории сайтове, включително хазарт и съдържание за възрастни.
За да улови опитите за контра действия, които хипотетично могат да бъдат вградени в сайтове, OpenAI казва, че е внедрила системи за модериране и откриване в реално време. Иначе цялата информация, която Операторът вижда за това, което е на екрана ви, се изпраща по интернет до облачните сървъри на OpenAI чрез периодични снимки на екрана.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
Няма коментари към тази новина !
Последни коментари