
Технологичният гигант Google интегрира мултимодални възможности в своя режим AI Mode, които му позволяват да отговаря на сложни въпроси за изображения. Тази нова функция обединява персонализирана версия на модела Gemini AI с технологията за разпознаване на снимки - Lens.
След актуализацията, потребителите на AI Mode Search могат да направят или качат изображение и да получат "богат, изчерпателен отговор с връзки" за неговото съдържание. Първоначално предназначена само за абонатите на Google One AI Premium срещу месечна такса от 20 долара, функцията вече е налична за всички потребители в САЩ чрез платформата Google Labs.
Според Google, Lens вече може да разбира специфичните характеристики на дадено изображение, като например връзката на обектите един с друг и характеристики като форми, цветове и други. Когато потребителят зададе въпрос, режимът AI Mode може да оцени както изображението като цяло, така и обектите в него, за да предостави повече информация и по-контекстуално точни отговори.
“С мултимодалните възможности на Gemini, AI Mode може да разбере цялата сцена в дадено изображение, включително контекста на това как обектите са свързани един с друг и техните уникални материали, цветове, форми и подредба“ - обяснява продуктовият вицепрезидент на Google Роби Стайн.
Новият алгоритъм за разпознаване на Google променя начина, по който се интерпретират изображенията и има множество практически приложения, сред които възможност за идентифициране на книги, заснети на снимка и отговаряне на въпроси, свързани с тях. В блога на компанията се дава пример с потребител, който снима своята библиотека с книги и иска препоръки на базата на изображението.
Режимът AI Mode идентифицира всяка книга, след което стартира търсене и прави своите препоръки. Нещо повече - той позволява задаването на допълнителни въпроси за конкретизиране на търсенето, като например: "Търся бързо четиво. Коя от тези книги е най-кратка?"
Новата функция на Google представлява комбинация от технологии за търсене и изкуствен интелект. Тя съчетава уеб базирани отговори в реално време с интуитивен AI интерфейс, който позволява на потребителите не само да получат точни резултати, а и да взаимодействат с информацията чрез разговор.
Тази технология се отличава от другите предложения на компанията, като AI Overviews и чатбота Gemini, с интегрирания си подход. Сред основните ѝ конкуренти са решения като ChatGPT Search на OpenAI и Perplexity AI, които също предлагат лесен начин за откриване и обработка на информация.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
Няма коментари към тази новина !
Последни коментари