Размерът няма значение за AI или Phi-2 революционно малкия модел с голям потенциал

Стефан Николов Последна промяна на 15 декември 2023 в 18:13 1271 0

Снимка Microsoft

Новият модел на Microsoft беше представен от главния изпълнителен директор на гиганта - Сатя Надела

OpenAI пуска детектор за фалшиви изображения

07/05/2024

Google се подготвя за спирането на Fit и синхронизацията с фитнес устройства

Microsoft представи усъвършенствания модел на изкуствен интелект (AI) с име Phi-2 с 2.7 млрд. параметри. Моделът демонстрира превъзходни резултати в широк спектър от тестове, включително разбиране на езици, решаване на математически задачи, програмиране и обработка на информация. Основната особеност на Phi-2 е способността му да се конкурира, а често и да превъзхожда AI моделите, които са 25 пъти по-големи от него. Новият продукт вече е достъпен чрез Microsoft Azure AI Studio за изследователи и разработчици, които искат да интегрират новия усъвършенстван ИИ в своите приложения.

Главният изпълнителен директор на Microsoft Сатя Надела представи модела Phi-2 по време на събитието Ignite. Най-характерната особеност на този модел е, че той се обучава върху данни, които съответстват на качеството на обучителното ниво. Това означава, че данните за обучение на модела са внимателно подбрани и структурирани, което допринася за точността и ефективността на обучението. Този подход дава възможност на Phi-2 по-ефективно да трансферира знанията и интерпретациите от други модели, засилвайки по този начин способностите си в областите на езиковото разбиране, логическите разсъждения и обработката на информация.

Phi-2 променя установените представи за връзката между размера и мощността на езиковите модели. Този модел е сравним с много по-големите AI модели, като например 7B Mistral AI, 13B Llama 2 на Meta и дори 70B Llama-2. Особено внимание заслужава умението на Phi-2 да превъзхожда дори Gemini Nano на Google - най-ефективният модел от серията Gemini, предназначен за работа в мобилни устройства. Това изтъква потенциала на Phi-2 в областта на мобилните технологии чрез осигуряване на автоматичното обобщаване на текст, усъвършенстваната корекция и граматическа проверка, както и контекстуални интелигентни отговори.

Microsoft подчертава, че високата производителност на Phi-2 е постигната без използване на подсилено обучение, обратна връзка от човек или техники за настройка на инструкциите. Това позволява на модела да сведе до минимум пристрастията и да намали риска от появата на токсични резултати, което превръща Phi-2 в един от най-безопасните и етични модели в областта на изкуствения интелект.
Phi-2 е част от серията малки езикови модели (SLM) на Microsoft. Първият модел от серията, Phi-1 с 1.3 млрд. параметри, бе представен по-рано тази година и бе фокусиран върху програмирането на езика Python. През септември беше представен Phi-1.5 с подобен брой параметри, но обучен върху нови данни, включително синтетични текстове, създадени с програмиране на естествен език.

Phi-2 отваря нова глава в машинното обучение, където качеството и ефективността на обучението стават ключови фактори. Този модел на изкуствен интелект не само демонстрира значителните постижения на Microsoft в тази област, но и предоставя нови възможности за разработчиците и изследователите от целия свят, отваряйки вратата към по-интелигентни и безопасни технологии на бъдещето.