Изкуственият интелект с отворен код трябва да разкрива данните си за обучение

Llama на Meta не отговаря на новата дефиниция на OSI

Стефан Николов Последна промяна на 31 October 2024 в 10:57 923 0

Снимка Jcomp/Freepik

Един от кръстниците на AI: xAI е „нещо като провал“ и цялата AI индустрия трябва да се рестартира

23/06/2026

Рискува ли нестабилност Европа заради изоставането си с изкуствения интелект

Инициативата за отворен код (OSI, Open Source Initiative) публикува своето официално определение за „отворен“ изкуствен интелект, което създава предпоставки за сблъсък с технологичните гиганти като Meta, чиито модели не отговарят на тези изисквания.

OSI отдавна определя индустриалния стандарт за това какво точно представлява софтуерът с отворен код, но системите за изкуствен интелект включват елементи, които не са обхванати от конвенционалните лицензи, като например данните за обучение на моделите. Сега, за да може една AI система да се счита за истински отворен код, тя трябва да предоставя:

Достъп до подробна информация за данните, използвани за обучение на изкуствения интелект, така че другите да могат да го разберат и пресъздадат
Пълния код, използван за изграждане и стартиране на AI
Настройките и тежестите от обучението, които помагат на AI да постигне своите резултати

Това определение е пряко предизвикателство спрямо Llama на Meta, широко рекламиран като най-големия AI модел с отворен код. Llama е публично достъпен за изтегляне и използване, но има ограничения за комерсиална употреба (за приложения с над 700 милиона потребители) и не предоставя достъп до данните за обучение, поради което не отговаря на стандартите на OSI за неограничена свобода на използване, модифициране и споделяне.

Говорителят на Meta Фейт Ейшън заяви пред изданието The Verge, че макар „да сме съгласни с нашия OSI партньор за много неща", компанията не е съгласна с това определение. „Няма единно определение за AI с отворен код, а определянето му е предизвикателство, тъй като предишните определения за отворен код не обхващат сложността на днешните бързо развиващи се модели на AI.“

„Ще продължим да работим с OSI и другите индустриални групи, за да направим AI по-достъпен и свободен по начин, който е отговорен, независимо от техническите дефиниции“, добави Айшен.

В продължение на 25 години определението на OSI за софтуер с отворен код се приема широко от разработчиците, които искат да надграждат взаимно своята работа, без да се опасяват от съдебни дела или лицензионни клопки. Сега, когато изкуственият интелект променя пейзажа, технологичните гиганти са изправени пред ключов избор: да приемат тези установени принципи или да ги отхвърлят. Linux Foundation също направи неотдавнашен опит да дефинира какво е „AI с отворен код“, с което даде сигнал за разрастващия се дебат за това как традиционните ценности на отворения код ще се адаптират в ерата на AI.

Главният изпълнителен директор на Hugging Face Клеман Деланж нарече определението на OSI „изключителна помощ при оформянето на дискусията за отворения код в областта на изкуствения интелект, особено когато става въпрос за решаващата роля на данните за обучение“.

Изпълнителният директор на OSI Стефано Мафули заяви, че на институцията са били необходими две години, като през това време тя се е консултирала с експерти от целия свят, за да усъвършенства това определение чрез процес на взаимно сътрудничество. Това е включвало работа с експерти от академичните среди в областта на машинното обучение и обработката на естествен език, философи, създатели на съдържание от света на Creative Commons и др.

Макар Meta да се позовава на опасения, свързани с безопасността, за да ограничи достъпа до своите данни за обучение, критиците виждат по-прост мотив: свеждане до минимум на правната отговорност и запазване на конкурентното предимство.