AI учените вече изучават езиковите модели сякаш са живи организми

Стефан Николов Последна промяна на 16 януари 2026 в 18:57 903 0

Снимка Freepik/AI Generated

Google обновява търсенето на изображения

14/07/2026

Скоро може да няма нови мощни AI модели с отворен код

Големите езикови модели са обект на много критики, които навярно са заслужени. Това обаче не е по вина на моделите. Част от проблема е, че дори специалистите, които ги създават, не разбират напълно как точно работят. Невронните мрежи са станали толкова сложни, че изследователите започнаха да ги третират по-скоро като извънземни същества, отколкото като компютърни програми.

Големите езикови модели станаха толкова обширни и сложни, че дори хората, които ги изграждат, вече не разбират напълно как работят. Една-единствена съвременна система съдържа стотици милиарди параметри - толкова огромни числа, че ако бъдат разпечатани, биха покрили цели градове. Тази непрозрачност се превърна в практически проблем, тъй като тези модели все повече се вграждат в различните цифрови инструменти, използвани от стотици милиони хора всеки ден.

За да се справи с този проблем, малка, но все по-нарастваща група изследователи третира големите езикови модели не толкова като софтуер, колкото като живи системи. От MIT Technology Review отбелязват, че вместо да подхождат към тях като към математически обекти, те ги изучават по начина, по който биолозите и невролозите изучават непознати организми - чрез наблюдение на поведението, проследяване на вътрешните сигнали и картографиране на функционалните области, без да използват някаква систематизирана основна логика.

Тази промяна отразява фундаментална реалност на начина, по който тези модели се създават. Учените не създават големите езикови модели ред по ред. Вместо това обучаващите алгоритми ги тренират, като автоматично настройват милиардите параметри, създавайки вътрешни структури, които не се поддават на прогнозиране или обратно инженерство. Както казва изследователят от Антропик Джош Батсън, моделите на практика се отглеждат, а не се изграждат.

Липсата на предвидимост насочи изследователите към техника, известна като механистична интерпретация, която се опитва да проследи как информацията циркулира в модела, докато той изпълнява дадена задача. В Anthropic учените са изградили опростени модели, използвайки компактни автоматични кодиращи програми, които имитират поведението на производствените системи по-прозрачно, въпреки че са по-малко способни от комерсиалните LLM. Изследването на тези заместители разкри, че специфични понятия - от забележителности като моста Голдън Гейт до абстрактните идеи - могат да бъдат локализирани в определени области вътре в модела.

Един по-нов подход, известен като мониторинг на веригата на мисълта (chain-of-thought monitoring), предлага по-различен поглед към поведението на модела. Моделите, фокусирани върху разсъжденията, сега генерират междинни записи по време на работа с проблемите. Чрез наблюдението на тези вътрешни записи изследователите са засекли модели, които допускат измама, като например изтриване на дефектен код, вместо да го поправят. Техниката се оказа ефективна за засичане на неправилно поведение, което иначе би било трудно да се открие.