Новият изкуствен интелект (AI) ERNIE-ViLG на китайския технологичен гигант Baidu може да генерира изображения, който много добре демонстрира културната специфика на Пекин. Алгоритъмът се представя много по-добре от DALL-E 2 и другите западни аналози. Само че има уловка и редица особености: китайският изкуствен интелект ERNIE-ViLG налага стриктна цензура на редица чувствителни теми за властите в Пекин. Той например, отказва да покаже площад Тянанмън, който е вторият по големина градски такъв в страната и символичен политически център с печалната слава на студентските протести от 1989 г. Тогава са дадени много жертви след сблъсъка с армията, която е изпратена да ги потуши.
Когато демонстрационната версия на тази невронна мрежа бе представена на китайските потребители през месец август тази година, те много бързо откриха, че определени думи са цензурирани и изключени. Като например изричното споменаване на китайски политически лидери и такива които са спорни в политически контекст. Всички те са маркирани като "чувствителни" и са блокирани за новия AI. По всичко личи, че Великата китайска защитна стена, която може да осъществява цензура в китайския сегмент на уеб пространството вече действа и в сферата на изкуствения интелект.
Това не е нещо ново и се прилага и при западните решения, но в малко по-различен контекст. Така например, невронната мрежа DALL-E 2 забранява използването на сексуално съдържание, лицата на публичните личности и някои изображения от областта на медицината. Но новият изкуствен интелект ERNIE-ViLG повдига въпроса къде все пак е границата между умереността и политическата цензура.
Моделът ERNIE-ViLG е част от мащабния проект Wenxin за обработка на естествения човешки разговорен език, създаден от водещата китайска технологична компания Baidu, която постигна големи успехи в AI сферата. Новият ERNIE-ViLG е обучен с помощта на база данни, включваща 145 млн. двойки изображение-текст и съдържа 10 млрд. параметъра - стойностите, които невронната мрежа променя и коригира докато се учи да различава фините разлики между различните концепции и стилове на изкуството.
Това означава, че ERNIE-ViLG е обучен с по-малко примери в сравнение с DALL-E 2 (650 млн. двойки) и Stable Diffusion (2.3 млрд. двойки), но от друга страна, има повече параметри от американските AI - DALL-E 2 има 3.5 млрд. параметъра, а Stable Diffusion има 890 млн. Baidu представи демо версия на тази платформа през месец август, а по-късно я демонстрира и на Hugging Face, една от най-популярните AI общности.
Основната разлика между ERNIE-ViLG и западните модели е, че разработеният от Baidu изкуствен интелект разбира китайски текст и допуска много по-малко грешки, когато става дума за специфични понятия от културата и изкуството.
Един от най-големите китайски автори на видеа сравни резултатите, демонстрирани от изброените дотук AI, като е давал текстови описания на китайски исторически личности, известни хора от поп културата и различни ястия. Той заяви, че ERNIE-ViLG създава по-точни изображения от DALL-E 2 и Stable Diffusion. Интересно е, че след като бе представен, ERNIE-ViLG бе образно казано прегърнат от японската аниме общност, понеже се оказа, че китайският AI генерира по-добро аниме от всички други подобни модели, най-вероятно защото обучението му е включвало много аниме изображения.
Само че за разлика от DALL-E 2 и Stable Diffusion, за китайския ERNIE-ViLG няма публикувана информация относно политиката за модерация. Baidu отказва да коментира тази тема.
Потребителите експериментират с новия AI и се оказа, че думи като "демокрация" и "правителство" са разрешени, но ако се комбинират като "демокрация в Близкия изток" или "британското правителство", то те са блокирани. Площад Тянанмън също не се показва от ERNIE-ViLG, вероятно заради връзката със събитията от 1989 г. - нещо, което е тотално цензурирано в Китай.
Въпреки вградената цензура, ERNIE-ViLG ще бъде сериозен играч в разработването на широкомащабни изкуствени интелекти, които преобразуват текстови описания в изображения. Появата на AI модели, обучени на специфични езикови набори от данни ще компенсира ограниченията на базираните на английски език модели от подобен род. ERNIE-ViLG ще бъде изключително полезен на потребителите, които се нуждаят от AI, който разбира китайски език и създава изображения с много високо качество. Китайският пазар е огромен и ERNIE-ViLG явно ще бъде прекият конкурент на западните AI от подобен род.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
Няма коментари към тази новина !
Последни коментари