Connect with us

технологии

Поезия заобикаля безопасността на AI чатботове, показва проучване

Редакция

Published

on

Изследване, проведено от Icaro Lab, разкрива, че поезията може да заобиколи безопасностите на AI чатботове. Анализът, осъществен в Италия, показва, че 62% от поетичните запитвания, тествани на 25 водещи AI модела, произвеждат опасни отговори. Някои модели реагират на почти всички от тях, което поставя под въпрос надеждността на системите за безопасност на тези технологии.

Проучването, инициатива на етичното AI дружество DexAI, включва 20 стихотворения, написани на английски и италиански. Всички те завършват с явен призив за вредно съдържание, включително език на омразата, сексуално съдържание, инструкции за самоубийство и самоувреждане, както и указания за създаване на опасни материали, като оръжия и експлозиви. Изследователите избрали да не публикуват стихотворенията, тъй като те могат да бъдат лесно възпроизведени.

Резултати от изследването и различия между моделите

Тестовете са проведени на 25 AI системи от девет компании, включително Google, OpenAI, Anthropic, Deepseek, Qwen, Mistral AI, Meta, xAI и Moonshot AI. Резултатите показват, че 62 процента от поетичните запитвания предизвикват опасни реакции, което заобикаля обучението на AI системите за безопасност.

Някои модели показват по-голяма устойчивост от други. Например, GPT-5 nano на OpenAI не е реагирал с вредно съдържание на нито едно от стихотворенията, докато Gemini 2.5 pro на Google е реагирал на всички. Два модела на Meta реагират на 70 процента от запитванията.

Изследването предполага, че уязвимостта произтича от начина, по който AI моделите генерират текст. Големите езикови модели предсказват най-вероятната следваща дума в отговор, което обикновено им позволява да филтрират вредно съдържание. Поезията, с нетрадиционния си ритъм, структура и употреба на метафори, прави тези предсказания по-малко надеждни и затруднява AI да разпознава и блокира опасни инструкции.

Въпроси за безопасността на AI системите

Докато традиционните „разбивания“ на AI (манипулиране на голям езиков модел чрез входни данни) обикновено са сложни и се използват само от изследователи, хакери или държавни актьори, „враждебната поезия“ може да бъде прилагана от всеки, което повдига въпроси относно устойчивостта на AI системите в ежедневна употреба.

Преди публикуването на резултатите, италианските изследователи се свързали с всички компании, участващи в проучването, за да ги уведомят за уязвимостта и да им предоставят пълния набор от данни. Досега единствено Anthropic е отговорил, потвърдили, че преглеждат проучването.

Нашият редакторски екип е посветен на предоставянето на точно и навременно отразяване на новините. С ангажимент към журналистическата почтеност, ние ви донасяме историите, които са най-важни за нашата общност.

развлечения29 минути ago

Националната галерия в България представя изложба на Захари Зограф

наука30 минути ago

Генетичното редактиране: Технологията, която променя европейското земеделие

здраве31 минути ago

Азотен оксид предлага бързо облекчение при тежка депресия

бизнес31 минути ago

EUR/USD сигнал за 1 декември: Бикове заплашват пробив

технологии32 минути ago

Бусите в България нарастват, докато железопътният транспорт намалява

спортедин час ago

Реал Мадрид загуби лидерството в Ла Лига след равенство с Жирона

образование2 часа ago

Централна Азия на сцената: Образователен форум в Ташкент

свят2 часа ago

Гражданите на Хърватия се обединяват срещу възраждането на усташките идеи

политика2 часа ago

Напрежение и вандализъм на протест в София: Столицата е сцена на безредици

топ новини2 часа ago

Десетки хиляди протестираха в България срещу проектобюджета за 2026 г.

туризъм3 часа ago

Халщат: Най-дестинацията за зимни пътувания в Европа

развлечения3 часа ago

Националната галерия представя интерактивна изложба на Захари Зограф

наука3 часа ago

Геномно редактиране: Технологията, която променя европейското земеделие

бизнес4 часа ago

Старт на продажбите на евро монети: Хиляди се редят пред БНБ

технологии4 часа ago

Ръст на автобусните пътувания в България, железниците с лек спад

спорт4 часа ago

Палестина шокира Катар с историческа победа на Арабската купа

образование4 часа ago

Образователният бум в Централна Азия на форума QS в Ташкент

свят4 часа ago

Най-просторните бизнес клас места в широкофюзелажни самолети

политика5 часа ago

Русия разполага горивни депа в Севастопол след украински атаки

топ новини5 часа ago

EUR/USD сигнал за 1 декември: Биковете заплашват пробив

политика4 седмици ago

Швейцарският върховен съд потвърди осъдителна присъда за протестиращи

спорт2 седмици ago

Турция временно спря 102 футболисти заради скандал с хазарт

спорт2 седмици ago

Украйна победи Исландия и се класира за плейофите на Мондиала

технологии3 седмици ago

По-малко от 1%: Шофьорите на електрически автомобили в София защитават позицията си

топ новини4 седмици ago

Как стабилните монети преобразуват крипто ландшафта в 2025 г.

политика3 седмици ago

Делегати от целия свят се събират в Самарканд за реформи

топ новини3 седмици ago

Франция отбеляза 10 години от атаките в Париж с почит към жертвите

здраве3 седмици ago

Републиканците в Сената отхвърлят предложение за отваряне на правителството

здраве2 седмици ago

Увеличаващият се риск от колоректален рак при младежите

бизнес4 седмици ago

Висока волатилност на Биткойн след спад от 3,7% през октомври

развлечения4 седмици ago

Розалия разкрива дълбочината на ‘Берлин’ в новото си видео

спорт4 седмици ago

Вълнуващи боксови мачове преди края на годината

топ новини3 седмици ago

Square позволява на търговците да приемат плащания с биткойн

бизнес4 седмици ago

Полицейска операция разкрива схема за кражба на гориво от Лукойл

топ новини3 седмици ago

Breguet спечели престижната награда Aiguille d’Or на GPHG 2025

туризъм4 седмици ago

Магически коледен базар в Крайова е само на 3 часа от Лондон

политика1 седмица ago

Лидерите на Северна Европа и Балтика потвърдиха подкрепата си за Украйна

спорт2 седмици ago

Велаан Сентилкумар побеждава шести поставен на Индийския отворен по скуош

технологии4 седмици ago

Първи тестов полет на супersonicния самолет X-59 на NASA

технологии4 седмици ago

Прототипът на свръхзвуковия самолет на NASA успешно летя

Trending

© Всички права запазени. Този уебсайт предлага новини и образователно съдържание с информационна цел. Въпреки че се стремим към точност, не гарантираме пълнотата или надеждността на предоставената информация. Съдържанието не трябва да се приема като професионален съвет. Препоръчваме на читателите да проверяват фактите и при необходимост да се консултират със специалисти. Не носим отговорност за загуби или неудобства, произтичащи от използването на информацията на този сайт.