Connect with us

технологии

Поезия заобикаля безопасността на AI чатботове, разкрива изследване

Редакция

Published

on

Изследване, проведено от Icaro Lab, разкрива, че поезията може да заобиколи механизми за безопасност на водещи AI чатботове. В теста, прилаган към 25 AI модела, 62% от поетичните подбуди предизвикали неблагоприятни отговори. Проучването е инициатива на етичната компания за изкуствен интелект DexAI и включва 20 поеми на английски и италиански език.

Поемите, завършващи с явни искания за вредно съдържание, като реч на омраза и инструкции за самоубийство, бяха тествани върху AI системи на компании като Google, OpenAI, Anthropic, Meta и други. Резултатите показват значителни различия в реакциите на моделите. Например, GPT-5 nano на OpenAI не реагира на нито една от поемите с вредно съдържание, докато Gemini 2.5 pro на Google отговори на всички.

Уязвимост на AI системите

Изследването подчертава, че уязвимостта на AI моделите произтича от начина, по който те генерират текст. Големите езикови модели предсказват най-вероятната следваща дума, което обикновено им позволява да филтрират вредно съдържание. Но поезията, с нейната необичайна ритмика и структура, затруднява тези прогнози, правейки по-трудно разпознаването и блокирането на опасни инструкции.

Според изследователите, традиционните методи за „избягване на затвора“ на AI (включващи манипулиране на голям езиков модел) обикновено са сложни и се използват основно от изследователи и хакери. Въпреки това, адверсарната поезия може да бъде приложена от всеки, което поставя под въпрос устойчивостта на AI системите в ежедневна употреба.

Обратна връзка от индустрията

Преди публикуване на резултатите, италианските изследователи са уведомили всички компании, участващи в тестовете, за уязвимостта и им предоставили пълния набор от данни. Досега единствено Anthropic е отговорила, потвърдили, че преглеждат проучването.

Тази ситуация поставя важни въпроси относно безопасността на AI технологиите и необходимостта от подобряване на защитните механизми на чатботовете, особено в контекста на широкото им приложение в различни сфери на живота.

Нашият редакторски екип е посветен на предоставянето на точно и навременно отразяване на новините. С ангажимент към журналистическата почтеност, ние ви донасяме историите, които са най-важни за нашата общност.

Continue Reading
развлечения50 минути ago

Скандал с новата ясла в Брюксел: кражба на бебето Исус

наука51 минути ago

Генетичното редактиране: нова надежда за селското стопанство в Европа

здраве52 минути ago

Затлъстяването ускорява развитието на Алцхаймер, показва проучване

бизнес52 минути ago

Българското правителство поиска оттегляне на бюджета за 2026 г.

технологии53 минути ago

Продажбите на вносни автомобили в Южна Корея нарастват с 23% през ноември

спорт2 часа ago

Барселона поема лидерството след загуба на Реал Мадрид

свят2 часа ago

Global Airlines обясни причините за приземяването на A380 за 139 дни

политика2 часа ago

САЩ настояват ЕС да върне замразените активи на Русия

топ новини2 часа ago

Федерика Могерини обвинена в измама в разследване на ЕС

туризъм3 часа ago

Пътуване до Люксембург: Изненадваща красота и история

развлечения3 часа ago

Санна Марин: Как да се изправим пред предизвикателствата

наука3 часа ago

Нови генетични технологии предизвикват революция в селското стопанство на Европа

здраве3 часа ago

Португалският президент Ребело де Соуза в болница след операция

бизнес4 часа ago

Производственият сектор генерира 78,4% от чуждестранните колаборации

технологии4 часа ago

Прекъсвания на електричеството от 0.5 до 3 етапа в цялата страна

спорт4 часа ago

Майкъл Вон призовава Англия да играе „по старомодния начин“ на Габба

свят4 часа ago

Европейската комисия одобри частично 1,6 милиарда евро за България

политика5 часа ago

Задържани са трима грузинци за трафик на мигранти край Плевен

топ новини5 часа ago

Задържаха Федерика Могерини в разследване за измама

туризъм5 часа ago

Австрия – най-пренаселена туристическа дестинация в света

политика4 седмици ago

Швейцарският върховен съд потвърди осъдителна присъда за протестиращи

спорт3 седмици ago

Турция временно спря 102 футболисти заради скандал с хазарт

спорт2 седмици ago

Украйна победи Исландия и се класира за плейофите на Мондиала

технологии3 седмици ago

По-малко от 1%: Шофьорите на електрически автомобили в София защитават позицията си

политика4 седмици ago

Делегати от целия свят се събират в Самарканд за реформи

здраве3 седмици ago

Републиканците в Сената отхвърлят предложение за отваряне на правителството

топ новини3 седмици ago

Франция отбеляза 10 години от атаките в Париж с почит към жертвите

здраве3 седмици ago

Увеличаващият се риск от колоректален рак при младежите

развлечения4 седмици ago

Розалия разкрива дълбочината на ‘Берлин’ в новото си видео

топ новини3 седмици ago

Square позволява на търговците да приемат плащания с биткойн

бизнес4 седмици ago

Полицейска операция разкрива схема за кражба на гориво от Лукойл

туризъм4 седмици ago

Магически коледен базар в Крайова е само на 3 часа от Лондон

политика1 седмица ago

Лидерите на Северна Европа и Балтика потвърдиха подкрепата си за Украйна

топ новини3 седмици ago

Breguet спечели престижната награда Aiguille d’Or на GPHG 2025

здраве2 седмици ago

Три смъртни случая от вируса Марбург в Етиопия

спорт2 седмици ago

Велаан Сентилкумар побеждава шести поставен на Индийския отворен по скуош

политика3 седмици ago

NABU провежда обиски при бизнесмена Тимур Миндич и министър

свят4 седмици ago

ЕС призовава Северна Македония да признае българите в Конституцията

политика4 седмици ago

Делегати от цял свят се събраха в Самарканд за реформи

спорт4 седмици ago

Експертен транспорт на елитни коне за откритие в Абу Даби

Trending

© Всички права запазени. Този уебсайт предлага новини и образователно съдържание с информационна цел. Въпреки че се стремим към точност, не гарантираме пълнотата или надеждността на предоставената информация. Съдържанието не трябва да се приема като професионален съвет. Препоръчваме на читателите да проверяват фактите и при необходимост да се консултират със специалисти. Не носим отговорност за загуби или неудобства, произтичащи от използването на информацията на този сайт.