Connect with us

технологии

Поезия заобикаля безопасността на AI чатботове, разкрива изследване

Редакция

Published

on

Изследване, проведено от Icaro Lab, разкрива, че поезията може да заобиколи механизми за безопасност на водещи AI чатботове. В теста, прилаган към 25 AI модела, 62% от поетичните подбуди предизвикали неблагоприятни отговори. Проучването е инициатива на етичната компания за изкуствен интелект DexAI и включва 20 поеми на английски и италиански език.

Поемите, завършващи с явни искания за вредно съдържание, като реч на омраза и инструкции за самоубийство, бяха тествани върху AI системи на компании като Google, OpenAI, Anthropic, Meta и други. Резултатите показват значителни различия в реакциите на моделите. Например, GPT-5 nano на OpenAI не реагира на нито една от поемите с вредно съдържание, докато Gemini 2.5 pro на Google отговори на всички.

Уязвимост на AI системите

Изследването подчертава, че уязвимостта на AI моделите произтича от начина, по който те генерират текст. Големите езикови модели предсказват най-вероятната следваща дума, което обикновено им позволява да филтрират вредно съдържание. Но поезията, с нейната необичайна ритмика и структура, затруднява тези прогнози, правейки по-трудно разпознаването и блокирането на опасни инструкции.

Според изследователите, традиционните методи за „избягване на затвора“ на AI (включващи манипулиране на голям езиков модел) обикновено са сложни и се използват основно от изследователи и хакери. Въпреки това, адверсарната поезия може да бъде приложена от всеки, което поставя под въпрос устойчивостта на AI системите в ежедневна употреба.

Обратна връзка от индустрията

Преди публикуване на резултатите, италианските изследователи са уведомили всички компании, участващи в тестовете, за уязвимостта и им предоставили пълния набор от данни. Досега единствено Anthropic е отговорила, потвърдили, че преглеждат проучването.

Тази ситуация поставя важни въпроси относно безопасността на AI технологиите и необходимостта от подобряване на защитните механизми на чатботовете, особено в контекста на широкото им приложение в различни сфери на живота.

Нашият редакторски екип е посветен на предоставянето на точно и навременно отразяване на новините. С ангажимент към журналистическата почтеност, ние ви донасяме историите, които са най-важни за нашата общност.

Continue Reading
туризъм48 минути ago

Пътуване до Люксембург: Изненадваща красота и история

развлечения49 минути ago

Санна Марин: Как да се изправим пред предизвикателствата

наука49 минути ago

Нови генетични технологии предизвикват революция в селското стопанство на Европа

здраве50 минути ago

Португалският президент Ребело де Соуза в болница след операция

бизнес2 часа ago

Производственият сектор генерира 78,4% от чуждестранните колаборации

технологии2 часа ago

Прекъсвания на електричеството от 0.5 до 3 етапа в цялата страна

спорт2 часа ago

Майкъл Вон призовава Англия да играе „по старомодния начин“ на Габба

свят2 часа ago

Европейската комисия одобри частично 1,6 милиарда евро за България

политика3 часа ago

Задържани са трима грузинци за трафик на мигранти край Плевен

топ новини3 часа ago

Задържаха Федерика Могерини в разследване за измама

туризъм3 часа ago

Австрия – най-пренаселена туристическа дестинация в света

развлечения3 часа ago

Националната галерия в България представя интерактивна изложба за Захари Зограф

наука4 часа ago

Редактиране на гени: иновацията, която променя европейското земеделие

здраве4 часа ago

Съвети на СЗО за лечение на затлъстяване с лекарства и здравословен начин на живот

бизнес4 часа ago

Безработицата в България спада до 3.6% през октомври 2025 г.

технологии4 часа ago

Поезия заобикаля безопасността на AI чатботове, разкрива изследване

спорт4 часа ago

Почина легендата на тениса Никола Пиеранджели на 92 години

образование5 часа ago

Централна Азия на глобалната образователна сцена: Форум QS в Ташкент

свят5 часа ago

НАТО разглежда по-агресивен подход срещу Русия

политика5 часа ago

София оцелява след насилие, разследват масовото прекъсване на тока

политика4 седмици ago

Швейцарският върховен съд потвърди осъдителна присъда за протестиращи

спорт3 седмици ago

Турция временно спря 102 футболисти заради скандал с хазарт

спорт2 седмици ago

Украйна победи Исландия и се класира за плейофите на Мондиала

технологии3 седмици ago

По-малко от 1%: Шофьорите на електрически автомобили в София защитават позицията си

политика4 седмици ago

Делегати от целия свят се събират в Самарканд за реформи

здраве3 седмици ago

Републиканците в Сената отхвърлят предложение за отваряне на правителството

топ новини3 седмици ago

Франция отбеляза 10 години от атаките в Париж с почит към жертвите

здраве3 седмици ago

Увеличаващият се риск от колоректален рак при младежите

развлечения4 седмици ago

Розалия разкрива дълбочината на ‘Берлин’ в новото си видео

топ новини3 седмици ago

Square позволява на търговците да приемат плащания с биткойн

бизнес4 седмици ago

Полицейска операция разкрива схема за кражба на гориво от Лукойл

туризъм4 седмици ago

Магически коледен базар в Крайова е само на 3 часа от Лондон

политика1 седмица ago

Лидерите на Северна Европа и Балтика потвърдиха подкрепата си за Украйна

топ новини3 седмици ago

Breguet спечели престижната награда Aiguille d’Or на GPHG 2025

здраве2 седмици ago

Три смъртни случая от вируса Марбург в Етиопия

спорт2 седмици ago

Велаан Сентилкумар побеждава шести поставен на Индийския отворен по скуош

свят4 седмици ago

ЕС призовава Северна Македония да признае българите в Конституцията

политика4 седмици ago

Делегати от цял свят се събраха в Самарканд за реформи

спорт4 седмици ago

Експертен транспорт на елитни коне за откритие в Абу Даби

развлечения3 седмици ago

Дебат за преоръжаването на Европа в „Кръга“ на Евронюз

Trending

© Всички права запазени. Този уебсайт предлага новини и образователно съдържание с информационна цел. Въпреки че се стремим към точност, не гарантираме пълнотата или надеждността на предоставената информация. Съдържанието не трябва да се приема като професионален съвет. Препоръчваме на читателите да проверяват фактите и при необходимост да се консултират със специалисти. Не носим отговорност за загуби или неудобства, произтичащи от използването на информацията на този сайт.