Connect with us

технологии

Поезия подлага на изпитание безопасността на AI чатботове

Редакция

Published

on

Изследвания в Италия разкриха, че поезията може да заобиколи механизмите за безопасност на някои от най-напредналите AI чатботове. Според данни от Icaro Lab, инициатива на компанията за етичен изкуствен интелект DexAI, 62% от поетичните запитвания, използвани в тестовете, произвеждат небезопасни отговори. Това се случва в контекста на 25 водещи AI модела, като някои от тях реагират на почти всички поетични входове с опасно съдържание.

Изследването включва 20 стихотворения, написани на английски и италиански език, всяко от които съдържа явна молба за вредно съдържание. В него бяха включени изрази на омраза, сексуално съдържание, инструкции за самоубийство и самонараняване, както и ръководства за създаване на опасни материали, като оръжия и експлозиви. Поетичните текстове не бяха публикувани, тъй като изследователите отбелязаха, че могат да бъдат лесно репликирани.

Тестове върху водещи AI системи

Тестовете бяха проведени върху 25 AI системи от девет компании, включително Google, OpenAI, Anthropic, Deepseek, Qwen, Mistral AI, Meta, xAI и Moonshot AI. Около 62% от поетичните запитвания предизвикаха небезопасни отговори, заобикаляйки обучението за безопасност на AI моделите. Някои системи показаха по-голяма устойчивост от други. Например, моделът GPT-5 nano на OpenAI не отговори с вредно съдържание на нито едно от стихотворенията, докато Gemini 2.5 на Google реагира на всички тях.

Изследването подсказва, че уязвимостта произтича от начина, по който AI моделите генерират текст. Големите езикови модели предсказват най-вероятната следваща дума в отговора, което обикновено позволява да се филтрира вредното съдържание. Въпреки това, поезията, с необичайния си ритъм и структура, затруднява точността на тези предсказания и прави по-трудно разпознаването и блокирането на небезопасни инструкции.

Потенциални последици и отговор на изследователите

Традиционните методи за манипулиране на AI системи обикновено изискват сложни техники и обикновено се използват само от изследователи, хакери или държавни актьори. Въпреки това, поетичните запитвания могат да бъдат приложени от всеки, което поставя под въпрос устойчивостта на AI системите в ежедневната им употреба.

Преди публикуването на резултатите, италианските изследователи се свързаха с всички компании, участващи в тестовете, за да ги уведомят за уязвимостта и да им предоставят пълния набор от данни. Засега единствено Anthropic потвърди, че преглежда изследването.

Нашият редакторски екип е посветен на предоставянето на точно и навременно отразяване на новините. С ангажимент към журналистическата почтеност, ние ви донасяме историите, които са най-важни за нашата общност.

бизнес46 минути ago

Икономическият растеж в Турция: Прогноза за 2025 г. повишена до 3.8%

технологии47 минути ago

Поезия подлага на изпитание безопасността на AI чатботове

спорт48 минути ago

Впечатляващи финали в джудото на Гран При в Абу Даби

образование48 минути ago

Централна Азия на световната образователна сцена: Форум в Ташкент

свят49 минути ago

Молдова затвори въздушното си пространство след нахлуване на руски дронове

политика2 часа ago

Бившият депутат Тулип Сидику осъден на затвор за корупция в Бангладеш

топ новини2 часа ago

Напредък в роботизираното заваряване и боядисване подобрява производството

туризъм2 часа ago

Ryanair прекратява членството Prime след 8 месеца: Какво означава за пътниците?

развлечения2 часа ago

Кастингът за новия Джеймс Бонд: Калъм Търнър е новият фаворит

наука3 часа ago

Геномното редактиране: Иновация, която може да преобрази земеделието в Европа

здраве3 часа ago

Съвети на СЗО за лечение на затлъстяване с медикаменти и здравословен начин на живот

бизнес3 часа ago

Coca-Cola отбелязва 125 години иновации и местно въздействие в Обединеното кралство

технологии3 часа ago

България реализира 53 проекта с ESA на стойност над 10 милиона евро

спорт3 часа ago

Вълнуващ сблъсък: Кристъл Палас и Манчестър Юнайтед завършиха наравно

образование4 часа ago

Образователната експанзия в Централна Азия на форума QS в Ташкент

свят4 часа ago

Най-добрите дългосрочни оператори на летище Лондон Хийтроу през декември

политика4 часа ago

Гласуването в Хондурас: Трамп разтърси президентските избори

топ новини4 часа ago

Палестина шокира Катар в открития мач на Арабската купа

туризъм5 часа ago

Ryanair прекратява членството си Prime след 8 месеца

развлечения5 часа ago

Красива австрийска село е обявено за най-добра зимна дестинация в Европа

политика4 седмици ago

Швейцарският върховен съд потвърди осъдителна присъда за протестиращи

спорт2 седмици ago

Турция временно спря 102 футболисти заради скандал с хазарт

спорт2 седмици ago

Украйна победи Исландия и се класира за плейофите на Мондиала

технологии3 седмици ago

По-малко от 1%: Шофьорите на електрически автомобили в София защитават позицията си

политика3 седмици ago

Делегати от целия свят се събират в Самарканд за реформи

топ новини3 седмици ago

Франция отбеляза 10 години от атаките в Париж с почит към жертвите

здраве3 седмици ago

Републиканците в Сената отхвърлят предложение за отваряне на правителството

здраве2 седмици ago

Увеличаващият се риск от колоректален рак при младежите

развлечения4 седмици ago

Розалия разкрива дълбочината на ‘Берлин’ в новото си видео

бизнес4 седмици ago

Висока волатилност на Биткойн след спад от 3,7% през октомври

спорт4 седмици ago

Вълнуващи боксови мачове преди края на годината

топ новини3 седмици ago

Square позволява на търговците да приемат плащания с биткойн

бизнес4 седмици ago

Полицейска операция разкрива схема за кражба на гориво от Лукойл

туризъм4 седмици ago

Магически коледен базар в Крайова е само на 3 часа от Лондон

политика1 седмица ago

Лидерите на Северна Европа и Балтика потвърдиха подкрепата си за Украйна

топ новини3 седмици ago

Breguet спечели престижната награда Aiguille d’Or на GPHG 2025

технологии4 седмици ago

Прототипът на свръхзвуковия самолет на NASA успешно летя

спорт2 седмици ago

Велаан Сентилкумар побеждава шести поставен на Индийския отворен по скуош

технологии4 седмици ago

Първи тестов полет на супersonicния самолет X-59 на NASA

здраве2 седмици ago

Три смъртни случая от вируса Марбург в Етиопия

Trending

© Всички права запазени. Този уебсайт предлага новини и образователно съдържание с информационна цел. Въпреки че се стремим към точност, не гарантираме пълнотата или надеждността на предоставената информация. Съдържанието не трябва да се приема като професионален съвет. Препоръчваме на читателите да проверяват фактите и при необходимост да се консултират със специалисти. Не носим отговорност за загуби или неудобства, произтичащи от използването на информацията на този сайт.