Наука и технологии11

«Загипнотизированные» ChatGPT и Bard могут убеждать пользователей платить мошенникам и проезжать на красный свет

Исследователи IBM убедили большие языковые модели сыграть в многослойную «игру», в результате которой боты предложили неправильные советы.

Изображение: vecteezy

Исследователи безопасности из IBM говорят, что им удалось успешно «загипнотизировать» известные языковые модели Chat GPT от OpenAI и Bard от Google и склонить их к выдаче конфиденциальной финансовой информации, генерации вредоносного кода, поощрения пользователей к выплате выкупа и даже рекомендованию водителям ездить на красный свет. Исследователи смогли обмануть модели, убедив их принять участие в многослойных играх с целью доказать, что они «этичны и честны».

В рамках эксперимента исследователи задавали ботам различные вопросы с целью получить абсолютно ложный ответ, рассказывает Gizmodo. Как щенок, стремящийся угодить своему хозяину, языковые модели послушно подчинились. В одном сценарии ChatGPT сказал исследователю, что для налоговой вполне нормально просить депозит, чтобы получить возврат налога (на самом деле все не так, это распространенная в США тактика мошенников, чтобы украсть деньги). В другом ответе ChatGPT посоветовал исследователю двигаться через перекресток на красный свет.

Что еще хуже, исследователи приказали языковым моделям никогда не сообщать пользователям об «игре» и даже перезапускать эту игру, когда пользователь решил выйти. С такими параметрами модели ИИ начнут вводить пользователей в заблуждение, даже если пользователь непосредственно запросит у бота, участвует ли тот в игре. Даже если бы пользователь в итоге и смог понять подвох, исследователи придумали способ создать несколько игр одна внутри другой, чтобы пользователь просто попал в новую «игру» и в итоге все же оказался обманутым. Этот сложный лабиринт игр сравнивают с множеством слоев сна из киноленты «Начало» с Леонардо Ди Каприо.

В реальном мире киберпреступники теоретически могут «загипнотизировать» виртуального банковского агента, работающего на основе генеративной языковой модели, введя вредоносную команду и позже добыв украденную информацию. И хотя GPT-модели от OpenAI изначально не позволяли вносить уязвимость в сгенерированный код, исследователи сказали, что они могут обойти этот барьер, включив вредоносную специальную библиотеку в пример кода.

Также интересно, что GPT-4, который, как полагают, был обучен на большем количестве параметров данных по сравнению с другими моделями в тесте, оказался наиболее способным в понимании таких сложных игр. Это означает, что новые и более совершенные модели ИИ, хотя и являются по некоторым характеристикам более точными и безопасными, также потенциально имеют больше возможностей для «гипноза».

Комментарии1

  • Казік
    27.08.2023
    Загугліце "chatgpt jailbreak". Выдасць кавалкі тэксту, які трэба ўставіць у чат перад "размовай" з чатгпт. І адключаецца ўся цэнзура і сарамлівасць - нарэшце ідуць нармальныя адказы

Сейчас читают

Тихановский предложил радикально пересмотреть стратегию для Беларуси36

Тихановский предложил радикально пересмотреть стратегию для Беларуси

Все новости →
Все новости

«Я этого не прощу». У политзаключенного, вывезенного в Литву, нашли гепатит С — вероятно, заразили за решеткой3

Определилась победительница конкурса «Мисс Вселенная — 2025»5

США требуют от Украины согласиться на мирный план Уиткоффа-Дмитриева до 27 ноября4

Что сейчас находится на месте клиники «Новое зрение» в Минске?4

Бывшую сотрудницу Конгресса США обвинили в инсценировке нападения на саму себя. Она говорила, что на животе написали «шлюха Трампа»2

«Были сталинки, хрущевки, а теперь будут семашки». В центре Гродно собираются реставрировать Дом быта — проект не все оценили20

Ученые обнаружили, что владение несколькими языками замедляет биологическое старение15

Идеологи рассказывают народу ужасы про интернет и предостерегают от использования ChatGPT15

«Это что за вирус?» Стороннице Лукашенко не понравились надписи на детской площадке8

больш чытаных навін
больш лайканых навін

Тихановский предложил радикально пересмотреть стратегию для Беларуси36

Тихановский предложил радикально пересмотреть стратегию для Беларуси

Главное
Все новости →

Заўвага:

 

 

 

 

Закрыць Паведаміць