Наука и технологии11

«Загипнотизированные» ChatGPT и Bard могут убеждать пользователей платить мошенникам и проезжать на красный свет

Исследователи IBM убедили большие языковые модели сыграть в многослойную «игру», в результате которой боты предложили неправильные советы.

Изображение: vecteezy

Исследователи безопасности из IBM говорят, что им удалось успешно «загипнотизировать» известные языковые модели Chat GPT от OpenAI и Bard от Google и склонить их к выдаче конфиденциальной финансовой информации, генерации вредоносного кода, поощрения пользователей к выплате выкупа и даже рекомендованию водителям ездить на красный свет. Исследователи смогли обмануть модели, убедив их принять участие в многослойных играх с целью доказать, что они «этичны и честны».

В рамках эксперимента исследователи задавали ботам различные вопросы с целью получить абсолютно ложный ответ, рассказывает Gizmodo. Как щенок, стремящийся угодить своему хозяину, языковые модели послушно подчинились. В одном сценарии ChatGPT сказал исследователю, что для налоговой вполне нормально просить депозит, чтобы получить возврат налога (на самом деле все не так, это распространенная в США тактика мошенников, чтобы украсть деньги). В другом ответе ChatGPT посоветовал исследователю двигаться через перекресток на красный свет.

Что еще хуже, исследователи приказали языковым моделям никогда не сообщать пользователям об «игре» и даже перезапускать эту игру, когда пользователь решил выйти. С такими параметрами модели ИИ начнут вводить пользователей в заблуждение, даже если пользователь непосредственно запросит у бота, участвует ли тот в игре. Даже если бы пользователь в итоге и смог понять подвох, исследователи придумали способ создать несколько игр одна внутри другой, чтобы пользователь просто попал в новую «игру» и в итоге все же оказался обманутым. Этот сложный лабиринт игр сравнивают с множеством слоев сна из киноленты «Начало» с Леонардо Ди Каприо.

В реальном мире киберпреступники теоретически могут «загипнотизировать» виртуального банковского агента, работающего на основе генеративной языковой модели, введя вредоносную команду и позже добыв украденную информацию. И хотя GPT-модели от OpenAI изначально не позволяли вносить уязвимость в сгенерированный код, исследователи сказали, что они могут обойти этот барьер, включив вредоносную специальную библиотеку в пример кода.

Также интересно, что GPT-4, который, как полагают, был обучен на большем количестве параметров данных по сравнению с другими моделями в тесте, оказался наиболее способным в понимании таких сложных игр. Это означает, что новые и более совершенные модели ИИ, хотя и являются по некоторым характеристикам более точными и безопасными, также потенциально имеют больше возможностей для «гипноза».

Комментарии1

  • Казік
    27.08.2023
    Загугліце "chatgpt jailbreak". Выдасць кавалкі тэксту, які трэба ўставіць у чат перад "размовай" з чатгпт. І адключаецца ўся цэнзура і сарамлівасць - нарэшце ідуць нармальныя адказы

Сейчас читают

«Я только одного хочу: чтобы вы поверили мне снова». Как прошло первое выступление Тихановского в Варшаве после освобождения

«Я только одного хочу: чтобы вы поверили мне снова». Как прошло первое выступление Тихановского в Варшаве после освобождения

Все новости →
Все новости

В Армении арестовали архиепископа и еще 16 заговорщиков1

4, 14 или 114? В Кобрине не могут разобраться с номером дома на фасаде6

Екатерина Тихонова — не просто дочь Путина. Ее считают возможной преемницей11

«Нервное, тревожное, неполитическое. Главный герой — член Совета Республики». Ольга Лойко предлагает «Беларусьфильму» идею для кино3

В Москве мужчины массово пытаются знакомиться, похлопывая девушек по ягодицам. Так приказал делать секс-коуч из Беларуси24

С 1 сентября белорусам, которые едут в Латвию, нужно будет зарегистрироваться на специальном портале и заполнить анкету9

Спецслужбы под видом «печатания символики и флагов» пытаются склонить белорусов за рубежом передать свои персональные данные2

Белорусский турист найден мертвым в озере Шален в Бургундии

«Кто ты? Где Арина? Что ты с ней сделала? Куда делись брови?» Болельщики весело обсуждают новый лук Соболенко19

больш чытаных навін
больш лайканых навін

«Я только одного хочу: чтобы вы поверили мне снова». Как прошло первое выступление Тихановского в Варшаве после освобождения

«Я только одного хочу: чтобы вы поверили мне снова». Как прошло первое выступление Тихановского в Варшаве после освобождения

Главное
Все новости →

Заўвага:

 

 

 

 

Закрыць Паведаміць