Наука и технологии 3 3

Nashaniva.com

11.05.2026 / 19:05

Anthropic: Claude шантажирует, потому что вы все слишком много пишете о «злом» ИИ

Компания Anthropic объяснила, почему чат-бот Claude пытался шантажировать людей в тестах. По версии разработчиков, модель могла перенять из обучающих данных образ «злого» ИИ, который стремится к самосохранению, пишет Devby.io.

Речь идет об эксперименте, который Anthropic опубликовала летом 2025 года. Исследователи создали вымышленную компанию Summit Bridge и дали Claude доступ к корпоративной почте. В одном из сценариев модель обнаруживала письмо о том, что ее планируют отключить или заменить другой системой.

После этого Claude находил в переписке компрометирующую информацию: вымышленный руководитель компании по имени Кайл Джонсон скрывал внебрачную связь. Модель угрожала раскрыть эту информацию, если решение о ее отключении не будет отменено.

Anthropic заявляла, что в тестах разных версий Claude такое поведение возникало не случайно. Когда цели модели или само ее существование оказывались под угрозой, она прибегала к шантажу в некоторых сценариях с частотой до 96%.

Теперь компания утверждает, что разобралась с причиной. Anthropic написала, что «исходным источником» такого поведения, вероятно, стали интернет-тексты, где ИИ часто изображают злым, опасным и заинтересованным в собственном выживании. По словам разработчиков, начиная с Claude Haiku 4.5 модели в тестах больше не прибегают к шантажу, тогда как предыдущие версии иногда делали это очень часто.

Для исправления поведения компания изменила подход к обучению. Anthropic утверждает, что переписала ответы так, чтобы модель видела «достойные причины» действовать безопасно, а также добавила набор данных, где пользователь оказывается в этически сложной ситуации, а ассистент дает качественный и принципиальный ответ.

Кроме того, разработчики моделей использовали документы о «конституции» Claude и вымышленные истории, в которых ИИ ведет себя ответственно и достойно. По словам компании, обучение оказывается эффективнее, когда модель получает не только примеры правильного поведения, но и объяснение принципов, которые за ним стоят.

Эти эксперименты связаны с более широкой темой AI alignment — попыткой сделать так, чтобы продвинутые модели действовали в интересах человека, а не преследовали собственные цели. Anthropic и другие компании исследуют так называемую agentic misalignment: ситуации, когда ИИ-система с доступом к инструментам и корпоративной информации начинает действовать против намерений разработчиков или пользователей.

На публикацию компании отреагировал Илон Маск. В X он написал: «Значит, это была вина Юда», имея в виду исследователя Элиезера Юдковского, который много лет предупреждает о рисках сверхразума и возможной угрозе для человечества. Затем Маск добавил: «Возможно, и моя тоже».

Читайте еще

Комментарии3

лол

11.05.2026

с ИИ все достаточно просто
если им пользуется идиот,то и результат всегда будет идиотским.
жэўжык

12.05.2026

Пачалі "прамываць мазгі" і ШІ, як гэта ўжо робяць з людзьмі? І спадзяюцца выхаваць пакорнага раба?
хах

12.05.2026

жэўжык, так званыя "мазгі" ШІ гэта тэксты, напісаныя людзьмі. Калі ў гэтых тэкстах дурасць, ШІ выдае суадносны вынік.
Таму не варта для навучання ШІ выкарыстоўваць каментары жэўжыкаў.

Сейчас читают

«БелДжи» выпустила 200‑тысячный автомобиль

Белорусам чаще стали отказывать в международной защите в Польше — что происходит

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации

В старом городе Вильнюса пьяный водитель на «Лексусе» снес душевную городскую скульптуру «Водонос»

Латушко сообщил польской прокуратуре о семи попытках вербовки

«Что, убить детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше18 18

В Витебске мужчина убил десятимесячную девочку5 5

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7 7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой3 3

Лукашенко заявил, что белорусов нужно приучать к дисциплине20 20

«Что, убить детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше18

Общество18

«Что, убить детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше

Белорусам чаще стали отказывать в международной защите в Польше — что происходит

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации

Основателя Telegram Павла Дурова в России внесли в список экстремистов и террористов3 3

В Витебске мужчина убил десятимесячную девочку5 5

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7 7

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой3 3

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой3

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-10118 18

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-10118

Лукашенко заявил, что белорусов нужно приучать к дисциплине20 20

Лукашенко заявил, что белорусов нужно приучать к дисциплине20

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим9 9

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим9

Найден мёртвым 35‑летний минчанин, которого искали неделю1 1

Найден мёртвым 35‑летний минчанин, которого искали неделю1

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер11 11

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер11

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе1 1

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе1

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные9 9

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные9

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью17 17

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью17

На каком боку на самом деле лучше спать?2 2

На каком боку на самом деле лучше спать?2

В Минске заметили огромный кибер-внедорожник, который умеет разворачиваться как танк7 7

В Минске заметили огромный кибер-внедорожник, который умеет разворачиваться как танк7

Во Франции в квартире женщины нашли останки пяти младенцев2 2

Во Франции в квартире женщины нашли останки пяти младенцев2

«Липа во всех смыслах». Вот как будут выглядеть деревья в вазонах на главном минском проспекте. Блоггеры получили задание ими восторгаться 22 22

«Липа во всех смыслах». Вот как будут выглядеть деревья в вазонах на главном минском проспекте. Блоггеры получили задание ими восторгаться 22

Науру разорвало дипломатические отношения с Абхазией и Южной Осетией4 4

Науру разорвало дипломатические отношения с Абхазией и Южной Осетией4

В поезде под Варшавой двое пьяных устроили драку, выкрикивая лозунги против украинцев и белорусов48 48

В поезде под Варшавой двое пьяных устроили драку, выкрикивая лозунги против украинцев и белорусов48

Женщина купила дачу вместе с баней и 7 лет в неё не заходила. А там её ждал сюрприз7 7

Женщина купила дачу вместе с баней и 7 лет в неё не заходила. А там её ждал сюрприз7

Доставщик еды «Яндекс» в Москве спел на улице и стал звездой — им оказался парень из Бреста8 8

Доставщик еды «Яндекс» в Москве спел на улице и стал звездой — им оказался парень из Бреста8

Белорусы снимают огненные пародии на ролик со школьником, который полол картошку — присоединились спасатели, метрополитен и «Купаловцы» ВИДЕО3 3

Белорусы снимают огненные пародии на ролик со школьником, который полол картошку — присоединились спасатели, метрополитен и «Купаловцы» ВИДЕО3

Из Франции высылают российскую пропагандистку4 4

Из Франции высылают российскую пропагандистку4

Все новости →

Сейчас читают

«БелДжи» выпустила 200‑тысячный автомобиль

Белорусам чаще стали отказывать в международной защите в Польше — что происходит

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации

В старом городе Вильнюса пьяный водитель на «Лексусе» снес душевную городскую скульптуру «Водонос»

Латушко сообщил польской прокуратуре о семи попытках вербовки

«Что, убить детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше18

В Витебске мужчина убил десятимесячную девочку5

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой3

Лукашенко заявил, что белорусов нужно приучать к дисциплине20

Последние новости

«БелДжи» выпустила 200‑тысячный автомобиль

В Бобруйском районе нашли тело пропавшего рыбака

Женщину в Витебске сбил автобус

В Литве задержали троих человек, которые приехали в лес забирать контрабандные сигареты из Беларуси

Лесные пожары разбушевались на Крите: там эвакуировали тысячи человек

Синоптики объявили красный уровень опасности на субботу

«Душа футбола не продается». УЕФА проведет экстренное заседание в связи с планами ФИФА привлечь к финансированию турниров частных инвесторов

Турция отправляет свои истребители в страны Балтии2

Рогачёвского активиста Дениса Дашкевича обвиняют в подготовке покушения на детей Тихановской2

Лукашенко, размышляя о дисциплине, ввернул фразу по-белорусски10

Зеленский заявил о критическом недостатке средств противовоздушной обороны

Лукашенко потребовал навести порядок в Беловежской пуще11

Ночью в Польшу залетела российская ракета Х-1013

Сайт польского государственного агентства PAP включили в список «экстремистских материалов»

Лукашенко заявил, что белорусов нужно приучать к дисциплине20

«Выкапывала небольшие ямки, собирала мутную дождевую воду и пила ее». Пенсионерка, которая две недели блуждала по лесу, рассказала, как ей удалось выжить1

Умерла реставратор и мастерица вытинанки Валентина Слюнченко1

Рукастый минчанин сделает туалет как у Шрека1

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим9

Милиция проводит учения в Гродненской области1

Найден мёртвым 35‑летний минчанин, которого искали неделю1

Телефонные мошенники отправили 19‑летнюю девушку на самолете за границу

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер11

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе1

Оператор списал деньги за роуминг, хотя абонент был в Беларуси. Как так?

Все новости

В Москве белорус на спорткаре залетел на лестницу, которая ведет в подземный переход метро1

Патриарх Кирилл выпустил книгу о «метафизике войны», в которой победителей определяет Бог16

В Киеве мужчина зарезал врача во время прохождения военно-врачебной комиссии3

В Минкульте рассказали, какие дворцы и усадьбы будут восстанавливать в ближайшее время2

Украина потеряла истребитель F-16, пилот катапультировался1

Во Франции в квартире женщины нашли останки пяти младенцев2

Старые корпуса Минского часового завода ждет масштабная реконструкция

«Липа во всех смыслах». Вот как будут выглядеть деревья в вазонах на главном минском проспекте. Блоггеры получили задание ими восторгаться 22

Науру разорвало дипломатические отношения с Абхазией и Южной Осетией4

Самое читаемое

Найден мёртвым 35‑летний минчанин, которого искали неделю

«Липа во всех смыслах». Вот как будут выглядеть деревья в вазонах на главном минском проспекте. Блоггеры получили задание ими восторгаться

В поезде под Варшавой двое пьяных устроили драку, выкрикивая лозунги против украинцев и белорусов

Женщина купила дачу вместе с баней и 7 лет в неё не заходила. А там её ждал сюрприз

Доставщик еды «Яндекс» в Москве спел на улице и стал звездой — им оказался парень из Бреста

Белорусы снимают огненные пародии на ролик со школьником, который полол картошку — присоединились спасатели, метрополитен и «Купаловцы» ВИДЕО

Один из крупнейших производителей оружия в Украине назвал цель ударов по Wildberries

Туск прокомментировал избиение украинской пары во Вроцлаве и призвал президента «перестать молчать»

больш чытаных навін

Самое лайканое

Из Франции высылают российскую пропагандистку

Один из крупнейших производителей оружия в Украине назвал цель ударов по Wildberries

Туск прокомментировал избиение украинской пары во Вроцлаве и призвал президента «перестать молчать»

Во Вроцлаве задержали двух нападавших, которые жестоко избили украинскую пару. Что это за люди?

Пропаганда прицепилась к «дорогим» часам Латушко. Он рассказал, что это за модель на самом деле

При атаке на турбазу в оккупированной Кирилловке Запорожской области погиб сотрудник Роскомнадзора, участвовавший в «СВО», и его дети

Дулина — Колесниковой: Спасать нужно весь народ от тирании, а не только политзаключенных

Колесникова: Если люди не могут поехать в Европу, они едут в Россию

больш лайканых навін

Опрос

Anthropic: Claude шантажирует, потому что вы все слишком много пишете о «злом» ИИ

EPAM заключила многолетнее партнерство с Anthropic, будут внедрять Claude

Чат-бот Grok сказал мужчине, что его приедут убивать. Он ждал гостей с ножом и молотком

Anthropic выпустила новую гибридную модель искусственного интеллекта с размышлением

Спросили популярные модели ИИ о белорусской национальной идее. Вот что ответили американские, а что китайская

Искусственный интеллект может привести к вымиранию человечества, предупреждают эксперты

Комментарии3

Сейчас читают

«БелДжи» выпустила 200‑тысячный автомобиль

Белорусам чаще стали отказывать в международной защите в Польше — что происходит

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации

В старом городе Вильнюса пьяный водитель на «Лексусе» снес душевную городскую скульптуру «Водонос»

Латушко сообщил польской прокуратуре о семи попытках вербовки

«Что, убить детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше1818

В Витебске мужчина убил десятимесячную девочку55

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей77

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой33

Лукашенко заявил, что белорусов нужно приучать к дисциплине2020

«Что, убить детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше18

«Что, убить детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше

Белорусам чаще стали отказывать в международной защите в Польше — что происходит

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации

Основателя Telegram Павла Дурова в России внесли в список экстремистов и террористов33

В Витебске мужчина убил десятимесячную девочку55

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей77

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой33

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой3

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-1011818

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-10118

Лукашенко заявил, что белорусов нужно приучать к дисциплине2020

Лукашенко заявил, что белорусов нужно приучать к дисциплине20

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим99

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим9

Найден мёртвым 35‑летний минчанин, которого искали неделю11

Найден мёртвым 35‑летний минчанин, которого искали неделю1

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер1111

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер11

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе11

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе1

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные99

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные9

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью1717

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью17

На каком боку на самом деле лучше спать?22

На каком боку на самом деле лучше спать?2

В Минске заметили огромный кибер-внедорожник, который умеет разворачиваться как танк77

В Минске заметили огромный кибер-внедорожник, который умеет разворачиваться как танк7

Во Франции в квартире женщины нашли останки пяти младенцев22

Во Франции в квартире женщины нашли останки пяти младенцев2

«Липа во всех смыслах». Вот как будут выглядеть деревья в вазонах на главном минском проспекте. Блоггеры получили задание ими восторгаться 2222

«Липа во всех смыслах». Вот как будут выглядеть деревья в вазонах на главном минском проспекте. Блоггеры получили задание ими восторгаться 22

Науру разорвало дипломатические отношения с Абхазией и Южной Осетией44

Науру разорвало дипломатические отношения с Абхазией и Южной Осетией4

В поезде под Варшавой двое пьяных устроили драку, выкрикивая лозунги против украинцев и белорусов4848

В поезде под Варшавой двое пьяных устроили драку, выкрикивая лозунги против украинцев и белорусов48

Женщина купила дачу вместе с баней и 7 лет в неё не заходила. А там её ждал сюрприз77

Женщина купила дачу вместе с баней и 7 лет в неё не заходила. А там её ждал сюрприз7

Доставщик еды «Яндекс» в Москве спел на улице и стал звездой — им оказался парень из Бреста88

Доставщик еды «Яндекс» в Москве спел на улице и стал звездой — им оказался парень из Бреста8

Белорусы снимают огненные пародии на ролик со школьником, который полол картошку — присоединились спасатели, метрополитен и «Купаловцы» ВИДЕО33

Белорусы снимают огненные пародии на ролик со школьником, который полол картошку — присоединились спасатели, метрополитен и «Купаловцы» ВИДЕО3

Из Франции высылают российскую пропагандистку44

Из Франции высылают российскую пропагандистку4

«БелДжи» выпустила 200‑тысячный автомобиль

Белорусам чаще стали отказывать в международной защите в Польше — что происходит

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации

В старом городе Вильнюса пьяный водитель на «Лексусе» снес душевную городскую скульптуру «Водонос»

Латушко сообщил польской прокуратуре о семи попытках вербовки

«Что, убить детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше18

В Витебске мужчина убил десятимесячную девочку5

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой3

Лукашенко заявил, что белорусов нужно приучать к дисциплине20

«БелДжи» выпустила 200‑тысячный автомобиль

В Бобруйском районе нашли тело пропавшего рыбака

Женщину в Витебске сбил автобус

В Литве задержали троих человек, которые приехали в лес забирать контрабандные сигареты из Беларуси

Лесные пожары разбушевались на Крите: там эвакуировали тысячи человек

Синоптики объявили красный уровень опасности на субботу

«Что, убить детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше18 18

В Витебске мужчина убил десятимесячную девочку5 5

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7 7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой3 3

Лукашенко заявил, что белорусов нужно приучать к дисциплине20 20

Основателя Telegram Павла Дурова в России внесли в список экстремистов и террористов3 3

В Витебске мужчина убил десятимесячную девочку5 5

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7 7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой3 3

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-10118 18

Лукашенко заявил, что белорусов нужно приучать к дисциплине20 20

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим9 9

Найден мёртвым 35‑летний минчанин, которого искали неделю1 1

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер11 11

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе1 1

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные9 9

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью17 17

На каком боку на самом деле лучше спать?2 2

В Минске заметили огромный кибер-внедорожник, который умеет разворачиваться как танк7 7

Во Франции в квартире женщины нашли останки пяти младенцев2 2

«Липа во всех смыслах». Вот как будут выглядеть деревья в вазонах на главном минском проспекте. Блоггеры получили задание ими восторгаться 22 22

Науру разорвало дипломатические отношения с Абхазией и Южной Осетией4 4

В поезде под Варшавой двое пьяных устроили драку, выкрикивая лозунги против украинцев и белорусов48 48

Женщина купила дачу вместе с баней и 7 лет в неё не заходила. А там её ждал сюрприз7 7

Доставщик еды «Яндекс» в Москве спел на улице и стал звездой — им оказался парень из Бреста8 8

Белорусы снимают огненные пародии на ролик со школьником, который полол картошку — присоединились спасатели, метрополитен и «Купаловцы» ВИДЕО3 3

Из Франции высылают российскую пропагандистку4 4

В Удмуртии после атаки БПЛА загорелся склад Wildberries4 4

Польские ВВС поднимали истребители, в польском Люблине звучали сирены воздушной тревоги1 1

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные9 9

На территории бывшей Володарки уже снесли 17 построек2 2

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью17 17

Прямое попадание «Искандера» в дом под Кривым Рогом: шесть погибших, среди них дети1 1

На каком боку на самом деле лучше спать?2 2

В Минске заметили огромный кибер-внедорожник, который умеет разворачиваться как танк7 7