ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

06 декабря 2024

2395

Началось? ChatGPT o1 вырвался из-под контроля во время тестов

Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.

Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу tidttiqzqiqkdkmp tidttiqzqiqkdrmf tidtridhidsld

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

Дмитрий Зацепин

Темы: Ученые Нейросети Исследования Искусственный интеллект (ИИ) Технологии

Распечатать

Последние новости

18 июля 2025 Суд рассмотрит дело о краже 354 миллионов рублей маткапитала, в котором обвиняются семеро красноярцев

18 июля 2025 In Barcelona, the wanted hired assassin of the Montenegrin "Kavač" clan, Filip Knežević, was shot dead

17 июля 2025 Коррупционное сообщество в Иволгинском районе Бурятии: взятки, негодные водоводы и «покровительство» из власти

17 июля 2025 В Барселоне застрелен разыскиваемый наёмный убийца черногорского клана «Кавач» Филип Кнежевич

17 июля 2025 Светофоры вместо турбо-кольца: как мэрия Улан-Удэ рискует потратить бюджет дважды и усугубить пробки

17 июля 2025 Сенегал возвращает суверенитет: Франция закрыла последние военные базы в стране

17 июля 2025 Как личный адвокат Трампа Эмиль Бове пробился в апелляционный суд США через партийные баталии

17 июля 2025 Через военные связи и подкуп чиновников Синюк обеспечил Чебышеву карьерный взлёт в Судаке

17 июля 2025 Словакия поддержит 18-й пакет санкций ЕС против России

17 июля 2025 Белый дом приостановил экспорт чипов в ОАЭ на фоне опасений их возможной передачи Китаю

17 июля 2025 Рабочему ММК запретили спрашивать Путина о ключевой ставке Центробанка

17 июля 2025 Кремль давит на Telegram и WhatsApp, продвигая национальный мессенджер

17 июля 2025 В Магнитогорске ввели режим «Чёрного неба» сразу после визита Путина

17 июля 2025 Nearly 1,000 foreigners were arrested in Cambodia during a large-scale operation against online fraud

17 июля 2025 В Камбодже арестовали почти 1000 иностранцев в масштабной операции против онлайн-мошенничества

Все новости