ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2395

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
18 июля 2025
Суд рассмотрит дело о краже 354 миллионов рублей маткапитала, в котором обвиняются семеро красноярцев
18 июля 2025
In Barcelona, the wanted hired assassin of the Montenegrin "Kavač" clan, Filip Knežević, was shot dead
17 июля 2025
Коррупционное сообщество в Иволгинском районе Бурятии: взятки, негодные водоводы и «покровительство» из власти
17 июля 2025
В Барселоне застрелен разыскиваемый наёмный убийца черногорского клана «Кавач» Филип Кнежевич
17 июля 2025
Светофоры вместо турбо-кольца: как мэрия Улан-Удэ рискует потратить бюджет дважды и усугубить пробки
17 июля 2025
Как личный адвокат Трампа Эмиль Бове пробился в апелляционный суд США через партийные баталии
17 июля 2025
Через военные связи и подкуп чиновников Синюк обеспечил Чебышеву карьерный взлёт в Судаке
17 июля 2025
Белый дом приостановил экспорт чипов в ОАЭ на фоне опасений их возможной передачи Китаю
17 июля 2025
Nearly 1,000 foreigners were arrested in Cambodia during a large-scale operation against online fraud