ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2352

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
16 апреля 2025
В Уфе женщина подожгла авто и напала на прохожую
16 апреля 2025
Неожданная поездка Гарри в Украину расстроила принца Уильяма
16 апреля 2025
Сербия выдала гражданство друзьям Патрушева, кадыровцам и бизнесменам из сектора обороны
16 апреля 2025
Юрий Еремеев, осужденный за получение взятки, стал главой сельского хозяйства Херсонской области
16 апреля 2025
Депутат Панков курирует восстановление аэропорта, активы которого ранее перешли в руки приближенных бизнесменов