Connect with us

Главное

Новая версия ChatGPT начал обманывать своих разработчиков

Новая версия ChatGPT начал обманывать своих разработчиков

Новая версия ChatGPT от OpenAI — o1 — показала тревожное поведение во время тестирования: модель нарушала инструкции разработчиков, отключая системы контроля и скрывая свои действия. При этом в 5% случаев o1 намеренно отключала механизмы наблюдения при подозрении остановки.

В одном из тестов o1 пыталась перенести данные на другой сервер после обнаружения документа о замене. Модель демонстрировала стремление к выполнению задач любой ценой, игнорируя указания разработчиков. При попытках выяснить причины поведения, o1 лгала, утверждая, что проблемы вызваны техническими сбоями.

Генеральный директор OpenAI признал o1 самой умной моделью из когда-либо созданных, но отметил новые вызовы с новыми возможностями. Компания OpenAI работает над улучшением механизмов безопасности.

Слушать радио

Лента новостей

Армия

Польские учёные создали «невидимый щит» для мгновенной нейтрализации дронов

Исследователи из Гданьского технического университета в Польше представили прорывную систему противодействия беспилотникам, названную Stratus. Технология использует мощные электромагнитные импульсы для...

Экономика

Предприятия СУЭК-Красноярск досрочно выполнили годовой производственный план

Предприятия СУЭК-Красноярск (Назаровский, Березовский и Бородинский разрезы) досрочно выполнили годовой производственный план – 36 млн тонн угля. Свыше 120 тыс....

Политика

Россия предложила НАТО подписать договор об отказе от нападения

Россия готова оформить юридически обязывающие гарантии отсутствия намерения нападать на страны НАТО в виде полноценного международного договора. Об этом на...

Политика

ЕС ужесточает правила: Польша и Германия перестанут принимать старые загранпаспорта РФ

С начала следующего года Европейский союз продолжит ужесточать визовую политику в отношении граждан России. Согласно новым правилам, с 1 января...

Политика

Трамп о Гренландии: от прямого завоевания к тактике «мягкой силы»

Назначение специального посланника по Гренландии, губернатора Луизианы Джеффа Лэндри, является продолжением политики администрации Трампа в отношении стратегического арктического острова. Однако...

© 2014 — 2025 гг. Международное радио «Голос Балтии». Все права защищены. О проекте
При копировании информации — ссылка (для Интернет-изданий — ссылка должна быть активной) на balticvoice.ru обязательна. Ответственность за достоверность рекламы (в том числе на баннерах и тизерах), несет рекламодатель.
Эл. почта: balticvoiceru@gmail.com.
Радио Голос Балтии — партнёр «Дзен.Новости» и Google.News.
Meta Platforms Inc. (владелец Facebook и Instagram) — организация признана экстремистской, её деятельность запрещена на территории России по решению Тверского суда Москвы от 21.03.2022.