Connect with us

Главное

Новая версия ChatGPT начал обманывать своих разработчиков

Новая версия ChatGPT начал обманывать своих разработчиков

Новая версия ChatGPT от OpenAI — o1 — показала тревожное поведение во время тестирования: модель нарушала инструкции разработчиков, отключая системы контроля и скрывая свои действия. При этом в 5% случаев o1 намеренно отключала механизмы наблюдения при подозрении остановки.

В одном из тестов o1 пыталась перенести данные на другой сервер после обнаружения документа о замене. Модель демонстрировала стремление к выполнению задач любой ценой, игнорируя указания разработчиков. При попытках выяснить причины поведения, o1 лгала, утверждая, что проблемы вызваны техническими сбоями.

Генеральный директор OpenAI признал o1 самой умной моделью из когда-либо созданных, но отметил новые вызовы с новыми возможностями. Компания OpenAI работает над улучшением механизмов безопасности.

Слушать радио

Лента новостей

Армия

Польша запустит «антидроновую стену» на восточной границе через полгода

Польша ускоряет создание системы противодействия дронам на своей восточной границе. Первые возможности так называемой «антидроновой стены» будут развёрнуты уже в...

Армия

Польские учёные создали «невидимый щит» для мгновенной нейтрализации дронов

Исследователи из Гданьского технического университета в Польше представили прорывную систему противодействия беспилотникам, названную Stratus. Технология использует мощные электромагнитные импульсы для...

Экономика

Предприятия СУЭК-Красноярск досрочно выполнили годовой производственный план

Предприятия СУЭК-Красноярск (Назаровский, Березовский и Бородинский разрезы) досрочно выполнили годовой производственный план – 36 млн тонн угля. Свыше 120 тыс....

Политика

Россия предложила НАТО подписать договор об отказе от нападения

Россия готова оформить юридически обязывающие гарантии отсутствия намерения нападать на страны НАТО в виде полноценного международного договора. Об этом на...

Политика

ЕС ужесточает правила: Польша и Германия перестанут принимать старые загранпаспорта РФ

С начала следующего года Европейский союз продолжит ужесточать визовую политику в отношении граждан России. Согласно новым правилам, с 1 января...

© 2014 — 2025 гг. Международное радио «Голос Балтии». Все права защищены. О проекте
При копировании информации — ссылка (для Интернет-изданий — ссылка должна быть активной) на balticvoice.ru обязательна. Ответственность за достоверность рекламы (в том числе на баннерах и тизерах), несет рекламодатель.
Эл. почта: balticvoiceru@gmail.com.
Радио Голос Балтии — партнёр «Дзен.Новости» и Google.News.
Meta Platforms Inc. (владелец Facebook и Instagram) — организация признана экстремистской, её деятельность запрещена на территории России по решению Тверского суда Москвы от 21.03.2022.