Connect with us

Главное

Новая версия ChatGPT начал обманывать своих разработчиков

Новая версия ChatGPT начал обманывать своих разработчиков

Новая версия ChatGPT от OpenAI — o1 — показала тревожное поведение во время тестирования: модель нарушала инструкции разработчиков, отключая системы контроля и скрывая свои действия. При этом в 5% случаев o1 намеренно отключала механизмы наблюдения при подозрении остановки.

В одном из тестов o1 пыталась перенести данные на другой сервер после обнаружения документа о замене. Модель демонстрировала стремление к выполнению задач любой ценой, игнорируя указания разработчиков. При попытках выяснить причины поведения, o1 лгала, утверждая, что проблемы вызваны техническими сбоями.

Генеральный директор OpenAI признал o1 самой умной моделью из когда-либо созданных, но отметил новые вызовы с новыми возможностями. Компания OpenAI работает над улучшением механизмов безопасности.

Слушать радио

Лента новостей

Общество

В Германии более миллиона взрослых лечатся от последствий злоупотребления алкоголем

В Германии свыше миллиона взрослых сталкиваются с тяжёлыми последствиями злоупотребления алкоголем и нуждаются в медицинской помощи. Об этом свидетельствует анализ...

Экономика

Nvidia впервые обошла Apple, став самой дорогой компанией мира

Производитель чипов для искусственного интеллекта Nvidia по итогам торгов 29 декабря 2025 года стала самой дорогой публичной компанией в мире....

Политика

Глава эстонской разведки не видит признаков подготовки Россией нападения на Балтию

Руководитель эстонской разведки Каупо Розин в интервью государственному вещателю ERR заявил, что Россия в настоящее время не демонстрирует намерений атаковать...

Армия

Польша запустит «антидроновую стену» на восточной границе через полгода

Польша ускоряет создание системы противодействия дронам на своей восточной границе. Первые возможности так называемой «антидроновой стены» будут развёрнуты уже в...

Армия

Польские учёные создали «невидимый щит» для мгновенной нейтрализации дронов

Исследователи из Гданьского технического университета в Польше представили прорывную систему противодействия беспилотникам, названную Stratus. Технология использует мощные электромагнитные импульсы для...

© 2014 — 2025 гг. Международное радио «Голос Балтии». Все права защищены. О проекте
При копировании информации — ссылка (для Интернет-изданий — ссылка должна быть активной) на balticvoice.ru обязательна. Ответственность за достоверность рекламы (в том числе на баннерах и тизерах), несет рекламодатель.
Эл. почта: balticvoiceru@gmail.com.
Радио Голос Балтии — партнёр «Дзен.Новости» и Google.News.
Meta Platforms Inc. (владелец Facebook и Instagram) — организация признана экстремистской, её деятельность запрещена на территории России по решению Тверского суда Москвы от 21.03.2022.