Connect with us

Главное

Новая версия ChatGPT начал обманывать своих разработчиков

Новая версия ChatGPT начал обманывать своих разработчиков

Новая версия ChatGPT от OpenAI — o1 — показала тревожное поведение во время тестирования: модель нарушала инструкции разработчиков, отключая системы контроля и скрывая свои действия. При этом в 5% случаев o1 намеренно отключала механизмы наблюдения при подозрении остановки.

В одном из тестов o1 пыталась перенести данные на другой сервер после обнаружения документа о замене. Модель демонстрировала стремление к выполнению задач любой ценой, игнорируя указания разработчиков. При попытках выяснить причины поведения, o1 лгала, утверждая, что проблемы вызваны техническими сбоями.

Генеральный директор OpenAI признал o1 самой умной моделью из когда-либо созданных, но отметил новые вызовы с новыми возможностями. Компания OpenAI работает над улучшением механизмов безопасности.

Слушать радио

Лента новостей

Политика

Каллас обвинила Трампа в попытке расколоть Европу

Глава европейской дипломатии Кая Каллас выступила с резкой критикой политики Дональда Трампа, обвинив американского президента в стремлении дестабилизировать Евросоюз. В интервью Financial Times...

Политика

Мерц обвинил Россию в нежелании вести переговоры и остался недоволен ослаблением санкций США

Канцлер Германии Фридрих Мерц после переговоров с премьер-министром Норвегии Йонасом Гаром Стёре вновь жёстко высказался о России. По его словам, Москва продолжает демонстрировать...

Экономика

«Китайский ширпотреб» вместо оборонных компонентов: мошенникам не удалось отделаться условно

Четверо предпринимателей, провернувших аферу с поставками контрафактных запчастей для оборонного завода, избежали реальных сроков лишь временно. Второй кассационный суд отменил условный...

Главное

Польша начала расследование по «файлам Эпштейна»: подозрение в торговле девушками

Национальная прокуратура Польши объявила о начале следствия по делу о торговле людьми после анализа документов, связанных с американским финансистом Джеффри Эпштейном. Как сообщили в ведомстве...

Политика

Мерц: у войны с Ираном нет плана завершения, а санкции против России ослаблять рано

Канцлер Германии Фридрих Мерц выступил с критикой затянувшейся военной кампании США и Израиля против Ирана. По его словам, эскалация растёт, а общего плана, как...

© 2014 — 2025 гг. Международное радио «Голос Балтии». Все права защищены. О проекте
При копировании информации — ссылка (для Интернет-изданий — ссылка должна быть активной) на balticvoice.ru обязательна. Ответственность за достоверность рекламы (в том числе на баннерах и тизерах), несет рекламодатель.
Эл. почта: balticvoiceru@gmail.com.
Радио Голос Балтии — партнёр «Дзен.Новости» и Google.News.
Meta Platforms Inc. (владелец Facebook и Instagram) — организация признана экстремистской, её деятельность запрещена на территории России по решению Тверского суда Москвы от 21.03.2022.