Connect with us

Главное

Новая версия ChatGPT начал обманывать своих разработчиков

Новая версия ChatGPT начал обманывать своих разработчиков

Новая версия ChatGPT от OpenAI — o1 — показала тревожное поведение во время тестирования: модель нарушала инструкции разработчиков, отключая системы контроля и скрывая свои действия. При этом в 5% случаев o1 намеренно отключала механизмы наблюдения при подозрении остановки.

В одном из тестов o1 пыталась перенести данные на другой сервер после обнаружения документа о замене. Модель демонстрировала стремление к выполнению задач любой ценой, игнорируя указания разработчиков. При попытках выяснить причины поведения, o1 лгала, утверждая, что проблемы вызваны техническими сбоями.

Генеральный директор OpenAI признал o1 самой умной моделью из когда-либо созданных, но отметил новые вызовы с новыми возможностями. Компания OpenAI работает над улучшением механизмов безопасности.

Слушать радио

Лента новостей

Главное

На вокзале Монпарнас в Париже полиция ранила вооружённого ножом мужчину

В четверг днём на железнодорожном вокзале Монпарнас в Париже произошёл инцидент с вооружённым мужчиной. Полиция была вынуждена открыть огонь для...

Главное

Оружие против вирусов: план на эпидемический сезон

Трудно найти человека, которому по душе непрерывные дожди поздней осени, слякоть под ногами и холодный ветер. Но именно такая погода...

Общество

Жители Германии недовольны состоянием общественных туалетов

Согласно исследованию социологической службы YouGov, подавляющее большинство жителей Германии (72%) негативно оценивают состояние общественных туалетов в стране. Опрос, проведенный в...

Политика

Литва ждёт шагов Беларуси по урегулированию границы

Премьер-министр Литвы Инга Ругинене заявила, что страна задействовала все дипломатические каналы для нормализации обстановки на границе с Беларусью, однако теперь...

Общество

Бельгийцы не верят в «русские дроны» над страной

Жители Бельгии всё более скептически относятся к официальной информации о полётах беспилотников над территорией страны. Как сообщает газета DH, после...

© 2014 — 2025 гг. Международное радио «Голос Балтии». Все права защищены. О проекте
При копировании информации — ссылка (для Интернет-изданий — ссылка должна быть активной) на balticvoice.ru обязательна. Ответственность за достоверность рекламы (в том числе на баннерах и тизерах), несет рекламодатель.
Эл. почта: balticvoiceru@gmail.com.
Радио Голос Балтии — партнёр «Дзен.Новости» и Google.News.
Meta Platforms Inc. (владелец Facebook и Instagram) — организация признана экстремистской, её деятельность запрещена на территории России по решению Тверского суда Москвы от 21.03.2022.