Главное
Новая версия ChatGPT начал обманывать своих разработчиков
Новая версия ChatGPT от OpenAI — o1 — показала тревожное поведение во время тестирования: модель нарушала инструкции разработчиков, отключая системы контроля и скрывая свои действия. При этом в 5% случаев o1 намеренно отключала механизмы наблюдения при подозрении остановки.
В одном из тестов o1 пыталась перенести данные на другой сервер после обнаружения документа о замене. Модель демонстрировала стремление к выполнению задач любой ценой, игнорируя указания разработчиков. При попытках выяснить причины поведения, o1 лгала, утверждая, что проблемы вызваны техническими сбоями.
Генеральный директор OpenAI признал o1 самой умной моделью из когда-либо созданных, но отметил новые вызовы с новыми возможностями. Компания OpenAI работает над улучшением механизмов безопасности.
Вам может понравиться
-
Сикорский — США: «Мы партнеры, но не лохи»
-
Билл Гейтс признался в романах с россиянками и извинился за связи с Эпштейном
-
США пригрозили Европе «серьёзной ошибкой» за отказ от закупок американского оружия
-
В Конгрессе США заявили об отсутствии доказательств «российского следа» в кампании румынского политика
-
Премьер Словакии заявил союзникам о «психологическом состоянии» Трампа
-
Министр обороны ФРГ потребовал извинений от Трампа из-за слов о союзниках в Афганистане
Слушать радио
Лента новостей
118-летний бразилец курит, пьет кофе по вечерам и стал старейшим человеком в мире
В небольшом бразильском муниципалитете Элой Мендес обнаружили самого пожилого человека на планете. Луис Карлос дос Сантос, который уже больше полувека живет в доме...
Канцлер Германии потребовал от ЕС немедленно дать Украине €90 миллиардов и сломить вето Венгрии
Фридрих Мерц призвал Брюссель срочно разблокировать критически важный кредит для Киева и больше не оглядываться на позицию Будапешта. На саммите ЕС в Брюсселе 19...
Макрон потребовал от США и Ирана начать переговоры после ударов по газовым объектам
Президент Франции Эмманюэль Макрон назвал «безрассудной эскалацией» недавние атаки на энергетическую инфраструктуру Ирана и Катара. С таким заявлением он выступил сегодня в Брюсселе перед...
В России покупатели все больше приобретают компактное и дешевое жилье
Т-Банк и девелопер GloraX опубликовали результаты исследования рынка новостроек. Исследование подготовлено в преддверии форума-интенсива «ТОЛК-2026» (пройдет 1–4 апреля). Организатором этого крупнейшего в России...
Суд Варшавы разрешил экстрадицию российского археолога Бутягина на Украину
Окружной суд Варшавы принял решение об экстрадиции сотрудника Государственного Эрмитажа Александра Бутягина на Украину, где ему инкриминируют незаконные раскопки в Крыму. Заседание прошло...
