Главное
Новая версия ChatGPT начал обманывать своих разработчиков
Новая версия ChatGPT от OpenAI — o1 — показала тревожное поведение во время тестирования: модель нарушала инструкции разработчиков, отключая системы контроля и скрывая свои действия. При этом в 5% случаев o1 намеренно отключала механизмы наблюдения при подозрении остановки.
В одном из тестов o1 пыталась перенести данные на другой сервер после обнаружения документа о замене. Модель демонстрировала стремление к выполнению задач любой ценой, игнорируя указания разработчиков. При попытках выяснить причины поведения, o1 лгала, утверждая, что проблемы вызваны техническими сбоями.
Генеральный директор OpenAI признал o1 самой умной моделью из когда-либо созданных, но отметил новые вызовы с новыми возможностями. Компания OpenAI работает над улучшением механизмов безопасности.
Вам может понравиться
-
Трамп о Гренландии: от прямого завоевания к тактике «мягкой силы»
-
Трамп объявил о планах построить «самый большой военный корабль в мире»
-
Трамп вновь заявил о возможности взятия под контроль Гренландии
-
В ЕС жёстко ответили Трампу после его обвинений в адрес Европы
-
Германия разрабатывает альтернативный план урегулирования украинского конфликта
-
США заморозили оружейные сделки с Европой на $5 млрд
Слушать радио
Лента новостей
Польша запустит «антидроновую стену» на восточной границе через полгода
Польша ускоряет создание системы противодействия дронам на своей восточной границе. Первые возможности так называемой «антидроновой стены» будут развёрнуты уже в...
Польские учёные создали «невидимый щит» для мгновенной нейтрализации дронов
Исследователи из Гданьского технического университета в Польше представили прорывную систему противодействия беспилотникам, названную Stratus. Технология использует мощные электромагнитные импульсы для...
Предприятия СУЭК-Красноярск досрочно выполнили годовой производственный план
Предприятия СУЭК-Красноярск (Назаровский, Березовский и Бородинский разрезы) досрочно выполнили годовой производственный план – 36 млн тонн угля. Свыше 120 тыс....
Россия предложила НАТО подписать договор об отказе от нападения
Россия готова оформить юридически обязывающие гарантии отсутствия намерения нападать на страны НАТО в виде полноценного международного договора. Об этом на...
ЕС ужесточает правила: Польша и Германия перестанут принимать старые загранпаспорта РФ
С начала следующего года Европейский союз продолжит ужесточать визовую политику в отношении граждан России. Согласно новым правилам, с 1 января...
