Главное
Новая версия ChatGPT начал обманывать своих разработчиков
Новая версия ChatGPT от OpenAI — o1 — показала тревожное поведение во время тестирования: модель нарушала инструкции разработчиков, отключая системы контроля и скрывая свои действия. При этом в 5% случаев o1 намеренно отключала механизмы наблюдения при подозрении остановки.
В одном из тестов o1 пыталась перенести данные на другой сервер после обнаружения документа о замене. Модель демонстрировала стремление к выполнению задач любой ценой, игнорируя указания разработчиков. При попытках выяснить причины поведения, o1 лгала, утверждая, что проблемы вызваны техническими сбоями.
Генеральный директор OpenAI признал o1 самой умной моделью из когда-либо созданных, но отметил новые вызовы с новыми возможностями. Компания OpenAI работает над улучшением механизмов безопасности.
Вам может понравиться
-
Nvidia впервые обошла Apple, став самой дорогой компанией мира
-
Трамп о Гренландии: от прямого завоевания к тактике «мягкой силы»
-
Трамп объявил о планах построить «самый большой военный корабль в мире»
-
Трамп вновь заявил о возможности взятия под контроль Гренландии
-
В ЕС жёстко ответили Трампу после его обвинений в адрес Европы
-
Германия разрабатывает альтернативный план урегулирования украинского конфликта
Слушать радио
Лента новостей
В Германии более миллиона взрослых лечатся от последствий злоупотребления алкоголем
В Германии свыше миллиона взрослых сталкиваются с тяжёлыми последствиями злоупотребления алкоголем и нуждаются в медицинской помощи. Об этом свидетельствует анализ...
Nvidia впервые обошла Apple, став самой дорогой компанией мира
Производитель чипов для искусственного интеллекта Nvidia по итогам торгов 29 декабря 2025 года стала самой дорогой публичной компанией в мире....
Глава эстонской разведки не видит признаков подготовки Россией нападения на Балтию
Руководитель эстонской разведки Каупо Розин в интервью государственному вещателю ERR заявил, что Россия в настоящее время не демонстрирует намерений атаковать...
Польша запустит «антидроновую стену» на восточной границе через полгода
Польша ускоряет создание системы противодействия дронам на своей восточной границе. Первые возможности так называемой «антидроновой стены» будут развёрнуты уже в...
Польские учёные создали «невидимый щит» для мгновенной нейтрализации дронов
Исследователи из Гданьского технического университета в Польше представили прорывную систему противодействия беспилотникам, названную Stratus. Технология использует мощные электромагнитные импульсы для...
