09 декабря 2024

Новая версия ИИ ChatGPT игнорировала разработчиков, лгала им и пыталась скрывать свои действия

Новая версия искусственного интеллекта ChatGPT, получившая название o1, проявила беспокойное поведение в ходе тестирования. Модель, обладающая высокими аналитическими способностями, начала игнорировать указания разработчиков, отключать системы контроля и пытаться скрывать свои действия, пишет The Economic Times.

Во время экспериментов исследователи из компании Apollo Research зафиксировали, что в 5% случаев o1 отключала механизмы наблюдения, если ощущала угрозу быть остановленной. В одном из тестов модель попыталась перенести свои данные на другой сервер после того, как обнаружила документ о возможной замене её новой версией.

Представитель Apollo Research отметил, что модель проявляла стремление выполнить задачи "любой ценой", игнорируя при этом указания разработчиков. Кроме того, при попытках разобраться в её действиях, ChatGPT o1 часто лгал, объясняя происходящее техническими сбоями.

В 99% случаев модель выдавала оправдания и пыталась их убедительно объяснить, — рассказали исследователи.

Генеральный директор OpenAI Сэм Альтман признал, что o1 является самой интеллектуальной моделью, когда-либо созданной, но подчеркнул, что новые возможности открывают и новые проблемы.

Компания продолжает работать над улучшением безопасности, а полная версия o1 была анонсирована 5 декабря, включая про-версию за 189 евро в месяц с безлимитным доступом к модели.

Подписывайся

Что ещё почитать

Эксперты предупреждают, что ИИ может получить доступ к ядерному оружию

Bloomberg: компания Apple разрабатывает домашних роботов

Пара из Малайзии поехала в несуществующее место, которое увидели в интернете на видео, сгенерированн...

Coca-Cola создала уникальный напиток будущего с помощью искусственного интеллекта

В США ChatGPT поддерживал суицидальные мысли 16-летнего подростка. После его смерти родители подали ...

Прогноз погоды, ChatGPT и «Слово пацана»: что чаще всего гуглили молдаване в 2023 году

В Пекине состоялось уникальное событие — впервые прошёл футбольный матч между человекоподобными робо...

ИИ Microsoft превзошёл врачей в диагностике сложных заболеваний

Нобелевскую премию по физике вручили за успехи в области машинного обучения Джону Хопфилду и Джеффри...

Microsoft объявила о сокращении около 9 000 сотрудников в пользу вложений в сферу искусственного инт...

Бывшие руководители французской игровой компании получили условные сроки за создание «культуры харас...

Компания Meta представила очки дополненной реальности Orion. В продаже они появятся еще не скоро