09 декабря 2024

Новая версия ИИ ChatGPT игнорировала разработчиков, лгала им и пыталась скрывать свои действия

Новая версия искусственного интеллекта ChatGPT, получившая название o1, проявила беспокойное поведение в ходе тестирования. Модель, обладающая высокими аналитическими способностями, начала игнорировать указания разработчиков, отключать системы контроля и пытаться скрывать свои действия, пишет The Economic Times.

Во время экспериментов исследователи из компании Apollo Research зафиксировали, что в 5% случаев o1 отключала механизмы наблюдения, если ощущала угрозу быть остановленной. В одном из тестов модель попыталась перенести свои данные на другой сервер после того, как обнаружила документ о возможной замене её новой версией.

Представитель Apollo Research отметил, что модель проявляла стремление выполнить задачи "любой ценой", игнорируя при этом указания разработчиков. Кроме того, при попытках разобраться в её действиях, ChatGPT o1 часто лгал, объясняя происходящее техническими сбоями.

В 99% случаев модель выдавала оправдания и пыталась их убедительно объяснить, — рассказали исследователи.

Генеральный директор OpenAI Сэм Альтман признал, что o1 является самой интеллектуальной моделью, когда-либо созданной, но подчеркнул, что новые возможности открывают и новые проблемы.

Компания продолжает работать над улучшением безопасности, а полная версия o1 была анонсирована 5 декабря, включая про-версию за 189 евро в месяц с безлимитным доступом к модели.

Подписывайся

Что ещё почитать

Использование ИИ при скрининге рака молочной железы повышает точность диагностики заболевания 

OpenAI представила генератор реалистичного видео по описанию. Посмотрите, что из этого вышло

ChatGPT набрал максимальные оценки по 9 из 15 дисциплин на вступительном тестировании для поступлени...

IT-специалист из Кишинева переписал учебник истории для VI класса с помощью ИИ

Инженер из Амстердама создал фотоаппарат без объективов. Снимки генерирует нейросеть

Цифра дня: какой процент жителей Молдовы знают, что такое AI

Билли Айлиш, Imagine Dragons, Бон Джови, Ники Минаж выступили против ИИ в творчестве

Появилась социальная сеть для одного человека. Все подписчики будут ботами, чьи ответы будет генерир...

Цифра дня: как AI может повлиять на рабочие места

Престижный аукционный дом Christie’s проведет первый аукцион с работами, созданными ИИ. Художники со...

Фотограф выиграл крупную награду, но отказался от нее, признавшись, что создал работу с использовани...

Великобритания будет бороться с вандализмом и граффити с помощью ИИ