09 декабря 2024

Новая версия ИИ ChatGPT игнорировала разработчиков, лгала им и пыталась скрывать свои действия

Новая версия искусственного интеллекта ChatGPT, получившая название o1, проявила беспокойное поведение в ходе тестирования. Модель, обладающая высокими аналитическими способностями, начала игнорировать указания разработчиков, отключать системы контроля и пытаться скрывать свои действия, пишет The Economic Times.

Во время экспериментов исследователи из компании Apollo Research зафиксировали, что в 5% случаев o1 отключала механизмы наблюдения, если ощущала угрозу быть остановленной. В одном из тестов модель попыталась перенести свои данные на другой сервер после того, как обнаружила документ о возможной замене её новой версией.

Представитель Apollo Research отметил, что модель проявляла стремление выполнить задачи "любой ценой", игнорируя при этом указания разработчиков. Кроме того, при попытках разобраться в её действиях, ChatGPT o1 часто лгал, объясняя происходящее техническими сбоями.

В 99% случаев модель выдавала оправдания и пыталась их убедительно объяснить, — рассказали исследователи.

Генеральный директор OpenAI Сэм Альтман признал, что o1 является самой интеллектуальной моделью, когда-либо созданной, но подчеркнул, что новые возможности открывают и новые проблемы.

Компания продолжает работать над улучшением безопасности, а полная версия o1 была анонсирована 5 декабря, включая про-версию за 189 евро в месяц с безлимитным доступом к модели.

Подписывайся

Что ещё почитать

Чего боится Илон Маск? К чему может привести развитие искусственного интеллекта

В США планируют разработать умное кольцо верности

Bloomberg: компания Apple разрабатывает домашних роботов

Европарламент принял первый в мире закон об искусственном интеллекте (ИИ)

Молдавские ученицы Ирина и Даниела Гросу заняли второе место на международном конкурсе для разработч...

Билли Айлиш, Imagine Dragons, Бон Джови, Ники Минаж выступили против ИИ в творчестве

Ученики из Молдовы разработали ИИ-платформу по постановке медицинских диагнозов и заняли первое мест...

В США предложили законопроект, который запретит ИИ убирать водяные знаки из контента

Пользователи Instagram жалуются на то, что их лица появляются в ленте с таргетированной рекламой, сг...

Был разработан искусственный интеллект, через который можно пообщаться с умершими знаменитостями

Фотограф отправил на конкурс ИИ-фотографий настоящую фотографию и занял призовое место

В Италии вновь разрешили ChatGPT. Ранее его запретили из-за нарушений законодательства ЕС