09 декабря 2024

Новая версия ИИ ChatGPT игнорировала разработчиков, лгала им и пыталась скрывать свои действия

Новая версия искусственного интеллекта ChatGPT, получившая название o1, проявила беспокойное поведение в ходе тестирования. Модель, обладающая высокими аналитическими способностями, начала игнорировать указания разработчиков, отключать системы контроля и пытаться скрывать свои действия, пишет The Economic Times.

Во время экспериментов исследователи из компании Apollo Research зафиксировали, что в 5% случаев o1 отключала механизмы наблюдения, если ощущала угрозу быть остановленной. В одном из тестов модель попыталась перенести свои данные на другой сервер после того, как обнаружила документ о возможной замене её новой версией.

Представитель Apollo Research отметил, что модель проявляла стремление выполнить задачи "любой ценой", игнорируя при этом указания разработчиков. Кроме того, при попытках разобраться в её действиях, ChatGPT o1 часто лгал, объясняя происходящее техническими сбоями.

В 99% случаев модель выдавала оправдания и пыталась их убедительно объяснить, — рассказали исследователи.

Генеральный директор OpenAI Сэм Альтман признал, что o1 является самой интеллектуальной моделью, когда-либо созданной, но подчеркнул, что новые возможности открывают и новые проблемы.

Компания продолжает работать над улучшением безопасности, а полная версия o1 была анонсирована 5 декабря, включая про-версию за 189 евро в месяц с безлимитным доступом к модели.

Новая версия ИИ ChatGPT игнорировала разработчиков, лгала им и пыталась скрывать свои действия

Подписывайся

Что ещё почитать

Компания Apple работает над созданием конкурента для ChatGPT

В Молдове пройдет крупнейшая технологическая конференция. Студия ArtDock в числе участников

Ученые обнаружили, что иногда собаки понимают, что люди им врут

Европейский союз приступил к исполнению закона об ограничении ИИ

OpenAI представила генератор реалистичного видео по описанию. Посмотрите, что из этого вышло

Ученые намерены лечить рак при помощи цифровых двойников пациентов. Они используют их для тестирован...

Разработанное в Молдове приложение для изучения языков Langly, заняло первое место на конкурсе EdTec...

В Голливуде появилась первая ИИ актриса. Не все артисты этому рады

Билли Айлиш, Imagine Dragons, Бон Джови, Ники Минаж выступили против ИИ в творчестве

5+ необычных способов применения GPT-4 — новой версии ChatGPT

Илон Маск намерен создать искусственный интеллект, чтобы "понять истинную природу вселенной"

Пользователи социальных сетей обвинили компанию Disney в использовании искусственного интеллекта