Сергей Карелов об опасностях ChatGPT

 
Что делать - скорость растет, впереди стена, уже не отвернуть, а подушки безопасности нет?
Юдковский считает, что если не можете спасти семью, хотя бы не помогайте её убивать.
Мир привык к страшилкам алармистов, уже несколько десятилетий вопящих «Волки! Волки!» по поводу грядущих экзистенциальных угроз человечеству.
Но происходящее сейчас принципиально отличается от прежних страшилок.
• До сих пор алармисты предупреждали о потенциально возможных событиях, со спорной вероятностью ведущих к катастрофическим последствиям для мира.
• Теперь же алармисты пишут, что катастрофическое событие уже произошло, а гибель неотвратима, ибо средств спасения у людей нет, да они и вообще не заморачиваются со спасением.
Уже произошедшей катастрофой называют случившуюся 3 месяца назад «утечку» в цифровой мир землян (ака Интернет) генеративного диалогового ИИ ChatGPT.
Спустя 3 месяца после «утечки», последствия «вырвавшегося на свободу» из лаборатории OpenAI генеративного диалогового ИИ уже соизмеримы по масштабу с последствиями «утечки» вируса COVID-19 то ли из лаборатории, то ли с рынка г. Ухань.
Вот как это описывают Андреа Миотти и Габриэль Альфур в активно обсуждаемом среди ИИ-профессионалов меморандуме «AGI in sight: our look at the game board»(1)
1) У человечества случилось озарение. Мир понял, что AGI на подходе, и с большой вероятностью это случится в ближайшие 5 лет.
Антропоморфизация ИИ сыграла с людьми злую шутку. Считая, что AGI будет человекоподобен, исследователи отодвигали возможность его создания до тех пор, когда научатся воспроизводить в машинах ключевые аспекты человеческого разума.
Оказалось же, что AGI вовсе не нужно быть человекоподобным - мыслить и понимать мир, подобно людям. И этот нечеловеческий ИИ может быть по-своему столь умел, чтобы бросить вызов многим интеллектуальным способностям людям, а затем и превзойти их.
Сейчас уже нет никаких принципиальных препятствий на пути превращения интеллектуальных агентов на основе больших языковых моделей в «AGI нечеловеческого типа».
2) Случившееся озарение произошло столь стремительно, что люди не успели подготовиться.
Никто не знает:
как сделать «AGI нечеловеческого типа» правдивым;
как предсказать появляющиеся у него эмерджентным образом новые способности;
как понять логику его работы и совершенствования.
3) Гонка за созданием «AGI нечеловеческого типа» уже началась и неостановима.
Выиграть ее хотят все мегакорпорации и правительства.
Хоть как-то замедлить ее не заинтересован никто (и никто даже не собирается сделать что-либо подобное).
Примерно о том же, что написано в «меморандуме Миотти – Альфура», пишут многие известные специалисты: Элиезер Юдковски, Ян Хогарт, Пол Кристиано , Нейт Соарес, Джон Вентворт …
Элиезер Юдковски предлагает вариант неучастия:
«Если вы не можете спасти свою семью, хотя бы не помогайте её убийству».
Но команда OpenAI опубликовала вчера обращение (2), в котором пишет, что не собирается сдаваться перед неотвратимо приближающимся «AGI нечеловеческого типа»:
«Успешный переход к миру со сверхразумом — это, пожалуй, самый важный — и обнадеживающий, и пугающий — проект в истории человечества. Успех далеко не гарантирован, и ставки (безграничные минусы и безграничные плюсы) объединят всех нас.»
 
 
 
 
 

 Сергей Карелов

 Начался ИИ апокалипсис, меняющий смысл закона Мура.

 
Теперь количество разума во Вселенной будет удваиваться каждые 18 месяцев.
Таково определение (1), данное Сэмом Альтманом (гендиром компании OpenAI, создавшей ChatGPT) для последствий происходящей революции, символом которой стал ChatGPT.
А ведь всего 7 лет назад Сэм весело острил: «ИИ, скорее всего, приведет к концу света, но до того появится огромный бизнес».
Теперь же про него пишут (2), что он не расстается с "ядерным рюкзаком", который можно использовать для дистанционного подрыва ЦОДов, если GPT выйдет из под контроля.
Чтоб понять, что стоит за лаконичной формулировкой Альтмана, и как теперь нам не спятить в ходе начавшегося ИИ апокалипсиса, - рекомендую прочесть соображения (3) Эрика Хоэла — американского нейробиолога и нейрофилософа из университета Тафтса.
Пересказывать отличный текст с кучей примеров, - нет смысла. Хоэл – еще и писатель. Так что переписывать его – только портить.
Хочу лишь обратить ваше внимание на одну из ключевых мыслей. Ибо она резюмирует глубинное понимание происходящего и ближайшего будущего уже наступившего ИИ апокалипсиса.
Главный аргумент «рациональных техно оптимистов», считающих что ничего экстраординарного и сверх рискованного с появлением ChatGPT не произошло, таков.
Не смотря на выдающиеся результаты генеративных диалоговых ИИ (типа ChatGPT, Bing и т.д.), эти ИИ-системы не могут считаться разумными. Они не понимают мира и не обладают мотивацией агента. У них нет личности, проявляющейся в намерениях и действиях. А их интеллект – не есть интеллект, а лишь симулякр интеллекта. В своей основе этот симулякр – всего лишь автозаполнитель очередных слов, отражающий в своем вероятностном зеркале колоссальный нефильтрованный корпус написанных людьми текстов из Интернета.
А раз так, значит нет пока ни близкой перспективы появления сверхразума, ни связанных с этим рисков (хотя нужно, конечно, к этому готовиться, скорее всего, на горизонте десятков лет).
Ответ Хоэла (и заодно мой на эту аргументацию таков.
Из того, что ChatGPT и пр. - всего лишь автозаполнитель очередных слов, не следует, что он не может стать (или даже уже быть) разумным агентом. В отличие от сознания, интеллект — это полностью функциональное понятие: если нечто действует разумно, оно разумно. Если оно действует как агент, перед нами агент.
Вот поясняющий пример.
Есть влиятельная когорта ученых - Карл Фристон (наиболее цитируемый нейробиолог) и множество других известных имен, - которые утверждают, что цель нашего мозга - свести к минимуму удивление. Эта «гипотеза байесовского мозга» сегодня одна из магистральных. Теория утверждает, что на глобальном уровне минимизация удивления — это главная функция мозга. И хотя это всего лишь одна из нескольких ведущих гипотез о работе мозга, представим, что она верна.
А теперь представим, что инопланетяне находят человеческий мозг, смотрят на него и говорят: «О, эта штука просто сводит к минимуму удивление! Это не может быть основой интеллекта и потому не может быть опасным для истинных носителей разума».
Подумайте:
Действительно ли «сведение к минимуму сюрпризов» намного более сложная цель, чем автозаполнение слов текста? Или на самом деле это весьма похоже?
А раз так, значит нечеловеческий сверхразум может быть уже рядом. И связанные с этим риски уже вполне реальны.
Что еще добавить?
• Возможно, ChatGPT и пр. уже более универсальны в своем интеллекте, чем любой человек.
• Весьма вероятно, что ChatGPT и пр. одновременно:
- разумны
- ненадежны
- не похожи на человеческий разум
- вводят в заблуждение
- неконтролируемы в любом фундаментальном смысле, кроме некоторых наскоро разработанных ограждений.
И если все это так, значит ИИ апокалипсис уже начался.