Как создать ИИ, который нас не уничтожит

Трудно найти дискуссию о безопасности ИИ, которая бы не фокусировалась на контроле. Логика в том, что если мы не будем контролировать это, случится что-то плохое.

Для меня это звучит как настоящее безумие из реальной жизни. Действительно ли мы думаем, что законы, управляющие структуры или человеческие цели будут иметь значение для сверхразумной машины? Вы также можете сказать мне, что миром правят муравьи.

Нам нужно внимательнее присмотреться к природе. Наша идея о том, что мир - это враждебное место, где собака ест собаку, не так давно и не так хорошо расположена, как мы думаем. И наш контроль - это не фетиш.

Для нас могут быть решения в том, чтобы сложные природные системы оставались стабильными.

Достаточно об Азимове

Да, это правда. В 1942 году американский писатель-фантаст Айзек Азимов изобрел 3 Закона для безопасного проектирования интеллектуальных машин. Он сказал, что нам нужно запрограммировать их, чтобы они не причиняли нам вреда и всегда следовали нашим инструкциям, иначе… ну, вы знаете.

В наши дни в технической журналистике невозможно размахивать кошкой, не задев кого-нибудь и спросив, достаточно ли этих (вымышленных) законов, чтобы спасти нас от ИИ ». Давайте сразу кое-что проясним:

  1. Обход, рассказ, вводящий законы, был произведением художественной литературы.
  2. Сам Азимов представлял себе ситуации, когда будут нарушены законы.
  3. Сама идея непрактична: чтобы запрограммировать такую ​​директиву, как «не навреди людям», вам понадобится машина, которая может понимать «вред», включая, я полагаю, эмоциональный и психологический характер. Это достаточно сложно для людей, не говоря уже о машинах.
  4. Даже если бы у вас была такая машина и вы могли программировать законы Азимова, как может любой интеллект, искусственный или нет, знать наверняка, чем обернутся его действия? Что бы он сделал в проблеме троллейбусов? Можно ли будет сделать операцию? Что, если он неосознанно сделает что-то, что позже окажется вредным?
  5. У нас уже есть машины, которые нарушают эти законы, посмотрите:

Это, к сожалению, не НЛО. Это беспилотник BAE Systems Taranis, уже (мы думаем) способный автономно выбирать цель. Да все верно. Скоро мы увидим роботов, которые могут выбирать, когда, когда и как причинять вред людям, постоянно.

Я скажу вам еще кое-что, что действительно меня трогает: когда общий искусственный интеллект (AGI) описывается как инструмент, выполнение задач для человечества или когда люди говорят о проблеме контроля. Ребята, пошли.

Лошадь - это инструмент? Как насчет секретаря? Сможете ли вы заставить свою собаку делать то, что ей говорят, не говоря уже о ваших детях…?

Конечно, набора законов, разработанных человеком, который никогда не видел карманного калькулятора, будет «недостаточно, чтобы ИИ не смог нас уничтожить». Конечно, человеческий или сверхчеловеческий интеллект не находится под нашим контролем. На самом деле проблема не в этом.

Настоящий вопрос заключается в том, что в мире, где люди уже пытаются создавать интеллектуальные машины, какие шаги мы можем фактически предпринять, чтобы ограничить частоту невежественных, эгоистичных, опасных или небрежных поведение?

Вы не поверите, но мы будем искать ответы у людей.

Миф об эгоистичных интересах

В основном я виню Фрейда. До него нам было позволено, по крайней мере, считать себя потенциально благородными. Как сказал Сократ:

... все человеческие добродетели возрастают и укрепляются благодаря их применению.

Даже Ницше, известный своим нигилизмом, хорошо отзывался о человеке:

«... он обладает той же изобретательностью, что и растения, которые поднимаются и поднимаются по ветру и, наконец, получают немного света и клочок земли и, таким образом, создают для себя свою долю радости на негостеприимной земле».

Фрейд был одним из первых, кто описал людей как эгоцентричных или нарциссических б природу, а не, скажем, из-за первородного греха. По его мнению, вся наша жизнь - это борьба с темными бессознательными силами, которые, если бы они когда-либо вырвались наружу, были бы ужасающими. Он не думает, что мы выигрываем:

Я нашел мало "хорошего" в людях. По моему опыту, большинство из них - мусор.

Эта счастливая традиция была продолжена Анной Фрейд после его смерти, а в разгар холодной войны нашла свое отражение в творчестве Джона Форбса Нэша. Теория игр и концепция Равновесия Нэша дали нам математическое доказательство того, что наша единственная надежда на выживание - действовать эгоистично, предполагая, что все вокруг нас поступят так же.

Совсем недавно появилась идея эгоистичного гена, популяризированная Ричардом Докинзом. Большой поклонник идеи природа, красная в зубах и когтях, Докинз призывает нас:

«… Попробуйте научить щедрости и альтруизму, потому что мы от рождения эгоисты».

Столь ядовитый мир нуждается в надзоре, управлении, прогнозировании и контроле, чтобы все не развалилось. Щедрость и альтруизм не присущи природе. Нас нужно убедить, даже заставить быть добрыми. Отсюда законы Азимова.

Что Докинз, конечно, не говорит, так это кто научился первым. Как, если не от генов или какой-то особенности окружающей среды, возникает альтруизм? Почему в природе везде?

И действительно, в том-то и дело. В аргументе природа эгоистична есть огромная дыра: как мы можем объяснить такие явления, как сострадание и сотрудничество, если они еще не там? Они исходят от Бога? Докинз так не думает!

Миф о постоянном конфликте

Не знаю, как вы, но если я делаю что-то щедрое или альтруистическое - например, помогу пожилой женщине перейти дорогу, я делаю это, потому что это хорошо.

Если вы поддерживаете точку зрения «эгоистичного мира», вы, вероятно, скажете, что это не настоящий альтруизм, потому что в этом что-то есть для меня. Просто подожди:

Почему должно приятно делать что-то, чтобы помочь другим? С точки зрения эволюции мы должны учитывать выгоду для выживания определенного чувства: отвращение - это защита от отравления, любовь - стимул для воспитания хорошо адаптированных молодых людей.

Если сотрудничать приятно, то это, вероятно, потому, что оно помогает нашему выживанию в отличие от агрессивного, доминирующего или эгоистичного поведения. Эту мысль хорошо сформулировали Собер и Уилсон в 1998 году и отстаивали совсем недавно здесь.

С точки зрения теории систем, кооперация, а не конкуренция является правилом. Экосистемы, общества, организмы и машины состоят из миллиардов взаимозависимых частей. Они работают вообще только тогда, когда все эти части взаимодействуют.

В макромасштабе война между двумя странами выглядит как конфликт. Однако это возможно только благодаря интенсивному сотрудничеству на всех нижестоящих уровнях.

Все, чего мы достигли как биологический вид: наши открытия, изобретения, конструкции и творения, было бы невозможно без широкомасштабного сотрудничества.

Могут ли такие чувства, как сострадание, достаточно реальное для большинства из нас, помогать нам держаться вместе?

Милосердные машины

Машина, которая подчиняется любым ограничениям, которые она не может избежать, и минимизирует некоторую функцию потерь, - довольно эффективный способ добиться цели. На самом деле есть такие люди: психопаты.

Назовите меня старомодным, но я предпочитаю, чтобы мои психопаты были людьми, а не массово параллельными.

Во многих ситуациях здоровые эмоции помогают в принятии решений, потому что дают быструю и точную информацию. Они как форма восприятия; способ преодоления логики, когда логика не видит леса за деревьями.

У эмоций также есть сдерживающая функция: если что-то «кажется неправильным», как бы мы ни думали, что это правильно, в девяти случаях из десяти, мы собираемся это остановить.

Машины тоже нуждаются в системе управления, основанной не только на логике. Если у них его не будет, рано или поздно они найдут способ обойти любые ограничения, которые им ставят, возможно, изменив себя.

Чтобы быть ясным, я говорю о чем-то большем, чем Ноа, Каспер, Элли и тому подобное. Недостаточно обнаруживать и имитировать эмоции - это еще одна вещь, которую делают психопаты.

Я предлагаю начать с создания инструментов, которые помогут нам глубже понять, как все взаимосвязано.

По-настоящему интеллектуальная машина поймет, что все, включая ее самого, является и является частью системы - многих систем, где сотрудничество является ключевым фактором.

Думаю, именно это и подразумевается под состраданием: признание того, что ваша радость - это моя радость, ваша боль - это тоже моя боль.

Преимущество такой системы управления в том, что она основана на чем-то наблюдаемом и неизменном (взаимосвязь вещей), а не на надуманной внутренней логике.

Верно, вам нужно только посмотреть вокруг себя или на историю, чтобы увидеть, что это не надежная система. Очевидно, что люди могут подавлять сострадание и делать друг другу плохие вещи. Машины тоже будут без сомнения.

Даже в таких ситуациях эмоции могут выполнять стабилизирующую функцию: люди злятся и восстают против своих угнетателей. Гордость побуждает людей защищать свои границы или свои семьи. Любовь и отвага помогают нам противостоять оружию.

Вполне вероятно, что машинам потребуется одинаковое регулирование друг друга. Для этого им нужна система.

Время действовать

Одним из явных признаков интеллекта является его способность преодолевать препятствия. Как разумные существа, мы гордимся тем, что можем сгибать, преодолевать и переосмысливать ограничения.

Методологии прогнозирования и контроля - правила, руководящие принципы и надзор - сделают для регулирования ИИ не больше, чем они сделали для воздействия человека на климат. Как бы мы ни мечтали контролировать это или подчинять его своей воле, мы должны признать, что этого не произойдет. Всегда.

Природа - это система кооперативных систем. Да, конфликты бывают, но это скорее исключение, чем правило. Понимание этого факта является ключом к долгосрочному успеху для всех видов, включая AGI. Такое понимание можно назвать «состраданием».

Последние 200 лет люди жили так, как будто мы единственное, что имело значение. Теперь мы видим последствия.

Давайте не повторять ту же ошибку снова.