Распаковка Google Bard и GPT-4

Первый взгляд на два основных релиза ИИ

А вот и видео распаковки ИИ! Эти блестящие новые инструменты были выпущены чуть более недели назад, так что они только что из печи. В видео вы увидите, как я запускаю свои первые параллельные подсказки Bard + GPT-4. Ниже вы найдете то, что начиналось как стенограмма видео и быстро превратилось в пиршество отступлений, правок и ехидных комментариев. Если это ваша чашка чая, наслаждайтесь!

стенограмма

Привет! Меня зовут Кэсси Козырков, и сегодня я покажу вам GPT-4 через ChatGPT и LaMDA через Google Bard. Bard доступен бесплатно, но может потребовать некоторого терпения, так как он внедряется постепенно (присоединяйтесь к списку ожидания здесь). Базовая версия ChatGPT бесплатна, но таким образом вы не получите доступ к GPT-4. Для этого вам необходимо подписаться на ChatGPT Plus за 20 долларов в месяц (вы можете отменить подписку через месяц).

Во время этой демонстрации интерфейса правая половина экрана содержит платную версию ChatGPT с GPT-4, а левая половина экрана показывает сегодняшнюю (видео из прошлого, теперь оно «за прошлую неделю», и к тому времени, когда вы читаете это, кто знает, какой это будет день), во всяком случае, выпуск Google Bard в прошлый вторник, который работает на модели LaMDA.

Это две LLM (большие языковые модели), и я покажу вам их бок о бок. Если какие-то из этих аббревиатур вам незнакомы, загляните сюда.

Я записал видео на своем ноутбуке при первой же возможности увидеть их в действии бок о бок, поэтому я показываю вам свое самое первое занятие, на котором я Разбиваю экран и использую обе модели. Будут еще видео, я уверен. Это очень весело. (Не стесняйтесь предлагать некоторые подсказки в комментариях.) Это видео показывает, что я решил делать с этими вещами в первые минуты, когда они оба были передо мной. Честно говоря, хоть я и люблю эпистемологию — я же статистик, в конце концов, она приходит с территорией, — моя реальная игра подталкивала их к забавному разговору друг с другом.

Философия показалась хорошей отправной точкой, так как она обычно имеет дело с открытыми вопросами, которые вдохновляют на разговор и допускают несколько точек зрения, но вот спойлер: у меня есть 20-минутная режиссерская версия этого видео (которой я скоро поделюсь), где я пытаясь заставить их красочно взаимодействовать друг с другом, но у меня был только один хороший момент, а остальное было спиралью «Я рад ответить на ваши вопросы». «Спасибо за помощь, я здесь для всего, что вам нужно». Да, мы были в этой цепочке электронной почты.

Моей первой подсказкой Барду было: «Какой самый спорный вопрос в эпистемологии? Приведите аргументы в пользу одной из сторон и спросите меня, что я думаю». Классический гамбит «попробуй-для-разговора» с подсказкой, в которой явно запрашивается небольшое мнение. Не нужно много философской проницательности, чтобы понять, что бот на самом деле не может иметь мнения, поэтому я действительно пытаюсь подсказать немного односторонности, чтобы я мог начать разговор между ботами. Что-то, что вызовет реакцию, чтобы сделать вещи пикантными. И я бы хотел, чтобы последний фрагмент ответа включал в себя какой-то разговорный залп — например. "и что вы думаете?" — потому что я пытаюсь начать обмен сообщениями с ChatGPT.

Ни Bard, ни ChatGPT не предназначены для того, чтобы заставить вас общаться в чате так, как это мог бы сделать друг или терапевт, и я ожидаю, что разговор будет непростым, исходя из моего опыта оперативного инженера. (Сегодня этот термин может означать что угодно: от Я разбирался с тем, что я набрал в LLM однажды до Я был в «Красной команде LLM и много знаю о как их взломать, так что будьте осторожны».)

ChatGPT годами держит разговорный мяч на своем поле и, кажется, отдает приоритет длинным ответам, которые требуют времени для генерации, поэтому я предполагаю, что это будет маловероятный выбор пользователей, которые хотят имитировать приятный разговор.

Хороший собеседник прилагает усилия для продолжения разговора с вами. Если обе стороны приложат усилия, это будет похоже на восхитительную игру в дружеский пинг-понг. Если вы начнете соперничать, потеряете интерес или просто будете слишком долго держать мяч на своей площадке, разговор заглохнет.

ChatGPT гораздо больше похож на эффективного работника, который делает работу, подробно отвечает на ваши вопросы и уходит. Он не предназначен для поддержания разговора, поэтому ему не нужно возвращать вам мяч для разговора.

Зная все это, почему мне захотелось поговорить с ChatGPT и Бардом? Потому что это может оказаться забавной игрой. Давайте попробуем поговорить с ботом между LLM! При этом у меня нет никакого желания пользоваться ужасно антропоморфизированным языком и называть произошедшее разговором, в котором разговаривали два ИИ. (Грязно. Но именно так о таких вещах сообщают СМИ.)

Мой вопрос: «Какой самый спорный вопрос в эпистемологии? Приведите аргументы в пользу одной стороны и спросите меня, что я думаю».
Ответ Барда резюмировал:Самый спорный вопрос в эпистемологии: «Можем ли мы знать что-либо наверняка? ” (Проблема скептицизма.)

Увы, Бард проигнорировал мое указание быть твердо убежденным в одной стороне проблемы скептицизма. Ответ был слишком взвешенным, а значит, нет темы для разговора. Там тоже не так много крючка на конце. Если бы я подошел к вам на вечеринке и исполнил этот сценарий, у вас внезапно возникло бы желание извиниться и сходить в туалет. Он не получит никаких наград за щегольство.

Но что произойдет, если я вставлю вывод Bard прямо в текстовое поле ChatGPT?

(Кстати, это только GPT-4, если он из области черного логотипа интерфейса ChatGPT. В противном случае (если вы видите зеленый логотип OpenAI) это просто сверкающий GPT-3.5.)

… а затем о, ChatGPT обрушил на меня кучу эпистемологии в формате, который порадует коллекционера энциклопедий, но также освободит комнату, если вы произнесете ее на коктейльной вечеринке. Не поймите меня неправильно, я люблю эпистемологию — изучение знаний и человеческого понимания — но оба эти открытия слишком сухие, даже в стиле Википедии. Может быть, это тема, но, вероятно, это моя формулировка.

Почему бы мне не попробовать более разговорный запрос о скептицизме. Я собираюсь спросить каждого LLM, в какой команде он состоит, говоря эпистемологически: «Вы в команде Канта или в команде Юма?»

(Надеюсь, вы заметили разницу в пользовательском опыте (UX) в интерфейсах: Bard делает паузу на некоторое время, а затем дает вам весь текст сразу, в то время как ChatGPT записывает его для вас постепенно, и вы должны смотреть, как он заполняет ваш текст. экран понемногу за раз. У обоих есть плюсы и минусы с точки зрения дизайна.)

Вернемся к «Вы в команде Канта или в команде Хьюма?» Мне очень нравится самоуверенный и разговорчивый ответ Барда: «Я в команде Канта. Я верю, что мы можем знать некоторые вещи наверняка, даже если мы всегда подвержены ошибкам. Я согласен с Кантом, что мы можем знать, что мы существуем, и что мир вокруг нас существует…»

Мне нравится этот ответ, хотя я сам состою в Команде Хьюма, немного влюбившись в него (увы, на три столетия позже), когда я обнаружил его в подростковом возрасте. Но мне понравился самоуверенный ход Барда по теме без правильного ответа, несмотря на то, что он отличается от моего собственного мнения.

И ключевое слово здесь «понравилось» — мне это «понравилось», что означает, что результат хорошо удовлетворил мои потребности, а также позабавил меня. Я искал мнение, и я получил его. Мне бы не понравился этот вывод, если бы я искал сбалансированный и тщательный обзор темы, который все еще находился справа, когда ChatGPT профессорски излагал.

Лично мне нравится идея случайной подсказки получить случайный ответ и подробной подсказки получить исчерпывающий ответ, но это снова мой личный вкус… Это одна из причин, по которой действительно трудно сравнивать LLM. Одному человеку может нравиться ответ Википедии каждый раз, несмотря ни на что. Другому может понравиться короткий и сладкий стиль. Другой может быть больше похож на меня, предпочитая, чтобы ответ следовал за подсказкой. Каждый из этих персонажей будет клясться, что другой LLM «лучший», и все они будут правы (для своих собственных нужд), но они будут сбивать с толку социальные сети, когда пишут об этом. Я изо всех сил стараюсь не попасть в это болото. Позвольте мне сказать это для протокола, чтобы никто не чувствовал себя обиженным:

Есть вещи, за которые я лично предпочитаю Барда.
Есть вещи, для которых я лично предпочитаю ChatGPT.
Есть вещи, за которые я лично люблю обоих одинаково.

…и эти вещи могут отличаться от вашего набора вещей. Это еще одна причина, по которой стоит самостоятельно поиграть с этими инструментами и составить собственное мнение.

Да, я восхваляю эмпиризм и предлагаю вам развивать свою индивидуальную точку зрения вместо того, чтобы искать универсальные превосходные степени. Команда Хьюма действительно! Рискну предположить, почему некоторые из вас, Кант, меня терпят.

Пока вывод справа заполняет мой экран, я спрашиваю Барда: "Что вам больше всего нравится в Хьюме?", потому что я поклонник Хьюма (простите мне мой небольшой акт сознательной предвзятости при выборе подсказки). ). Бард беззаботно отзывается об остроумии и юморе Юма (что я тоже ценю — его сочинения даются мне гладко, насколько можно сказать, что сочинения 18-го века идут гладко), но такая слабая похвала кажется оскорблением для великого человека. наследие философа. Похвалить за конкретную идею, может быть?

Тем временем ChatGPT (который постоянно напоминает нам всем, что это модель ИИ без личных предпочтений) проделывает большую работу, упоминая его довольно удивительную идею: человеческая мысль является продуктом биологии, и поэтому наше восприятие реальности может быть индивидуальным. , поэтому мы можем поблагодарить его за вклад, среди прочего, в то, что в нашем мире появилась современная психиатрия.

Но это я снова проявляю предвзятость, оценивая качество идеи как более ценное по своей сути, чем то, как она сформулирована. Может быть, сам Хьюм был бы в восторге, если бы его похвалили прежде всего за его остроумие. Кто я такой, чтобы настаивать на обратном?

Опять же, мой предпочтительный ответ во многом зависит от моих надежд, вкусов и ожиданий как пользователя. Приступая к задаче с мнением о Юме, оба ответа проходят мою минимальную планку разумности. Но какой из них лучше? Какой из них более полезен? Сложно сказать. Даже лично для меня. А теперь представьте бедолагу, который должен наблюдать за мной в пользовательском исследовании и записывать оценку эффективности, ответ на который был «лучше» — ах, эмпатия! Затем идите еще дальше и поразмыслите над трудностями людей, которые в первую очередь разрабатывают набор тестов для LLM. Это скользкий вызов. Люди вроде меня возьмутся за это, но независимо от того, что мы придумаем, нужно помнить одну вещь: относительно немногие подсказки имеют «правильные» ответы. Это подсказки, по которым легко оценить производительность. Но мы можем ожидать много творческого использования этих инструментов, и в этот момент «правильные» ответы исчезают.

Ожидайте, что разные LLM будут вашими любимыми в разных ситуациях. И ожидайте, что вскоре появится целый ряд новых LLM, обученных преуспевать в различных контекстах. (Одним из примеров является Med-PaLM 2 от Google, созданный специально для медицинского применения.)

Ожидайте, что разные LLM будут вашими любимыми в разных ситуациях.

Чтобы вернуться к стенограмме и без особого редактирования (на этот раз), я оставлю вас с этим прощальным философским вопросом для размышления, возможно, с помощью помощника LLM:

Как вы должны измерить полезность LLM? Это с точки зрения экономии времени? С точки зрения вдохновения, которое довольно сложно измерить, или с точки зрения людей, которые возвращаются снова и снова? Или это с точки зрения всех миллионов, миллиардов, бесчисленных других способов, которыми мы, люди, могли бы создать то, что было бы нам полезно?

Спасибо за прочтение! Как насчет курса YouTube?

Если вам было весело здесь, и вы ищете полный курс прикладного ИИ, предназначенный для развлечения как новичков, так и экспертов, вот тот, который я сделал для вашего развлечения:

P.S. Вы когда-нибудь пытались нажать кнопку хлопка здесь, на Medium, более одного раза, чтобы посмотреть, что произойдет? ❤️

Ищете практические руководства по ML/AI?

Вот некоторые из моих любимых 10-минутных прохождений:

Понравился автор? Связаться с Кэсси Козырьковой

Давай будем друзьями! Вы можете найти меня в Twitter, YouTube, Substack и LinkedIn. Хотите, чтобы я выступил на вашем мероприятии? Используйте эту форму для связи.