Публикации по тегам large-language-models

Публикации по теме 'large-language-models'

Тонкая настройка модели для разговора на английском и китайском языках

В Preemo мы создали модель, которая понимает и воспроизводит как английский, так и китайский языки, используя эффективную и быструю форму тонкой настройки для улучшения моделей и данных с открытым исходным кодом. Новая модель, которую мы называем Alpaca LoRA 30B, может быть проинструктирована на английском и китайском языках и хорошо работает на обоих языках в задачах генерации кода и творческого письма. Чтобы создать эту новую модель, мы доработали модель LLaMA с параметрами 30B от Meta,..

GitEase — Инструмент для упрощения использования Git с добавлением магии искусственного интеллекта.

TL’DR Не каждое изменение кода имеет важное значение; для быстрого исправления в качестве единственного участника или игрушечного примера GitEase — это упрощенный способ использования Git. Помните, когда в последний раз вам приходилось искать, как отменить последнее изменение, или разницу между извлечением и извлечением? 🙈 Что, если бы вы могли просто использовать осмысленные команды, такие как save , load , share и undo ? Что, если ИИ возьмет на себя тяжелую умственную..

ТРИЛЕММА ГЕНЕРАТИВНОГО ОБУЧЕНИЯ

ТРИЛЕММА ГЕНЕРАТИВНОГО ОБУЧЕНИЯ В настоящее время системы генеративного обучения не могут одновременно соответствовать трем основным критериям, которые часто необходимы для их широкого использования в реальных приложениях. Эти критерии включают (i) получение высококачественных выборок, (ii) охват всех режимов и создание разнообразных выборок и (iii) быстрое создание выборок с низкими вычислительными затратами. Было замечено, что диффузионные модели обычно делают предположение, что..

[Обзор статьи] Восемь вещей, которые нужно знать о больших языковых моделях (2023 г.)

Моя команда рассматривает «Paper Review» как проект по развитию компетенций. Итак, каждую неделю я буду загружать на Medium как минимум одну публикацию с обзором статьи, название которой начинается с «[Обзор статьи]». Название статьи | Восемь вещей, которые нужно знать о больших языковых моделях Автор | Сэмюэл Р. Боуман (Нью-Йоркский университет 2Anthropic, PBC.) Дата | 2 апреля 2023 г. Документ представляет собой статью Сэмюэля Р. Боумена, в которой рассматриваются восемь..

Генеративный ИИ — поиск документов и ответы на вопросы с LLM

Примените LLM к данным вашего домена С помощью больших языковых моделей (LLM) мы можем интегрировать данные, относящиеся к предметной области, для ответа на вопросы. Это особенно полезно для данных, недоступных для модели во время ее первоначального обучения, таких как внутренняя документация компании или база знаний. Эта архитектура называется Retrieval Augmentation Generation или менее часто используемой генеративной системой ответов на вопросы .