Публикации по тегам data-science

Публикации по теме 'data-science'

Масштабирование функций в машинном обучении

1. Что такое масштабирование функций? Масштабирование признаков — это статистическая операция использования значений признаков для их масштабирования до меньших и аналогичных диапазонов. Он широко используется при предварительной обработке данных перед дальнейшим проектированием признаков в машинном обучении и глубоком обучении. 2. Какие существуют методы масштабирования характеристик? Существует 3 основных подхода, каждый из которых состоит из своих вариантов масштабирования..

Краткий обзор: как использовать функцию Across в программировании на R

( Обновление от 16 февраля: я возвращаюсь назад, чтобы включить исправление, упомянутое в комментариях Пола Джейкобсона, а также еще один пример из ChatGPT, который, как я думаю, добавит понимания (хотя объяснение мне не так нравится). :-) ). Отдельное спасибо Павлу за то, что заметил мою оплошность. Скоро будет обновление… Спасибо за терпение ) Если вы только начинаете изучать R и науку о данных, вы найдете функции, которые станут вашей основной тактикой при создании кода. Одна из..

Разработка через тестирование в MLOps, часть 2

Подход к разработке через тестирование приложений на основе машинного обучения Это вторая часть из трех частей. Предлагаю вам прочитать часть 1 для лучшего понимания: Разработка через тестирование в MLOps, часть 1 Подход к разработке через тестирование приложений на основе ML medium.com В этой статье мы продолжим создание приложений на основе машинного обучения с использованием подхода TDD, уделяя особое внимание следующему:..

Самостоятельное обучение — это непросто: 5 советов для начинающих

Когда вы изучаете машинное обучение и науку о данных, может быть трудно найти время и энергию для обучения. Этот пост в блоге поможет вам с некоторыми советами по самостоятельному изучению машинного обучения и науки о данных, чтобы вы не выгорели до окончания учебы! Начните с основ

10 лучших трюков JupyterLab, которые я нашел после трех лет использования

Вы можете начать использовать их прямо в эту секунду Не могу поверить, что говорю это, но прошло почти три года с тех пор, как я изучаю науку о данных. И на протяжении всего этого периода неизменным оставалось только одно — моя любовь к JupyterLab.

Прогнозирование жанра песни с помощью обработки естественного языка

В одних жанрах одни тексты песен встречаются чаще, чем другие? Мне всегда было любопытно, как количественно определить значение или взаимосвязь между словами. В конце концов, я привык обрабатывать числа или кодировать переменные как числа и вводить их в статистические модели и модели машинного обучения. Поэтому я выбрал изучение обработки естественного языка (NLP), среди других тем машинного обучения в моем классе Python, чтобы узнать. Мне и моим товарищам по команде было интересно..

Работа с задачей о рюкзаке, часть 2 (информатика)

Возможный метод решения SDP-релаксации квадратичной задачи о рюкзаке (arXiv) Автор: Тяньюнь Тан , Ким-Чуан То . Аннотация: В этой статье мы рассматриваем SDP-релаксацию квадратичной задачи о рюкзаке (QKP). После использования факторизации Бюрера-Монтейро мы получаем невыпуклую задачу оптимизации, допустимая область которой является алгебраическим многообразием. Хотя на алгебраическом многообразии могут быть нерегулярные точки, мы доказываем, что алгебраическое многообразие является..