Публикации по теме 'feature-engineering'


Масштабирование функций в машинном обучении
1. Что такое масштабирование функций? Масштабирование признаков — это статистическая операция использования значений признаков для их масштабирования до меньших и аналогичных диапазонов. Он широко используется при предварительной обработке данных перед дальнейшим проектированием признаков в машинном обучении и глубоком обучении. 2. Какие существуют методы масштабирования характеристик? Существует 3 основных подхода, каждый из которых состоит из своих вариантов масштабирования..

Все о выбросах в наборе данных
Итак, во-первых, что такое выброс? Давайте посмотрим на изображение, а затем начнем статью Выброс - это точка данных, которая представляет собой отдаленное значение в случайной выборке из совокупности. Точка данных, которая находится за пределами общее стандартное нормальное распределение данных называется выбросом. Обнаружение и обработка выбросов - очень важная часть исследовательского анализа данных. Выбросы - это те значения в наборе данных, которые лежат за пределами..