Публикации по теме 'feature-engineering'
Масштабирование функций в машинном обучении
1. Что такое масштабирование функций?
Масштабирование признаков — это статистическая операция использования значений признаков для их масштабирования до меньших и аналогичных диапазонов.
Он широко используется при предварительной обработке данных перед дальнейшим проектированием признаков в машинном обучении и глубоком обучении.
2. Какие существуют методы масштабирования характеристик?
Существует 3 основных подхода, каждый из которых состоит из своих вариантов масштабирования..
Все о выбросах в наборе данных
Итак, во-первых, что такое выброс?
Давайте посмотрим на изображение, а затем начнем статью
Выброс - это точка данных, которая представляет собой отдаленное значение в случайной выборке из совокупности. Точка данных, которая находится за пределами
общее стандартное нормальное распределение данных называется выбросом. Обнаружение и обработка выбросов - очень важная часть исследовательского анализа данных. Выбросы - это те значения в наборе данных, которые лежат за пределами..