СРЕДСТВА МАШИННОГО ОБУЧЕНИЯ (для Rstudio)

ПЕРЕКРЕСТНАЯ ПРОВЕРКА (CV)

Перекрестная проверка играет важную роль в машинном обучении. CV — это игра с данными, чтобы понять их смысл — узнать о переоснащении, предвзятости выбора и, что наиболее важно, узнать об ошибке в данных. В этом случае ошибка обычно возводится в квадрат (не абсолютное значение или не возводится в некоторую степень четного числа, а возводится в квадрат), и рассуждение можно изучить, исследуя связь между ошибкой в ​​​​этом контексте и оценкой максимального правдоподобия (MLE). ).

РЕГУЛЯРИЗАЦИЯ — Почему лагранжев?

Для упрощения задачи используется регуляризация, а в качестве инструмента в этом поиске используется лагранжиан. В Rstudio пакет glmnet часто используется для работы с регуляризацией — альфа равна нулю для Ridge, а альфа равна единице для Lasso. Обычно ридж-регрессия используется, когда независимые переменные сильно коррелируют друг с другом. Эта регрессия сохраняет независимые переменные, но уменьшает их коэффициенты. С другой стороны, Лассо убивает некоторые независимые переменные, предлагая разреженное решение.

Ошибка обобщения проливает свет на ошибку неизвестных данных, давая ей название OUT OF SAMPLE ERROR. Обычно кривые обучения составляются с использованием ошибки обобщения.