Машинное обучение — это приложение ИИ, которое позволяет системам учиться и совершенствоваться на основе опыта без явного программирования.

Машинное обучение опирается на входные данные, такие как обучающие данные или графики знаний, для понимания вещей, областей и связей между ними, во многом так же, как человеческий мозг получает информацию и понимание. Он уже широко используется предприятиями во всех секторах для продвижения инноваций и повышения эффективности процессов.

Существует множество методов обучения машинному обучению на выбор:

· контролируемое обучение

· Неконтролируемое обучение

· Полуконтролируемое обучение

Следующее дерево дает четкое представление о различных типах.

Линейная регрессия – это контролируемый алгоритм машинного обучения, в котором прогнозируемый результат является непрерывным и имеет постоянный наклон. Он используется для прогнозирования значений в непрерывном диапазоне. Линейная регрессия используется для прогнозирования значения зависимой переменной (y) на основе заданной независимой переменной (x).

Хребетная регрессия — это метод настройки модели, который используется для анализа любых данных, страдающих от мультиколлинеарности. Этот метод выполняет регуляризацию L2.

Когда возникает проблема мультиколлинеарности, метод наименьших квадратов несмещен, а дисперсия велика, это приводит к тому, что прогнозируемые значения далеки от фактических значений.

Лассо-регрессия – это популярный тип регуляризованной линейной регрессии, который включает штраф L1. Это приводит к уменьшению коэффициентов для тех входных переменных, которые не вносят большого вклада в задачу прогнозирования.

В этой статье я объяснил линейную, гребенчатую и лассо-регрессию с использованием набора данных Hitter в Python.

Для этого набора данных мы сначала импортируем необходимые библиотеки.

Нормализация:

По мере роста числа признаков расчет градиента занимает больше времени. Мы можем ускорить это, «нормализовав» наши входные данные, чтобы убедиться, что все значения находятся в одном диапазоне. Наша цель теперь будет заключаться в том, чтобы нормализовать наши функции, чтобы все они находились в диапазоне от -1 до 1.

Линейная регрессия:

Здесь мы разделили данные на наборы обучающих и тестовых данных в соотношении 80:20 соответственно, и модель регрессии была подобрана для определения значения RMSE.

Мы создали альфа от 10 до -2 со 100 значениями для дальнейшего использования.

Регрессия хребта:

Мы подогнали регрессионную модель Риджа и нашли ошибку. Альфа-значение, созданное на предыдущем шаге, использовалось при настройке модели, чтобы найти наилучшее соответствие альфа.

Регрессия Лазо:

Модель лассо была подобрана, и значение альфа использовалось для настройки модели.

Вывод: из регрессии хребта и лассо мы можем сделать вывод, что RMSE регрессии хребта меньше, следовательно, регрессия хребта подходит хорошо.