Привет, я Хай, и давайте поговорим о линейной регрессии!

Вы находите математические объяснения громоздкими и трудными для понимания, но все же хотели бы понять на высоком уровне, что делает модели данных, такие как линейная регрессия, такими успешными в бизнесе?

Тогда давайте поговорим о линейной регрессии. . . без математики!

Линейная регрессия — это способ предсказать число, например, сколько денег кто-то заработает или насколько хорош кто-то в определенной деятельности.

Представьте, что у вас есть куча данных о людях, и вы хотите предсказать, сколько денег они зарабатывают, исходя из того, сколько им лет. Вы можете нанести эти данные на график, где возраст будет внизу (ось X), а деньги, которые они зарабатывают, сбоку (ось Y).

Это может выглядеть примерно так:

Если вы проведете линию (красную линию) через середину всех точек (синие точки), вы можете использовать эту линию, чтобы сделать прогноз о том, сколько денег кто-то заработает в зависимости от его возраста. В сценариях реальной жизни у нас могут быть только ограниченные данные, как и выше, у нас есть только 10 точек данных, охватывающих возраст, хотя возраст может быть от 0 до 122 (при условии, что вы можете жить до самого старого человека, который когда-либо жил! ). Теперь, используя модель, мы можем сделать «прогноз» или «оценку» дохода для всех 122 лет, хотя наши данные показали истинный доход только для 10 разных возрастов. Это слишком упрощенный пример — в контексте реальной жизни нам потребуется больше данных, скажем, 10 000 точек данных, чтобы сделать прогнозы о 50 000 неизвестных значений.

Конечно, это может быть не на 100% точно, но при использовании на более сложных данных эти модели могут оказаться эффективным инструментом во многих сценариях реальной жизни.

Обратите внимание, что пример, показанный выше, является лишь проблеском того, что может сделать линейная регрессия. Линейную регрессию можно использовать для больших многомерных данных, которые было бы не так просто визуализировать, как график выше (приведенный выше график является двумерным). данные). Хорошо обученная модель сможет создать прогнозную линию (например, красную линию выше) и будет столь же эффективной в данных, которые распределены за пределами нашего воображения.

Если у вас есть какие-либо вопросы о линейной регрессии, науке о данных, машинном обучении или карьере, не стесняйтесь обращаться ко мне в комментариях.