Эй технари! Добро пожаловать в мою самую первую статью в Интернете. Я гордый инженер-программист и любопытный пришелец из захватывающего мира науки о данных, машинного обучения и глубокого обучения.

Я работаю в этой области последние 2-3 года, и я должен сказать вам, что это довольно захватывающее путешествие, полное новых безграничных возможностей, которое меняет мир каждый день. например, как вы блокируете/разблокируете свой телефон. раньше вы сохраняли PIN-код или графический ключ, чтобы защитить свое устройство, но теперь вы можете использовать свое собственное лицо, чтобы заблокировать / разблокировать свой телефон, и теперь это возможно с помощью AI / ML.

Я до сих пор помню свой самый первый шаг в этой области и знаю, как сложно новичкам найти правильное направление в изучении машинного обучения. Поэтому я решил найти лучший путь изучения машинного обучения, чтобы новичкам было легче найти свой путь в машинном обучении.

Что нужно, чтобы заняться наукой о данных или машинным обучением

Немного знаний в области программирования, Интерес к математике/статистике и много терпения!

Да! это все, что я считаю необходимым условием для поступления в ML.

1. Зарядитесь энергией

Прежде чем приступить к учебе или программированию, сначала зарядитесь энергией и скажите себе, что это займет некоторое время, но в конце концов оно того стоит.

Да, путь изучения машинного обучения похож на шоссе, и вам потребуется некоторое время, чтобы добраться до места назначения. В отличие от изучения любого языка программирования, изучение машинного обучения отличается тем, что здесь вы будете изучать всю экосистему машинного обучения, состоящую из множества инструментов, библиотек, алгоритмов, методов и новых идей. Так что пристегните ремень безопасности и не забудьте подзарядиться, прочитав несколько историй успеха в этой области, чтобы найти для себя мотивацию:

Истории успеха машинного обучения:

Жизнь на грани AI/ML

Сундар Пичаи: Как машинное обучение и глубокое обучение улучшили технологии

Подъем ИИ: как машинное обучение изменит мир

2. Изучайте Python/R

Самое первое, что вам нужно сделать, это изучить язык программирования, который широко используется в проектах ML, создании библиотек ML, а именно Python или R. Я бы порекомендовал изучить Python, так как это один из самых популярных языков программирования в области Data Science/ML, и его недавний рост показывает это, а также один из самых простых в освоении. Мне потребовалась пара недель, чтобы изучить Python, включая некоторые из его популярных пакетов, таких как pandas, numpy, flask, pickle и т. д. и т. д.

3. Статистика и математика — хорошие друзья инженера машинного обучения

Я знаю, что вы, возможно, сейчас испугались, прочитав «Статистика и математика», но я не буду просить учить их, а некоторые очень важные темы, которые помогут вам выжить в этой области.

Статистика обучения важна, потому что она помогает вам понять работу алгоритмов машинного обучения, поскольку все алгоритмы машинного обучения имеют в своей основе статистику.

Важные темы:

  1. "Описательная статистика"
  2. "Выведенный статистика"
  3. Линейная алгебра, метрики, векторы, метрико-векторные операции
  4. Вероятность, центральная предельная теорема, нормальное распределение и проверка гипотез

Наиболее популярные библиотеки Python для статистического анализа: NumPy, statsmodels

4. Исследовательский анализ данных

Прежде чем начать EDA, я хотел бы, чтобы вы знали, что, поскольку вы только собираетесь начать свое путешествие в ML, вы можете пока пропустить EDA и перейти к следующей теме, но позже вам придется научиться быть полноценным инженером ML. .

Данные — это новая нефть. Да, для обучения модели машинного обучения нам нужно много данных, и данные могут быть собраны откуда угодно, например, из СУБД, баз данных NoSQL, плоских файлов, данных сигналов и т. д. Такие данные необходимо обработать и очистить перед обучением модели машинного обучения (Дон не волнуйтесь, вы познакомитесь с «Моделью», «Очисткой данных», «Разработкой признаков» позже).

Чтобы узнать поведение или закономерность данных, вам нужно нанести их на график, и это поможет вам лучше понять ваши данные и, таким образом, упростить принятие решений.

Важные темы:

  1. Введение в исследовательский анализ данных (EDA)
  2. Графики для изучения взаимосвязи между двумя переменными (гистограммы),
  3. Блочные диаграммы для изучения одной переменной (тепловые карты)
  4. Соедините графики для изучения взаимосвязей

Практика: выполните EDA, чтобы исследовать выживание, используя наборы данных Титаника.

Наиболее популярные библиотеки Python для построения графиков: MatplotLib, Seaborn и Bokeh.

Pandas — самый популярный пакет Python. pandas упрощает процесс загрузки данных в приложение ML и предоставляет простые способы очистки данных и управления ими.

5. Готовы погрузиться в машинное обучение

До сих пор вы ничего не сделали для ML. Если вы помните, я упоминал ранее, что, в отличие от изучения языков программирования, изучение машин отличается. Здесь вы будете изучать экосистему, и каждый компонент экосистемы машинного обучения играет жизненно важную роль в создании приложения машинного обучения от сбора данных до очистки данных, проектирования функций, масштабирования функций, разделения обучения и тестирования, выбора алгоритма, модели обучения и оценки модели. и отбор. Типичное приложение ML состоит из этих задач и может варьироваться в зависимости от приложения.

Я хотел бы порекомендовать один курс известного человека в мире машинного обучения Эндрю Нг. Я прошел этот курс еще в 2019 году и получил сертификат этого курса. Ссылка на сертификат

Есть много курсов, но этот мне нравится больше всего, потому что объяснение алгоритма доступно и глубоко. Этот курс дал мне большую уверенность в прошлом и помог мне улучшить свои знания.

Курс: Машинное обучение, предлагаемое Стэнфордом

Важные темы:

Основы машинного обучения:

  1. Что такое машинное обучение?
  2. Варианты использования приложения машинного обучения
  3. Типы машинного обучения — от контролируемых до неконтролируемых методов
  4. Рабочий процесс машинного обучения

Лучшие алгоритмы машинного обучения

  1. Линейная регрессия
  2. Логистическая регрессия
  3. Дерево решений и случайный лес
  4. SVM
  5. Кластеризация K-средних
  6. Алгоритмы уменьшения размерности (Анализ главных компонентов)
  7. Ансамблевые алгоритмы

Самые популярные библиотеки машинного обучения: Scikit-Learn

Я также подготовил список важных тем, которые могут помочь вам лучше понять методы машинного обучения и обогатить свои знания.

6. Оставайтесь на связи с сообществами Data Science

Пока вы изучаете методы ML, вам необходимо оставаться на связи с некоторыми известными сообществами Data Science, где люди часто делятся своей работой в области ML и обмениваются знаниями друг друга.

Kaggle, Analytics Vidhya, Machine Learning Mastery и KD Nuggets — некоторые из активных сообществ.

7. Продвинутые методы машинного обучения и запачканные руки с помощью глубокого обучения

Как только вы хорошо освоите алгоритмы и основы машинного обучения, пришло время изучить более продвинутые методы машинного обучения, такие как компромисс между отклонениями, регуляризация, методы оценки модели, такие как Consufion Matrix, Precision/Recall/Accuracy, F-Measure, Type1/2 Errors. , методы перекрестной проверки и т. д. и т. д.

Глубокое обучение пользуется наибольшим спросом в мире искусственного интеллекта.

Глубокое обучение – это область машинного обучения, связанная с алгоритмами, вдохновленными структурой и функциями мозга, которые называются искусственными нейронными сетями.

Я ограничу эту статью машинным обучением и не буду освещать какие-либо аспекты глубокого обучения. В ближайшие дни я создам отдельную статью для пути изучения глубокого обучения.

Я хотел бы завершить на этом и надеюсь, что эта статья сделает ваш вход в область машинного обучения менее болезненным и даст вам представление о том, с чего начать и что изучать в отношении экосистемы машинного обучения.

Наслаждайтесь машинным обучением!