Эй технари! Добро пожаловать в мою самую первую статью в Интернете. Я гордый инженер-программист и любопытный пришелец из захватывающего мира науки о данных, машинного обучения и глубокого обучения.
Я работаю в этой области последние 2-3 года, и я должен сказать вам, что это довольно захватывающее путешествие, полное новых безграничных возможностей, которое меняет мир каждый день. например, как вы блокируете/разблокируете свой телефон. раньше вы сохраняли PIN-код или графический ключ, чтобы защитить свое устройство, но теперь вы можете использовать свое собственное лицо, чтобы заблокировать / разблокировать свой телефон, и теперь это возможно с помощью AI / ML.
Я до сих пор помню свой самый первый шаг в этой области и знаю, как сложно новичкам найти правильное направление в изучении машинного обучения. Поэтому я решил найти лучший путь изучения машинного обучения, чтобы новичкам было легче найти свой путь в машинном обучении.
Что нужно, чтобы заняться наукой о данных или машинным обучением
Немного знаний в области программирования, Интерес к математике/статистике и много терпения!
Да! это все, что я считаю необходимым условием для поступления в ML.
1. Зарядитесь энергией
Прежде чем приступить к учебе или программированию, сначала зарядитесь энергией и скажите себе, что это займет некоторое время, но в конце концов оно того стоит.
Да, путь изучения машинного обучения похож на шоссе, и вам потребуется некоторое время, чтобы добраться до места назначения. В отличие от изучения любого языка программирования, изучение машинного обучения отличается тем, что здесь вы будете изучать всю экосистему машинного обучения, состоящую из множества инструментов, библиотек, алгоритмов, методов и новых идей. Так что пристегните ремень безопасности и не забудьте подзарядиться, прочитав несколько историй успеха в этой области, чтобы найти для себя мотивацию:
Истории успеха машинного обучения:
Сундар Пичаи: Как машинное обучение и глубокое обучение улучшили технологии
Подъем ИИ: как машинное обучение изменит мир
2. Изучайте Python/R
Самое первое, что вам нужно сделать, это изучить язык программирования, который широко используется в проектах ML, создании библиотек ML, а именно Python или R. Я бы порекомендовал изучить Python, так как это один из самых популярных языков программирования в области Data Science/ML, и его недавний рост показывает это, а также один из самых простых в освоении. Мне потребовалась пара недель, чтобы изучить Python, включая некоторые из его популярных пакетов, таких как pandas, numpy, flask, pickle и т. д. и т. д.
3. Статистика и математика — хорошие друзья инженера машинного обучения
Я знаю, что вы, возможно, сейчас испугались, прочитав «Статистика и математика», но я не буду просить учить их, а некоторые очень важные темы, которые помогут вам выжить в этой области.
Статистика обучения важна, потому что она помогает вам понять работу алгоритмов машинного обучения, поскольку все алгоритмы машинного обучения имеют в своей основе статистику.
Важные темы:
- "Описательная статистика"
- "Выведенный статистика"
- Линейная алгебра, метрики, векторы, метрико-векторные операции
- Вероятность, центральная предельная теорема, нормальное распределение и проверка гипотез
Наиболее популярные библиотеки Python для статистического анализа: NumPy, statsmodels
4. Исследовательский анализ данных
Прежде чем начать EDA, я хотел бы, чтобы вы знали, что, поскольку вы только собираетесь начать свое путешествие в ML, вы можете пока пропустить EDA и перейти к следующей теме, но позже вам придется научиться быть полноценным инженером ML. .
Данные — это новая нефть. Да, для обучения модели машинного обучения нам нужно много данных, и данные могут быть собраны откуда угодно, например, из СУБД, баз данных NoSQL, плоских файлов, данных сигналов и т. д. Такие данные необходимо обработать и очистить перед обучением модели машинного обучения (Дон не волнуйтесь, вы познакомитесь с «Моделью», «Очисткой данных», «Разработкой признаков» позже).
Чтобы узнать поведение или закономерность данных, вам нужно нанести их на график, и это поможет вам лучше понять ваши данные и, таким образом, упростить принятие решений.
Важные темы:
- Введение в исследовательский анализ данных (EDA)
- Графики для изучения взаимосвязи между двумя переменными (гистограммы),
- Блочные диаграммы для изучения одной переменной (тепловые карты)
- Соедините графики для изучения взаимосвязей
Практика: выполните EDA, чтобы исследовать выживание, используя наборы данных Титаника.
Наиболее популярные библиотеки Python для построения графиков: MatplotLib, Seaborn и Bokeh.
Pandas — самый популярный пакет Python. pandas упрощает процесс загрузки данных в приложение ML и предоставляет простые способы очистки данных и управления ими.
5. Готовы погрузиться в машинное обучение
До сих пор вы ничего не сделали для ML. Если вы помните, я упоминал ранее, что, в отличие от изучения языков программирования, изучение машин отличается. Здесь вы будете изучать экосистему, и каждый компонент экосистемы машинного обучения играет жизненно важную роль в создании приложения машинного обучения от сбора данных до очистки данных, проектирования функций, масштабирования функций, разделения обучения и тестирования, выбора алгоритма, модели обучения и оценки модели. и отбор. Типичное приложение ML состоит из этих задач и может варьироваться в зависимости от приложения.
Я хотел бы порекомендовать один курс известного человека в мире машинного обучения Эндрю Нг. Я прошел этот курс еще в 2019 году и получил сертификат этого курса. Ссылка на сертификат
Есть много курсов, но этот мне нравится больше всего, потому что объяснение алгоритма доступно и глубоко. Этот курс дал мне большую уверенность в прошлом и помог мне улучшить свои знания.
Курс: Машинное обучение, предлагаемое Стэнфордом
Важные темы:
Основы машинного обучения:
- Что такое машинное обучение?
- Варианты использования приложения машинного обучения
- Типы машинного обучения — от контролируемых до неконтролируемых методов
- Рабочий процесс машинного обучения
Лучшие алгоритмы машинного обучения
- Линейная регрессия
- Логистическая регрессия
- Дерево решений и случайный лес
- SVM
- Кластеризация K-средних
- Алгоритмы уменьшения размерности (Анализ главных компонентов)
- Ансамблевые алгоритмы
Самые популярные библиотеки машинного обучения: Scikit-Learn
Я также подготовил список важных тем, которые могут помочь вам лучше понять методы машинного обучения и обогатить свои знания.
6. Оставайтесь на связи с сообществами Data Science
Пока вы изучаете методы ML, вам необходимо оставаться на связи с некоторыми известными сообществами Data Science, где люди часто делятся своей работой в области ML и обмениваются знаниями друг друга.
Kaggle, Analytics Vidhya, Machine Learning Mastery и KD Nuggets — некоторые из активных сообществ.
7. Продвинутые методы машинного обучения и запачканные руки с помощью глубокого обучения
Как только вы хорошо освоите алгоритмы и основы машинного обучения, пришло время изучить более продвинутые методы машинного обучения, такие как компромисс между отклонениями, регуляризация, методы оценки модели, такие как Consufion Matrix, Precision/Recall/Accuracy, F-Measure, Type1/2 Errors. , методы перекрестной проверки и т. д. и т. д.
Глубокое обучение пользуется наибольшим спросом в мире искусственного интеллекта.
Глубокое обучение – это область машинного обучения, связанная с алгоритмами, вдохновленными структурой и функциями мозга, которые называются искусственными нейронными сетями.
Я ограничу эту статью машинным обучением и не буду освещать какие-либо аспекты глубокого обучения. В ближайшие дни я создам отдельную статью для пути изучения глубокого обучения.
Я хотел бы завершить на этом и надеюсь, что эта статья сделает ваш вход в область машинного обучения менее болезненным и даст вам представление о том, с чего начать и что изучать в отношении экосистемы машинного обучения.
Наслаждайтесь машинным обучением!