Сдайте сертификационный экзамен Azure Data Science Associate: проектирование и внедрение решения для обработки и анализа данных в Azure (DP-100).

Последнее обновление статьи: март 2022 г.

Введение

Итак, вы хотите стать Certified Azure Data Science Associate? Вы находитесь в правильном месте. В этой статье содержится все, что вам нужно знать о DP-100, сертификате Microsoft Azure для облачных вычислений и обработки данных, который проверяет вашу способность разрабатывать и внедрять решения для машинного обучения с использованием Azure ML.

После изложения спецификаций экзамена мы начнем с рассмотрения того, что входит в экзамен DP-100, а также 5 типов вопросов, с которыми вы столкнетесь. Затем мы рассмотрим некоторые подготовительные действия, и я расскажу, какие ресурсы следует изучать, а каких следует избегать. Когда вы будете готовы к экзамену, я покажу вам, как запланировать его и чего ожидать в день экзамена.

Характеристики экзамена

DP-100 — экзамен средней сложности (сложнее, чем AZ-900, — более сопоставим с AWS MLS-C01).

  • Продолжительность: 40–60 вопросов.
  • Продолжительность: 120 минут.
  • Стоимость экзамена: 165 долларов США.
  • Формат вопроса: множественный выбор (один или два правильных ответа), заполнение пробелов с вариантами завершения кода, вопросы на основе сценариев, переупорядочение последовательности (без тематических исследований). Штрафа за неправильный ответ нет.
  • Проходной балл: 700/1000 баллов (70%).
  • Последнее обновление экзамена:20 мая 2021 г.
  • Политика повторной сдачи: 24-часовой период ожидания после 1-й неудачи. 14-дневный период ожидания после 2-го, 3-го и 4-го сбоев. 1 год ожидания после 5-го отказа.
  • Среда тестирования:онлайн через Pearson VUE или на месте.

Содержание экзамена

Содержание экзамена разбито на четыре части:

  1. Управление ресурсами Azure для машинного обучения (25–30 % экзамена)
  2. Проведение экспериментов и обучение моделей (20–25%)
  3. Развертывание и внедрение решений машинного обучения (35–40%)
  4. Внедрить ответственное машинное обучение (5–10%)

Я настоятельно рекомендую прочитать схему официальные сертификационные навыки, чтобы узнать больше о содержании экзамена.

Типы вопросов

Как упоминалось в спецификациях экзамена, тест состоит из пяти различных типов вопросов. Штрафа за неправильные ответы нет, поэтому обязательно отвечайте на каждый вопрос. Вы также можете получить частичный кредит за вопросы (если применимо). За исключением вопросов, основанных на сценариях, вопросы можно пометить для проверки при сдаче экзамена онлайн через Pearson VUE.

  1. Множественный выбор с 1 правильным ответом и 3 неправильными вариантами.
  2. Множественный выбор с 2 правильными ответами и 3 неправильными вариантами.
  3. Заполните пустые поля вариантами завершения кода. Для ответов на эти вопросы вам будет предоставлен банк возможных решений, и вам будет предложено выбрать соответствующую строку для заполнения пропусков. Блоки кода почти всегда будут использовать Комплект разработки программного обеспечения для машинного обучения Azure (SDK) для Python. Фактически, единственный код, который вам нужно знать для этого экзамена, — это пакет Azure ML SDK для python и некоторое базовое знакомство с интерфейсом командной строки Azure (CLI). Вот пример такого типа вопроса.

Отказ от ответственности: все эти примеры вопросов были написаны мной, чтобы проиллюстрировать стиль вопросов DP-100. Содержимое основано на коде Лаборатории машинного обучения Azure, предоставленном Microsoft Learn, и НЕ основано на каких-либо фактических или практических экзаменационных вопросах.

Fill-in-the-blank example question: 
You want to write code to connect to your Azure ML workspace. Fill in the blank with the option that completes this code block.
import azureml.core
from azureml.core import Workspace

# Load the workspace from the saved config file
ws = ________.from_config()
"Bank" of Options: 
- print
- Workspace
- log
- Experiment 
Correct Answer: Workspace.

4. Переупорядочивание последовательности. В этом типе вопросов вам будет предложено задание и список последовательных действий. Вопрос скажет вам, сколько всего шагов требуется для выполнения задачи. Ваша задача будет заключаться в том, чтобы выбрать правильные действия из списка и расположить их в правильном порядке. Вот пример.

Sequence Reordering example question:
You're working for a large consulting firm, and you want to train a machine learning model for computer vision using Azure ML. Using images from your colleagues, you want to create a neural network that categorizes new images as either cats or dogs. What four steps do you need to do to train your model?
"Bank" of Steps: 
1. Submit your experiment run 
2. Create a ScriptRunConfig object to connect your training script to your environment
3. Create a batch inferencing service to make inferences overnight
4. Create a training script to train your model 
5. Connect to your workspace
6. Create an EqualizedOdds object to detect unfairness in your model. 
Correct Answer: 5 -> 4 -> 2 -> 1. Note that 3 and 6 were not used.

5. Вопросы на основе сценария. Этот тип вопроса начинается с описания распространенной проблемы с решением Azure ML. Затем он предлагает потенциальное решение этой проблемы. Ваша задача — определить, действительно ли это решение может решить проблему. Этот раздел не подлежит проверке, поскольку эти сценарии будут использоваться повторно, поэтому, как только вы нажмете «Далее», ваш ответ станет каменным и больше не будет вам виден. Эти основанные на сценариях вопросы входят в наборы из 3 и появляются в конце экзамена DP-100. Вот пример.

Scenario-Based example questions:
Question 1: This scenario will be reused for the next three questions. You've written some code to use AutoML to train a binary classification model. Your training dataset is heavily imbalanced with 10 times as many negative classes relative to positive classes. Unfortunately, your code fails to run. After asking a colleague to review your code, she finds that you're missing a line in your AutoMLConfig. She inserts code below (at <<< insert line here >>>):
automl_config = AutoMLConfig(name='Automated ML Experiment',
                             task='classification',
                             compute_target=training_cluster,
                             training_data = train_ds,
                             validation_data = test_ds,
                             label_column_name='Diabetic',
                             iterations=4,
                             <<< insert line here >>>,
                             max_concurrent_iterations=2,
                             featurization='auto'
                             )
She adds the line "vm_size='STANDARD_DS11_V2'". Does this actually solve the problem? 
Correct Answer: No. 
Question 2. <<<Scenario repeated>>> This time, she adds the line "primary_metric = 'AUC_weighted'" Does this actually solve the problem? 
Correct Answer: Yes.
Question 3. <<<Scenario repeated>>> This time, she adds the line "primary_metric = 'normalized_mean_absolute_error'" Does this actually solve the problem?
Correct Answer: No.

Что нужно и чего нельзя делать при подготовке

Вот несколько советов по обучению, которые помогли мне пройти DP-100 с первой попытки.

  • НЕОБХОДИМО использовать бесплатный курс обучения Microsoft DP-100. Microsoft предоставляет бесплатные ресурсы, которые помогут вам подготовиться к экзамену DP-100. Путь обучения Создание и эксплуатация решений для машинного обучения с помощью машинного обучения Azure включает 15 модулей высококачественного контента, соответствующего содержанию экзамена DP-100. Хотя вам, вероятно, не нужно читать каждое слово каждого модуля, это отличное место для начала подготовки. Каждый модуль также завершается проверкой знаний — мини-викториной для проверки вашего понимания материала. По крайней мере, вы должны убедиться, что вы можете пройти все проверки знаний перед сдачей экзамена.
  • НЕОБХОДИМО потратить время на изучение Azure ML SDK для python. Чтобы сдать экзамен DP-100, вам необходимо очень хорошо понимать SDK машинного обучения Azure для python. Лучший способ сделать это — просмотреть Лаборатории машинного обучения Azure, предоставленные Microsoft Learn. Эти лабораторные работы написаны корпорацией Майкрософт и используются в курсах DP-100T01 под руководством инструкторов, поэтому они гарантированно актуальны и соответствуют материалам экзамена.
  • НЕОБХОДИМО создать бесплатную пробную учетную запись Azure, чтобы получить практический опыт работы с Azure ML. Microsoft предлагает кредиты Azure на сумму 200 долларов США, которые можно использовать в течение первых 30 дней после создания учетной записи Azure (подробности здесь). Я настоятельно рекомендую воспользоваться этим, чтобы опробовать некоторые из учебных лабораторий Azure ML.
    Совет для профессионалов. Если вы исчерпали кредит в размере 200 долларов США или уже использовали свой основной адрес электронной почты, просто создайте новый адрес электронной почты Outlook и используйте его для бесплатной пробной версии.

Вот некоторые вещи, от которых я бы порекомендовал воздержаться во время подготовки.

  • НЕ используйте онлайн-дампы экзамена DP-100. Если вы погуглите любой сертификационный экзамен по облачным технологиям, вы обязательно найдете веб-сайты с дампами экзаменов. Сайты экзаменационных дампов содержат настоящие вопросы из прошлых экзаменов, составленные людьми, которые сдавали экзамен в прошлом. К сожалению, экзаменационные дампы не являются хорошим учебным материалом по ряду причин (помимо того, что они противоречат закону об авторском праве). Во-первых, у создателей тестов Microsoft тоже есть Google. Экзамены часто меняются и обновляются, и Microsoft постоянно следит за тем, чтобы вопросы, которые появляются в дампах экзаменов, не появлялись на вашем реальном экзамене. Во-вторых, фактическое содержание экзамена DP-100 также менялось с течением времени, поэтому также нет гарантии, что вопросы, которые были на экзамене DP-100 в прошлом, будут охватывать тот же материал, что и ваш тест сейчас. Наконец, что наиболее важно, доступ к дампам экзаменов может привести к пожизненному запрету на получение сертификатов Microsoft вместе с мгновенным провалом на текущем экзамене (помните тот закон об авторском праве, о котором я упоминал?). Серьезно — не используйте дампы экзаменов.
    Примечание. Если вам действительно нужны практические вопросы, я рекомендую WhizLabs (к сожалению, не спонсируется). Я использовал тренировочные тесты WhizLabs, чтобы ознакомиться со стилем вопросов, и обнаружил, что они довольно точно отражают фактический тест.
  • НЕ игнорируйте материалы экзамена во время учебы. Проценты рядом с каждым разделом содержания экзамена — ваши друзья! Вы должны планировать распределение своего внимания в соответствии с этими процентами при обучении. Как бы ни было интересно узнать о дифференциальной конфиденциальности и значениях SHAP, помните, что они составляют всего 5–10% всего экзамена (3–6 вопросов в тесте из 60 вопросов). С другой стороны, 25–30 % текущего теста посвящено управлению ресурсами Azure для машинного обучения, а это означает, что лучше потратить время на ознакомление с основами Azure.
  • НЕ забудьте потратить некоторое время на автоматизированное машинное обучение и визуальные инструменты конструктора. Несмотря на то, что вам следует уделить много времени изучению пакета Azure ML SDK для Python, убедитесь, что вы также знакомы с визуальными инструментами Auto ML и Designer. Большинство учебных планов, в том числе собственный план обучения Microsoft DP-100, вначале кратко охватывают эти два инструмента, а затем углубляются в SDK Python. Обязательно вернитесь к Auto ML и Designer еще раз перед экзаменом, так как вы, скорее всего, получите несколько вопросов об этих возможностях сами по себе.

Планирование экзамена и советы по дню экзамена

Когда вы будете почти готовы, перейдите на официальную страницу экзамена Microsoft и нажмите кнопку, чтобы начать запланировать свой экзамен. Места для экзаменов различаются по доступности. Если есть свободное время, вы можете запланировать экзамен на следующий день, но есть места и на последующие месяцы. Я рекомендую планировать экзамен за неделю или две до него. Будьте готовы создать профиль сертификации, если у вас его еще нет, проверить часть своей личной информации и указать способ оплаты экзаменационного взноса в размере 165 долларов США.

У вас также будет выбор: сдавать экзамен лично или онлайн через Pearson VUE. Я решил сдавать экзамен онлайн, поэтому не могу комментировать очный прокторинг, но скажу, что мой опыт работы с Pearson VUE был очень положительным. Вот несколько советов, которые сделают вашу работу с Pearson VUE максимально комфортной.

  • Убедитесь, что в помещении для сдачи теста тихо и что вас никто не будет отвлекать на протяжении всего теста. Во избежание списывания результаты вашего теста могут быть аннулированы, если кто-либо еще находится с вами в комнате во время сдачи экзамена. Программное обеспечение Pearson VUE также будет использовать микрофон вашего компьютера для записи любых звуков, издаваемых во время теста, чтобы предотвратить мошенничество с помощью аудиосигналов. Это также означает, что вам нужно будет хранить молчание на протяжении всего теста — не читать вопросы вслух, так как это может привести к дисквалификации.
  • Убедитесь, что место для сдачи теста максимально пустое. Перед экзаменом вам нужно будет сделать четыре снимка спереди, сзади, слева и справа от места сдачи теста. Прежде чем делать эти фотографии, убедитесь, что убрали из поля зрения бумагу, карандаши, внешние клавиатуры, мыши и т. д. в соответствии с правилами тестирования. Вам не разрешается писать во время теста (хотя вы можете использовать виртуальный блокнот) или использовать внешние устройства, поэтому лучше просто очистить зону тестирования.
  • Будьте внимательны к своим глазам во время теста. Ваша фронтальная камера будет записывать вас на протяжении всего теста, и на протяжении всего сеанса за вами будет наблюдать проктор Pearson VUE. Если вы не смотрите на экран компьютера во время теста, это вызовет подозрение, что вы мошенничаете. Если вам нравится смотреть вдаль, пока вы думаете, сделайте все возможное, чтобы сопротивляться этому желанию в течение 120 минут вашего экзамена.

Хотя кажется, что это множество правил, на самом деле они не очень заметны во время теста. Если вы не обманываете, вам действительно не о чем беспокоиться. Просто представьте, что вы снова в старшей школе и следуете тем же правилам, что и в реальном классе: молчите, смотрите на тест и не получайте помощи ни от кого и ни от чего.

Если вы зашли так далеко, поздравляю! Вы находитесь на пути к сдаче сертификационного экзамена Azure Data Science Associate. И последнее замечание: всегда помните, что сертификаты — это только начало вашего учебного пути, а не его конец. После того, как вы прошли сертификацию, вы должны использовать эту сертификацию с пользой — будь то на работе или в личном проекте.

Удачи на экзамене и успешной сертификации!