Зачем соглашаться на монотонные и неуклюжие процессы, если мы можем вернуть немного времени и немного спокойствия с помощью нескольких изменений в том, как мы делаем свою работу? Авторы, которых мы публикуем в TDS, обладают глубоким и разносторонним опытом работы в промышленности, научных кругах и других секторах и щедро делятся своими мыслями. В этом выпуске Variable мы выделяем три недавние статьи, посвященные конкретному рабочему процессу обработки данных, и показываем, как мы можем подойти к нему эффективно и плавно. Наслаждаться!

  • Пользовательский набор данных изображений доступен. Настраиваемые наборы данных могут быть чрезвычайно полезны для многих типов проектов машинного обучения. Подробный и доступный учебник Rachel Draelos показывает, как вы можете создавать наборы данных изображений в PyTorch в соответствии с вашими конкретными потребностями, и самое приятное то, что тот же метод можно применять и к текстовым и структурированным табличным наборам данных.
  • Выбор правильных показателей для определения объяснимости. Практики машинного обучения все больше осознают важность объяснимости модели, но иногда трудно решить, какой подход подходит для вашей производственной модели. Франческо Марини знакомит нас с метриками (из открытых источников), которые он и его команда разработали для оценки качества объяснений.
  • Правильный исследовательский анализ данных (EDA). Глубокое погружение Тары Бойл объясняет, как соискатели могут преуспеть в решении домашних задач, которые стали стандартным шагом в процессе найма. EDA в реальной жизни может быть более запутанным и менее структурированным, но упрощенный подход Тары к первому знакомству с набором данных полезен во многих других контекстах.

Ищете отличные материалы по другим темам? Вы определенно попали в нужное место — вот лишь несколько выдающихся статей за последние пару недель:

Спасибо за знакомство с работой наших авторов на этой неделе и за вашу постоянную поддержку нашей публикации.

До следующей переменной,

Редакторы TDS