Пришло время оптимизировать рабочие процессы обработки данных?

Зачем соглашаться на монотонные и неуклюжие процессы, если мы можем вернуть немного времени и немного спокойствия с помощью нескольких изменений в том, как мы делаем свою работу? Авторы, которых мы публикуем в TDS, обладают глубоким и разносторонним опытом работы в промышленности, научных кругах и других секторах и щедро делятся своими мыслями. В этом выпуске Variable мы выделяем три недавние статьи, посвященные конкретному рабочему процессу обработки данных, и показываем, как мы можем подойти к нему эффективно и плавно. Наслаждаться!

Пользовательский набор данных изображений доступен. Настраиваемые наборы данных могут быть чрезвычайно полезны для многих типов проектов машинного обучения. Подробный и доступный учебник Rachel Draelos показывает, как вы можете создавать наборы данных изображений в PyTorch в соответствии с вашими конкретными потребностями, и самое приятное то, что тот же метод можно применять и к текстовым и структурированным табличным наборам данных.
Выбор правильных показателей для определения объяснимости. Практики машинного обучения все больше осознают важность объяснимости модели, но иногда трудно решить, какой подход подходит для вашей производственной модели. Франческо Марини знакомит нас с метриками (из открытых источников), которые он и его команда разработали для оценки качества объяснений.
Правильный исследовательский анализ данных (EDA). Глубокое погружение Тары Бойл объясняет, как соискатели могут преуспеть в решении домашних задач, которые стали стандартным шагом в процессе найма. EDA в реальной жизни может быть более запутанным и менее структурированным, но упрощенный подход Тары к первому знакомству с набором данных полезен во многих других контекстах.

Ищете отличные материалы по другим темам? Вы определенно попали в нужное место — вот лишь несколько выдающихся статей за последние пару недель:

Феликс Хофштеттер поделился долгим и захватывающим исследованием контрфактических явлений в контексте обучения с подкреплением, второй частью своей продолжающейся серии.
Чтобы получить четкое наглядное представление о линейной регрессии, перейдите прямо к пояснителю Анжелы Ши.
Офир Магдачи продолжает свою увлекательную работу на пересечении науки о данных и футбола, используя алгоритм Эло для оценки навыков дриблинга игроков.
Мы любим проницательный анализ влиятельных статей — вот острый прогон Майи Павлович Глубокая вероятностная модель для прогнозирования пожизненной ценности клиента.
Демонстрируя потенциал ИИ для борьбы с последствиями изменения климата, проект Тео Жакено объединяет геопространственные данные и дистанционное зондирование для прогнозирования риска лесных пожаров в США.
Еще одна область, где искусственный интеллект может произвести большой фурор? Геномика. В недавнем выпуске подкаста TDS Джереми Харрис побеседовал с Тали Равех о перспективах иммунологии одиночных клеток на базе искусственного интеллекта.

Спасибо за знакомство с работой наших авторов на этой неделе и за вашу постоянную поддержку нашей публикации.

До следующей переменной,

Редакторы TDS

Пришло время оптимизировать рабочие процессы обработки данных?

Похожие вопросы