Зачем соглашаться на монотонные и неуклюжие процессы, если мы можем вернуть немного времени и немного спокойствия с помощью нескольких изменений в том, как мы делаем свою работу? Авторы, которых мы публикуем в TDS, обладают глубоким и разносторонним опытом работы в промышленности, научных кругах и других секторах и щедро делятся своими мыслями. В этом выпуске Variable мы выделяем три недавние статьи, посвященные конкретному рабочему процессу обработки данных, и показываем, как мы можем подойти к нему эффективно и плавно. Наслаждаться!
- Пользовательский набор данных изображений доступен. Настраиваемые наборы данных могут быть чрезвычайно полезны для многих типов проектов машинного обучения. Подробный и доступный учебник Rachel Draelos показывает, как вы можете создавать наборы данных изображений в PyTorch в соответствии с вашими конкретными потребностями, и самое приятное то, что тот же метод можно применять и к текстовым и структурированным табличным наборам данных.
- Выбор правильных показателей для определения объяснимости. Практики машинного обучения все больше осознают важность объяснимости модели, но иногда трудно решить, какой подход подходит для вашей производственной модели. Франческо Марини знакомит нас с метриками (из открытых источников), которые он и его команда разработали для оценки качества объяснений.
- Правильный исследовательский анализ данных (EDA). Глубокое погружение Тары Бойл объясняет, как соискатели могут преуспеть в решении домашних задач, которые стали стандартным шагом в процессе найма. EDA в реальной жизни может быть более запутанным и менее структурированным, но упрощенный подход Тары к первому знакомству с набором данных полезен во многих других контекстах.
Ищете отличные материалы по другим темам? Вы определенно попали в нужное место — вот лишь несколько выдающихся статей за последние пару недель:
- Феликс Хофштеттер поделился долгим и захватывающим исследованием контрфактических явлений в контексте обучения с подкреплением, второй частью своей продолжающейся серии.
- Чтобы получить четкое наглядное представление о линейной регрессии, перейдите прямо к пояснителю Анжелы Ши.
- Офир Магдачи продолжает свою увлекательную работу на пересечении науки о данных и футбола, используя алгоритм Эло для оценки навыков дриблинга игроков.
- Мы любим проницательный анализ влиятельных статей — вот острый прогон Майи Павлович Глубокая вероятностная модель для прогнозирования пожизненной ценности клиента.
- Демонстрируя потенциал ИИ для борьбы с последствиями изменения климата, проект Тео Жакено объединяет геопространственные данные и дистанционное зондирование для прогнозирования риска лесных пожаров в США.
- Еще одна область, где искусственный интеллект может произвести большой фурор? Геномика. В недавнем выпуске подкаста TDS Джереми Харрис побеседовал с Тали Равех о перспективах иммунологии одиночных клеток на базе искусственного интеллекта.
Спасибо за знакомство с работой наших авторов на этой неделе и за вашу постоянную поддержку нашей публикации.
До следующей переменной,
Редакторы TDS