Публикации по теме 'data-science'


Юпитер в докере
Узнайте, как запустить Jupyter в контейнере Docker. Позвольте мне показать вам, как можно простым способом запустить Jupyter Notebook в контейнере Docker . Это полезно, если вы хотите запустить Jupyter на сервере. Функции 😎 На основе Python 3.9 и Jupyter 6.5 . После запуска контейнера автоматически будут установлены библиотеки, расположенные в файле requirements.txt . Если вы хотите установить другие библиотеки, вы можете добавить их в файл requirements.txt и..

Сводка книг — шаблоны проектирования ML для создания систем на основе ML
https://www.amazon.com/Machine-Learning-Design-Patterns-Preparation/dp/1098115783 Общие проблемы при создании систем машинного обучения: 1. Качество данных 2. Полнота данных 3. Непротиворечивость данных Методы масштабирования данных: Линейное масштабирование — масштабирование минимум-максимум, отсечение для удаления выбросов и последующего масштабирования до [-1,1], нормализация Z-показателя и Winsorizing, при котором используется эмпирическое распределение в наборе обучающих данных для..

Последние инновации в сетях ReLU, часть 4 (машинное обучение)
Слегка завышенные параметры сетей ReLU имеют благоприятный ландшафт потерь (arXiv) Автор: Кедар Кархадкар , Майкл Мюррей , Ханна Церан , Гвидо Монтуфар . Аннотация: мы изучаем ландшафт потерь двухслойных нейронных сетей ReLU со слегка завышенными параметрами на общем конечном наборе входных данных для квадрата ошибки. Наш подход включает ограничение размерности множеств локальных и глобальных минимумов с использованием ранга якобиана карты параметризации. Используя результаты для..

Инновации с комбинаторной оптимизацией, часть 3 (информатика)
Минимизация матрицы плотности отвечает задаче комбинаторной оптимизации (arXiv) Автор: Ясухару Окамото . Аннотация: В работе исследуется новый гибридный метод решения комбинаторной задачи оптимизации дробных функций с 0–1 бинарными переменными. Этот метод сочетает в себе минимизацию матрицы плотности (DMM), поиск табу (TS) и алгоритм Динкельбаха для оптимизации дробных функций. Хотя сам по себе цифровой мультиметр не дает достаточно точного решения, сочетание цифрового мультиметра с..

[Обзор статьи] Восемь вещей, которые нужно знать о больших языковых моделях (2023 г.)
Моя команда рассматривает «Paper Review» как проект по развитию компетенций. Итак, каждую неделю я буду загружать на Medium как минимум одну публикацию с обзором статьи, название которой начинается с «[Обзор статьи]». Название статьи | Восемь вещей, которые нужно знать о больших языковых моделях Автор | Сэмюэл Р. Боуман (Нью-Йоркский университет 2Anthropic, PBC.) Дата | 2 апреля 2023 г. Документ представляет собой статью Сэмюэля Р. Боумена, в которой рассматриваются восемь..

Интервью по проектированию системы: пошаговое руководство
Как эффективно провести 45-минутное собеседование по проектированию системы. Интервью по проектированию систем (SDI) привлекли большое внимание в последние несколько лет. Теперь это стандартная часть каждого собеседования по разработке программного обеспечения. Эти собеседования оценивают способность кандидата работать со сложными системами. Показатели на этих собеседованиях определяют должность и зарплату, предлагаемую интервьюирующей компанией. Инженеры обычно борются с SDI..

Путешествие аспиранта по науке о данных: что вам нужно знать, чтобы достичь своих целей
Вы хотите стать специалистом по данным? Если да, то вас ждет увлекательное путешествие! Наука о данных — это быстро растущая и развивающаяся область, и она полна потенциала. Чтобы помочь вам начать свой путь к успеху, в этом блоге будет представлен обзор шагов, которые необходимо предпринять — от понимания основ науки о данных до практических шагов к карьере в этой области. Читайте дальше, чтобы узнать больше о том, что нужно, чтобы стать успешным специалистом по данным! Введение в..