Публикации по теме 'data-analysis'


Прогнозирование сердечных заболеваний с помощью машинного обучения (часть 2)
Это вторая часть предыдущей статьи, в которой добавлены этапы масштабирования и моделирования машинного обучения для классификации точек данных на наличие или отсутствие заболеваний сердца. В предыдущей части статьи ( Часть 1 ) я закончил описанием корреляционной матрицы между различными параметрами и целевой переменной (есть ли у пациента болезнь сердца или нет). Следующий шаг включает в себя использование процесса Label Encoding , где категориальные переменные, такие как пол ,..

От хаоса к ясности: расшифровка силы неструктурированных данных
Часть 1/3. Удивительный мир неструктурированных данных Добро пожаловать в дикий и удивительный мир данных, где царит хаос, а идеи прячутся среди неструктурированного хаоса! В этом приключении, состоящем из трех частей, мы отправимся в путешествие, чтобы раскрыть необузданную силу неструктурированных данных. Наше цифровое царство похоже на быстрорастущие джунгли данных, где информация появляется каждую секунду. И угадай что? Колоссальные 80% этих данных — это непослушные,..

Jupyter AI: Расширение AI для Jupyter Lab
Он добавляет собственный пользовательский интерфейс чата, волшебные команды для отправки запросов в ChatGPT и создает целые блокноты из текстового приглашения. Ранее мы видели, как добавить функции ChatGPT в Jupyter Notebook и VSCode с помощью расширений, а теперь пришло время для Jupyter Lab! Зачем тебе это? Что ж, в отличие от предыдущих расширений, которые я вам показывал, это предлагает пользовательский интерфейс чата, который позволяет нам общаться с диалоговым помощником..

Неконтролируемое обучение в Python: K-средства
Если мы не знаем, к какой категории нам следует отнести данные (правда муравья), мы можем использовать неконтролируемое обучение, чтобы позволить Python выполнять эту работу, однако это менее точно, чем обучение с учителем. Здесь мы используем известный набор данных Iris data, который вы можете найти в Интернете. Мы можем визуализировать только двух- или трехмерные данные с помощью точечной диаграммы, поэтому мы не можем сделать это с данными Iris. кластеризация k-средних..

Наука о данных по обмену данными об аренде велосипедов с использованием Python
Схема Это задание по анализу системы проката велосипедов . Используя эту систему, люди могут брать велосипеды напрокат в одном месте и возвращать их в другом по мере необходимости. Используемый здесь набор данных описывает спрос на эту систему аренды на основе различных факторов, таких как месяцы, праздники, времена года, температура и т. д. Используя приведенный ниже анализ, мы сможем определить тенденции, присутствующие в наборе данных. Часть 1. Загрузка данных Я..

Аспектно-ориентированный анализ настроений с помощью машинного обучения | 47 миллиардов
ПОСТРОЕНИЕ МОДЕЛИ ДЛЯ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ОБЗОРОВ AMAZON Целью статьи является извлечение мнений и выявление областей улучшения продукта, касающихся различных аспектов продукта, из их онлайн-обзоров. Почему именно эта газета? Плохая оценка продукта редко означает, что он плох во всех аспектах. Если доставка на Amazon была отложена на неделю, плохой отзыв не обязательно будет отражать качество продукта. Покупателям и продавцам важно понимать, о чем именно был отрицательный..

Улучшите свои навыки работы с ноутбуком Jupyter с помощью этих полезных советов
Наука о данных Улучшите свои навыки работы с ноутбуком Jupyter с помощью этих полезных советов 10 лайфхаков для ноутбуков Jupyter, которые повысят вашу продуктивность Введение Блокноты Jupyter — это интерактивные веб-документы, которые позволяют объединять код, текст и другие медиафайлы (например, изображения, видео и графики) в одном документе. Они часто используются для анализа данных, визуализации и машинного обучения и являются популярным инструментом среди ученых,..