Публикации по тегам data-science

Публикации по теме 'data-science'

Начало работы с линейной регрессией Продолжение…

Начало работы с линейной регрессией Продолжение… Обычный метод наименьших квадратов (OLS) Итак, первая таблица в регрессии в statsmodels — это сводная таблица модели или таблица OLS. Так что же такое OLS? ну, это самый распространенный метод определения уравнения регрессии. вы помните точечную диаграмму в последняя статья этой серии, только представьте, сколько линий может пройти через нее, но будет только одна линия, которая будет наименее удалена от всех точек на диаграмме..

Наши колонки

Колонки на TDS - это тщательно подобранные коллекции сообщений по определенной идее или категории статей. Мы организовали эти статьи, чтобы помочь людям, которым может быть интересна конкретная тема. Например, вы можете получить информацию о том, как устроиться на работу в сфере машинного обучения или науки о данных. Вы можете найти наши лучшие статьи по этой теме в колонке Часы работы . Читая статьи в столбце, имейте в виду, что вы можете вернуться в столбец в любое время, нажав..

Понимание динамической деформации времени (информатика)

Динамическое искажение времени в сильно субквадратичном времени: алгоритмы для режима малых расстояний и приближенная оценка ( arXiv ) Автор: Уильям Кусмаул Аннотация . Динамическое расстояние искривления времени (DTW) — это широко используемый показатель расстояния между временными рядами. Наиболее известные алгоритмы вычисления DTW работают почти за квадратичное время, а условные нижние границы запрещают существование значительно более быстрых алгоритмов. Однако нижние..

День 22 #DataScience28: Технологии больших данных для науки о данных

В сегодняшнюю цифровую эпоху объем генерируемых данных растет беспрецедентными темпами. Согласно отчету Statista, ожидается, что к 2025 году общий объем данных, созданных, захваченных и реплицированных по всему миру, достигнет 181 зеттабайта. Этот ошеломляющий объем данных вызвал потребность в передовых технологиях для хранения, обработки и анализа больших объемов данных. объемы данных. Здесь на помощь приходят технологии больших данных. В этой статье мы обсудим наиболее важные..

Понимание TF-IDF: традиционный подход к извлечению признаков в НЛП

Изучите основы TF-IDF и как реализовать его с нуля на Python. Введение Извлечение признаков — важный начальный шаг в НЛП , который включает преобразование текстовых данных в математическое представление, часто в виде векторов, известных как встраивания слов . Существуют различные подходы к встраиванию слов, начиная от классических подходов, таких как word2vec и GloVe , до более современных, таких как встраивания BERT . Хотя сегодня в области НЛП преобладают встраивания на..

Дополнительный! Дополнительный!

Узнайте все о журналистике данных Наука о данных оказала влияние практически на все основные области человеческой деятельности: коммерцию, образование, энергетику, программное обеспечение и журналистику. В этой статье я покажу вам, как журналисты могут находить информационные истории в коллекциях документов. Что такое журналистика данных? Журналистика данных — это новый набор навыков для поиска, понимания и визуализации цифровых источников в то время, когда базовых навыков..

Как далеко мы продвинулись с нейроморфными вычислениями в 2023 году, часть 7

Фотонные нейронные сети с высокоэффективными протоколами обучения для сверхбыстрых нейроморфных вычислительных систем (arXiv) Автор: Дафидд Оуэн-Ньюнс , Джошуа Робертсон , Матей Хейда , Антонио Уртадо . Аннотация: Фотонные технологии открывают большие перспективы для новых сверхбыстрых, энергоэффективных и дружественных к оборудованию нейроморфных (подобных мозгу) вычислительных платформ. Кроме того, особый интерес представляют нейроморфные фотонные подходы, основанные на..