Публикации по теме 'titanic-dataset'


Выбор функций в машинном обучении с помощью Sklearn
Многие из нас сталкиваются с ситуацией, когда мы находим набор данных, имеющий большое количество атрибутов, мы называем его набором данных высокой размерности. Основная проблема с высокой размерностью заключается в том, что некоторые атрибуты не влияют на результат (например, идентификатор человека, имя человека). Использование таких атрибутов для обучения модели может привести к проблемам, связанным с точностью и оценкой модели, но в основном, просто просматривая набор данных, мы не можем..