В рамках серии EDA я хочу познакомить вас с простым способом проведения одномерного анализа в интерактивном режиме с использованием браузера.
Plotly и его расширение Dash загружаются 5 миллионов раз в месяц.
Я буду использовать самый простой набор данных Titanic, но замена набора данных - это изменение всего двухстрочного кода.
Предположения
- Вы очистили набор данных
- Переменные преобразуются в правильный тип данных.
Как только эти шаги будут выполнены, с помощью тире мы сможем настроить простой интерфейс на основе браузера для проведения одномерного анализа.
Установите Dash и плотно
pip install dash dash-renderer dash-html-components dash-core-components plotly
Код для настройки доступен здесь.
Когда вы запустите файл univariate_analysis_dash.py, вы увидите результат, похожий на этот
Откройте указанный URL-адрес и вуаля, у вас есть веб-приложение, работающее в вашей системе с очень небольшими усилиями.
Вы можете выбрать столбец в раскрывающемся списке и увидеть распределения.
Чтобы изменить набор данных в файле, измените путь для чтения набора данных и заголовок дисплея, и все готово!
Видео, демонстрирующее простоту интерфейса Dash.
Понравилась статья? Пожалуйста, дайте мне знать в комментариях, вы можете связаться со мной в LinkedIn, и мы сможем поговорить об этом.
Вы также можете посетить мою ссылку github для некоторых фрагментов кода, которые могут быть полезны в EDA и построении моделей.
Свяжитесь со мной по слабине