Я только начал знакомиться с модулем науки о данных и мне это очень нравится. В настоящее время я изучаю использование Matplotlib, низкоуровневой библиотеки для визуализации данных, и Seaborn, высокоуровневой библиотеки для визуализации данных. Вот несколько методов, которым я научился визуализировать числовую одномерную статистику!
Во-первых, давайте импортируем библиотеки.
import seaborn as sb import matplotlib as plt sb.set()#this sets the default Seaborn style for graphics
Целью использования plt.figure()
является создание объекта фигуры. Figsize принимает 2 параметра (ширина, высота) и позволяет указать размеры вашей фигуры в дюймах.
Вставьте свой собственный набор данных csv в свои данные.
Ориентация графика (вертикальная или горизонтальная) не является обязательной. Однако обычно он используется при работе с числовыми переменными для устранения неоднозначности, когда и x, и y являются числовыми, или при построении данных в широкой форме.
Блочная диаграмма:
f = plt.figure(figsize=(24, 4)) sb.boxplot(data = yourdata, orient = "h")
История:
f = plt.figure(figsize=(16, 8)) sb.histplot(data = yourdata)
Сюжет для скрипки:
f = plt.figure(figsize=(16, 8)) sb.violinplot(data = yourdata, orient = "h")
На самом деле есть ярлык для построения всей визуализации с использованием цикла for
f, axes = plt.subplots(6, 3, figsize=(18, 24)) count = 0 for var in numDF: sb.boxplot(data = numDF[var], orient = "h", ax = axes[count,0]) sb.histplot(data = numDF[var], ax = axes[count,1]) sb.violinplot(data = numDF[var], orient = "h", ax = axes[count,2]) count += 1
Мой совет — используйте документацию всякий раз, когда сомневаетесь. Приятного обучения!