Я только начал знакомиться с модулем науки о данных и мне это очень нравится. В настоящее время я изучаю использование Matplotlib, низкоуровневой библиотеки для визуализации данных, и Seaborn, высокоуровневой библиотеки для визуализации данных. Вот несколько методов, которым я научился визуализировать числовую одномерную статистику!

Во-первых, давайте импортируем библиотеки.

import seaborn as sb
import matplotlib as plt 
sb.set()#this sets the default Seaborn style for graphics

Целью использования plt.figure() является создание объекта фигуры. Figsize принимает 2 параметра (ширина, высота) и позволяет указать размеры вашей фигуры в дюймах.

Вставьте свой собственный набор данных csv в свои данные.

Ориентация графика (вертикальная или горизонтальная) не является обязательной. Однако обычно он используется при работе с числовыми переменными для устранения неоднозначности, когда и x, и y являются числовыми, или при построении данных в широкой форме.

Блочная диаграмма:

f = plt.figure(figsize=(24, 4))
sb.boxplot(data = yourdata, orient = "h")

История:

f = plt.figure(figsize=(16, 8))
sb.histplot(data = yourdata)

Сюжет для скрипки:

f = plt.figure(figsize=(16, 8))
sb.violinplot(data = yourdata, orient = "h")

На самом деле есть ярлык для построения всей визуализации с использованием цикла for

f, axes = plt.subplots(6, 3, figsize=(18, 24))
count = 0
for var in numDF:
    sb.boxplot(data = numDF[var], orient = "h", ax = axes[count,0])
    sb.histplot(data = numDF[var], ax = axes[count,1])
    sb.violinplot(data = numDF[var], orient = "h", ax = axes[count,2])
    count += 1

Мой совет — используйте документацию всякий раз, когда сомневаетесь. Приятного обучения!