Предыдущая статья была кратким руководством по основам Matplotlib. Большинство вещей, которые вы можете применить к линейной диаграмме, также можно применить к другим диаграммам, таким как точечные диаграммы, гистограммы, гистограммы и т. д.

Итак, увидев, как вы можете создавать базовые графики с помощью Matplotlib, мы увидим, как вы можете создавать другие типы диаграмм.

Графики рассеяния

Точечная диаграмма — это тип диаграммы, которая используется для отображения взаимосвязи между двумя числовыми переменными. Глядя на точечную диаграмму, вы можете быстро увидеть, есть ли положительная связь, отрицательная связь или вообще нет связи между двумя переменными.

Он использует точки для представления значений каждой переменной, а положение точек на осях x и y показывает взаимосвязь между двумя переменными.

Чтобы создать точечный график с помощью Matplotlib в Python, вы можете использовать метод scatter и создать его, как если бы вы создавали линейный график:

import matplotlib.pyplot as plt


x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

plt.scatter(x, y)
plt.show()

Просто напоминание о предыдущей статье, чтобы показать, как вы можете добавить некоторые параметры:

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

plt.scatter(x, y, label='2x', color='red', marker='o', s=100, edgecolor='black')

plt.xlabel('x axis')
plt.ylabel('y axis')
plt.title('Scatter Plot')
plt.legend()
plt.show()

Реальным вариантом использования точечной диаграммы может быть визуализация взаимосвязи между ценой акций компании и ее квартальной прибылью. Вы можете использовать точечную диаграмму, чтобы увидеть, есть ли положительная или отрицательная корреляция между этими двумя переменными, что может помочь вам принять решение о том, стоит ли инвестировать в компанию.

Гистограммы

Гистограмма — это тип диаграммы, который используется для отображения частоты или относительной частоты различных значений в наборе данных. Он использует столбцы для представления значений, а длина столбцов показывает частоту или относительную частоту каждого значения.

Глядя на гистограмму, вы можете быстро увидеть, какие значения являются наиболее распространенными и как эти значения сравниваются друг с другом.

Чтобы создать гистограмму с помощью Matplotlib в Python, вы можете использовать метод bar:

x = ["A", "B", "C", "D"]
y = [1, 2, 3, 4]

plt.bar(x, y)
plt.show()

Одним из вариантов использования гистограммы является отображение результатов выборов. Вы можете использовать линейчатую диаграмму для отображения количества голосов, полученных каждым кандидатом, а длина столбцов будет показывать относительную популярность каждого кандидата. Это может помочь вам быстро увидеть, какой кандидат победил на выборах и на сколько.

Вы также можете создать несколько полос и предотвратить их перекрытие. Для этого вам нужно использовать параметр ширины и изменить ось X для каждого дополнительного бара.

x = [1, 2, 3, 4]
xticks = ["Monday", "Tuesday", "Wednesday", "Thursday"]
y1 = [1, 2, 3, 4]
y2 = [2, 4, 1, 3]

width = 0.25

plt.bar(x, y1, width=width, label='y1')
plt.bar([x + width for x in x], y2, width=width, label='y2')

plt.xticks([x + width for x in x], xticks)
plt.show()

Гистограммы

Гистограмма — это тип диаграммы, которая используется для отображения распределения набора данных. Он использует столбцы для представления значений в наборе данных, а высота столбцов показывает частоту или относительную частоту каждого значения.

Целью гистограммы является выявление любых закономерностей или тенденций в данных. Глядя на гистограмму, вы можете быстро увидеть диапазон значений в наборе данных, форму распределения и любые выбросы или пробелы в данных.

Мы можем создавать гистограммы в matplotlib с помощью метода histogram:

data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5]

plt.hist(data)
plt.show()

Когда мы смотрим на гистограмму, она может быть очень похожа на гистограмму. Однако гистограмма и столбчатая диаграмма совершенно разные.

Гистограмма используется для отображения распределения набора данных, а гистограмма используется для отображения частоты или относительной частоты различных значений в наборе данных.

Столбцы на гистограмме располагаются вдоль непрерывной оси X, а ширина столбцов представляет собой диапазон значений в наборе данных. Напротив, гистограмма обычно используется для отображения частоты или относительной частоты дискретных значений, а положение столбцов на оси x определяется самими значениями.

Несмотря на сходство, гистограмма и столбчатая диаграмма — это два разных типа диаграмм, которые используются для представления разных типов данных.

Одним из вариантов использования гистограммы является отображение распределения оценок в классе. Вы можете использовать гистограмму для отображения количества учащихся, получивших каждую оценку, а высота столбцов будет показывать относительную частоту каждой оценки. Это может помочь вам быстро увидеть общую успеваемость класса и определить любые тенденции или закономерности в оценках.

Круговые диаграммы

Круговая диаграмма — это тип диаграммы, который используется для отображения доли различных значений в наборе данных. Он использует круглую форму, разделенную на срезы, для представления данных. Размер каждого среза представляет собой долю значения, которое он представляет, и срезы обычно помечаются соответствующим значением.

Глядя на круговую диаграмму, вы можете быстро увидеть, какие значения составляют наибольшую и наименьшую долю набора данных, и как эти значения сравниваются друг с другом.

Мы можем сделать круговую диаграмму в matplotlib, используя метод pie:

labels = ["A", "B", "C", "D"]
sizes = [10, 20, 30, 40]

plt.pie(sizes, labels=labels)
plt.show()

Есть некоторые параметры, специфичные для круговых диаграмм, посмотрите на следующий пример:

plt.pie(sizes, labels=labels, autopct='%1.1f%%', shadow=True, startangle=90, explode=(0, 0.1, 0, 0))

Одним из вариантов использования круговой диаграммы является отображение доли рынка различных компаний в отрасли. Вы можете использовать круговую диаграмму, чтобы отобразить процент рынка, который контролирует каждая компания, а размер каждого сегмента покажет относительный размер доли рынка каждой компании. Это может помочь вам быстро увидеть, какие компании являются крупнейшими и самыми маленькими в отрасли, и как рынок разделен между компаниями.

Заключительное примечание

Теперь вы знаете основы Matplotlib и можете использовать его для создания профессионально выглядящих визуализаций ваших данных, и вы можете использовать эти визуализации для изучения и понимания ваших данных.

Независимо от того, анализируете ли вы финансовые данные, политические данные или данные любого другого типа, Matplotlib может помочь вам разобраться в ваших данных и сообщить о своих выводах другим.

Matplotlib — ценный инструмент для анализа данных, и, освоив основы, вы сможете поднять свои навыки анализа данных на новый уровень.

Чтобы узнать больше о моих историях о Python, нажмите здесь! Вы также можете получить доступ ко всему моему контенту, проверив эту страницу.

Если вам понравилась история, не забудьте похлопать, прокомментировать и, возможно, подписаться на меня, если вы хотите узнать больше о моем содержании :)

Вы также можете подписаться на меня по электронной почте, чтобы получать уведомления каждый раз, когда я публикую новую историю, просто нажмите здесь!

Если вы еще не подписаны на Medium и хотите поддержать меня или получить доступ ко всем моим историям, вы можете использовать мою ссылку: