核心点:详解对常用的12个matplotlib图!
今儿来聊聊关于机器学习项目中最常用的matplotlib图形。
有可能你在想要用的时候,直接把下面的代码粘贴过去,改改就好~
既方便了学习并且按照自己的理解进行定制化,也能快速领略其奇妙之处!
在机器学习实际项目和数据分析中,Matplotlib是一个常用的Python绘图库,用于创建各种类型的图表和可视化。今天总结了12中最最常用的图形,大家可以看看~
老规矩:大家伙如果觉得近期文章还不错!欢迎大家点个赞、转个发,让更多的朋友看到。
折线图(Line Plot):用于显示数据随时间或其他连续变量的变化趋势。在实际项目中,可以用于可视化模型性能随着训练迭代次数的变化。
下面示例中,我们将绘制一个包含多个数据系列的折线图。
首先,确保已经安装了Matplotlib库。
如果没有安装,使用pip
来安装它:
pip install matplotlib
看代码,创建一个包含多个数据系列的折线图:
import matplotlib.pyplot as plt
import numpy as np
# 创建示例数据集
x = np.linspace(0, 10, 100) # 生成0到10之间的100个数据点作为x轴
y1 = np.sin(x) # 第一个数据系列,正弦函数
y2 = np.cos(x) # 第二个数据系列,余弦函数
y3 = np.sin(2 \* x) # 第三个数据系列,正弦函数的倍频
# 创建一个Matplotlib图表
plt.figure(figsize=(10, 6)) # 设置图表的大小
# 绘制折线图
plt.plot(x, y1, label='sin(x)', color='blue', linestyle='-', linewidth=2)
plt.plot(x, y2, label='cos(x)', color='red', linestyle='--', linewidth=2)
plt.plot(x, y3, label='sin(2x)', color='green', linestyle='-.', linewidth=2)
# 添加标题和标签
plt.title('Complex Line Plot')
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
# 添加图例
plt.legend()
# 自定义坐标轴范围
plt.xlim(0, 10)
plt.ylim(\-2, 2)
# 添加网格线
plt.grid(True, linestyle='--', alpha=0.6)
# 保存图像(可选)
# plt.savefig('complex\_line\_plot.png')
# 显示图像
plt.show()
包含三个不同的数据系列,每个系列都具有不同的线型和颜色。
可以根据需要自定义图表的样式、颜色和标签。
散点图(Scatter Plot):用于显示两个变量之间的关系,通常用于观察数据的分布、异常值或类别之间的关系。
创建一个包含多个数据系列的散点图。
我们将使用随机生成的数据集来模拟复杂的散点图:
import matplotlib.pyplot as plt
import numpy as np
# 创建示例数据集
np.random.seed(0)
n\_points = 200
x = np.random.rand(n\_points) # 随机生成x坐标
y1 = np.random.rand(n\_points) # 随机生成y坐标
y2 = 1.5 \* x + np.random.rand(n\_points) # 生成带趋势的数据
colors = np.random.rand(n\_points) # 随机生成颜色值
sizes = np.random.rand(n\_points) \* 100 # 随机生成点的大小
# 创建一个Matplotlib图表
plt.figure(figsize=(10, 6)) # 设置图表的大小
# 绘制散点图
plt.scatter(x, y1, label='Random Data', c=colors, s=sizes, alpha=0.7, cmap='viridis')
plt.scatter(x, y2, label='Trendline Data', c='red', marker='x', s=50, label='Trendline', alpha=0.7)
# 添加标题和标签
plt.title('Complex Scatter Plot')
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
# 添加图例
plt.legend()
# 自定义坐标轴范围
plt.xlim(0, 1)
plt.ylim(0, 2)
# 添加颜色条
colorbar = plt.colorbar()
colorbar.set\_label('Color Intensity')
# 保存图像(可选)
# plt.savefig('complex\_scatter\_plot.png')
# 显示图像
plt.show()
上面代码创建了一个复杂的散点图,其中包含两个不同的数据系列,每个系列都具有不同的颜色、标记和点大小。通过使用cmap
参数,可以改变数据点的颜色映射。
可以根据需要自定义图表的样式、颜色和标签。
直方图(Histogram):用于显示数据的分布情况,特别适用于展示数值型数据的频率分布。
使用多个数据系列以及自定义的颜色、透明度和边界线等属性来创建一个直方图。
import matplotlib.pyplot as plt
import numpy as np
# 创建示例数据集(多个数据系列)
np.random.seed(0)
data\_series = \[np.random.normal(0, std, 1000) for std in range(1, 4)\]
# 创建一个Matplotlib图表
plt.figure(figsize=(10, 6)) # 设置图表的大小
# 绘制直方图
plt.hist(data\_series, bins=20, color=\['blue', 'green', 'purple'\], alpha=0.7, label=\['Series 1', 'Series 2', 'Series 3'\], edgecolor='black')
# 添加标题和标签
plt.title('Complex Histogram')
plt.xlabel('Value')
plt.ylabel('Frequency')
# 添加图例
plt.legend()
# 自定义坐标轴范围
plt.xlim(\-4, 4)
plt.ylim(0, 300)
# 添加网格线
plt.grid(True, linestyle='--', alpha=0.6)
# 保存图像(可选)
# plt.savefig('complex\_histogram.png')
# 显示图像
plt.show()
代码中,包含三个不同的数据系列,每个系列都具有不同的颜色、透明度和边界线颜色。直方图的bins数设置为20,可以根据需要进行调整。
可以根据实际情况自定义样式、颜色和标签。
柱状图(Bar Plot):用于比较不同类别之间的数据,例如不同产品的销售量或不同类别的统计数据。
当涉及到柱状图可视化时,Matplotlib提供了丰富的自定义选项。
下面代码将创建一个具有多个数据系列、堆叠柱状图和自定义颜色、标签等属性的柱状图。
import matplotlib.pyplot as plt
import numpy as np
# 创建示例数据集(多个数据系列)
categories = \['Category A', 'Category B', 'Category C', 'Category D'\]
data\_series1 = \[3, 4, 2, 6\]
data\_series2 = \[2, 5, 1, 4\]
data\_series3 = \[1, 3, 4, 2\]
# 创建一个Matplotlib图表
plt.figure(figsize=(10, 6)) # 设置图表的大小
# 绘制柱状图(堆叠)
bar\_width = 0.2
index = np.arange(len(categories))
plt.bar(index, data\_series1, bar\_width, label='Series 1', color='blue', edgecolor='black')
plt.bar(index, data\_series2, bar\_width, label='Series 2', color='green', edgecolor='black', bottom=data\_series1)
plt.bar(index, data\_series3, bar\_width, label='Series 3', color='purple', edgecolor='black', bottom=np.array(data\_series1) + np.array(data\_series2))
# 添加标题和标签
plt.title('Complex Bar Chart')
plt.xlabel('Categories')
plt.ylabel('Values')
# 添加图例
plt.legend()
# 自定义坐标轴标签
plt.xticks(index, categories)
# 自定义坐标轴范围
plt.ylim(0, 15)
# 添加网格线
plt.grid(True, linestyle='--', alpha=0.6)
# 保存图像(可选)
# plt.savefig('complex\_bar\_chart.png')
# 显示图像
plt.show()
示例中,使用了三个数据系列,每个系列都具有不同的颜色。柱状图被堆叠在一起,以显示每个类别中各系列的值,并使用bottom
参数来堆叠。
箱线图(Box Plot):用于展示数据的分布、中位数、离群值等统计信息,有助于检测数据中的异常值。
导入必要的库和生成一个示例数据集:
import matplotlib.pyplot as plt
import numpy as np
# 创建一个示例数据集,这里使用随机生成的数据
np.random.seed(0)
data = \[np.random.normal(0, std, 100) for std in range(1, 4)\]
# 设置箱线图的标签
labels = \['Dataset 1', 'Dataset 2', 'Dataset 3'\]
# 创建一个箱线图
fig, ax = plt.subplots(figsize=(10, 6))
# 自定义箱线图的外观,包括颜色、填充、标记和线宽
boxprops = dict(linewidth=2, color='blue', facecolor='lightblue')
flierprops = dict(marker='o', markerfacecolor='red', markersize=8, linestyle='none')
medianprops = dict(linestyle='-', linewidth=2, color='green')
whiskerprops = dict(color='blue', linewidth=2)
capprops = dict(color='blue', linewidth=2)
# 画出箱线图
bplot = ax.boxplot(data, vert=True, patch\_artist=True, labels=labels,
boxprops=boxprops, flierprops=flierprops,
medianprops=medianprops, whiskerprops=whiskerprops,
capprops=capprops)
# 自定义Y轴标签
ax.set\_ylabel('Values')
# 添加标题
ax.set\_title('Complex Box Plot')
# 添加网格线
ax.yaxis.grid(True, linestyle='--', which='major', color='gray', alpha=0.7)
# 自定义箱线图的背景色
colors = \['lightblue', 'lightgreen', 'lightpink'\]
for patch, color in zip(bplot\['boxes'\], colors):
patch.set\_facecolor(color)
# 自定义X轴刻度标签
ax.set\_xticklabels(labels)
# 显示图例
legend\_elements = \[plt.Line2D(\[0\], \[0\], marker='o', color='w', markerfacecolor='red', markersize=10, label='Outliers')\]
ax.legend(handles=legend\_elements, loc='upper right')
# 自定义X轴标签位置
ax.set\_xticks(np.arange(1, len(labels) + 1))
# 调整Y轴刻度范围,根据的数据集进行调整
ax.set\_ylim(\-5, 10)
# 显示图形
plt.tight\_layout()
plt.show()
上面代码创建不同颜色的箱体、自定义标记的异常值、自定义线条属性和其他个性化选项。
热力图(Heatmap):用于可视化矩阵数据,通常用于显示相关性、相似性矩阵或特征之间的关系。
下面创建一个热力图,并提供多个定制化参数:
import matplotlib.pyplot as plt
import numpy as np
# 创建示例数据集(这里使用随机生成的数据)
np.random.seed(0)
data = np.random.rand(10, 10)
# 设置热力图的标签和自定义参数
labels = \['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'\]
cmap = 'YlOrRd' # 自定义颜色映射
annot = True # 显示数值标签
fmt = '.2f' # 数值标签格式
# 创建热力图
fig, ax = plt.subplots(figsize=(8, 8))
# 自定义热力图的外观
heatmap = ax.imshow(data, cmap=cmap, aspect='auto')
# 显示数值标签
if annot:
for i in range(len(labels)):
for j in range(len(labels)):
text = ax.text(j, i, format(data\[i, j\], fmt),
ha="center", va="center", color="black")
# 添加颜色条
cbar = plt.colorbar(heatmap)
# 自定义X轴和Y轴标签
ax.set\_xticks(np.arange(len(labels)))
ax.set\_yticks(np.arange(len(labels)))
ax.set\_xticklabels(labels)
ax.set\_yticklabels(labels)
# 添加标题
ax.set\_title('Customized Heatmap')
# 自定义热力图的颜色条标签
cbar.set\_label('Values', rotation=270, labelpad=15)
# 显示图形
plt.tight\_layout()
plt.show()
上面代码中提供了多个定制化参数,包括颜色映射、数值标签、数值标签格式、颜色条标签等。可以根据自己的数据集和需求进一步自定义热力图,例如更改颜色映射、调整数值标签格式、添加自定义标题等。
饼图(Pie Chart):用于显示数据的部分与整体的比例,通常用于显示类别的占比。
一个出色的饼图,并提供多个定制化参数,使用随机数据集进行案例的展示:
import matplotlib.pyplot as plt
# 创建示例数据集(这里使用随机生成的数据)
labels = \['Category A', 'Category B', 'Category C', 'Category D'\]
sizes = \[15, 30, 45, 10\] # 自定义每个类别的大小
explode = (0.1, 0, 0, 0) # 自定义饼图中的分离
# 自定义颜色,可以使用Matplotlib中的其他颜色映射
colors = \['#ff9999', '#66b3ff', '#99ff99', '#c2c2f0'\]
# 自定义百分比格式
autopct = '%1.1f%%'
# 创建饼图
fig, ax = plt.subplots()
# 自定义饼图的外观
ax.pie(sizes, explode=explode, labels=labels, colors=colors, autopct=autopct,
shadow=True, startangle=90, wedgeprops={'edgecolor': 'gray'})
# 添加标题
ax.set\_title('Customized Pie Chart')
# 显示图形
plt.tight\_layout()
plt.show()
上面创建的饼图中,提供了多个定制化参数,包括每个类别的大小、分离、颜色、百分比格式等。可以根据自己的数据集和需求进一步自定义饼图,例如更改颜色、调整百分比格式、添加自定义标题等。
面积图(Area Plot):类似于折线图,但可以用于展示多个类别之间的堆积关系,通常用于时间序列数据。
创建一个面积堆积图时,需要考虑多个定制化参数以确保可视化效果出色。
import matplotlib.pyplot as plt
import numpy as np
# 创建示例数据集
years = \[2010, 2011, 2012, 2013, 2014\]
categories = \['Category A', 'Category B', 'Category C', 'Category D'\]
data = np.array(\[
\[5, 8, 6, 9, 12\],
\[7, 10, 8, 11, 14\],
\[4, 6, 5, 7, 9\],
\[3, 5, 4, 6, 7\]
\])
# 自定义堆积颜色
colors = \['#ff9999', '#66b3ff', '#99ff99', '#c2c2f0'\]
# 创建面积堆积图
fig, ax = plt.subplots(figsize=(10, 6))
# 绘制面积堆积图
bottoms = np.zeros(len(years))
for i, category in enumerate(categories):
ax.fill\_between(years, bottoms, bottoms + data\[i\], label=category, color=colors\[i\], alpha=0.7)
bottoms += data\[i\]
# 添加标题
ax.set\_title('Customized Stacked Area Chart (Complex Data)')
# 自定义X轴和Y轴标签
ax.set\_xlabel('Year')
ax.set\_ylabel('Values')
# 添加图例
ax.legend(loc='upper left')
# 添加阴影
ax.grid(alpha=0.3)
# 自定义Y轴刻度
ax.set\_yticks(np.arange(0, max(bottoms), step=10))
# 自定义X轴刻度标签
ax.set\_xticks(years)
# 显示图形
plt.tight\_layout()
plt.show()
包括数据集、自定义颜色、图例、标签、标题、阴影、刻度标签等。
等高线图(Contour Plot):用于可视化二维数据的等高线,通常用于显示函数的等值线。
下面案例包含自定义的数据集和多个定制化参数:
import matplotlib.pyplot as plt
import numpy as np
# 创建示例数据集
x = np.linspace(\-2, 2, 400)
y = np.linspace(\-2, 2, 400)
X, Y = np.meshgrid(x, y)
Z = np.sin(np.sqrt(X\*\*2 + Y\*\*2)) \* np.exp(\-0.2 \* np.sqrt(X\*\*2 + Y\*\*2))
# 自定义等高线参数
levels = np.linspace(\-1, 1, 20)
cmap = plt.get\_cmap('RdYlBu\_r') # 自定义颜色映射
# 创建等高线图
fig, ax = plt.subplots(figsize=(8, 8))
# 绘制等高线图
contour = ax.contourf(X, Y, Z, levels=levels, cmap=cmap)
# 添加等高线线条
contour\_lines = ax.contour(X, Y, Z, levels=levels, colors='k', linewidths=0.5)
# 添加颜色条
cbar = plt.colorbar(contour, ax=ax, ticks=np.arange(\-1, 1.2, 0.2))
cbar.set\_label('Values')
# 添加标题
ax.set\_title('Customized Contour Plot')
# 自定义X轴和Y轴标签
ax.set\_xlabel('X-axis')
ax.set\_ylabel('Y-axis')
# 添加网格线
ax.grid(linestyle='--', alpha=0.7)
# 添加等高线标签
ax.clabel(contour\_lines, inline=1, fontsize=8, fmt='%0.1f')
# 显示图形
plt.tight\_layout()
plt.show()
创建了一个等高线图,包括自定义等高线参数、颜色映射、颜色条、等高线线条、标签、标题、网格线等。
可以根据实际情况自定义等高线图,例如更改颜色、调整标签、添加自定义标题等。
3D图(3D Plot):用于可视化包含三个变量的数据,例如三维散点图、三维曲面图等。
同样是使用了自定义的数据集和多个定制化参数:
import matplotlib.pyplot as plt
from mpl\_toolkits.mplot3d import Axes3D
import numpy as np
# 创建示例数据集
x = np.linspace(\-5, 5, 100)
y = np.linspace(\-5, 5, 100)
X, Y = np.meshgrid(x, y)
Z = np.sin(np.sqrt(X\*\*2 + Y\*\*2)) / (np.sqrt(X\*\*2 + Y\*\*2) + 1)
# 创建3D图形
fig = plt.figure(figsize=(10, 8))
ax = fig.add\_subplot(111, projection='3d')
# 自定义颜色映射和标签
cmap = plt.get\_cmap('viridis')
ax.plot\_surface(X, Y, Z, cmap=cmap, label='Surface Plot')
# 添加颜色条
cbar = fig.colorbar(ax.plot\_surface(X, Y, Z, cmap=cmap), ax=ax, pad=0.1)
cbar.set\_label('Values')
# 添加标题
ax.set\_title('Customized 3D Surface Plot')
# 自定义坐标轴标签
ax.set\_xlabel('X-axis')
ax.set\_ylabel('Y-axis')
ax.set\_zlabel('Z-axis')
# 自定义坐标轴刻度
ax.set\_xticks(np.arange(\-5, 6, 2))
ax.set\_yticks(np.arange(\-5, 6, 2))
# 自定义视角
ax.view\_init(elev=20, azim=45) # 仰角和方位角
# 显示图形
plt.tight\_layout()
plt.show()
上面代码中,创建了一个复杂的3D表面绘图,包括自定义颜色映射、颜色条、标签、标题、坐标轴标签、坐标轴刻度和视角。
根据自己的情况,可以更改颜色映射、调整标签、添加自定义标题等。
时间序列图(Time Series Plot):用于可视化时间序列数据,通常包括折线图和柱状图,以便观察时间趋势和季节性模式。
创建一个时间序列图,其中包含复杂的数据集和多个定制化参数:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 创建示例数据集
np.random.seed(0)
dates = pd.date\_range('2023-01-01', '2023-12-31', freq='D')
num\_series = 5
data = np.random.randn(len(dates), num\_series).cumsum(axis=0)
# 创建时间序列图
fig, ax = plt.subplots(figsize=(12, 6))
# 自定义线条颜色和样式
colors = \['b', 'g', 'r', 'c', 'm'\]
linestyles = \['-', '--', '-.', ':', '-'\]
for i in range(num\_series):
ax.plot(dates, data\[:, i\], label=f'Series {i+1}', color=colors\[i\], linestyle=linestyles\[i\])
# 添加标题
ax.set\_title('Customized Time Series Plot')
# 自定义X轴和Y轴标签
ax.set\_xlabel('Date')
ax.set\_ylabel('Value')
# 添加图例
ax.legend(loc='upper left')
# 添加网格线
ax.grid(linestyle='--', alpha=0.7)
# 自定义X轴的日期刻度显示
ax.xaxis.set\_major\_locator(plt.MaxNLocator(10)) # 最多显示10个日期刻度
# 自定义日期刻度标签的格式
from matplotlib.dates import DateFormatter
date\_format = DateFormatter('%b %d')
ax.xaxis.set\_major\_formatter(date\_format)
# 自定义Y轴刻度范围
ax.set\_ylim(\-10, 10)
# 显示图形
plt.tight\_layout()
plt.show()
上面代码中,自定义线条颜色和样式、标签、标题、坐标轴标签、图例、网格线、日期刻度显示和日期刻度标签的格式。
可以根据自己的需求继续自定义时间序列图,例如更改颜色、调整标签、添加自定义标题等。
树状图(Tree Diagram):用于可视化决策树、层次聚类等树状结构的数据。
使用networkx
库来构建树的结构,并使用matplotlib
进行可视化。
首先,需要安装networkx
库:
pip install networkx
然后,可以使用以下代码进行绘制:
import matplotlib.pyplot as plt
import networkx as nx
# 创建示例数据集
G = nx.DiGraph()
G.add\_nodes\_from(\[1, 2, 3, 4, 5, 6, 7, 8, 9, 10\])
G.add\_edges\_from(\[(1, 2), (1, 3), (2, 4), (2, 5), (3, 6), (3, 7), (4, 8), (4, 9), (5, 10)\])
# 创建树状图布局
pos = nx.spring\_layout(G, seed=42)
# 自定义节点颜色和大小
node\_colors = \['#1f78b4' for \_ in G.nodes()\]
node\_sizes = \[800 for \_ in G.nodes()\]
# 创建树状图
fig, ax = plt.subplots(figsize=(10, 8))
# 绘制树状图
nx.draw(G, pos, ax=ax, with\_labels=True, node\_color=node\_colors, node\_size=node\_sizes,
font\_size=10, font\_weight='bold', edge\_color='gray', width=1.0, arrows=True)
# 添加标题
ax.set\_title('Customized Tree Diagram')
# 显示图形
plt.tight\_layout()
plt.show()
包括自定义数据集、自定义节点颜色、大小、标签、标题、布局、边的颜色和宽度等。
喜欢本文的朋友可以收藏、点赞、转发起来!
往期精彩回顾
* [适合初学者入门人工智能的路线及资料下载](http://mp.weixin.qq.com/s?__biz=MzIwODI2NDkxNQ==&mid=2247484737&idx=1&sn=27c52b4bc4ca98d3ab817344b84226cc&chksm=97048efda07307eb78d4f4ec0039a386a658404156b051af0cb715fafa8d2ae66cbe49343bf3&scene=21#wechat_redirect)
* [(图文+视频)机器学习入门系列下载](https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzIwODI2NDkxNQ==&action=getalbum&album_id=2259163844755406853#wechat_redirect)
* [机器学习及深度学习笔记等资料打印](http://mp.weixin.qq.com/s?__biz=MzIwODI2NDkxNQ==&mid=2247488304&idx=1&sn=581944f63eab1822ca53b9a4eeedad79&chksm=9704988ca073119a38a534adbedd51ca0b5705cdd6a104fed74b265bb092485e97c91bb5b347&scene=21#wechat_redirect)
* [《统计学习方法》的代码复现专辑
](https://mp.weixin.qq.com/mp/appmsgalbum?action=getalbum&album_id=1337257945842778113&__biz=MzIwODI2NDkxNQ==#wechat_redirect)
* ```
交流群
```
**欢迎加入机器学习爱好者微信群一起和同行交流,目前有机器学习交流群、博士群、博士申报交流、CV、NLP等微信群,请扫描下面的微信号加群,备注:”昵称-学校/公司-研究方向“,例如:”张小明-浙大-CV“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~(**也可以加入机器学习交流qq群772479961)