箱线图(Box plot)是一种用于展示数据分布特征的图形,它可以显示数据的中位数、四分位数、最大值、最小值以及异常值等信息,在Python中,我们可以使用pandas库的Series对象和matplotlib库来绘制箱线图,以下是详细的技术教学:
(图片来源网络,侵删)1、我们需要安装pandas和matplotlib库,可以使用以下命令进行安装:
pip install pandas matplotlib
2、接下来,我们创建一个简单的Series对象,用于演示如何绘制箱线图,我们创建一个包含10个随机数的Series对象:
import pandas as pd import numpy as np data = pd.Series(np.random.randn(10)) print(data)
3、为了绘制箱线图,我们需要导入matplotlib库,并设置一些基本的绘图参数,我们可以设置图像的大小、标题等:
import matplotlib.pyplot as plt plt.figure(figsize=(8, 6)) plt.title("箱线图示例")
4、现在,我们可以使用matplotlib的boxplot()
函数来绘制箱线图,这个函数接受一个或多个Series对象作为参数,并返回一个包含箱线图的轴对象,我们可以将这个轴对象添加到当前的图像中:
ax = data.plot(kind='box')
5、默认情况下,箱线图的箱子是蓝色的,上下边框是黑色的,我们可以使用set_color()
函数来更改箱子的颜色,使用set_edgecolor()
函数来更改上下边框的颜色:
ax.set_color('lightblue') ax.set_edgecolor('black')
6、我们还可以通过设置whiskers
参数来调整箱线图中的“须子”长度,我们可以将“须子”设置为数据的1.5倍四分位距:
ax.set_whiskers(1.5 * data.quantile(0.75))
7、我们还可以通过设置caps
参数来调整箱线图中箱子顶部和底部的长度,我们可以将箱子顶部和底部的长度设置为数据的1.5倍四分位距:
ax.set_caps(1.5 * data.quantile(0.75))
8、我们可以使用show()
函数来显示箱线图:
plt.show()
将以上代码整合在一起,我们可以得到一个完整的绘制箱线图的程序:
import pandas as pd import numpy as np import matplotlib.pyplot as plt 创建一个简单的Series对象 data = pd.Series(np.random.randn(10)) print(data) 设置绘图参数 plt.figure(figsize=(8, 6)) plt.title("箱线图示例") 绘制箱线图 ax = data.plot(kind='box') ax.set_color('lightblue') ax.set_edgecolor('black') ax.set_whiskers(1.5 * data.quantile(0.75)) ax.set_caps(1.5 * data.quantile(0.75)) 显示箱线图 plt.show()
通过以上步骤,我们可以使用Python的pandas库和matplotlib库轻松地绘制箱线图,需要注意的是,这里的示例仅适用于一维数据,对于二维或多维数据,我们需要对每一列或每一行分别绘制箱线图。
最新评论
本站CDN与莫名CDN同款、亚太CDN、速度还不错,值得推荐。
感谢推荐我们公司产品、有什么活动会第一时间公布!
我在用这类站群服务器、还可以. 用很多年了。