箱线图画法详解:颜色、标签、大小等

箱线图画法详解:颜色、标签、大小等一 定义箱线图 又称箱型图或盒式图

大家好,欢迎来到IT知识分享网。

第一四分位数(Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。Q1的位置=(n+1)/4

第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。Q2的位置=(n+1)/2

import csv import pandas as pd import matplotlib.pyplot as plt file_in = open('D:/emotion_analysis_data/cleaned/vs_box.csv', 'r', encoding='utf-8') positive = csv.DictReader(file_in, ['id', 'confidence', 'text']) next(positive) all_positive = [] for i, record in enumerate(positive): con_str = record['confidence'] con_list = con_str.split(' ') del(con_list[0]) constr = ''.join(con_list) value_str = constr.replace(']', '') value = float(value_str) all_positive.append(value) 

把输入的列表数据all_positive写入data,即

data = { 
   'positive': all_positive} df = pd.DataFrame(data) print(df.describe()) 
f = df.boxplot(sym='r.', patch_artist=True, return_type='dict', meanline=False, showmeans=True) for box in f['boxes']: box.set(color='#0E3CE6', linewidth=2) # 箱体边框  box.set(facecolor='#FF6CEC') # 箱体内部填充颜色 for whisker in f['whiskers']: whisker.set(color='r', linewidth=2) for cap in f['caps']: cap.set(color='g', linewidth=2) for median in f['medians']: median.set(color='#52E636', linewidth=3) for mean in f['means']: mean.set(color='#52E636') for flier in f['fliers']: flier.set(marker='o', color='y', alpha=0.5) plt.show() 
f = df.boxplot(sym='r.', patch_artist=True, return_type='dict', meanline=False, showmeans=True) plt.show() 
  • 箱子的宽度在一定程度上反映了数据的波动程度。箱体越扁说明数据越集中,端线(也就是“须”)越短也说明数据集中。
  • 异常值集中在较小值一侧,则分布呈现左偏态;异常值集中在较大值一侧,则分布呈现右偏态。
  • 长长的细尾巴在左边即为左偏,长长的细尾巴在右边边即为右偏

在这里插入图片描述
例如上图,数据呈左偏态,那么靠近最大值的数据比较多,中位数也靠近最大值及上四分位数。反之,数据呈右偏态,那么这组数据靠近最小值的数据比较多,中位线也靠近最小值。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/128819.html

(0)
上一篇 2025-08-28 20:26
下一篇 2025-08-28 20:33

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信