箱形图/盒图(转)
http://zh.wikipedia.org/wiki/%E7%AE%B1%E5%BD%A2%E5%9C%96
http://www.blogjava.net/norvid/articles/317235.html
箱形图(英文:Box-plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理。不过作法相对较繁琐。
箱形图于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数、下四分位数及上四分位数。
举例[编辑]
以下是箱形图的具体例子:
+-----+-+ * o |-------| + | |---| +-----+-+ +---+---+---+---+---+---+---+---+---+---+ 數線 0 1 2 3 4 5 6 7 8 9 10
这组数据显示出:
- 最小值(minimum)=5
- 下四分位数(Q1)=7
- 中位数(Med)=8.5
- 上四分位数(Q3)=9
- 最大值(maximum )=10
- 平均值=8
- 四分位间距(interquartile range)==2 (即ΔQ)
在区间 Q3+2(或3?)ΔQ, Q1-2(或3?)ΔQ 之外的值被视为应忽略(farout)。
- farout: 在图上不予显示,仅标注一个符号∇。
- 最大值区间: Q3+1.5ΔQ ——如何推导?
- 最小值区间: Q1-1.5ΔQ
最大值与最小值产生于这个区间。区间外的值被视为outlier显示在图上.
- mild outlier = 3.5
- extreme outlier = 0.5
外部链接[编辑]
- Visual Presentation of Data by Means of Box Plots (PDF)
- On-line box plot calculator with explanations and examples
- Box and Whisker Diagrams: getting Microsoft Excel to plot them for you
- Box and Whisker Plots in Microsoft Excel
- Box plot and whisker plots in Excel 2007
- Box plot explanation, examples and a javascript/css-based box plot