数据信息汇总的7种基本技术总结

数据汇总是一个将原始数据简化为其主要成分或特征的过程,使其更容易理解、可视化和分析。本文介绍总结数据的七种重要方法,有助于理解数据实质的内容。

1、集中趋势:平均值,中位数,众数

集中趋势是一种统计测量,目的是确认最典型的个体,找到最能够代表整个组的单个数值。它可以提供对数据集中“典型”数据点的准确描述。集中趋势的三个主要度量是平均值、中位数和众数。

平均值:通过将数据集中的所有数据点相加,然后除以数据点的数量来计算平均值。

中位数:中位数是数据集的中间点。要找到中位数,必须首先按量级(升序或降序)对数据进行排序。如果数据集包含奇数个观测值,则中位数为中间值。如果有偶数个观测值,中位数是两个中间值的平均值。

众数:众数是数据集中出现频率最高的值。数据集可以有一个众数(单峰),两个众数(双峰),或多个众数(多峰)。

理解集中趋势有助于建立一个“典型”值,作为数据的有用总结。

完整文章:

https://avoid.overfit.cn/post/3aeec64b87c247cd9eb3d2a340df96ce

posted @ 2023-05-15 09:48  deephub  阅读(26)  评论(0编辑  收藏  举报