统计学中抽样调查和一些常用的方法

（文章转载自https://www.cnblogs.com/yangsy0915/p/5162449.html）

抽样调查的领域涉及如何用有效的方式得到样本。这些调查都利用了问卷，而问卷的设计则很有学问。它设计如何用词、问题的次序和问题的选择与组合等等。涉及包括心理学、社会学等知识。问题的语言应该和被调查者的文化水平相适应。那么抽样调查的设计的目的之一是确保样本对总体的代表性，以保证后续推断的可靠性。然而每个个体可能的简单随机抽样是一个理想情况。

概率抽样方法 ：假定每个个体出现在样本中的概率是已知的。这种概率相抽样方法使得数据能够进行合理的统计推断。

非概率抽样方法 ：对从非概率抽样得到的数据进行推断，它依赖于具体的抽样方案是如何设计的，也依赖于它是如何实施的。

那么概率抽样方法有哪些呢：

系统抽样 也成为每N个名字选择方法(n-th name selection technique)，这是先把总体中的每个单元编号，然后随机选取其中之一作为抽样的开始点进行抽样。根据预定的样本量决定"距离"→N,在选取开始点之后，通常从开始点开始按照编号进行所谓等距抽样。比如起始点为5，"距离" N = 10，则下面的抽查对象为15号、25号等等。如果编号是随机选取的，则这和简单随机抽样就是等价的了。

分层抽样 是简单随机抽样的一个变种，先把要研究的总体分成相对相似或相对齐次的个体组成的类，再在各类中分别抽取简单随机样本。然后把从各类中得到的结果汇总，并对总体进行判断。这里在每类中调查的人数通常是按照该类人的比例，但出于各种考虑，也可能不按照比例，也可能需要加权。（加权的概念：在求若干项的和时，对各项乘以不同的系数，这些系数的和通常为1）

整群抽样 是先把总体划分成若干群，和分层抽样不同之处在于，这里的群是由不相似或异类的个体组成的，在单级整群抽样中，先（通常是随机的）从这些群中抽取几群，然后再在这些抽取的群中对个体进行全面调查。在两极整群抽样中，先（通常是随机地）从这些群中抽取几个群，然后再在这些抽取的群中对个体做简单随机抽样。适用于区域抽样，比如对某县的各个村子进行调查，显然这些村子的情况差异不大，否则就会增大误差。主要应用在于区域抽样，群是以区域进行划分的。

多级抽样 在群体很大时，往往在抽取若干群之后，再在其中抽取若干子群，甚至再在子群中抽取子群，等等。这个在每一级都可能再采用不同的抽样方法，所以比较复杂，也称为多级混合型抽样。

非概率抽样方法有哪些呢：

目的抽样 由研究人员主观地选择对象。那么样本多少依赖于与预先就有的知识。

方便抽样 通常用于初期的评估。比如，为了调查游客的意见，可能选择不同的时间和旅游景点，随意对愿意停下的游客进行调查。这看起来可能是随机的，其实并不是。

判断抽样 凭经验来判断选择样本，通常是方便抽样的延伸。这种比如研究各县的情况，而研究人员仅在一个县中抽样，那么这个县就具有代表性。

定额抽样 先是确定各类及比例（与分层抽样类似），然后利用方便抽样或判断抽样来按比例选取需要的个体数。

雪球抽样 用于感兴趣的样本特征较稀有的情况，比如吸毒者，你想调查一个和吸毒者有关的人，然后这个人就会介绍你找到相关的人，可能会产生较大误差。依赖于一个目标推荐另一个目标的方法。

自我选择 是让个体自愿参加调查。

总的来说，科学的数据抽样方法很多，但是往往是各种抽样方法的组合，因为既要考虑精度又要考虑方便性、可行性等。

posted @ 2019-05-18 16:08 hgz_dm 阅读(1285) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· ollama系列1：轻松3步本地部署deepseek，普通电脑可用
· 按钮权限的设计及实现
· 【杂谈】分布式事务——高大上的无用知识？

公告

昵称： hgz_dm
园龄： 6年1个月
粉丝： 10
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

hgz_dm

统计学中抽样调查和一些常用的方法

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论