如何理解总体、样本、分布、统计量、假设检验?

如题所述

第1个回答  2022-09-01

总体:包含所研究的全部个体(数据)的集合。

      样本:从总体中抽取出来的,作为总体的代表,由部分单位组成的集合体

    “例如考察某厂生产的灯泡的使用寿命,该厂生产的所有灯泡的使用寿命为总体,每个灯泡的使用寿命为一个个体,从总体中抽取若干个体(100个)灯泡做实验,这100个灯泡就是样本。” 总体和样本关系:1)样本的单位必须取自总体;2) 一个总体可以抽取多个样本;3)确保样本的客观性与代表性

      统计量:  是统计理论中用来对数据进行分析、检验的变量。从样本推断整体性质,我们通常是通过统计量来推断的,比如上面这个例子我们通过计算100个灯泡的使用寿命平均值推断总体这个工厂生产出灯泡的使用寿命长短。常见的统计量有:样本均值、样本方差、样本矩、样本K阶中心距、样本偏度、样本峰度等分布:在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体单位在各组间的分布。常见的分布类型有:T分布、F分布、卡方分布假设检验(单侧检验和双侧检验):又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。对应不同应用场景,服从不同分布形式,对应不同检验:T检验、F检验、卡方检验等。

     

        这里先说一下如何提出假设,这里分单侧检验和双侧检验。

        举例:考虑某工厂袋装盐的重量(服从正态分布),总体均值为



      第Ⅰ类错误和第 II 类错误

    第Ⅰ类错误(alpha类错误):原假设是正确的,但拒绝了原假设(弃真)

    第 II 类错误(beta类错误):原假设是错误的,但没有拒绝原假设(存伪)

    以上弃真,存伪都是从原假设出发的。放弃原假设就可能发生”弃真”,接受原假设有可能“存伪”。

    这里我们举个简单的例子说明这个问题,假设我们从某个指标一组检测结果判断某个人是否是肝病病人。原假设:健康人,备择假设:肝病病人。那么,当这组数据表明应该拒绝原假设,那么,我们可能会犯第Ⅰ类错误,将健康人误诊为肝病病人(图中黄色部分)。但是如果我们接受了原假设,认为该人为健康人,我们有可能会犯第II类错误,将肝病病人认为是健康人(图中红色部分),因为有一部分肝病病人该指标的表现和正常人类似,从数据无法判断。

    相似回答