谁知道调查问卷的信度和效度是怎么回事?

如题所述

测试信度(test reliability)也叫测试的可靠性,指的是测试结果是否稳定可靠。也就是说,测试的成绩是不是反映了受试者的实际语言水平。例如,如果同一套测试在对同一测试对象(即受试者本身没有变化)进行的数次测试中,受试者的分数忽高忽低的话,则说明该测试缺乏信度。测试的信度与测试的效度有着密切的关系。一般说来,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。试题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素;评分是否可靠则要看评分标准是否客观和准确。

测试的信度通常用一种相关系数(即两个数之间的比例关系)来表示,相关系数越大,信度则越高。当系数为1.00时,说明测试的可靠性达到最高程度;而系数是0.00时,则测试的可靠性降到最低程度。在一般情况下,系数不会高到1.00,也不会降到0.00,而是在两者之间。对信度指数的要求因测试类别的不同而不同,人们通常对标准化测试的信度系数要求在0.90以上,例如“托福”的信度大致为0.95,而课堂测试的信度系数则以0.70-0.80之间为可接受性系数。测试信度的计算方法有很多种,以下仅介绍三种易于操作的方法:

1)重测法(the retesting method)。用同一套试卷在两个不同时间内来测试同一批受试者,这样便获得两组分数,然后计算出两组分数的相关系数。当然,在两次测试中,学生第二次的测试成绩理应比第一次的要高,因为在第二次测试时学生已经有了进步而且临场经验也更丰富了。但是若该试题是比较可靠的,每个学生在两次测试中的排名次序应该是基本不变的。

2)交替形式法(the alternative method)。对同一批受试者使用试题类型完全相同,难易程度相当,但具体题目不同的两套对等试卷先后进行两次测试,然后计算出两次得分的相关系数。

3)对半法(the split-half method)。测试只进行一次,但将整份试卷的题目按单、双数分成两组来分别计分,算出两组分数的相关系数,然后再用Spearman-Brown的公式计算整份试卷的信度系数。具体计算步骤是:将两组分数的相关系数乘以2,再除以1加两组分数的相关系数。
http://baike.baidu.com/view/698674.htm
测试效度(test validity)亦称测试的有效性,指一套测试对应该测试的内容所测的程度。也就是说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。例如:“Is photography an art orscience?Discuss.”这种题目以摄影的知识为前提和主要内容,用来考语言能力,就不具有效性。又如用听写来测量学生的听觉能力,其效度也是不理想的,因为书面记录有声语言不仅涉及学生的听觉能力,而且还与他们的书写速度、拼写能力、语法知识、记忆能力和对全文的理解能力等有关。

测试的效度一般可分为以下几类:

1)表面效度(face validity)。指测试应达到的卷面标准,即一套测试题从表面看来是否是合适的。例如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度。表面效度是测试出受试者正常水平的一种保证因素。

2)内容效度(content validity)。指一套测试题是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度。例如,如果某一套发音技能测试题仅仅考查发音所必须具备的某些技能,如只考单一音素的发音,而不考查重读、语调或音素在词语中的发音,那么,该测试的内容效度就很低。

3)编制效度(construct validity)。指一套测试题的诸项目对编制该测试所依据的理论的各个基本方面的反映程度。例如,以结构主义语言理论为基础,认为系统的语言习惯是通过句型而获得的,那么,强调词汇和语法环境的测试题目就失去了编制效度。

4)经验效度(empirical validity)。经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或多个标准尺度相对照而得出。经验效度可分为两种:一是共时效度(concurrent validity),即将一次测试的结果同另一次时间相近的有效测试的结果相比较,或同教师的鉴定相比较而得出的系数;二是预测效度(predictive validity),即将一次测试的结果同后来的语言能力相比较,或是同教师后来对学生的鉴定相比较而得出的系数。

一般来说,对某次测试的效度进行检验时,除了要根据教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外,还须采用计算相关系数的定量方法,即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间的相关系数。系数高则有效性大。课堂测试的效度应在0.4-0.7之间,规模较大的测试其效度应在0.7以上。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-09-04

问卷调查是有针对性的非目标群体则结果无效,非认真作答不可信。

例如一份调查宝妈对奶粉的满意度,调查对象是宝妈如果调查对象换成了爸爸显然结果没用。

调查过程中如果有引导性提问,或者对宝妈群体中个体选择性调查那么得出的结果自然是不可信的。

调查问卷注意事项:

    问卷的开场白

问卷的开场白,必须慎重对待,要以亲切的口吻询问,措词应精心切磋,做到言简意明,亲切诚       恳,使被查者自愿与之合作,认真填好问卷。

2. 问题的字眼

由于不同的字眼会对被调查者产生不同的影响,因此往往看起来差不多的相同的问题,会因所用       字眼不同,而使应答者作不同的反应,作出不同的回答。

故问题所用的字眼必须小心,以免影响答案的准确性。


扩展资料:

调查问卷设计原则:

1.有明确的主题。根据 主题,从实际出发拟题,问题目的明确,重点突出,没有可有可无的问题。

2.结构合理、逻辑性强。问题的排列应有一定的逻辑顺序,符合应答者的思维程序。一般是先易后        难、先简后繁、先具体后抽象。

3.通俗易懂。问卷应使应答者一目了然,并愿意如实回答。问卷中语气要亲切,符合应答者的理解       能力和认识能力,避免使用专业术语。

对敏感性问题采取一定的技巧调查,使问卷具有合理性和       可答性,避免主观性和暗示性,以       免答案失真。

4.控制问卷的长度。回答问卷的时间控制在20分钟左右,问卷中既不浪费一个问句,也不遗漏一         个 问句。

5.便于资料的校验、整理和统计。

扩展资料来源:百度百科-调查问卷

本回答被网友采纳
第2个回答  2019-10-09

    信度可以把它理解为可靠度、一致性、稳定性。用于测量样本回答结果是否可靠,即样本有没有真实作答量表类题项。

    比如说,在对同一对象进行测量,多次测量结果都很接近,就会认为这个结果是可信的,真实的,也就是信度高。如果每次测量的结果都有很大的差异,则说明信度较低。

    衡量信度的方法有很多种,常用的信度系数包括:克隆巴赫α系数和折半系数,可在spssau中进行分析。

    效度分析,简单来说就是问卷设计的有效性、准确程度,用于测量题项设计是否合理。

    效度又可分为内容效度、结构效度和效标效度。

    内容效度,通常是以文字来说明问卷的有效性。如通过参考文献,或者权威来源说明问卷的权威性和有效性。还有就是通过对问卷前测并结合结果进行题项的修正等工作来充分说明问卷的有效性。

    结构效度,指测量题项与测量维度之间的对应关系。测量方法有两种,一种是探索性因子分析,另外一种是验证性因子分析。其中,探索性因子分析是当前使用最为广泛的结构效度测量方法,SPSSAU提供此两种分析方法。

    效标效度,如果以前有一份权威且标准的量表数据,现在依旧使用该量表进行研究,并且收集回来一份数据。以前权威标准数据作为标准,当前数据与前一份数据之间进行相关分析,如果说相关系数值较高,则说明效标效度良好。但在实际分析中,效标效度很少使用。

第3个回答  2012-06-28
信度就是测验的可靠性,也就是每次测量结果是否都差不多。
效度就是测验结构的有效性,也就是一套测试是否测量了它要测量的内容。
举例:
一个人买一个电子称,站上去测量,这个时候电子秤的数字就是信度,单位就是效度。

不管这个称准不准,假如我每次上去显示的数字都差不多,都在50左右,说明信度高,因为它测的“数值”稳定。
但是,明知道自己体重不止50KG那么重,(比如60KG)所以肯定这个结果是错的,那么就意味着这个秤效度有问题,比如说这个秤被人去皮了或者其他设置什么的。

希望能帮到你,楼上回答也很不错!
第4个回答  2017-06-13
信度分析主要针对的是 量表 比如通过各种问题 去衡量一个人的性格 爱好之类的
效度检验 其实就是因子分析 因子分析 主要是针对 那些 得分情况来分析的
注:不是所有的问卷表都能用 信度分析的 信度分析主要针对的是 量表 而量表的设计要求很严格 是经过很多测试 推理才行的 比如:光电式量表 心理量表等等
这两种方式都是用来 测试调查问卷得到的结果 是否合理
相似回答