社会调查与统计分析

社会调查与统计研究方法 是人们在探究事物发展规律、认识影响现象决定因素的过程中所采用的具体的手段、途径和方式社会调查研究的方法体系包括三个层面:哲学方法论、基本研究方法和研究技术方法论 :哲学基础、逻辑、范式、价值、客观性基本方式 :调查研究、实验研究、文献研究、实地研究具体方法技术 :问卷法、访问法、观察法、量表法、抽样方法、测量方法、统计分析方法、定性资料分析方法、计算机应用技术逻辑思维方式 :归纳、演绎、比较、分类、类比、分析和综合基本研究方法 是研究方法体系的中间层次, 是指人们为了解决理论、 认识、 实践、日常生活的等特定任务所选择和采取的手段、 途径、 方式的总和 具体研究技术是属于各门学科本身所使用的具体研究方法定性研究 是指某一社会现象以现有的文献资料或经验材料为依据,运用演绎、归纳、比较、分类、矛盾分析等方法,以判断事物性质为目的的社会调查研究定性研究特点 :多运用典型调查方法来获得资料, 并以此为主要依据获得结论; 可以从纷繁复杂的事物中探寻其本质特征和要素, 从个别的、 典型的材料中得出结论; 所得出的结论多具有概括性或概貌性 由于缺乏精确数据的支持, 势必造成可比性较差。
一般用于对社会结构和社会关系的研究、历史问题的研究、探索性研究或者是对难以定量的问题的研究定量研究 是运用概率、 统计原理对社会现象的数量特征、 数量关系和事物发展过程中的数量变化等方面进行的研究特点 是:具有科学性、客观性的特点,在实地调查搜集资料方面,强调运用抽样技术选择样本;在对样本进行调查研究中,运用变量、操作化、假设、检验等概念和方法对一些社会现象进行量化研究; 它是为认识社会现象的不同性质提供量的说明,由此来了解事物的性质,或者了解某一社会现象各要素之间量的关系定量研究是一种科学的方法,对于认识社会现象具有重要意义定量研究方式与定性研究方式的比较定量研究定性研究哲学基础实证主义人文主义研究范式科学范式自然范式逻辑过程演绎推理归纳推理理论模式理论检验理论建构主要目标确定相关关系和因果联系深入理解社会现象分析方法统计分析文字描述主要方式实验、调查实地研究资料收集技术量表、问卷、结构观察等参与观察、深度访问等研究特征 客观 主观社会的基本要素 :自然环境、人口、文化自然环境 是指人类社会所处的地理位置所决定的物质条件, 它包括地质地貌、 气候水文、 矿产植被等 人口 是社会的最基本要素,没有人,就没有人类社会,就没有人类历史。
文化 是社会的另一个重要因素 广义的文化是指人类在社会的历史实践中所创造的一切成果, 包括物质文化和精神文化两部分内容调查研究单位 是指社会调查研究具体的、 最基本的对象 包括:个人、初级社会群体如家庭、村落、非正式组织等) 、社会组织如工厂、商店、银行、政府、政党、军队、学校、报社、医院等)、阶级和阶层、民族、社区、社会行为、社会产品如歌曲、电影、书籍、报刊、广告、服装、建筑物、交通工具、基础设施等社会调查研究的基本步骤准备阶段:确定课题、设计调查方案、具体准备等调查阶段:是社会调查研究方案的执行阶段, 主要是按照调查研究方案中所确立的调查计划、调查方式进行资料的收集,具体贯彻调查设计中所确定的思路分析阶段:也称研究阶段,是在实地调查完成后,调查者对所收集的资料进行审核、整理、统计分析、理论分析的过程总结阶段: 是社会调查的最后阶段, 这一阶段的主要任务是总结调查工作、评估调查结果和撰写调查报告社会调查在公共管理中的运用:将公共管理客体中某种公共问题或命题作为假设,运用定性分析或定量分析的方法,根据实际观测、 记录资料等对其进行分析、揭示其变量特征、变量关系与变量变化趋势,再将分析的结果反过来对假设的公共管理论断进行检验和修正,以推进公共管理理论和实践创新。
具体过程主要包括:建立假设;概念操作化,资料收集、统计分析、撰写调查报告得出结论社会调查研究的分类一、研究目的分类(一)描述性研究 反映某个状态、背景、行动或关系的细节,将现象和事件识别清楚,回答who, what, where 的问题 .例:民意测验、电视节目收视调查、大学生人际交往的特征调查研究(二) 探索性研究 对某个议题提出一些初步的认识,对某一未知领域进行探索, 回答 shouldbe 的问题(对策等应然问题) 例:论适合渔民需要的社会养老保险制度的建构—— 基于舟山渔区的调查、村庄民主及其影响因素 :一项基于400 个村庄的实证分析、过度满足对大学生未来发展的研究(三)相关性研究揭示两种或两种以上社会现象或事物之间关系的研究问题例:社会资本对大学生就业影响的调查研究—— 以华侨大学为例、略论社会资本对高校学生社团发展的影响—— 基于厦门大学学生社团的个案调查、红绿灯设置合理化与违章关系研究(四 )解释性研究 解释事物发生的原因,探索现象与事件之间的关联,回答why 的问题例:失地农民社会保障问题的调查与思考—— 以河北省唐山市王滩镇为例、农村社会经济与消费分层及原因分析 —— 基于对张磨村和新村的调查、大学生综合素质的影响因素研究三种不同目的的研究类型的特征探索性研究描述性研究解释性研究对象规模小样本大样本中样本抽样方法非随机选取简单随机、 按比例分层不按比例分层研究方式观察、无结构访问问卷调查、 结构式访问调查、实验等分析方法主观的、定性的定量的、描述统计相关与因果分析主要目的形成概念和初步印象描述总体状况和分布变量关系和理论检验特征基本特征设计简单、形式自由内容广泛、规模很大设计复杂、理论性强二、研究的时间范围(一)共时或横剖面研究(横向研究) :如现状分析、统计年鉴等,在某一时点收集数据展开研究。
例:人口普查、社会资本影响农村中小企业非正规信贷可得性的实证研究 —— 基于 2008 年福建省 5 设区市的调查数据(二)历时性研究: 趋势研究:时间序列分析,随时间发生变化的规律纵向研究) 小样本连续调查追踪研究:发展史研究例:农村公共事业民营化的制度变迁分析、 学校对毕业生上岗后情况追踪研究、 青年大学生不同时期的思想状况研究三、研究对象的多少(一)全面调查(二)抽样调查(三)个案研究调查研究 :全面调查 :一次性普查、经常性调查、专门调查非全面调查 :重点调查、典型调查、抽样调查个案调查 :全面调查 :定义 : 它是对调查对象的全部无一例外地进行逐一调查最大特点:全面性、综合性适用:宏观调查,国情国力调查,或某一部门全面调查 .例:人口普查非全面调查 :定义 : 只对被调查对象的部分单位进行调查的一种调查方式重点调查 :在被调查对象的全部单位中选择一部分重点单位进行调查典型调查 :它是根据调查目的,在对调查对象作全面分析的基础上,通过比较,有计划,有目的地选择其有代表性的单位或个人作为典型, 进行系统、细致地调查, 探索其内在规律性,然后以具有代表性的典型单位的调查结果推论全面情况 .抽样调查 :从调查对象中按随机原则选取一定数目的单位作为代表总体的样本,运用样本单位结果推断总体一般情况的一种调查方式。
个案研究 :发现某个时间段内,研究对象的特征选题 ;选题的途径 :前沿区 :本领域研究的前沿问题无人区 :本领域无人涉足的领域矛盾区 :理论与观察现实交叉区 :学科交叉领域热点区 :研究的热点领域紧迫问题区 :现实急待解决但没有解决的问题选题的原则 :(1)可行性:研究者是否具备进行或完成某一项调查课题的主客观条件主要包括研究者自身条件方面的限制的主观限制和进行一项调查课题时受到外在环境或条件的客观限制 如专业水平、数据的获得能力(2)创新性创新的内涵主要包括:揭示新问题或现象、采用新视角、 提出新概念或对旧概念做出新解定、提出新观点、做出新论证、补充新材料、对现象做出新解释、提出解决问题的新方法、总结新经验、别的学科的概念、理论和方法的移植、建立起新的体系或做出新的综合、(语言新,理论新,方法新,对象新,视角新 )(3)适合性选题的技巧:善观察、善思考;题目有深度;具有可行性;选题应注意的几个问题 :题目的大小:大题小做与小题大做论文的视角或切入点热门话题与非热门话题学术论文与案例分析、基础研究和应用研究标题必须准确的揭示调查报告的主题思想,做到提文一致高度概括,文字简洁,一目了然标题要有吸引力和感染力社会调查问题的分类和题材: 行政统计调查、生活状况调查、社会问题调查、市场调查、民意调查、研究性调查概念的操作化与测量社会调查研究的构成要素 :命题、假设、概念、变量。
命:两个或两个以上概念之间关系的陈述 命题的形式是一个非真即伪的陈述句, 命题不存在疑问句、命令句或感叹句的形式公理 :作为理论推演的基点,从公理导出其他的理论命题公理本身无法由经验直接检验定理 :由公理推导出来,它可以由经验检验和证实设定 :这类命题未经过也不准备在研究工作中检验,但从逻辑上承认这种自行设定的假设假定 :假:在研究过程中,当选定了课题,收集好资料,研究者根据已有理论、自己的经验、日常观察以及收集到的有关资料和事实, 对所研究的事物提出一种带有推测或假定意义的推想或假设假设 :为得出逻辑的或经验的结论并加以检验而设立的试验性假说命题命题的类型 如何产生 可测度性假设( hypothesis ) 演绎或资料收集与分析 可直接测度公理( axiom ) 定义为真实 不可直接测度设定( Assumption ) 逻辑上认定 不进行直接测度定理( theorem ) 从公理或原理演绎而来 可直接测度假设的构建方法 :演绎法归纳法假设 :层次缪误:把高层次的信息、经验、发现应用到低层次的分析单位概念 :对现象的抽象,一类事物的共同属性在人们主观上的反映如社会地位有些概念就是具体的变量,如年龄、收入等,有些不是,如对某些事情的态度或看法。
概念的操作化 : 将模糊不明确的概念明确话精确话的过程如研究者通过一串能够被观察、测量的指标对抽象概念进行测量 (社会地位)(现实世界中事物和现象的类型、结构不同, 复杂程度不同, 所以,概念的抽象层次也有高低变量 :概念的具体化, 是被观察对象的被观察的特征、态度和行为方式;这些特征在一个观察对象的时点身上并不会变化,但是在多个被观察对象身上就形成了一个变化的量变量是具有可测量性的概念, 其属性在幅度和强度上的变化程度可以加以度量, 可以通过客观数据来测量如重量、 出席率、 温度等, 也可通过主观的数据来测量如态度、 感情、感觉等如调查某人 “社会经济地位”是一个抽象的概念;而社会经济地位如何?答案可能五花八门,标准各异概念、变量与指标三者的比较概念:是对现象的抽象,是一类事物的属性在人们主观上的反映变量:具有一个以上取值的概念指标:是表示一个概念或变量含义的一组可观察到的事物概念操作化与指标构建的方法 : 头脑风暴法、德尔菲法、平衡计分卡、 业绩三棱镜、关键绩效指标、“头脑风暴法” 是由现代创造学的创始人、美国学者阿历克斯奥斯本于1938年首次提出,最初用于广告设计,是一种集体开发创造性思维的方法。
原理 :即由有关专家通过召开专题会议的形式,充分阐明问题,发表意见, 提出尽可能多的方案成功要点: 1、自由畅想,大家不受任何条条框框限制,放飞你想象的翅膀,任思维凭空翱翔 2、延迟判断,在头脑风暴活动中,每一提出的设想当场不做评价, (消除影响自由畅想的一切负面因素,鼓励发言,才能强化信息同时不断刺激思维,诱发新的思想 )3、以量求质,头脑风暴会议的目标是获取尽可能多的设想, 从中提取有价值的创造, 因此设想越多越好 4、综合改善,这是一个吸收与完善的过程,也是一个相互补充一齐提升的过程规则 : 1、异想天开!——说出能想到的任何主意2 、不许评价!—— 要到评估阶段才能进行评价( 妄加评论的负面影响:如果进行评论, 许多人就会变得更加拘谨 他们未发表的意见或许非常好, 或许可以激发别人的好意见人们 花费在评论上的精力未能用在产生好意见的现实任务上)3 、越多越好!——重数量而非质量4 、综合改善!—— 鼓励综合数种见解或在他人见解上进行发挥德尔菲法的基本特征德尔菲法本质上是一种反馈匿名函询法 其作法是, 在对所要预测的问题征得专家的意见之后,进行整理、归纳、统计,再匿名反馈给各专家,再次征求意见,再集中,再反馈,直至得到稳定的意见。
其过程可简单图示如下:匿名征求专家意见——归纳、统计——匿名反馈——归纳、统计 ,, ,若干轮后,停止总之,它是一种利用函询形式的集体匿名思想交流过程 它有区别于其他专家预测方法的三个明显的特点它们是: 匿名性、多次反馈、小组的统计回答 德尔菲法的程序首先注意,德尔菲法中的调查表与通常的调查表有所不同通常的调查表只向被调查者提出问题, 要求回答 而德尔菲法的调查表不仅提出问题, 还兼有向被调查者提供信息的责任它是专家们交流思想的工具在德尔菲法过程中, 始终有两方面的人在活动: 一是预测的组织者; 二是被选出来的专家德尔菲法的程序是以轮来说明的在每一轮中,组织者与专家都有各自不同的任务第一轮 :①由组织者发给专家的第一轮调查表是开放式的, 不带任何框框, 只提出预测问题请专家围绕预测主题提出预测事件 如果限制太多, 会漏掉一些重要事件 ②预测组织者要对专家填好的调查表进行汇总整理, 归并同类事件, 排除次要事件, 用准确术语提出一个预测事件一览表,并作为第二轮调查表发给专家第二轮 :①专家对第二轮调查表所列的每个事件作出评价例如,说明事件发生的时间、叙述争论问题和事件或迟或早发生的理由②预测组织者收到第二轮专家意见后,对专家意见作统计处理,整理出第三张调查表。
第三张调查表包括:事件、事件发生的中位数和上下四分点,以及事件发生时间在四分点外侧的理由第三轮 :①把第三张调查表发下去后,请专家做以下事情: 重审争论;对上下四分点外的对立意见作一个评价; 给出自己新的评价( 尤其是在上下四分点外的专家, 应重述自己的理由 ) ;如果修正自己的观点,也请叙述为何改变,原来的理由错在哪里,或者说明哪里不完善②专家们的新评论和新争论返回到组织者手中后,组织者的工作与第二轮十分类似:统计中位数和上下四分点;总结专家观点,重点在争论双方的意见形成第四张调查表第四轮 :①请专家对第四张调查表再次评价和权衡,作出新的预测 是否要求作出新的论证与评价, 取决于组织者的要求 ②当第四张调查表返回后,组织者的任务与上一轮的任务相同:计算每个事件的中位数和上下四分点,归纳总结各种意见的理由以及争论点注意: ①并不是所有被预测的事件都要经过四轮可能有的事件在第二轮就达到统一,而不必在第三轮中出现 ②在第四轮结束后,专家对各事件的预测也不一定都达到统一不统一也可以用中位数和上下四分点来作结论事实上,总会有许多事件的预测结果都是不统一的德尔菲法的预测结果 可用表格、直观图或文字叙述等形式表示。
平衡计分卡 :由哈佛商学院罗伯特·卡普兰和大卫诺顿于战略出发将企业及其内部各部门的任务和决策转化为多样的、标分解成1992 年发明的,从企业的愿景和相互联系的目标, 然后再把目财务状况:我们应该如何满足股东的要求?顾客服务:我们应该如何满足顾客的要求?内部管理 : 我们必须擅长什么?学习和成长 : 我们能否继续提高并创造价值?平衡计分卡的特点: 平衡性、战略性、定性分析与定量分析相结合平衡计分卡反映 了财务与非财务衡量方法之间的平衡, 长期目标与短期目标之间的平衡, 外部和内部的平衡, 结果和过程平衡, 管理业绩和经营业绩的平衡等多个方面 所以能反映组织综合经营状况,使业绩评价趋于平衡和完善,利于组织长期发展实施步骤 : 定义远景、设定长期目标(时间范围为 3 年)、 描述当前的形势、描述将要采取的战略计划、为不同的体系和测量程序定义参数实施障碍 :沟通与共识上的障碍、 组织与管理系统方面的障碍、 信息交流方面的障碍、对绩效考核认识方面的障碍业绩三棱镜法 :把利益相关者的置于中心位置,从利益相关者的角度出发形成企业的战略,确定企业的内部过程和发展企业的能力利益相关者 是指那些在组织发展过程中, 对组织生产经营活动能够产生重大影响的团体和个人。
可根据团体或个人对组织的影响程度分为核心利益相关者和外围利益相关者利益相关者的满意度 :我们关键的利益相关者是谁,他们需要从我们这里得到什么?利益相关者的贡献度 :如果我们要维持和提高这些能力, 我们需要利益相关者为我们作什么贡献相比 BSC 法而言,绩效三棱镜作出了改进:首先,绩效三棱镜引入了系统思考的观念,巧妙地运用“因果闭环”解决了在BSC法中“单向因果链”无法解决的“动态性复杂”问题;其次,绩效三棱镜拓宽了利益相关者的涵盖范围,改变了 BSC法“视野狭窄” - 只关注股东、雇员和顾客而忽视了其它利益相关者(如供货商、竞争对手、社区等)的做法不足 :它的每个透视层面都能衍生出许多的评价指标,结果导致评价指标过多、而且散落在多个职能部门 这样,不但给绩效评价在数据处理上带来极大的难度和误差,更会使得关键指标被淹没在纷飞的评价指标中另外,它的实施需要较扎实的企业管理功底和相对完备的信息系统,但许多企业在这些方面相对欠缺关键绩效指标 通过对组织内部某一流程的输入端、 输出端的关键参数进行测量、 取样、计算、分析,衡量流程绩效的一种目标式量化管理指标, 是一种把企业的战略目标分解为可运作的愿景目标的工具,可以有效的将组织目标转化为个人目标测量 所谓测量就是根据一定的法则, 将某种物体或者现象所具有的属性或特征用数字或者符号表现出来测量的四个要素 :测量客体、测量内容、测量法则、数字和符号变量的测量层次 :定类测量、定序测量、定距测量、定比测量测量量表 :二分量表、 类别量表、 李克特量表、 语意差别量表、 数值量表、 列举式评点量表、固定或常数总和评点量表二分量表 又称为简单分类量表 , 提供两个相互排斥的回答选项,通常以“是”或“否”来做回答, 但是有时也可以时是“重要”和“不重要”, “同意”和“不同意”, 或另外一套不连续的种类。
类别量表 :多选项-单一选择量表允许评价者选择一个或几个选项, 在下表中, 我们用一个问题测量7 个指标, 可能所有7 个方面都在考虑之中,当考虑了所有应答者的选项时,这种选项的积累特点是有效的例:你居住在加州北部的何处?□北湾□南湾□东湾□半岛□其他()李克特量表 是评分加总量表的变种中最常用的一种量表,加总量表有一些陈述,应答者利用数值表示对每一个陈述的赞成或反对程度,这些数值可以加总来测量应答者的态度,一般一个可靠的李克特量表要求包括20-25 个适当构造的、有关态度对象的问题在下面的例子中,对每一个陈述被设计为五点量表,如下所示之定位点(anchors )是用来检查受试者对叙述句的赞成或不赞成程度有多强烈例;非常不同不同意不赞成也不同意非常同意意同意12345语意差别量表 主要用来研究概念对于不同的人所具有的不同含义每一种内涵意义具有相对两极的属性,将相对应的属性放在量表两端当作极端值,而受试者则被要求在语意空间中,指出他们对某些特定地个人、目标物或事件的态度主要用于文化的比较研究、个人及群体间差异的比较研究以及人们对周围环境或事物的态度、看法研究 例如, 常使用某些具有相对应两端地形容词,如“好-坏”、“强-弱”、“热-冷”等。
例:有反应的―――――――没有反应的、美丽的―――――――丑陋的固定或常数总和评点量表 受试者必须在欲评点的变项之间分配点数,但是当要均衡或加总许多方面时, 应答者的耐心和精确度都会受到影响这种尺度的优点是它与百分比的相容性和可以对连续的数据进行比较并做出选择例:总分为一百点,请以分配的方式,指出你在选择香皂时,对下列五个特性之重视程度香味 颜色 形状 大小泡沫的质地总点数测量的信度和效度检测信度 :即可靠性, 指采取同样的方法对同以对象重复进行测量时,其所得结果相一致的程度信度的统计定义: 定义 1:信度是被试团体真分数方差与实得分数方差之比定义 2:信度是被试团体真分数与实得分数相关系数的平方定义 3:信度是一个测验 X( A卷)与它的任意一个平行测验(B 卷)的相关系数描述信度的指标经典测量理论的信度系数rXX信度系数是表示测量结果的稳定性程度的指标记为:信度系数的值域: [0,1]没有百分之百可靠的测量,因此,rXX=1 只是理论上的值,实际当中是不会存在的信度的作用1. 信度是测量过程中所存在的随机误差大小的反映2. 信度可以用来解释个人测验分数的意义——测量标准误。
3. 信度可以帮助进行不同测验分数的比较信度统计理论认为, 信度是指测量结果反映系统变异的程度, 常用相关系数 R 来估算 若相关系数 R=1.00 即表明测量结果完全可信可靠,若相关系数 R=0.00 则表明测量结果完全不可信、不可靠经验表明,当相关系数 R 达到了 0.70 水平时,测量指标体系就基本上符合了统计学的基本要求复测信度 是指我们用同一份量表, 对同一群受访者, 在两次不同的时间进行调查, 根据两次测量结果,计算相关系数,以此来评估测量信度 如两次测量身高使用技巧 :选取少数重要的问题通过电话、邮件或再上门拜访等方式进行复测面对面访谈,在受访者做答完完毕后,进行补充式复测长期跟踪调查,采用完全重复测量,并辅以电话、 电邮、电脑等建立大型的数据库管理系统,定期更新、修补数据复测信度使用的前提条件:1)测验所测的特质必须是稳定的,即被测的特征和属性在两次测验之间没有发生变化2)把握适当的时间间隔,遗忘和练习的效果基本上相互抵消3)两次施测期间被试的学习效果没有差别时间间隔的把握间隔时间越长, 稳定性系数越低适宜时间间隔依照测验目的、性质及被试特点而定 几分钟至几年年幼儿童,间隔要小;年长群体,间隔可大。
智力测验的间隔不能太短,成就测验的间隔不能太长一般间隔时间不超过六个月 (即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)复本信度 指用两个等价的量表形式 (原本和复本) 对同一群受访者进行两次调查, 然后根据测量结果,比较两次答案的相似性,计算相关系数,评估测量信度 (期末考卷的 A、 B 卷)缺点 :构建一个完全等价的量表技术上非常困难复本的设计耗时、耗力、且成本昂贵设计技巧 :同一主题,可将原本中的某些问题或陈述反向表达使用前提条件 :1)施测所用的两个复本必须是真正平行的测验各份测验测量的是同一种心理特性各份测验具有相同的内容和形式各份测验的题目不应重复各份测验题目数量相等,难度和区分度大体相同各份测验的分数分布(平均数和标准差)大致相等复本编好后,应再测一次,以确保各份测验的等值2)被试要有条件接受两个测验★注意排除施测顺序的影响在报告结果时, 应报告两次施测的间隔, 及在此间隔内被试的有关经历折半信度 ,即将研究对象在一次测量中所得的结果, 按测量项目的单双号分为两组, 计算这两组分数之间的相关系数, 这种相关系数 折半信度的测量集中在构成一份量表的项目体系的内部一致性上。
它是在我们无复本又不准备复测的情况下, 通常采用的最简单的估计信度的方法计算 :分半信度先要确定分半方法不同的分半法可能会得到不同的信度值计算两半的相关系数利用公式校正影响信度因素: 测验的长度 在适当的长度内, 且合乎同质性的要求, 一项测验的题数越多,其信度也越高 受试人员的变异性 在其它条件相等的情况下, 团体内成员特质的分布范围越广,其信度系数也越大 间隔的时间 如果用再测法或复本法去求信度, 两次测验相隔的时间短点,其信度较高调查者 调查者是否按程序和标准,是否有意或无意对被调查者施加影响, 记录的认真程度等,都会影响信度 测量的环境 被调查者是否受到较大的“干扰信度评估的步骤: 首先 ,形成一个合格的测量标准我们应在正式调查前, 用心进行前期测试,改进或剔除那些含有不可靠测量标准的问题其次,量表中项目及所设答案的添减或变化都是造成不可靠测量标准的原因在调查进行中, 当我们对测量标准产生疑问时,可以考虑“浓缩”量表,增加可信度再次,在确保有一个比较准确的测量标准前提下,我们可以使用复测信度、 复本信度或折半信度来直接检测受访者的可信性,将那些不可靠的测量结果排除于最终的汇总、 分析之外。
但在将这些受访者的答案排列之前,必须肯定你的度量标准对大多数受访者来说是可信的最后, 通过计算 α 系数来表征可信度 通常 ,第一次测量的可靠度达到 0.65 或 0.70就被认为是可以接受的效度( Validity )是就测量的准确性和真实性而言的,是指测量工具或测量手段能够准确测量出所要测量的变量(调查对象特性)的程度内容效度(表面效度)准则效度建构效度效度是一个相对的概念,这种相对性表现在以下两个方面:效度是相对于一定的测量目的而言的效度只有程度上的差异,而不是“全”或“无”的差异内容效度 的建立是要确保量表中,包含了能够衡量该概念的适当且具代表性的题项量表内的项目愈能代表该概念的主要领域或共通性,则其内容效度愈好一般来说,量表的内容效度通常会透过评审小组的认可Kidder与 Judd ( 1686)曾举例说明,某个用来衡量“语言障碍”的量表是否具有内容效度,可交由一群专家来评估(如专业的语言治疗师) 表面效度 一般被视为内容效度的基本且最低的要求表面效度系指当某些题项被设计来衡量某个概念时,至少要看起来像在衡量此概念但有些研究者并不认为表面效度可当作内容效度有意义的构成要素。
如 1:目标—桌子的形状—测量四边长度、邻边夹角效度检测:具有较高内容效度的绩效评估指标系统能够把被测试对象置身于与实际工作非常类似的情境之中 如在设计指标体系评估政府绩效时,只关注地方政府管理的经济绩效,而忽视地方政府管理的社会绩效,只关注地方政府的眼前绩效, 而忽视潜伏的政府绩效主要通过经验判断或请一些熟悉该测量内容的人员来评判,确定指标与所需测量的内容范畴之间关系的密切程度来进行效标关系效度 指建立另一个个体的期望效标,当作衡量是否有效的标准效标关系度一般可用同时效度或预测效度来代表某人成功了吗?某人患病了吗?某人会成功吗?某人会患病吗?同时效度适用于量表可区别出某些已知有差异的个体时;亦即这些个体在此量表上的得分应该是有差异的,如以下范例之说明例; 假设一个关于工作伦理的量表已被发展出来,并交由一群领取社会救济的人来填答,基本上, 此量表应能区别出, 一群乐于接受工作且渴望获取机会不依靠社会救济的人,以及另一群即使提供工作也不想工作的人因此,这二群人在该量表上应由不同的得分很明显地,这些具有高度工作伦理价值观的人,不想依靠社会救济且渴望靠自己获取被雇佣的机会另一方面, 那些工作伦理价值观较低的人,将尽可能地争取继续使用社会救济地机会,且视工作为作苦工。
故如果此二种类型地人在工作伦理量表上地得分相同,则该份测验就不是衡量到工作伦理,而是其他概念的衡量预测效度 系指测量工具能在某个未来的效标上,区分出个别差异的能力例如,在招募员工时,同时也让新近员工填写性格或能力测验,并将此成绩与其未来的工作绩效做比较基本上,性格测验得分较低的人应该会由较差的工作绩效表现;反之,则由较好的工作绩效表现由此即可得知,此测验具有较高的预测效度准则效度 是指用一种不同以往的测量方式或指标对同一事物或变量进行测量时,将以往原有的某一种测量方式或指标作为准则,用新的方式或指标所得到的测量结果与原有准则的测量结果作比较,如果新的测量方式或指标与原有的作为准则的测量方式或指标具有相同的效果,那么就可以认为这种新的测量方式具有准则效度如: 2009 年进行的某次调查中涉及如下两个问Q4:您的年龄是 36 岁Q27:您在 1999年结婚,当时26 岁建构效度 是用来证明,从量表所获得的结果与设计该量表时所依据的理论之间的契合程度一般来说,建构效度可透过聚合效度与区别效度来评估,其意义如下聚合效度系指 ,当采用二种不同的衡量工具来衡量同一个概念时,所获得的分数之间是有否高度相关的。
区别效度系指 ,如果根据理论的预测,二个变项之间是不相关的,则两个变项的实际衡量分数之间,应该也是不相关的建构效度 是指通过将测量结果与有关理论命题或假设进行对比来考察测量的效度如:理论假设——婚姻满意度与主动做家务的行为有关婚姻满意度越高,越是主动承担家务将婚姻满意度的测量指标换成新指标以后,测量结果——婚姻满意度越高,越是主动承担家务——具有建构效度婚姻满意度不同,承担家务的行为相似——不具有建构效度指标体系权重的确定各指标的重视程度不同, 造成的主观差异;所起的作用不同, 造成的客观差异;可靠程度不同,反映各指标提供信息的可靠性指标体系权重实际上是指指标体系中各指标对于总目标的重要程度的数量关系目前确定指标权重的方法如专家调查法、熵值法、层次分析法等。