简介 李克特量表形式上与沙氏通量表相似,都要求受测者对一组与测量主题有关陈述语句发表自己的看法。它们的区别是,沙氏通量表只要求受测者选出他所同意的陈述语句,而李克特量表要求受测者对每一个与态度有关的陈述语句表明他同意或不同意的程度。另外,沙氏通量表中的一组有关态度的语句按有利和不利的程度都有一个确定的分值,而李克特量表仅仅需要对态度语句划分是有利还是不利,以便事后进行数据处理。李克特量表的基本步骤 (1)收集大量(50~100)与测量的概念相关的陈述语句。 (2)有研究人员根据测量的概念将每个测量的项目划分为“有利”或“不利”两类,一般测量的项目 中有利的或不利的项目都应有一定的数量。 (3)选择部分受测者对全部项目进行预先测试,要求受测者指出每个项目是有利的或不利的,并在下面的方向-强度描述语中进行选择,一般采用所谓“五点”量表: a.非常同意 b.同意 c.无所谓(不确定) d.不同意 e.非常不同意 (4)对每个回答给一个分数,如从非常同意到非常不同意的有利项目分别为1、2、3、4、5分,对不利项目的分数就为5、4、3、2、1。 (5)根据受测者的各个项目的分数计算代数和,得到个人态度总得分,并依据总分多少将受测者划分为高分组和低分组。 (6)选出若干条在高分组和低分组之间有较大区分能力的项目,构成一个李克特量表。如可以计算每个项目在高分组和低分组中的平均得分,选择那些在高分组平均得分较高并且在低分组平均得分较低的项目。李克特量表的应用 李克特量表的构作比较简单而且易于操作,因此在市场营销研究实务中应用非常广泛。在实地调查时,研究者通常给受测者一个“回答范围”卡,请他从中挑选一个答案。需要指出的是,目前在商业调查中很少按照上面给出的步骤来制作李克特量表,通常由客户项目经理和研究人员共同研究确定。李克特量表的优点 (1)容易设计; (2)使用范围比其他量表要广,可以用来测量其他一些量表所不能测量的某些多维度的复杂概念或态度。 (3)通常情况下,利克特量表比同样长度的量表具有更高的信度。 (4)利克特量表的五种答案形式使回答者能够很方便的标出自己的位置李克特量表的缺点 相同的态度得分者具有十分不同的态度形态。因为利克特量表是一个项目总加的分代表一个人的赞成程度,它可大致上区分个体间谁的态度高,谁的低,但无法进一步描述他们的态度结构差异。关键字 华语:李克特量表,利克特量表,李克特5点量表,李克特式量表,李氏累加量表,里克特量表,李克特5级量表,赖克梯量表 英语:Likert scale, Likert summated rating scale
释义 词目:权数 拼音:quán shù 基本解释: 1. 谓掌握权力的术数、要领。 《管子·山权数》:“ 桓公 问 管子 曰:‘请问权数。’ 管子 对曰:‘天以时为权,地以财为权,人以力为权,君以令为权;失天之权,则人地之权亡。’” 2. 犹权术。 汉 桓宽 《盐铁论·非鞅》:“ 商鞅 以权数危 秦国 , 蒙恬 以得千里亡 秦 社稷。”《后汉书·鲁恭传》:“祖父 匡 ……有权数,号曰知囊。” 宋 张齐贤 《洛阳搢绅旧闻记·梁太祖优待文士》:“ 梁祖 虽起於羣盗,安忍雄猜,甚於古者。至於刚猛英断,以权数御物,遂成兴王之业。” 清 侯方域 《颜真卿论》:“使天下相观而喻,而有以逆销其僭乱之萌,又岂必待其著而力争于甲兵权数之间。” 权数介绍 在统计计算中,用来衡量总体中各单位标志值在总体中作用大小的数值叫权数。权数决定指标的结构,权数如变动,绝对指标值和平均数也变动,所以权数是影响指标数值变动的一个重要因素。权数一般有两种表现形式:一是绝对数(频数)表示,另一个是用相对数(频率)表示。相对数是用绝对数计算出来的百分数(%)或千分数(‰)表示的,又称比重。平均数的大小不仅取决于总体中各单位的标志值(变量值)的大小,而且取决于各标志值出现的次数(频数),由于各标志值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。这说明权数的权衡轻重作用,是体现在各组单位数占总体单位数的比重大小上。如工业生产指数中的权数是对产品的个体指数在生产指数形成过程中的重要性进行界定的指标。产品的重要性不同,在发展速度中的作用不同,产品或行业占比重大的,权数就大,在指数中的作用就大。工业经济效益综合指数中的权数是根据各项指标在综合经济效益中的重要程度确定的。零售物价指数除选用代表规格品计算个体物价指数外,还要采用零售额为权数,对个体商品物价指数在物价总指数形成中的重要程度起着权衡轻重的作用。正确理解统计中的权数 在统计中,用来衡量总体中各单位标志值在总体中作用大小的数值叫权数。权数的总和一般为100或1000,现假设一个算例加以说明。 平均报酬:按不加权计算(800+600+400)÷ 3 = 600元按加权计算: 按从业人员数加权(800×50+600×250+400×200)÷ 500 = 540元 按各组从业人员占从业人员总人数比重加权 800×10%+600×50%+400×40% =540元 从上例看,按不加权计算把不同报酬水平对总体平均报酬的影响等同起来,是不符合实际情况的。按加权方法计算考虑了不同报酬水平的人数(或比重)不同,对总体平均数的影响不同,计算结果表明600元的占50%对平均报酬影响最大,其次是400元的占40%,800元的占10%影响最小,因而平均报酬540元,是符合实际情况的。 从理论上讲,权数决定指标的结构,权数如变动,绝对指标值和平均数也变动,所以权数是影响指标数值变动的一个重要因素。权数一般有两种表现形式,一是绝对数(频数)表示,另一个是用相对数(频率)表示,相对数是用绝对数计算出来的百分数(%)表示的,又称比重。平均数的大小不仅取决于总体中各单位的标志值(变量值)的大小,而且取决于各标志值出现的次数(频数),由于各标志值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。 权数的权衡轻重作用是体现在各组单位数占总体单位数的比重大小上,在计算平均数和指数上得到广泛的应用。如,工业生产指数中的权数是对产品的个体指数在生产指数形成过程中的重要性进行界定的指标。零售物价指数除选用代表规格品计算个体物价指标外,还要采用零售额为权数。居民消费价格指数的权数来源于居民用于各类商品和服务项目的消费支出额以及各种商品、服务项目的实际消费支出额的构成比重,在居民消费价格指数的形成中起着权衡轻重的作用。
标准分数(stardard score)也叫z分数(z-score),是一个分数与平均数的差再除以标准差的过程。用公式表示为: z=(x-μ)/σ。其中x为某一具体分数, μ为平均数,σ为标准差。 Z值的量代表着原始分数和母体平均值之间的距离,是以标准差为单位计算。在原始分数低于平均值时Z则为负数,反之则为正数。标准分数的作用和特点 标准分数可以回答这样一个问题:"一个给定分数距离平均数多少个标准差?"在平均数之上的分数会得到一个正的标准分数,在平均数之下的分数会得到一个负的标准分数。 标准分数是一种可以看出某分数在分布中相对位置的方法。标准分数能够真实的反应一个分数距离平均数的相对标准距离。如果我们把每一个分数都抓换成标准分数,那么每一个标准分数会以标准差为单位表示一个具体分数到平均数的距离或离差。将成正态分布的数据中的原始分数转换为标准分数,我们就可以通过查阅标准分数在正态曲线下面积的表格来得知平均数与标准分数之间的面积,进而得知原始分数在数据集合中的百分等级。 一个数列的各标准分数的平方和等于该数列数据的个数,并且标准分数的标准差和方差都为1。. 应用 在日本,标准分数常被用在计算学力测验的“学力偏差值”,并且依此判断进入理想大学的可能性。在智力测验时,用来计算“智力标准分数”,在教育的用途上,常和“智商”一起被当作参考的依据
柯西分布 英文名称: Cauchy distribution 是因大数学家柯西(Cauchy)而命名,记为C(θ,α)。 对X有柯西分布C(θ,α), 令Y=(X-θ)/α, 则称Y有C(0,1)分布。对于C(0,1)分布称为标准的柯西分布。正态分布也有类似的性质。 柯西分布的重要特性之一就是期望和方差均不存在。 柯西分布有两个参数θ、a, 概率密度函数p.d.f.的图形亦为钟形,不仔细看, 还不容易与正态分布p.d.f.的图形区别。插图中,我们把柯西分布和正态分布的p.d.f.之图形放在一起比较。可发现,,柯西分布p.d.f.之图形下降至0的速度慢很多。 柯西分布是一个数学期望不存在的连续型分布函数,它同样具有自己的分布密度,满足 分布函数F(X)=1/2+1/π*arctanx,-∞<x<+∞ 密度函数ф(x)=1/[π(1+x^2)],-∞<x<+∞ 的称为柯西分布。
指生长乔木、竹类、灌木、沿海红树林等林木的土地面积,包括有林地、灌木林、疏林地、未成林造林地、迹地、苗圃等。
定义:一组数据中的最大数据与最小数据的差叫做这组数据的极差。 range 数学名词。 指一组数据中最大数据与最小数据的差,在统计中常用极差来刻画一组数据的离散程度。以及表示,R=Xmax-Xmin。又称全距或范围误差。反映的是变量分布的变异范围和离散幅度,在总体中任何两个单位的标准值之差都不能超过极差。同时,它能体现一组数据波动的范围。 方差计算公式:s^2=(1/n)*[(x1-x0)^2 + (x2-x0)^2 +...+ (xn-x0)^2] (x0即为x的平均值) 极差计算公式: x=xmax-xmin (xmax为最大值,xmin为最小值) 如 12 12 13 14 16 21 这组数的极差就是 21-12=9 如 “早穿皮袄午穿纱”,这句话说明的气温特征数就是极差。 极差只指明了测定值的最大离散范围,而未能利用全部测量值的信息,不能细致地反映测量值彼此相符合的程度,极差是总体标准偏差的有偏估计值,当乘以校正系数之后,可以作为总体标准偏差的无偏估计值,它的优点是计算简单,含义直观,运用方便,故在数据统计处理中仍有着相当广泛的应用。 但是,它仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。移动极差(Moving Range) 两个或多个连续样本值中最大值与最小值之差,这种差是按这样方式计算的:每当得到一个额外的数据点时,就在样本中加上这个新的点,同时删除其中时间上“最老的”点,然后计算与这点有关的极差,因此每个极差的计算至少与前一个极差的计算共用一个点的值。一般说来,移动极差用于单值控制图,并且通常用两点(连续的点)来计算移动极差。
条件分布函数 §3.6 条件分布函数与条件期望、回归与第二类回归 在前一章中,对离散型随机变量 ,我们曾经研究了在已知 发生的条件下 的分布问题,并称P(=x| =y )为条件分布开,类似的问题对连续型随机变量也存在。 因为连续型随机变量取单点值的概率为零,所以用分布函数P (x)=P ( x)来代替离散型时的分布列P(=a ),在这里也同样以P( <x| =y)来代替离散型时的P(=x| =y ),并且称P(=x| =y )为已知(=y)发生的条件下 的条件分布函数,并记作F (x|y)。数学分布中的“不定式” 现在的问题是,如果已知 的联合分布函数F(x, y)或它的密度函数p(x, y),如何来条件分布函数F (x|y)。由条件概率的定义读者会想到应该有 P (x|y)= P( <x| =y)= 但是,因为对连续型随机变量来说,P( <x,=y)=0, P(=y)=0,上述等式中的右端是 ,也就是数学分布中的“不定式”,这并没有解决问题。 在数学分析中已知 也是 的不定式,为解决这个矛盾,先考虑有限增量时的比值 ,然后再令 ,并定义 = 由此得到启发,我们采取同样的思想途径定义 P (x|y)= P( <x| =y) = = (3.86) 因为 是连续型随机变量,若其密度函数为p(x, y),则上式可以写成 P (x|y)= P( <x| =y) = = (3.87) 若太是连续函数,又,则有 P (x|y)= = (3.88) 显然,这时P (x|y)关于x的导数存在,且有 P (x|y)=F (x | y) = (3.89) 我们称P (x|y)为在已知发生的条件下 的条件概率密度。完全类似地可以定义F (x|y)及P ( y|x),读者还可以比较一下条件概率密度与离散型时的条件分布列: P ( x | y )= 它们之间是多么的相似! 例6.18(略)条件数学期望 条件分布函数F ( y|x)或条件密度函数P ( y|x)描写了随机变量 在已知(=y)发生的条件下的统计规律,同样离散型情形一样,还可以求在(=y)发生的条件下的数学期望,也就是条件数学期望,于是有下述定义。 定义5.1 如果随机变量 在已知(=y)发生的条件下的条件密度函数为P ( y|x),若 则称 E ( )= (3.90) 为 在( =y)发生的条件下的数学期望,或简称为条件期望。 同离散型情形相同,连续型随机变量的条件期望也具有下述性质: (1)若a≤ ≤b,则a≤E ( )≤b; (2)若是 、 两个常数,又E ( )(i=1, 2)存在,则有 E ( )= E ( )+ E ( ) 进一步还可以把E ( )看成是 的函数,当时这个函数取值为E ( ),记这个函数为E ( ),它是一个随机变量,可以对它求数学期望,仍与离散型相同,有 (3)E (E )=E 。在近代概率论中的作用 条件数学期望在近代概率论中有着基本重要的作用,在实际问题中也有很大用处。在两个互有影响的随机变量 、 中,如果已知其中一个随机变量的取值=y,要据此去估计或预测另一个随机变量的取值,这样的问题在实际应用中经常会碰到。人们称它为“预测问题”。由上述讨论可知,条件数学期望E ( )是在已知(=y)发生的条件下,对 的一个颇为“合理”的预测。 例6.18(略) 一般认为,人的身高和脚印长可当作一个二维正态分布变量来处理。下面我们给出脚印长的估计式: E ( )= 如果 把画在平面的直角坐标系中,它是一条直线,这条直线在一定程度上描写了身高 依赖于 的关系,常常称为是回归直线。在一般情形下,由 E ( ,y) (3.94) 或 {x,E ( )} (3.94 ) 可以得到平面上的两条曲线,它们称为是回归曲线或简称为回归, 前面曾经指出,把E ( )作为在已知(=y)发生的条件下,对 的估计或预测,在直觉上是“合理”的,究竟它合理在什么地方?这个估计或预测具有那些“优良”的性质值得引起人们的注意呢?这是下面要进一步研究的问题。估计或预测“优良”的性质 我们已经知道E ( )是 的函数,现在不妨假定有别的 的函数g( )可以作为对 的估计或预测,我们当然要求这种估计或预测的误差| |要尽可能地小,但| |是随机变量,一般就要求它的平均值 E [ ]=min 但是绝对运算在数学上处理并不方便,回忆在数学分析中提到过的最小的二乘方法以及第二章中关于方差的讨论,读者能够想到,可以要求 E [ ] =min 如果 的密度函数为p(x,y),就有 E [ ] = = 由方差的性质( 3.74),当g(y)=E ( )时,能使 达到最小,从而当g(y)=E ( )时也使E[ ] 到最小。所以,在已知(=y)发生的条件下,用E ( )作为对 的估计或预测是最佳的,这时均方差E{[ ] |=y }达到最小,这里证明的是连续型的情形,对离散型也可以类似地证明这个结论。第二类回归 现在我们已经知道用E ( )作为对 进行估计或预测具有很有的性质。在 的任意函数中,它的平均方差为最小,但是在某些场合,譬如密度函数p(x,y)为未知,或者E ( )过分复杂等原因,这时可以降低一些要求寻找另外的估计,这当中一个常用的估计是,只要求所得到的估计在 的线性函数类L( )=a +b中能使均方差达到最小,也就是要确定a与b常数,使 =E [ ] =min 为此,只要令 上述方程组等价于 (3.95) 解此方程组可以求得 (3.96) 通常称上式为线性回归或第二类回归,并称(3.94)或给出的一般情况的回归为第一类回归。第二娄回归的性质比第一类回归要差一些,但是在求第二类回归时,不必知道联合密度函数而只要求知道 、 的期望、方差与协方差就够了,而且第二类回归得到的总是一个线性函数,因而第二类回归有便于应用的优点。剩余方差 还有一点应该指出的是,对于用得最广泛的正态分布来说,可以从例3.27知道,两类回归恰好是一致的。这一事实表明,就正态分布而言,最佳线性估计就是最佳估计。当然,这里“最佳”的意思是指均方差最小 由(3.96)式还可得到最佳线性估计的均方误差为 E [ ] =E [ ] = 这个均方误差常常称为剩余方差。由上式可知,当 与 间的相关系数| |=1时,剩余方差为零。这时, 可以用(3.96)式来准确估计,也就是说 与 之间存在着线性关系。于是我们又一次证明了相关系数是随机变量间线性相依程度的反映。
简介 英文:Standard Error 标准偏差反映的是个体观察值的变异,标准误反映的是样本均数之间的变异(即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度),标准误不是标准差,是样本平均数的标准差。 标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。 在相同测量条件下进行的测量称为等精度测量,例如在同样的条件下,用同一个游标卡尺测量铜棒的直径若干次,这就是等精度测量。对于等精度测量来说,还有一种更好的表示误差的方法,就是标准误差。定义 标准误差定义为各测量值误差的平方和的平均值的平方根,故又称为均方误差。 设n个测量值的误差为ε1、ε2……εn,则这组测量值的标准误差σ等于: (此处为一公式,显示不出来,你看下文字就可以知道这个公式是什么样的。) 由于被测量的真值是未知数,各测量值的误差也都不知道,因此不能按上式求得标准误差。测量时能够得到的是算术平均值(),它最接近真值(N),而且也容易算出测量值和算术平均值之差,称为残差(记为v)。理论分析表明①可以用残差v表示有限次(n次)观测中的某一次测量结果的标准误差σ,其计算公式为 (此处为一公式,显示不出来,你看下文字就可以知道这个公式是什么样的。) 对于一组等精度测量(n次测量)数据的算术平均值,其误差应该更小些。理论分析表明,它的算术平均值的标准误差。有的书中或计算器上用符号s表示)与一次测量值的标准误差σ之间的关系是 (此处为一公式,显示不出来,你看下文字就可以知道这个公式是什么样的。)误差 需要注意的是,标准误差不是测量值的实际误差,也不是误差范围,它只是对一组测量数据可靠性的估计。标准误差小,测量的可靠性大一些,反之,测量就不大可靠。进一步的分析表明,根据偶然误差的高斯理论,当一组测量值的标准误差为σ时,则其中的任何一个测量值的误差εi有68.3%的可能性是在(-σ,+σ)区间内。 世界上多数国家的物理实验和正式的科学实验报告都是用标准误差评价数据的,现在稍好一些的计算器都有计算标准误差的功能,因此,了解标准误差是必要的。