概述 在消费者群体中也称为统计群体,特指具有某些共同特点的消费者群体,而成员之间并没有现实的联系,也没有任何的组织形式,只是具有统计意义或研究意义的群体。 在管理心理学中,假设群体是指名义上存在,实际上并不存在的一种形式上的群体。它只是为研究问题的需要,人为的将人群作为一种观念上的不同划分。特点 群体按是否实际存在而言可分为:假设群体和实际群体。 假设群体,是虽有其名,而无其实,在实际中并不存在的一种群体。它是为了某种需要,人为的将人群按不同的方式加以划分。例如:凡是下过乡的知青,都不自觉地归入“锻炼类”。一般同种经历的人相遇,就觉得亲近几分。再如:目前我国正处于经济建设的高潮期,大量的年富力强的知识分子就成了中坚力量,于是,社会上就把40~50岁之间的知识分子称为“中年知识分子”等等。这些群体都属假设群体,因为这些人从没有自觉地聚集在一起,也没有直接交往,甚至根本就不认识,只是因为他们在某些方面具有共同点而已,如共同的经历,共同的年龄特征,职业特征,典型的社会心理特征等,由此可见,这些群体实际并不存在,只是为了研究的方便而创设的,故称之为假设群体。 实际群体则是现实生活中实际存在的,其成员之间有着各种各样的联系。如工厂中的车间、班组、行政机构中的科室等,都是实际群体。
定义 位置平均数:是指按数据的大小顺序或出现频数的多少,确定的集中趋势的代表值,主要有众数、中位数等。有哪几项 1、算术平均值:有样本标志值的总和除以样本数据个数得出。它是描述样本集中区是最常用的统计量。它的指标仅适用于定比数据和定距数据。 2、中位数:一组数据按从小到大的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)。中位数是样本数据所占频率的等分线,它不受少数几个极端值得影响,有时也会成为优点。 3、众数:是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个。用M表示。 理性理解:简单的说,就是一组数据中占比例最多的那个数。用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。
伽玛分布(Gamma distribution)是统计学的一种连续机率函数。Gamma分布中的参数α,称为形状参数(shape parameter),β称为尺度参数(scale parameter)。 伽玛分布的期望和方差分别是:a/λ,a/λ~2或者αβ,αβ~2(其中λ=β的倒数) 伽玛方程表达式:Γ(x)=∫e^(-t)*t^(x-1)dt (积分的下限式0,上限式+∞) 利用分部积分法(integration by parts)我们可以得到 Γ(x)=(x-1)*Γ(x-1) 在概率的研究中有一个重要的分布叫做伽玛分布: f(x)=λe^(-λx)(λx)^(x-1)/Γ(x) x>=0 =0 x<0
该指标全面反映筛检试验的诊断价值,且非常稳定。似然比的计算只涉及到灵敏度与特异度,不受患病率的影响。 因检验结果有阳性与阴性之分,似然比可相应地区分为阳性似然比(positive likelihood ratio, +LR)和阴性似然比(negative likelihood ratio, -LR)。 阳性似然比是筛检结果的真阳性率与假阳性率之比。说明筛检试验正确判断阳性的可能性是错误判断阳性可能性的倍数。比值越大,试验结果阳性时为真阳性的概率越大。 阴性似然比是筛检结果的假阴性率与真阴性率之比。表示错误判断阴性的可能性是正确判断阴性可能性的倍数。其比值越小,试验结果阴性时为真阴性的可能性越大。
根据回归线上的分数^Y来预测Yi所产生的估计误差.像这样利用回归公式来根据Xi预测Yi所产生的误差,不叫做标准差,而特别叫做估计标准误.σyx=σy=.
【英文】: Deviation 【中文拼音】: piancha 【解释】: 1、偏差是指某一尺寸(实际尺寸,极限尺寸,等等)减其基本尺寸所得的代数差。 2、运动的物体离开确定方向的角度。 3、工作上产生的过分或不及的差错。 【例句】: 第一发炮弹打歪了,修正了偏差后,第二发便击中了目标。 我们实验班数学考试上竟有人得了个偏差。 【偏差值】: 所谓“偏差值”,是日本人对于学生智能、学力的一项计算公式值,[(个人成绩-平均 成绩)÷标准差]×10+50=偏差值,也就是自己的分数 。 【标准偏差】: 统计学名词。一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。 【偏差系数】: 标准差与变量及期望值的大小有关,项目比较时,若某一项目的期望值及标准差均比其他项目大,不能简单地认为标准差大的项目风险就一定大,还应进一步用两者的相对指标进行分析和比较,该相对指标即偏差系数。 【相对误差】: 讲解相对误差就要引入决对偏差的概念。绝对误差意思是测定值与标准值之差,用g(mL)表示。相对误差意思是绝对误差与标准值之比,用%表示。 绝对误差=标签明示值-测定值 相对误差=[(标签明示值-测定值)/标签明示值]×100%
partial regression coefficient 在多元回归分析中,随机因变量对各个自变量的回归系数,表示各自变量对随机变量的影响程度。 偏回归系数是多元回归问题出现的一个特殊性质,如何理解、辨认和求取偏回归系数正是本文要讨论的。为了简化问题,我们把对偏回归系数的讨论,限定为只有2个解释变量的系统,即建立的经济计量模型为Yi=β0+β1X1i+β2X2i+ui(1) 回归方程为^Yi=^β0+^β1X1i+^β2X2i(2)式中^βi(i=0,1,2)为偏回归系数。一、X1增加一个单位引起Y的增加量肯定是偏回归系数^β1吗? 为了回答这个命题,首先,必须进行因素影响分析,即X1,X2对Y的作用关系分析。具体讲,这种作用关系有四种:其一是X1本身变化对Y的净作用;其二是X2的变化引起X1的相应变化,…
测量学 任何试验必须尽可能排除偏倚,否则统计结论不可信。要保证试验无偏倚,必须有精确的测量方法,一定的样本量,周密的试验设计,随机化的抽样及分组,避免试验者的主观偏见等。医学研究 虽然要在研究工作中完全避免误差几乎是不可能的,但对于研究中可能存在的各种误差,我们要在临床研究工作的各个环节中尽量加以控制和预防,以使研究结论更符合实际情况。 临床研究中误差的来源可以分为两类:一类是随机误差(random error);一类是系统误差(systematic error)。 随机误差:是由于抽样误差所引起的,其大小可以用统计学方法进行估计,但没有方向性,也就是说,这种误差的存在使研究结果随机的高于或小于真值。 系统误差即偏倚(bias):是指研究结果系统地偏离了真实情况。与随机误差不同,偏倚的存在总是造成研究结果或高于真值或低于真值,因而具有方向性。由于在研究工作中定量的估计偏倚的大小很困难,而确定偏倚的方向却相对较容易。当偏倚使研究结果高于真值时,称之为正偏倚,反之,偏倚使研究结果低于真值时,称之为负偏倚。 临床研究中的偏倚一般分为三类,即选择偏倚、信息偏倚、混杂偏倚。 选择偏倚:出现于研究设计阶段,指由于研究对象选择不当而使研究结果偏离真实情况而产生偏倚。研究设计上的缺陷是选择偏倚的主要来源,在确定研究对象时表现得最为突出。常见的情况是在研究开始时实验组和对照组就存在着除诊疗措施以外的差异,而缺乏可比性。 信息偏倚:又称观察偏倚、测量偏倚,是指研究过程中进行信息收集时产生的系统误差。测量方法的缺陷,诊断标准不明确或资料的缺失遗漏等都是信息偏倚的来源。 混杂偏倚:流行病学研究中,由于一个或多个外来因素的存在,掩盖或夸大了研究因素与疾病的联系,从而部分或全部地歪曲了两者间的真实联系,称之为混杂偏倚(confounding bias)或混杂(confounding)。引起混杂的因素称为混杂因子(confounder)。 从某种意义上讲,偏倚是抽样调查所无法避免的误差。也就是说,只要是抽样,就会产生偏倚。相应地,要最大限度地控制偏倚,只能通过多次抽样、预实验等手段加以判断。由于许多调查或实验是无法重复或进行预实验的,所以经验在偏倚的处理上也是非常重要的。汽车用语 指由同一操作人员使用相同量具, 测量同一零件之相同特性多次数所得平均值与工具室或精密仪器测量同一零件的相同特性所得的真值或参考值之间的偏差值。是测量结果的观测平均值与基准值的差值。真值的取得可以通过采用更高级别的测量设备进行多次测量,取其平均值而定。 为了在过程范围内指定的位置确定测量系统的偏倚,得到一个零件可接受的基准值是必要的。通常可在计量室或全尺寸检验设备上完成。基准值从这些读数中获得,然后这些读数要与研究评价人的一组观察平均值(定为XA,XB,XC)进行比较。 如果不能按这种方法对所有样件进行测量,可采下列替代的方法: 1.在计量室或全尺寸检验设备上对一个基准件进行精密测量。 2.让一位评价人用正被评价的量具测量同一零件至少十次。 3.计算读数的平均值。基准值与平均值之间的差值表示测量系统的偏倚。 如果需要一个指数,把偏倚乘以100再除以过程变差(或公差),就把偏倚转化为过程差(或公差)的百分比。 计算偏倚: 偏倚= 观测平均值 – 参考值 制造过程变异= 6σ(也可以用公差) %偏倚=偏倚/制造过程变差(也可以用公差) 如果偏倚相对比较大,查看这些可能的原因 1.基准的误差 2.磨损的零件 3.制造的仪器尺寸不对 4.仪器测量非代表性的特性 5.仪器没有正确校准 6.评价人员使用仪器不正确。选择性偏倚入院率偏倚 倚在选择研究对象时,试验组和对照组的设立(纳入标准)不正确,使得这两组人在开始时即存在处理因素以外的重大差异,从而产生偏倚。常见的主要有: 1.就诊机会偏倚(入院率偏倚):由于疾病严重程度不同、就医条件不同、人群对某一疾病的了解和认识程度不同等原因而使患不同种类疾病的人(或有某种特性者)的住院率不同。从医院选取对照时,如果没有注意到此点,则可引起偏倚。新发病例偏倚 2.现患病例及新发病例偏倚:此种偏倚易出现在病程较短的严重致死性疾病,如心肌梗死,部分病例在送到医院前已死亡,如果只以存活的现患病例为对象,研究某因素的作用,必然产生偏倚。这些死亡病例通常未计入心肌梗死总发病人数中,以至于所报道的患病数少于实际的发病数。又如,在病例对照研究中有意或无意排除(或加入)某些病例,也可出现偏倚,如研究吸烟与肺癌的关系时,对照组包括了慢性支气管炎和冠心病,由于此二病均与吸烟有关,所以吸烟与肺癌的OR减低,甚至于看不出吸烟作为肺癌的病因作用。患病后改变生活习惯也可以使用病例对照方法探讨病因出现偏倚,如患肺癌后戒烟,患高血压后将饮食口味调淡、不吃动物脂肪(肥肉)、适当增加体力活动等等,都可在病例对照研究中使这些因素的病因作用被抵消。又如,乳腺癌与利血平关系的病例对照研究,在对照组中排除了心血管病人(其中有相当多的高血压病人,他们服用利血平),所以得出利血平是乳腺癌的危险因素的结论。另一个研究将全部病例均纳入,则未发现此相关。检出信号偏倚 3.检出信号偏倚:某因素如能引起或促进某症候(与所研究疾病的体征或症状类似)的出现,使患者因此而去就医,这就提高了该病的检出机会,使人误以为某因素与该病有因果联系。这种虚假联系造成的偏倚称为检出信号(或检出症候)偏倚。如,曾有研究发现子宫内膜癌与绝经期服用雌激素有关。这个研究结果是因为绝经期妇女服用雌激素会引起不规则子宫出血,因此而就医,得到检查子宫内膜的机会较多,从而增加了发现子宫内膜癌的机会。不服用雌激素的子宫内膜癌常无明显症状,发现机会较少。以刮宫或子宫切除作为诊断子宫内膜癌的诊断时,绝经期服用雌激素的OR为1.7,而以子宫出血就诊者的OR为9.8,二者相差悬殊。显然,以子宫出血就诊增高了OR。此类偏倚即检出信号偏倚。无应答偏倚 4.无应答偏倚:即研究对象对研究内容产生不同的反应而造成的偏倚。如用通信方式调查吸烟情况,不吸烟者与吸烟者的应答率可以相差悬殊。无应答者的暴露或患病状况与应答者可能不同。如果无应答者比例较高,则使以有应答者为对象的研究结果可能存在严重偏倚。所以在研究报告中必须如实说明应答率,并评价其对结果可能造成的影响。与一部分人无应答相反的情况是有一部分人特别乐意或自愿接受调查或测试。这些人往往是比较关心自身健康或自觉有某种疾病,而想得到检查机会的人。他们的特征或经历不能代表目标人群。由此造成的偏倚称为志愿者偏倚。 总之,无论什么原因使观察组与对照组成员不是来自同一总体,即可造成除研究因素以外的有关因素在两组分布不均衡,从而造成选择偏倚。