指数分布:如果随机变量X的概率密度为 公式P(X≥0)=λ乘以(e的-λX次方);p(x<0)=0 分布函数为 F(a)=P{X≤a}=1-(e的-λa次方) a≥0则称X遵从指数分布(参数为λ)。 在概率论和统计学中,指数分布(Exponential distribution)是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。 许多电子产品的寿命分布一般服从指数分布。有的系统的寿命分布也可用指数分布来近似。它在可靠性研究中是最常用的一种分布形式。指数分布是伽玛分布和威布尔分布的特殊情况,产品的失效是偶然失效时,其寿命服从指数分布。 指数分布可以看作当威布尔分布中的形状系数等于1的特殊分布,指数分布的失效率是与时间t无关的常数,所以分布函数简单。分布应用 在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果。这种分布表现为均值越小,分布偏斜的越厉害。 指数分布应用广泛,在日本的工业标准和美国军用标准中,半导体器件的抽验方案都是采用指数分布。此外,指数分布还用来描述大型复杂系统(如计算机)的平均故障间隔时间MTBF的失效分布。但是,由于指数分布具有缺乏“记忆”的特性.因而限制了它在机械可靠性研究中的应用,所谓缺乏“记忆”,是指某种产品或零件经过一段时间t0的工作后,仍然如同新的产品一样,不影响以后的工作寿命值,或者说,经过一段时间t0的工作之后,该产品的寿命分布与原来还未工作时的寿命分布相同,显然,指数分布的这种特性,与机械零件的疲劳、磨损、腐蚀、蠕变等损伤过程的实际情况是完全矛盾的,它违背了产品损伤累积和老化这一过程。所以,指数分布不能作为机械零件功能参数的分布形式。 指数分布虽然不能作为机械零件功能参数的分布规律,但是,它可以近似地作为高可靠性的复杂部件、机器或系统的失效分布模型,特别是在部件或机器的整机试验中得到广泛的应用。 指数分布比幂分布趋近0的速度慢很多,所以有一条很长的尾巴。指数分布很多时候被认为是长尾分布。互联网网页链接的出度入度符合指数分布 指数分布的参数为λ,则指数分布的期望为1/λ,方差为(1/λ)的平方。
什么是指数体系 所谓指数体系(Index System),指数体系是指若干个在经济上有联系、数量上有关系的指数所形成的整体。如:一个总值指数等于两个(或两个以上)因素指数的乘积。指数体系的特点 (1)具备三个或三个以上的指数。 (2)体系中的单个指数在数量上能相互推算。例如,已知销售额指数、销售量指数,则可推算出价格指数;已知价格指数、销售量指数,则可推算出销售额指数。 (3)现象总变动差额等于各个因素变动差额的和。指数体系的内容及表现形式 1、销售额指数=销售量指数×销售价格指数; 2、总成本指数=产品产量指数×单位产品成本指数; 3、增加值指数=员工人数指数×劳动生产率指数×增加值率指数; 4、销售利润指数=销售量指数×销售价格指数×销售利润率指数;指数体系的作用 指数体系主要有以下三方面的作用: (1)指数体系是进行因素分析的根据。 即利用指数体系可以分析复杂经济现象总变动中各因素变动影响方向和程度。 (2)利用各指数之间的联系进行指数间的相互推算。 例如,我国商品销售量总指数往往就是根据商品销售额总指数和价格总指数进行推算的。即商品的销售量指数一销售额指数÷价格指数 (3)用综合指数法编制总指数时,指数体系也是确定同度量因素时期的根据之一。 因为,指数体系是进行因素分析的根据,要求各个指数之间在数量上要保持一定的联系。因此,编制产品产量指数时,如用基期价格作同度量因素,那么编制产品价格指数时就必须用报告期的产品产量作为同度量因素;如果编制产品产量指数用报告期价格作为同度量因素,那么编制产品价格指数时就必须用基期的产品产量作为同度量因素。
简介 reject region 又称否定域(critical region)。 用来判断是否接受原假设H0的数量界限。 当由样本值计算的具有统计量落入该区域内则拒绝原假设H0,接受备择假设H1。 计算的检验统计量落入该区域外,则不拒绝接受原假设H0,从而拒绝备择假设H1。 拒绝域的边界值称为临界值。 当原假设H0正确时,它被拒绝的概率不得超过给定的显著性水平α,α通常取值为0.05,0.01。 因此,落在拒绝区域内是一个小概率事件。概念 当检验统计量取某个区域C中的值时,我们拒绝原假设,则称区域C为拒绝域,拒绝域的边界点称为临界点.如在前面实例中,假设检验的基本原理 在总体的分布函数完全未知或只知其形式、但不知其参数的情况下,为了推断总体的某些性质,提出某些关于总体的假设。例如,提出总体服从泊松分布的假设;又如,对于正态总体提出数学期望等于的假设。假设检验就是根据样本对所提出的假设作出判断:是接受,还是拒绝.假设检验问题是统计推断的另一类重要问题.如何利用样本值对一个具体的假设进行检验?通常借助于直观分析和理论分析相结合的做法,其基本原理就是人们在实际问题中经常采用的所谓实际推断原理:“一个小概率事件在一次试验中几乎是不可能发生的”.典型例题 某工厂生产的固体燃料推进器的燃烧率服从正态分布,,现用新方法生产了一批推进器,从中随机取n=25只,测得燃烧率的样本均值为。设在新方法下总体均方差仍为,问这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?
概念 抽样误差(sampling error) 抽样方法本身所引起的误差。当由总体中随机地抽取样本时,哪个样本被抽到是随机的,由所抽到的样本得到的样本指标x与总体指标μ之间偏差,称为实际抽样误差。当总体相当大时,可能被抽取的样本非常多,不可能列出所有的实际抽样误差,而用平均抽样误差来表征各样本实际抽样误差的平均水平。 抽样误差是指样本指标值与被推断的总体指标值之差。 主要包括:样本平均数与总体平均数之差;样本成数与总体成数之差。 统计误差的来源:一类:登记性误差;二类:代表性误差(A、系统性误差;B、偶然性误差)抽样误差特指偶然性误差。 表示抽样误差的大小,已选择标准误。引起抽样误差的原因 影响抽样误差的因素:抽样单位数的多少,总体中被研究标志的变动程度的大小。 抽样误差是抽样理论的一个重要概念,在说明抽样误差之前我们先介绍统计误差。统计误差是指在统计调查中,调查资料与实际情况间的偏差。即抽样估计值与被估计的未知总体参数之差。例如,样本平均数与总体平均数之差;样本成数与总体成数之差等。在统计推断中,误差的来源是多方面的,统计误差按产生的来源分类,有登记误差和代表性误差。 登记误差又称调查误差或工作误差,是指在调查过程中,由于各种主观或客观的原因而引起的误差。例如,由于指标含义不清,口径不同而造成的误差;由于被调查者提供不实的资料,以及在登记、计算、抄写上有差错等而出现的误差。这种登记误差不论是在抽样调查还是在其他形式的调查中都有可能产生。调查的范围越广,规模越大,内容越复杂,产生登记误差的可能性就越大。 代表性误差是指在抽样调查中,样本各单位的结构情况不足以代表总体的状况,而用部分去推断总体所产生的误差。代表性误差的发生有以下两种情况:一种是由于违反了抽样调查的随机原则。例如,有意识多选好的单位或较差的单位进行调查而造成的系统性误差。可见,只要遵循了随机原则就可以避免产生系统性误差,系统性误差和登记性误差一样,都是抽样组织工作造成的,应该采取措施预防误差发生或将其减小到最低程度;另一种情况是指遵循了随机原则,可能抽到各种不同的样本而产生的随机性误差。随机性误差在抽样推断中是不避免的,是偶然的代表性误差。 抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。由于总体平均数、总体成数是唯一确定,而样本平均数、样本成数是随机变量,因而抽样误差也是一个随机变量。抽样误差越小,说明样本的代表性越高;反之,样本的代表性越低。同时抽样误差还说明样本指标与总体指标的相差范围,因此,它是打断总体指标的依据。 抽样误差是统计推断所固有的,虽然无法避免,但可以运用数学公式计算。确定其具体的数量界限,并通过抽样设计程序加以控制,因此抽样误差也可以称为可控制的误差。 影响抽样误差的因素 ①抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了。 ②总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小。总体标志的变异程度越大,抽样误差越大。抽样误差和总体标志的变异程度成正比变化。这是因为总体的变异程度小,表示吝惜体各单位标志值之间的差异小。则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。 ③抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比采用重复抽样的抽样误差小。 ④抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。通常,我们不常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。
简介 抽样推断是在抽样调查的基础上进行的统计方法,主要内容为:参数估计和假设检验。抽样推断的基本概念1、全及总体和样本总体 全及总体是研究对象,而样本总体则是观察对象,两者是有区别而又有联系的不同范畴。全及总体又称母体,简称总体,它是指所要认识的,具有某种共同性质的许多单位的集合体。样本总体又称子样,简称样本,是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。样本总体的单位数称为样本容量,通常用小写英文字母 n来表示。随着样本容量的增大,样本对总体的代表性越来越高,并且当样本单位数足够多时,样本平均数愈接近总体平均数。 如果说对于一次抽样调查,全及总体是唯一确定的,那么样本总体就不是这样,样本是不确定的,一个全及总体可能抽出很多个样本总体,样本的个数和样本的容量有关,也和抽样的方法有关。2、总体参数和样本统计量 总体参数又称为全及指标,根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指标。常用的全及指标有总体平均数(或总体成数)、总体标准差(或总体方差 )。 样本统计量又称样本指标,由样本总体各单位标志值计算出来反映样本特征,用来估计全及指标的综合指标(抽样指标)。统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应,统计量有样本平均数(或抽样成数)、样本标准差(或样本方差 )。 对于一个问题全及总体是唯一确定的,所以全及指标也是唯一确定的,全及指标也称为参数,它是待估计的数。而统计量则是随机变量,它的取值随样本的不同而发生变化。3、样本容量和样本个数 样本容量是指一个样本所包含的单位数。通常将样本单位数不少于30个的样本称为大样本,不及30个的称为小样本。社会经济统计的抽样调查多属于大样本调查。样本个数又称样本可能数目。指从一个总体中可能抽取的样本个数。一个总体有多少样本,则样本统计量就有多少种取值,从而形成该统计量的分布,此分布是抽样推断的基础。4、重复抽样和不重复抽样 重复抽样是从总体单位中抽取一个单位进行观察、纪录后,再放回总体中,然后再抽取下一个单位,这样连续抽取样本的方法。 不重复抽样是从总体单位中抽取一个单位进行观察、纪录后,不放回总体中,在余下的总体中抽取下一个单位,这样连续抽取样本的方法。抽样推断的特点 1、按随机的原则抽取样本。 2、在数量上,以样本推断总体。 3、抽样推断的误差可以事先计算和控制。抽样推断的应用场合 1、用于无法采用或不必采用全面调查的现象。 2、对全面调查的结果进行复核。 3、生产过程的质量控制。 4、对总体的假设进行检验。
operational error,procedure error 由于操作人员的生理缺陷、主观偏见、不良习惯或不规范操作而产生的误差。 是与操作人员的素质有关的,因此,又称为个人误差。 由于分析工作者操作不标准而引起的误差称为操作误差。如读滴定管数值时偏高或偏低,滴定终点颜色辨别偏深或偏浅。
数灵学的概念最早出现在美国著名科幻小说作家艾萨克·阿西莫夫Isaac Asimov (1920-1992)的科幻小说作品《请用S拼我的名字》中,是一种介于科学与占卜之间的学科,最常见的用途是通过某人收集大量的客观数据,输入计算机编制的程序,加以大量的运算来预知未来,或者未来某件事情的概率,并通过改变某个客观条件来影响未来以达到预期的目的。虽然这是一门集数学、统计学、占卜学于一体的综合学科,但是运算过程中会出现非常庞杂的变量,所以数灵学的运算往往并不是那么准确。
概述 mathematical expectation离散型随机变量的数学期望离散型 离散型随机变量的一切可能的取值xi与对应的概率Pi(=xi)之积的和称为的数学期望(设级数绝对收敛),记为E。随机变量最基本的数学特征之一。它反映随机变量平均取值的大小。又称期望或均值。如果随机变量只取得有限个值,称之为离散型随机变量的数学期望。它是简单算术平均的一种推广,类似加权平均。例如某城市有10万个家庭,没有孩子的家庭有1000个,有一个孩子的家庭有9万个,有两个孩子的家庭有6000个,有3个孩子的家庭有3000个, 则此城市中任一个家庭中孩子的数目是一个随机变量,记为X,它可取值0,1,2,3,其中取0的概率为0.01,取1的概率为0.9,取2的概率为0.06,取3的概率为0.03,它的数学期望为0×0.01+1×0.9+2×0.06+3×0.03等于1.11,即此城市一个家庭平均有小孩1.11个,用数学式子表示为:E(X)=1.11。连续型 连续型随机变量X的概率密度函数为f(x),若积分:绝对收敛,则称此积分值为随机变量X的数学期望,记为:数学期望的定义定义1: 数学期望按照定义,离散随机变量的一切可能取值与其对应的概率P的乘积之和称为数学期望,记为E.如果随机变量只取得有限个值:x,y,z,...则称该随机变量为离散型随机变量。定义2: 1 决定可靠性的因素常规的安全系数是根据经验而选取的,即取材料的强度极限均值(概率理论中称为数学期望)与工作应力均值(数学期望)之比计算随机变量的数学期望值 在概率论数学期望和统计学中,一个离散性随机变量的期望值(或数学期望、或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和。换句话说,期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常识中的“期望”——“期望值”也许与每一个结果都不相等。(换句话说,期望值是该变量输出值的平均数。期望值并不一定包含于变量的输出值集合里。)单独数据的数学期望值算法 对于数学期望的定义是这样的。数学期望 E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn) X1,X2,X3,……,Xn为这几个数据,p(X1),p(X2),p(X3),……p(Xn)为这几个数据的概率函数。在随机出现的几个数据中p(X1),p(X2),p(X3),……p(Xn)概率函数就理解为数据X1,X2,X3,……,Xn出现的频率f(Xi).则: E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn) = X1*f1(X1) + X2*f2(X2) + …… + Xn*fn(Xn) 很北京大学数学教学系列丛书容易证明E(X)对于这几个数据来说就是他们的算术平均值。 我们举个例子,比如说有这么几个数: 1,1,2,5,2,6,5,8,9,4,8,1 1出现的次数为3次,占所有数据出现次数的3/12,这个3/12就是1所对应的频率。同理,可以计算出f(2) = 2/12,f(5) = 2/12 , f(6) = 1/12 , f(8) = 2/12 , f(9) = 1/12 , f(4) = 1/12 根据数学期望的定义: E(X) = 1*f(1) + 2*f(2) + 5*f(5) + 6*f(6) + 8*f(8) + 9*f(9) + 4*f(4) = 13/3 所以 E(X) = 13/3, 现在算这些数的算术平均值: Xa = (1+1+2+5+2+6+5+8+9+4+8+1)/12 = 13/3 所以E(X) = Xa = 13/3