regression equation
对变量之间统计关系进行定量描述的一种数学表达式。
指具有相关的随机变量和固定变量之间关系的方程。
回归直线方程
若:在一组具有相关关系的变量的数据(x与Y)间,通过散点图我们可观察出所有数据点都分布在一条直线附近,这样的直线可以画出许多条,而我们希望其中的一条最好地反映x与Y之间的关系,即我们要找出一条直线,使这条直线“最贴近”已知的数据点,记此直线方程为(如右所示,记为①式)
这里在y的上方加记号“^”,是为了区分Y的实际值y,表示当x取值xi=1,2,……,6)时,Y相应的观察值为yi,而直线上对应于xi的纵坐标是
①式叫做Y对x的
回归直线方程,相应的直线叫做
回归直线,b叫做回归系数。要确定回归直线方程①,只要确定a与回归系数b。
回归直线的求法
最小二乘法:
总离差不能用n个离差之和
来表示,通常是用离差的平方和,即
作为总离差,并使之达到最小,这样回归直线就是所有直线中Q去最小值的那一条,这种使“离差平方和最小”的方法,叫做最小二乘法
用最小二乘法求回归直线方程中的a,b有下面的公式:
最小二乘法求回归直线方程中a、b的公式