计量回归模型

2024-05-16

计量回归模型(精选八篇)

计量回归模型 篇1

近年来, 在计量经济学的研究中广泛应用非参数统计方法,这是现代统计学发展的一个重要方向,为未知分布的数据模型的处理以及不完全数据的处理等提供了一种新的统计方法。由于实际经济环境中存在不确定因素,而是微观计量经济学中大量的经济结构是无法预先确认的,有时不能提供可信赖的模型的参数形式,所构成的模型更可能对实际经济趋势产生误导,因此已有学者开始把非参数密度估计的方法引入计量经济学,并已取得了一定的成果。因为不需要曲线确定变量间的函数关系,所以对计量经济模型的估计和预测提供了多方面的灵活机动的表现形式。对实际曲线形式无定型(数据参数分布未知)的经济模型,有一些很积极的结果,展示出极大的优越性。

在经济结构发生巨大转变的当今, 居民经济收入的变化,已经极大地影响了社会整体的消费需求结构。本文将微观经济层面的居民经济状况作为研究的主体, 利用非参数回归估计技术, 考查收入与消费的相依关系和变化趋势,并得到了一些可靠的推断性结论。在保证了对这些数据所做的假设同经验所得出的结论不会有太大的差距的基础上, 不仅能增进对经济要素相互依存的理解,而且可以做出切实可行的预测服务,对制定更合理,更有效的宏观经济政策提供了积极的参考, 也可以为经济学家做深入研究提供基础。

二、模型与主要方法

考虑非参数回归模型

其中Y为相应变量,X为解释变量,这里m(x)是给定X=x下Y的条件期望,e为不可观测的随机误差。本文讨论X为一维随机变量的情形,即

其中f(x,y)为(X,Y)的联合密度函数,f X(x)为X的边际分布。m(x)完全无定型,其函数形式完全由随机变量(X,Y)的相互独立抽样数据(xi,yi),i=1,2,...,n来估计决定。可以假设模型中误差e1,e,...,en为相互独立同分布随机变量,满足期望Eei=0,方差

考查模型(1)中的未知条件均值回归函数 本文采用局部多项式估计作为非参数回归估计方法。设m(x)在X=t处的p+1 阶导数存在,x为t邻域内的任一点,则m(x)的Taylor展开式为

因此,可以视m(t),m'(t),…,m(p)(t)为待估参数。若令 则局部多项式估计(2)可以表示为

这里(X1,Y1),…,(Xn,Yn)为(X,Y)的观测样本。

上式即为一多项式回归,由我们所熟知的广义最小二乘法(GLSE)可解出 这里可假设权函数为 需要最小化下面的目标函数:

将上式写成矩阵形式,即有

当t取遍X的样本点时,可以得到整个曲线的估计

LPE的主要优点为:可用于模型(1)中X的随机形式,并同时给出m(·)所有r阶导函数 的估计 。不必修正边界是众多优点中最为重要的,同时,选择局部线性估计可同时减少偏差和方差,情况较好,渐进地优于一些其他的方法。实际应用中,一般取p=1(局部线性光滑)或p=3(三次光滑)。这里只是对非参数局部多项式估计的一个简单介绍,系统介绍及详细结果可参见Fan and Gijbels(1996)。

三、应用

本节将对上节中提出的方法进行模拟研究,对2012年全国230 个城市家庭年收入与消费的经济调查数据,利用非参数回归技术, 在不假设模型参数形式的较宽条件下, 考查城市居民年总收入与总消费的相依变化趋势,同时与通常的参数模型分析的结果进行比较, 数据来自中经专网。

由简单的描述统计可知:在这些城市中,家庭年最低收入为11428 元,最高收入达40741.88 元,最高收入是最低收入的3.57 倍, 且这些城市的平均家庭年收入为21969.97 元,而收入的中位数仅为20516 元,平均收入是中位数的1.07 倍,收入呈现出偏态分布状况。图2 是利用非参数局部多项式回归拟合所得出的结果, 为了比较,同时也给出图1 利用最小二乘回归技术拟合的结果, 下面图中的散点均为实际调查数据点。图1 可以观察到,随着收入的增加,消费支出有增高的现象。再由图3,残差点分布呈右喇叭形状,可能存在异方差,故最小二乘法回归估计结果不太可靠,不适合这里给出的调查数据,图4 的残差分布显示出非参数局部多项式回归拟合的结果要优于最小二乘回归技术。观察图2 中的右尾部,呈现出增幅下降的趋势。收入与消费的关系可以推断是上凸形状的曲线,表示消费随收入的增加而增加,而增加的趋势是逐渐减缓的。从微观计量的角度出发,消费最优化是指理性消费者在收入约束条件下去追求效用最大化, 且在保证不降低生活水平的前提下去谋求支出最小化, 这种趋势大致满足微观经济调查数据所得到的一般结论, 即边际消费倾向随着收入的变化而反变化, 这也是与实际散点图的趋势一致的。

图5给出了正态核估计的拟合结果,考查模型的误差分布。有关非参数回归模型误差密度的估计可参看Liand Chai(1997),施笋娟,张文扬(1995),李竹渝(2011)。可以证明在大样本条件下, 非参数回归模型误差密度的非参数核估计是渐进无偏的, 其收敛速度不仅受自身光滑参数的影响,还要受非参数回归函数光滑参数的影响。图中存在右拖尾现象,可以解释为调查数据中出现的“异常值”,可见在调查值中, 高收入家庭对估计结果的影响比较明显,如果需要,还可以考察去掉那些收入“异常值”进一步讨论。

计量回归模型 篇2

课程名称金融计量学 实验项目名称多元线性回归模型

班级与班级代码 实验室名称(或课室)

专业

任课教师 xxx

学号 :xxx

姓名 :xxx 实验日期:2012 年 5 月 3 日

广东商学院教务处制 姓名 xxx 实验报告成绩 评语 :

指导教师(签名)

年月日

说明:指导教师评分后,实验报告交院(系)办公室保存

多 元线性回归模型

一、实验目的 通过上机实验,使学生能够使用 Eviews 软件估计可化为线性回归模型的非线性模型,并对线性回归模型的参数线性约束条件进行检验。

二、实验内容 (一)根据中国某年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值 Y,资产合计 K 及职工人数 L 进行回归分析。

(二)掌握可化为线性多元非线性回归模型的估计和多元线性回归模型的线性约束条件的检验方法 (三)根据实验结果判断中国该年制造业总体的规模报酬状态如何? 三、实验步骤(一)收集数据 下表列示出来中国某年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值 Y,资产合计 K 及职工人数 L。

序号 工业总产值 Y(亿元)

资产合计 K(亿元)

职工人数 L(万人)

序号 工业总产值 Y(亿元)

资产合计 K(亿元)

职工人数 L(万人)3722.7 3078.22 113 17 812.7 1118.81 43 2 1442.52 1684.43 67 18 1899.7 2052.16 61 3 1752.37 2742.77 84 19 3692.85 6113.11 240 4 1451.29 1973.82 27 20 4732.9 9228.25 222 5 5149.3 5917.01 327 21 2180.23 2866.65 80 6 2291.16 1758.77 120 22 2539.76 2545.63 96 7 1345.17 939.1 58 23 3046.95 4787.9 222 8 656.77 694.94 31 24 2192.63 3255.29 163 9 370.18 363.48 16 25 5364.83 8129.68 244 10 1590.36 2511.99 66 26 4834.68 5260.2 145 11 616.71 973.73 58 27 7549.58 7518.79 138 12 617.94 516.01 28 28 867.91 984.52 46 13 4429.19 3785.91 61 29 4611.39 18626.94 218 14 5749.02 8688.03 254 30 170.3 610.91 19 15 1781.37 2798.9 83 31 325.53 1523.19 45 16 1243.07 1808.44 33 表 1(二)创建工作文件(Workfile)。

1、启动Eviews5,在主菜单上依次点击FileNewWorkfile(如图),按确定。

2、在弹出的对话框中选择数据的时间频率(本实验为序列数据),输入数据数为31(如图1),然后点击OK(如图2)。

(图 1)(图 2)、(三)输入数据 1、在 Eviews 软件的命令窗口中键入数据输入/编辑命令:DATAYKL,按 Enter,则显示一个数组窗口(如图)。

2、分别在Y、K、L列输入相应的数据并以group01命名保存(如图):

(四)、回归分析 1、在经济理论指导下,设定如下的理论模型:

2、运用OLS估计模型 经对数转换,式  e L AK Y 可变换对数形式如下:

3、对表1的Y、K、L的数据进行对数转换,得新的数据如表2所示:

序号

序号

18.222204 8.032107 4.727388 27.274147 7.429183 4.204693 37.468724 7.916724 4.430817 47.280208 7.587726 3.295837 58.546616 8.685587 5.78996 67.736814 7.47237 4.787492 77.204276 6.844922 4.060443 86.487334 6.543826 3.433987 95.913989 5.895724 2.772589 107.371716 7.828831 4.189655 116.424399 6.881134 4.060443 126.426391 6.246126 3.332205 138.395972 8.239042 4.110874 148.656785 9.069701 5.537334 15

7.485138 7.936982 4.418841 16

表2 4、对表2经对数转化后的数据进行相关性分析 ①重复数据输入步骤,输入取对数后的数据如图:

②在弹出的窗口中选择ViewGraphScatterSimpleScatter按确定,得取对数后的Y、K、L三者之间关系的散点图,结果如下:

③通过对以上散点图的观察可以看出,取对数后的K、L的联合值对取对数后的Y的值有着显着的线性影响。

5、在 Eviews 主窗口中点击 QuickEstimateEquation,在弹出的方程设定框内输入模型:log(y)clog(k)log(l)(如图):

再点击确定,系统将弹出一个窗口来显示有关估计结果(如图)。

由图显示的结果可知,样本回归方程为:

Y ln =1.154+0.609 K ln +0.361 L ln

(1.59)(3.45)(1.75)其中 8099.02 R,2R =0.7963,F=59.66 4、对以上实验结果做 t 检验分析:

给定显着性水平5%,自由度为(2,28)的 F 分布的临界值为34.3 28 2(05.0),F,因此总体上看,K ln , L ln 联合起来对 Y ln 有着显着的线性影响。在 5%的显着性水平下,自由度为 28 的 t 分布的临界值为048.2)28(05.0 t,因此,K ln 的参数通过了该显着性水平下的 t 检验,但L ln 未通过检验。如果设定显着性水平为 10%,t 分布的临界值为701.1)28(05.0 t,这时 L ln 的参数通过了显着性水平的检验。

2R =0.7963 表明,工业总产值对数值的 79.6%的变化可以由资产合计的对数与职工的对数的变化来解释,但仍有 20.4%的变化是由其他因素的变化影响的。

(五)参数的约束检验 由以上的实验结果可以看出,1 97.0     ,即资产与劳动的产出弹性之和近似为1,表明中国制造业在2000年基本呈现规模报酬不变的状态。因此,进行参数的约束检验时,提出零假设为0H :1    。

如果原假设为真,则可估计如下模型:

1、在 Equation 窗口选择 proc/Specify/Estimate 在弹出的窗口中输入 log(y/l)clog(k/l)如图所示:按确定,所得结果如下:

容易看出,该估计方程通过了 F 检验与参数的 t 检验。

2、对规模报酬是否变化进行的分析 由上面两个实验可以得到 0703.5 URSS,0886.5 RRSS。在原假设为真的条件下有:

 )1 2 31(1)(UU RRSSRSS RSSF28 0703.50703.5 0886.5 =0.1011 在 5%的显着性水平下,自由度为(1,28)的 F 分布的临界值为 4.20。因为 0.1011<4.20,所以不拒绝原假设,表明 2000 年中国制造业呈现规模报酬不变的状态。

3、运用参数约束条件 12 1    对上面假设模型进行检验 打 开 eq01 方 程 对 象 窗 , 点 击ViewCoefficientTestsWaldCoefficientRestrictions…,在 Waldtests窗口设定参数约束条件:c(2)+c(3)=1。再按 OK,结果如下图:

由以上实验结果可知,我们仍然不拒绝原假设,原假设为真,即中国该年的制造业总体呈现规模报酬不变状态。

计量回归模型 篇3

关键词:约束线性回归模型,约束最小二乘估计,条件广义岭估计

考虑带齐次线性等式约束的线性回归模型

Y=+ε,ε~(0,σ2In),=0 (1)

(1)式中Yn×1的观测向量,Xn×p的设计矩阵,Rq×p的矩阵,εn×1的随机误差向量,Inn阶单位矩阵,βB=Δ{β:Rβ=0}为未知回归系数向量,σ2>0为误差方差。秩(X)=p,秩(R)=qβ的约束最小二乘(RLS)估计为

βR*=β^-(XX)-1R(R(XX)-2R)-1Rβ^(2)

(2)式中β^=(XX)-1XY,它在约束=0下是β唯一的BLU估计。文献[1,2]给出了不同的条件岭估计并讨论了其优良性。本文给出了一种新的条件广义岭估计,并讨论了它的优良性。

1 条件广义岭估计

定义1 对于约束线性回归模型式(1),称由下式给出的β^R(k)为β的条件广义岭估计

β^R(Κ)=β^(Κ)-Sk-1R(RSk-1R)-1Rβ^(Κ)(3)

(3)式中β^(Κ)=(XX+Κ)-1X-1YΚ=diag(k1,k2,kp)SΚ=XX+Κ。显然条件广义岭估计是一个很大的估计类,且β^R(0)=βR*

定理1 对于条件广义岭估计,有limmin(ki)β^R(k)=0

证明 设MK=Sk-1-S-1kR′(RS-1kR′)-1Sk-1,则MK可以写成如下形式

ΜΚ=(QSΚQ)+=V((+Κp-m)-1000)V

,其中Q=Ip-R′(RR′)-1R ,∧是QXXQ的个非平凡特征根组成的对角矩阵,V是一个正交矩阵。对于(3)式所给出的β^R(Κ)可以写成β^R(Κ)=ΜΚXY,而对于MK当min(ki)→∞时MK=0,此时有β^R(Κ)=0limmin(ki)β^R(Κ)=0

2 条件广义岭估计的优良性

将约束线性回归模型式(1)化为其典则形:

Y=+ε,ε~(0,σ2I),=0 (4)

(4)式中Z=XQ,α=Qβ,L=RQ,QXX的标准正交化特征向量组成的正交阵,ZZ=QXXQ=∧=diag(λ1,λ2,…,λp)称α为条件典则参数, α的岭估计为α^=(ΖΖ)-1ΖY=-1ΖY,α的条件BLU估计为

α*L=

(ZZ)-1-(ZZ)-1L′(L(ZZ)-1L′)-1L(ZZ)-1]ZY (5)

由定义1可知, α的条件广义岭估计为

α^L(Κ)=α^-Sk-1L(LSk-1L)-1Lα^,

m(K)= MSE(α,αL(K)),则有

ΜSE(ααL(Κ))=σ2λi(λi+ki)2+ki2αi2(λi+ki)2(6)

定理2 当0kiσ2αi时,

ΜSE(α^L(Κ)<ΜSE(αL*)

证明 对m(k)求导得,σ2i=1p-m-2λi(λi+ki)3+i=1p-m2kiλiαi2(λi+ki)3=i=1p-m2λi(λi+ki)3(kiαi2-σ2),

所以当0kiσ2αidm(k)k<0,而m(k)在ki≥0是连续的,这就说明m(k)在0kiσ2αi内随ki的增大而减小。故当0kiσ2αi时, m(ki)<m(0),而m(0)=MSE(α*L),即可得ΜSE(α^L(Κ)<ΜSE(αL*)

定理3 当β/[2Kp-m-1Q+(QX/XQ)+]+βσ2时,有ΜSEΜ(β,β^R(Κ))ΜSEΜ(β,βR*)

证明 设D=ΜSEΜ(β,β^R(Κ))-ΜSEΜ(β,βR*),因为ΜSEΜ(β,β^R(Κ)=σ2ΜΚXXΜΚ+ΚΚΜΚββΜΚΜSEΜ(β,βR*)=σ2Μ0XXΜ0

D=σ2N-MKKββKMK,其中N=M0XXM0-MKXXMK,而(QXXQ)+=(QXXQ)+Q=Q(QXXQ)+,M0=(QXXQ)+,所以有M0XXM0=M0,MKXXMK=MK(SK-K)MK=MK-KMΚ2,于是N= M0 -MK + KMΚ2,又

Ν=V(Γ000)V

,其中Γ=∧-1-(∧+Kp-m)-1+K(∧+Kp-m)-2。Γ的元素ri=(2λiki+ki2)/λi(λi+ki)2,当λi>0时,对ki>0有ri>0,故N为非负定矩阵,且秩为p-m,令

δ=ΚΜΚβ=V(Κp-m(+Κp-m)-1000)V/β

,

D=σ2N-δδ′,因为N是非负定对称矩阵,且δu(N),可知,D是非负定矩阵的充要条件为δN+δσ2。

δΝ+δ=βV(Κp-m2(+Κp-m)-1Γ-1(+Κp-m)-1000)Vβ

将代入得

Kp-m2(∧+Kp-m)-1Γ-1(∧+Kp-m)-1=(2K2p-m+∧-1)-1,所以

δΝ+δ=β[V(2Κp-m2+-1000)V]+β=β[2Κp-m-1Q+(QXXQ)+]+β

,

β′[2Kp-m-1Q+(QXXQ)+]+βσ2成立。

参考文献

[1] Jurgen G B.Restricted ridge estimation.Statistics&Probability Let-ters,2003;65:57—64

[2] Sarkar N.Anewestimator combining the regression and the restrictedleast squares methods of estimation.Comm Statist Theory Methods 21(1992):1987—2000

[3]史建红.约束线性回归模型回归系数的条件岭估计.山西师范大学学报(自然科学版),2001;15:10—16

计量回归模型 篇4

财政收入是我国国民经济核算体系的一项重要指标。建立科学合理的财政收入统方法, 是加强国民经济核算和宏观调控的需要, 也是评价财政工作优劣的重要依据。长期以来, 我国对财政收入的统计分析主要基于预算收入法及其以此为基础的财政收入占GDP比重。但是, 就当前我国财政收入的实际情况来看, 仅仅依靠这种统计分析方法, 不仅有失偏妥, 也给各级财政工作带来了被动。这就需要建立合适的政府财政收入统计方法。

逐步回归分析法就是一种自动地从大量可供选择的变量中选择那些对建立回归方程比较重要的变量的方法, 它是在多元线性回归基础上派生出来的一种算法技巧。逐步回归分析法在筛选变量方面较为理想。故目前多采用该方法来组建回归模型。该方法也是从一个自变量开始, 视自变量对Y作用的显著程度, 从大到小地依次逐个引入回归方程。但当引入的自变量由于后面变量的引入而变得不显著时要将其剔除掉。引入一个自变量或从回归方程中剔除一个自变量, 为逐步回归的一步。对于每一步都要进行F值检验 (F值检验的具体含义在下一节做介绍) , 以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。这个过程反复进行, 直至既无不显著的变量从回归方程中剔除, 又无显著变量可引入回归方程时为止[1]。

本文旨在运用应用统计软件SPSS V17.0, 基于逐步回归法建立国家财政收入的回归模型, 分析影响国家财政收入的可能因素。

2 利用逐步回归法建立国家财政收入的回归模型

2.1 变量的选取与筛选

在使用回归分析建立模型时, 首先遇到的一个重要问题就是自变量的选择问题。一方面为了获取全面信息, 总是希望模型中包含的自变量尽可能的多;另一方面, 考虑到收获很多自变量的观测值的费用和实际困难, 则希望模型中包含的变量是最重要的, 且尽可能的少。理论上可以证明:当自变量数目过大时, 模型计算复杂并且往往会扩大估计方差, 降低模型的精度。因此, 最优的线性回归模型应理解为: (1) 该模型中包含所有对因变量有显著影响的自变量; (2) 该模型中包含的自变量个数尽可能的少; (3) 当有几个模型都满足这两方面的要求时, 方差的无偏估计中以最小者为优。

根据实际情况, 本文中考虑的自变量包括: (1) 工业总产值 (亿元) ; (2) 农业总产值 (亿元) ; (3) 建筑业总产值 (亿元) ; (4) 全民人口数 (万人) ; (5) 社会商品零售总额 (亿元) ; (6) 受灾面积 (万公顷) 。因变量为国家财政收入。

在决定一个新的变量是否有必要进入模型或判断某个变量是否可以从模型中剔除, 首先要解决的问题是:这个变量对因变量的影响是否显著?解决该问题的正规方法是偏F检验, 设有n个自变量采用这n个自变量拟合的全模型为

2.2 计算过程及结果

本文选取的可能影响国家财政收入的因素有:工业总产值 (亿元) 、农业总产值 (亿元) 、建筑业总产值 (亿元) 、社会商品零售总额 (亿元) 、人口 (万人) 、受灾面积 (万公顷) 等。数据来源于《中国统计年鉴》[3], 选取了1997年—2011年近15年的数据使用SPSSV17.0进行处理。

相关分析如表1所示 (只选取了部分数据) , 显示各变量间的泊松相关系数和显著性检验单尾P值及每个变量的个数。从表中我们可以看到国家财政收入跟工业生产总值, 农业生产总值, 建筑业生产总值, 人口还有社会商品零售总额都有很强的相关性, 但与受灾面积相关性比较弱。

表2为方差分析表, 为回归拟合过程中每一步的方差分析结果。列出了回归平方和、残差平方和、自由度等。Sig.为大于F值的概率。方差结果表明, 当回归方程包含不同自变量时, 其显著性概率值均小于0.001。因此回归方程应该包括这两个自变量。

表3为回归系数表, 包括B、Beta分别为非标准化和标准化的回归系数, t为偏回归系数为0时的假设检验的t值, Sig.为偏回归系数为0时的假设检验的显著性水平、B的95%置信区间、偏回归系数等。在逐步回归过程中, 利用偏回归系数平方和来判断一个自变量对因变量影响的显著程度。某因素的偏回归系数平方和越大, 该因素对因变量的作用就愈大。从表中分析可以看到:逐步回归的最优回归子集为模型2, 回归方程为::;方程中的常数项为-7533.154, 偏回归系数b1为0.273, b3为1.808, 经t检验, b1、b3的P值分别为:0.000, 0.000, 按α=0.05水平, 均有显著意义。

2.3 图表总结分析

实验结果表明, 在利用逐步回归法建立方程的过程中, 引入了两个自变量x1和x3, 即工业总产值和建筑业总产值, 且它们与因变量y财政收入具有显著的线性相关性, 其结果有显著性意义, 而其它自变量均未能引入方程。分析给出的散点图, 得到这一结果的原因是显而易见的:一些自变量如农业总产值, 虽然其散点图也基本为线性, 但此线性关系不如建筑业总产值和工业总产值的强, 同时它与建筑业总产值又具有高度相关性, 因此它最终成为不需要被引入的因素;还有一些散点图如受灾面积与财政收入散点图比较凌乱, 不能判断它们与因变量的关系, 但显然是非线性的。此外, 选取的年份较少及由于知识背景不足而使得某些重要因素未被考虑等, 可能是影响实验精度的主要原因。

3 模型解释说明

从上面的分析我们得到了两个对财政收入影响较显著的自变量:工业生产总值和建筑业生产总值。即工业生产总值和建筑业生产总值对我国财政收入有显著的影响。在工业方面, 国家对工业的发展给予了高度的重视, 对产业结构进行了重大的调整, 国民经济保持着快速健康发展的势头。工业生产快速增长, 财政收入迅速增加。而另一方面在政府积极的财政政策运用过程中, 尤其是在大规模的基础设施建设拉动内需和扩大就业过程中, 建筑业是受益较大的产业, 促进了建筑业的极大发展。中国建筑业进入了健康、快速发展的轨道。近年来中国的建筑业总产值一直呈高速增长态势, 对国家财政收入起着积极的促进作用。因此, 工业生产总值和建筑业生产总值是国家财政收入的两个重要来源。

最后我们运用模型对2011年的财政收入进行检验, 2011年我国的工业生产总值为188470亿元, 建筑业生产总值为31943亿元。运用上面的回归方程我们可以得到2011年我国的财政收入为:0.273*188470+1.808*31943-7533.154=101672亿元。而实际的国家财政收入为103874亿元。我们可以认为得到的回归方程拟合的效果较好。

本模型在一定程度上体现了与选取的自变量之间的线性关系, 并能对因变量做出近似的预测。综合来看, 数据模型基本达到了预期的目的。对国家或地方财政模型建立、经济现象的分析有很好参考意义。

参考文献

[1]孙海燕, 周梦, 李卫国, 冯伟.应用数理统计[M], 北京:北京航空航天大学出版社, 2004 (9) .

[2]周复恭, 黄运成.应用线性回归分析[M], 北京:中国人民大学出版社, 1989 (8) .

自回归模型在新安江模型中的应用 篇5

河海大学赵人俊教授等人最初提出的是二水源新安江模型, 20世纪80年代中期, 借鉴山坡水文学概念和国内外产汇流理论方面研究成果, 提出了三水源新安江模型。新安江模型是一个通过长期实践和对水文规律认识基础上建立起来的一个概念性水文模型, 模型中有较多的参数。由于模型是在假设、概化和判断的基础上建立起来的, 加上水文要素又十分复杂, 在当前的观测技术条件下, 参数选取还存在相当大的困难。在这种情况下, 参数的确定存在较大的不确定性, 同时不确定性又带来结果的较大偏差。

自回归是数理统计的一种计算方法, 简称VAR模型, 是一种常用的计量经济模型。VAR模型描述在同一样本期间内的n个变量 (内生变量) 可以作为它们过去值的线性函数。自回归方法的优点是所需资料不多, 可用自身变量数列来进行预测。但是这种方法受到一定的限制:必须具有自相关, 自相关系数是关键。如果自相关系数小于0.5, 则不宜采用, 否则预测结果极不准确;自回归只能适用于预测与自身前期相关的经济现象, 即受自身历史因素影响较大的经济现象, 如矿的开采量, 各种自然资源产量等;对于受社会因素影响较大的经济现象, 不宜采用自回归, 而应改采可纳入其他变量的向量自回归模型。

洪水流量是自然现象受社会因素影响较小, 本文采用自回归模型对结果进行修正, 洪峰相对误差、洪量相对误差、确定性系数均得到了较好的矫正效果。

1 新安江模型 (三水源) 简介

机理:任一地点上, 土壤含水量达蓄满即达田间持水量前, 降雨量全部补充土壤含水量, 不产流;当土壤蓄满后, 其后续降雨量全部产生径流。

结构:新安江模型分为蒸散发, 产流, 分水源, 汇流四个模块。蒸散发采用三层蒸散发模型;产流采用蓄水容量分布曲线;分水源模块把产流分为地面径流, 壤中流, 地下径流三种成分;汇流分为坡面汇流与河网汇流, 坡面汇流采用线性水库或滞后演算法, 有时也可采用单位线法, 但如用滞后演算法代替单位线则更为简便[1], 河网汇流采用马斯京跟演算法。

新安江模型是一个通过长期实践和对水文规律认识基础上建立起来的一个概念性水文模型。模型参数较多且都具有实际的物理意义, 水文要素十分复杂, 因此参数的选取十分困难。模型参数是系统识别优化的结果, 模拟精度可以很好, 但参数可以有很多种解, 甚至物理上显然有不合理的解, 因此模型参数不一定能代表流域水文特性[2]。参数选取不合理会带来结果较大的偏差, 本文另辟蹊径, 不从参数选取考虑, 而从结果矫正入手, 结果较为理想。

2 自回归方法原理

以二阶自回归为例

令实测流量为Q, 计算流量为Q&apos;, εi=Q&apos;i-Qi, 假设

采用最小二乘法令φ2最小, 则:

3 修正前后的比较

取呈村流域1989年至1996年15场的洪水资料, 以洪峰相对误差、洪量相对误差、确定性系数为指标比较两种方法的优劣。

利用第一场洪水采用新安江模型计算值与实测值的误差算出二阶自回归修正模型系数:

将自回归模型应用到15场次洪中, 结果指标如表1 (前为未使用自回归模型的结果, 后为采用自回归模型计算的结果) :

摘取1996年6月29日至7月4日的洪水结果图 (图1) 。

4 结果分析

由结果可见, 在采用自回归模型处理后, 洪峰相对误差与洪量相对误差显著减小, 确定性系数显著增大, 三项指标都得到了较好的优化。

观察结果图示, 自回归模型的结果也存在不足之处, 在采用自回归修正后, 洪水过程线比修正前存在较多的尖端, 锐化较强烈, 锐化来源是自回归修正是简单的线性修正, 而真实水文水资源系统是高维、非线性、非正态的[3], 所以自回归模型的修正可能会导致结果的细微突变。

摘要:自回归模型是数理统计中的一种数据处理方法, 本文把自回归模型应用到新安江模型当中以对所得结果进行自回归修正, 取得了较好的效果。

关键词:自回归,新安江模型,参数,锐化

参考文献

[1]王佩兰.水源划分对非线性汇流的影响[J].河海大学学报, 1986, 14 (4) :7279.

[2]新安江模型 (三水源) 参数的检验[J].河海大学学报.

基于回归分析的备件标准制定模型 篇6

备件标准是我军进行备件筹措、储存、供应等管理活动的重要依据。长期以来,我军大都根据专家经验进行标准的制定,经常与实际情况不符。因此,制定备件标准需要建立科学、合理的备件需求模型。20世纪70年代,美军曾下达指令,必须采用数学模型确定备件的数量[1]。可见数学模型在确定备件数量时的重要作用,这也是我军标准制定由经验型向科学型转化的必然要求。

目前,在备件标准制定方面使用较多的是保障度模型法[2]。这种方法较符合实际情况,但关键是分布的参数选取要合适,否则计算出的误差较大。另一类方法是基于消耗数据的时间序列模型,包括指数平滑法[3]和灰色预计法[4]等。这种方法往往需要一定的样本数据,使得标准制定的周期较长。回归分析法可以在消耗量与消耗因素之间建立相关关系,它具有样本需要数据量少,计算简便的优点。本文拟采用一元线性回归模型制定备件的标准。

1 备件的分类

备件的品种复杂,不同的备件存在不同的特点,在建立标准制定模型前要对备件进行合理的分类。备件的分类方法很多,根据本文的需要,按照维修方式分为必换件和视换件。

必换件是在修理过程中,无论是否损坏都必须更换的单元,可以通过查阅相关的修理规程得到;视换件是在修理过程中,根据单元的实际性能,如果损坏则更换,如果还能继续使用,则不更换。

必换件与装备的机用数关系最密切,消耗的数量应等于装备的机用数;而视换件则不是简单的等于机用数,其消耗数量是与维修的装备数量存在相关关系,当维修的装备数量越多时,其消耗的备件数应该也越来越多。视换件的这个特点为建立回归模型创造了前提条件。

2 备件标准制定模型

2.1 一元回归模型的特点

回归分析模型是在肯定现象之间存在着相关关系的前提下,通过回归分析,配合回归趋势线,建立的数学模型。一元回归模型中最简单的是一元线性回归模型,在现实生活中有许多问题可以用线性回归解决,将一个随机变量Y(称作响应变量)视为另一个随机变量X(称作预测变量)的线性函数,并且更多的可以对变量进行变换,使得非线性问题可以转换为线性问题加以处理。

2.2 模型的建立

视换件的消耗情况与装备维修的数量存在相关关系。设视换件的消耗量为y,装备维修的数量为y,收集到n个样本消耗数据为(x1,y1),(x2,y2)…,(xn,yn)。一元线性回归方程的基本形式为

式中a、b为待定系数。这些系数可以用最小二乘法求解[5],这可使得实际数据与该直线的估计之间误差最小。所用方程如下:

解得a、b的估计值:

代入式(1),即得:

2.3 模型的检验

本文用相关系数描述变量x和y的线性相关的程度,用r来表示。r的值在[-1,1]之间,r的绝对值越接近于1,表示x和y之间的线性关系越密切;r>0,两者呈正比关系,叫正相关;r<0,两者呈负相关;r的值越接近于0,两者越没有线性相关关系。r的计算公式为:

3 应用示例

某部2002-2008年维修某型装备数与所需备件A的统计数据如表一所示,试用一元线性回归模型分析维修装备数与备件消耗间的关系。

根据以上数据可以算出=10.29,=6.86。将这些值代入式(4)和式(5),得:

拟合的图形如图一所示:

将数据代入式(7),得相关系数:

可见维修装备数与备件A的线性相关性是明显的。

因此,可以求出:每修理一个装备,其备件标准为0.706-0.407≈0.3。

4 结束语

备件品种繁多,不可能用一种方法制定所有的备件标准。一元线性回归模型是一种简单、易操作的模型,将其用于视换件的标准制定模型,通过实例验证是有效的,提高了标准制定的科学性。

参考文献

[1]John R.Folkeson,Marygail K.Brauner.Improveing the Army's management of Repairable Spare Parts[R].2005.

[2]李金国,丁红兵.备件需求量计算模型分析[J].电子产品可靠性与环境试验,2000,3(1):11-14.

[3]程玉波,车建国,杨作宾等.基于指数平滑法的装备维修器材需求量的预测[J].指挥控制与仿真,2009,31(1):115-118.

[4]周文斌,陈春良,焦双荣等.基于灰色理论的修复性维修器材需求的确定[J].四川兵工学报,2009,30(1):28-29.

基于支持向量机回归的模型辨识 篇7

关键词:迟滞,支持向量机,连续模型

1 引言

压电陶瓷、磁致伸缩材料、形状记忆合金等智能材料构成的传感器或执行器在航空航天、微纳米定位、微电子制造、精密机械、生物工程等领域应用的越来越广泛, 但是, 这些智能材料都表现出迟滞特性, 迟滞的存在不但会降低系统的控制精度, 甚至会导致系统不稳定[1]。为了消除迟滞非线性对系统的不良影响, 通常的做法是建立迟滞的数学模型并构建相应的逆模型来实现对迟滞的补偿[2]。支持向量机[3]是Vapnik等在解决模式识别问题时提出来的。其基本思想是在训练样本集中通过某种算法选出一个特征样本子集, 使得对此样本子集的划分等价于对原训练集的划分, 从而大大简化分类和回归问题。本文在此基础上提出一种简化的遗忘因子矩形窗LS-SVR算法, 并通过MATLAB仿真验证算法。

2 支持向量机回归原理

最小。其中R[f]为期望风险, L为损失函数。支持向量机回归是一种机器学习的算法, 而机器学习的目的是求出对某系统输入、输出之间依赖关系的估计, 使它能够对未知输出尽可能地预测, 即使期望风险最小化。传统机器学习采用经验风险最小化来近似期望风险最小化。对 (1) 式, 经验风险为:

现在, 实际系统回归过程中我们一般采用结构风险最小化来代替期望风险最小化。结构风险为

-不敏感损失函数表达式如下:

根据以上分析, 我们固定经验风险, 最小化函数集复杂度即 , 就得到优化问题

但是, 在实际回归过程中, 总是有一个或几个样本点不能在 精度下无误差的拟合。我们又不能为了这个别的几个点牺牲整体的性能, 所以我们引入松弛变量i0, i*0, 认为这几个点是由系统扰动形成。得到最终的优化问题用线性二次规划表示如下:

3 MATLAB仿真

为验证简化后的遗忘因子矩形窗算法的最小二乘支持向量机算法的有效性, 考虑非线性系统。

其中, 为单位阶跃函数, 即

4 结语

本章首先介绍了支持向量机的基本理论, 然后针对标准支持向量机存在的缺陷, 引入最小二乘、矩形窗以及遗忘因子等思想对其进行改进, 研究了一种简化的基于遗忘因子矩形窗算法的最小二乘支持向量机回归算法, 最后通过MATLAB仿真验证了其可行性。

参考文献

[1]G.Tao, EV.Kolotovic.Adaptive control of plants with unknown hysteresiss[J].IEEE Trans on automatic Control, 1995 (2) :200-212.

[2]赵新龙, 董建萍.基于神经网络的迟滞非线性补偿控制[J].控制工程, 2010 (4) :475-477.

人力资本成本计量模型探讨 篇8

一、人力资本成本的计量模式

(一) 人力资本成本内容的界定

目前学术界对人力资本成本的分析从被投资企业和人力资本投资者两个不同的角度出发。

从被投资企业角度分析的学者认为, 人力资本成本是企业为了取得和使用各种人力资本的过程中付出的所有代价。其内容包括取得成本 (AC) 、开发成本 (DC) 、使用成本 (UC) 和离职成本 (SC) , 这些成本都可以较为准确地加以计量。人力资本取得成本 (AC) 主要是人力资本对外招募、面试、录用、安置费用;开发成本 (DC) 主要指岗前教育、在岗培训费用等;人力资本使用成本 (UC) 则主要包括应为职工支付的薪酬、保险等固定费用和人力资本所有者参与企业税后收益分配的支付;离职成本 (SC) 是指离职补偿成本及离职给企业带来的其他损失。故人力资本成本可表示为:人力资本总成本=AC+DC+UC+SC。也有学者认为企业对于人力资本的培训、开发支出将会提高人力资本的效用, 应该比照固定资产后续的会计处理方法, 予以资本化, 在计算人力资本成本时, 只把企业薪酬支出看作人力资本的成本。

从人力资本投资者角度分析的学者认为, 人力资本成本是人力资本投资者所能接受的最低收益率。人力资本的收益由两部分组成:补偿性收益 (表现为工资福利等固定报酬) 和权益性收益 (表现为对企业剩余收益的分享部分) 。所以, 对被投资单位而言, 人力资本成本包括补偿性成本和权益性成本。人力资本成本中的薪酬福利费等, 是企业对人力资本耗费的补偿, 为补偿性成本。权益性成本则是类似于权益资本股利的变动性成本, 是人力资本根据产权对企业剩余收益的要求权。故人力资本成本也由两部分组成:补偿性成本和权益性成本。

(二) 人力资本成本计量模式

目前主要有两种计量模式:

一是人力资本历史成本的计算。历史成本是使用历史实际发生的费用来计算的。年人力资本成本量=当年人力资本取得成本+当年人力开发成本+当年使用成本+当年离职成本;年人力资本成本率=年人力资本成本量/当年人力资本价值。通过改进会计处理方法, 完善人力资本成本会计, 人力资本历史成本很容易通过会计资料获得。也有学者认为取得成本、开发成本和离职成本应该在人力资本存续期内进行合理分摊, 以分摊后的年平均人力资本成本作为年人力资本成本量。则人力资本成本率=年平均人力资本成本/人力资本价值。

二是人力资本未来成本的计算。人力资本预测成本的计算主要采用现金流量贴现法。从企业角度, 把人力资本成本看作是人力资本投资引起的企业资金流入等于资金流出的贴现率。计算公式为:

其中, Rt是企业第t年的现金流入量, α为人力资本贡献率, K为人力资本成本, n为人力资本使用年限, 其他指标意义同上。用内差法求出K。从人力资本投资者角度, 人力资本成本则被看做是使人力资本投资引起的人力资本所有者资金流入等于人力资本价值的贴现率。计算公式为:

其中, V为人力资本价值, Mt为第t年补偿性收益, It为第t年的权益性收益。

通过对上述两种人力资本成本计量的分析可知:首先, 必须明确资本成本实质是机会成本。财务管理中, 一般把选择最优方案而放弃次优方案所失去的潜在利益称为机会成本。资本成本的大小应由投资者决定。因为投资者享有公司的终极产权, 也是公司风险的最终承担者, 所以投资者会要求公司对其所承担的风险给予相应的补偿。这种补偿对投资者而言是最低投资报酬, 对公司而言即为资本成本。其次, 要明确资本成本不同于资金成本。资本成本是投资者所要求的报酬率即预期收益率, 而资金成本是将盈利和资金的一部分支付给资金所有者的报酬, 体现着资金使用者和所有者之间的实际利润分配关系。总之, 资本成本应该是从投资者的角度来衡量的必要报酬率, 人力资本投资者确定的机会成本才是我们所要求的人力资本成本。而以被投资公司付出所有的代价作为资本成本的做法, 扭曲了资本成本的本质。

二、人力资本投资风险和收益分析

(一) 人力资本投资者所面临的风险分析

在风险和不确定环境下, 债权资本、股权资本和人力资本三种资本所有者的风险收益追索权的不同, 决定了三种资本具有不同的风险承担机制, 进而决定了三种资本应该以不同的形式参与收益分配:债权人作为产权主体, 向企业出让资本的使用权, 承担着企业不能按时获得足额还本付息的风险, 拥有被投资单位追索债权和利息的权利;股东作为原始产权主体, 以其投入的股权资本为限承担着企业经营失败的风险, 享有风险收益的索取权;人力资本所有者承担的风险不但包括企业经营过程中的所有风险, 还承担其前途的不稳定性、人力资本贬值及继续寻找工作的风险等。这是其他产权主体承担的风险之外的一种不完全追索权的风险。所以人力资本承担的风险比其他产权主体更高。

(二) 人力资本的收益方式

由于人力资本与其所有者不可分离的特性, 决定了其不同于股权资本和债务资本的收益方式。人力资本拥有两种性质不同的收益方式:无风险收益和风险性收益。

无风险收益一般表现为企业员工的基本薪酬、福利及津贴, 是人力资本价值消耗的补偿形式。它实质上是为维持劳动力的再生产, 为下一次生产过程的正常进行创造必要条件。该部分收入不是企业剩余收益的分配, 其数量的多少与人力资本所有者的贡献无关, 而由劳动力的价值决定, 并随劳动力在市场上的供求状况上下波动。它实际上是劳动力的市场价格, 由劳动者的受教育情况、所任职位以及同地区、同行业的工资水平等因素综合决定。这部分固定收益是无风险收益, 因为:首先, 其支付期限不宜太长, 一般一个月支付一次, 并主要以现金形式进行发放, 国家劳动合同法保证这部分权利的实现。其次, 在企业破产清算时, 人力资本所有者有优先受偿权。所以对人力资本投资者而言, 这部分收益是不承担风险的, 是无风险收益。不同类型的人力资本的无风险收益率是不同的。

在现代企业中, 人力资本所有者正逐渐获取企业产权, 成为企业的核心。几乎所有层面的员工都有人力资本的专用性, 这种专用性随着技术进步不断增强, 使得人力资本投入某企业后, 一旦离开, 其在该特定企业形成的知识、能力、权力、地位、荣誉、机会、人际关系等人力资本要素不可能完全随身带到另一个企业去, 这会使原有的人力资本贬值。另外, 一旦某个个体人力资本所有者退出企业, 其在工作中协作形成的团体合作力的优势, 就不能继续分享。这对人力资本所有者来说, 是一种不小的损失。正因为如此, 人力资本变得不易退出和流动, 对非人力资本产生了某种程度的“套牢效应”, 使得人力资本具有很强的可抵押性, 由此人力资本承担企业生产经营风险具有主动性和自觉性, 要求获得的风险收益率比股权资本和债券资本都要高。风险收益表现为因承担企业风险而对企业剩余收益享有的部分。

人力资本投资者要求的最低报酬率, 可以表示为:人力资本最低报酬率=无风险收益率+风险收益率。对被投资企业而言, 人力资本最低报酬率就是企业的人力资本成本。

三、人力资本成本计量模型构建及其应用

(一) 人力资本成本计量模型构建

通过以上分析, 可知人力资本成本=无风险收益率+风险收益率。人力资本分为不同的级别, 在企业的作用及能承担的风险各不相同, 所以不同类别的人力资本成本也各不相同。以某类人力资本为例, 对人力资本成本计量模型进行探讨。无风险收益等于本期员工获得的固定收益, 这部分收益可以通过财务报告获得。故无风险收益率可由下式表示:

其中, Rf表示某类人力资本平均无风险收益率, Wt表示某类人力资本固定报酬总额, Vt表示某类人力资本价值总额。较难计算的是人力资本的风险收益率, 从资本资产定价模型Ri=Rf+βi (Rm-Rf) 中可知, βi (Rm-Rf) 表示的就是投资者要求的风险收益率, 可借此原理对人力资本的风险收益率进行衡量。由于人力资本专用性, 使人力资本分为不同的类型, 这阻碍了人力资本在整个人力资本市场的自由流动, 人力资本大多数只能在同行业内流动。另外, 不同类型的人力资本要求的收益率也大为不同。所以各类人力资本的收益率与同类型人力资本平均收益率有更强的正相关关系, 解释度比全部资本平均收益率更好。在使用这一模型时, 必须对此模型的指标进行重新定义。首先, 用同类人力资本无风险收益率代替Rf。其次, 用同类人力资本平均风险收益率Ra替代Rm。故某类型人力资本资产定价模型为:

式中:Ri为该人力资本成本;Rf为本类型人力资本平均补偿性收益率;Ra为本类型所有人力资本平均权益性收益率;βi为投资者对该人力资本投资风险的估计程度。

图1中βi表示某类人力资本无风险报酬率为Rf, 在某固定时刻可视为常量;投资者对该人力资本投资风险的估计程度为β'i;则根据人力资本资产定价模型, 该人力资本投资的风险收益率为β'i (Ra-Rf) ;该人力资本投资的期望收益率 (对被投资企业来讲为人力资本成本) 为Rh。人力资本资产定价模型简化了一些实际因素, 用相对简单的公式来表达风险与收益的关系, 计算风险可能获得的补偿, 简单明确、易于理解和操作, 对投资者和筹资单位都有很大的指导作用。

(二) 人力资本资产定价模型应用中应注意的问题

一是要注意人力资本的异质性对模型的影响。人力资本的专用性决定了人力资本的异质性, 企业中的员工可分为经理层、创业者、工程师、会计师、生产工人等技术阶层。对人力资本所有者来说, 不同阶层人力资本的投资、形成过程和形成速度存在很大的差异, 人力资本价值差别也很大, 市场价格也就不同, 不同阶层人力资本要求的最低收益率也存在差异。所以在计算某人力资本成本时, 要明确该人力资本所属阶层和类型, 准确计算每类人力资本所对应的无风险收益率和风险收益率。另外, 随着经济的发展, 模型中的各项指标是动态变化的, 要及时作出调整, 以保证人力资本成本计量的实效性和准确性。二是要注意人力资本投资过程中对风险的分散。企业是在动态中发展的, 因此人力资本投资应该是动态的、系统的、高效的。在企业发展的不同阶段, 对人力资本投资要进行合理的规划, 结合岗位和员工各自的特征, 掌握合理的投资层次和投资数量。如同企业的财务结构一样, 同样的投资数量未必能获得同样的投资收益, 还取决于投资结构的优劣。所以企业要利用有限的投资, 更好地发挥人力资本的协同效应, 进行合理的人力资本多样化投资, 降低人力资本投资的整体风险。即企业要注意通过有效合理的人力资本投资组合分散非系统风险。

参考文献

[1]张宏伟:《三元经济下劳动力流动的分析框架》, 经济科学出版社2008年版。

上一篇:经营技术研究下一篇:简易垃圾填埋场