贝叶斯理论

2024-05-18

贝叶斯理论(精选十篇)

贝叶斯理论 篇1

贝叶斯决策理论起源于18世纪人们对概率论的研究,但其作为一门系统化、理论化的科学理论提出来,却是20世纪的事情了。它的正式提出有赖于当时概率论、统计学、经济学等的发展和完善。贝叶斯决策理论最完善的理论形态是由萨维奇在《统计学基础》(The Foundations of Statistics)(1954年)一书中提出来的,我们称之为经典贝叶斯决策理论(Classical Bayesian Decision Theory)。贝叶斯决策理论的发展经历了从最初的经典贝叶斯决策理论到稍后的证据决策理论(Evidential Decision Theory),再到后来的因果决策理论(Causal Decision Theory)的发展历程。考察贝叶斯决策理论的演进过程和研究动态,通过梳理其发展脉络而预测其发展趋势,对于我们研究和发展归纳逻辑理论及其应用具有重要的意义。

一 贝叶斯决策理论的理论基础

贝叶斯决策理论有许多不同的理论形态,所采用的决策原则也有所不同,但它们的重要理论基础是贝叶斯定理(Bayes theorem)和期望效用最大化原则(the principle of expected utility maximization)。

贝叶斯定理是英国数学家贝叶斯(Thomas Bayes)在《论机遇学说中一个问题的解》中提出的一个重要定理。它可以用来计算条件概率,以及描述两个条件概率之间的关系。[1]比如,A在B上的条件概率可以用下式来表示:

undefined

贝叶斯定理为主体利用搜集到的信息对原有判断进行修正提供了有效手段,也就是说,贝叶斯定理能够告知我们如何利用新证据修改已有的看法。

利用贝叶斯定理,我们可以很好地刻画我们的决策准则。例如,当我们面临一个选择时,如果我们已经有了一个用数字来表示的价值概念,那么,贝叶斯定理就可以给我们提供一个算法来帮助我们决定哪种选择更好。令u是一个效用函数,它给一个行动可能导致的每一个结果都指派一个数值,以反映该结果的好坏程度。如此一来,如果行动A1比A2好,那么就可以用下面这个式子来表示:

undefined

其中,pi是行动A1可能导致的结果的概率,ui是那些结果的效用;同样地,pj是行动A2可能导致的结果的概率,uj是相应的结果的效用。undefined的值叫做行动A1的期望效用(Expected Utility,简记为EU)。实际上,我们总是选择那些具有最大期望效用的行动,因此,这种决策规则叫做期望效用最大化原则,简记为EU-最大化。

二 经典贝叶斯决策理论

以贝叶斯定理为基础,使用主观概率并遵守期望效用最大化原则的决策理论称为经典贝叶斯决策理论,简称为经典决策理论。对经典决策理论的建立作出了重要贡献的学者主要有兰姆赛(E.P.Ramsey)、德·菲耐蒂(de Finetti)、冯·诺依曼(J.von Neumann)、摩根斯坦(O.Morgenstern)和萨维奇(L.J.Savage)。兰姆赛的主要贡献在于他首次把主观概率引入了期望效用理论,而且还给出了测度主观概率的方法。德·菲耐蒂的主要贡献在于他提出并发展了主观概率理论。冯·诺依曼与摩根斯坦的主要贡献在于他们在《博弈论和经济行为》(1944年)一书中建立了现代效用理论。萨维奇的主要贡献在于他系统地提出并发展了经典决策理论。“由于萨维奇的工作,贝叶斯决策理论的基本框架形成了。”[2]下面,我们就以萨维奇的决策理论为例来讨论经典贝叶斯决策理论及其优缺点。

萨维奇给出的决策模型包括三个要素:行动(acts)、状态(states)和结果(outcomes),我们分别用A,S和O来表示。其中,A指的是可供决策者选择的备选行动;S指的是决策者进行选择时需要考虑的世界状态(或外在条件);O指的是决策者选择行动A后所导致的结果。当备选行动和世界状态都是有穷的时候,一个决策问题可以用如下矩阵来表示:

其中,O[A,S]表示行动A在状态S下可能导致的结果。

例如,在轮盘赌中,我们需要决定是赌红色(记为AR)还是赌黑色(记为AB)。有两种可能的状态:转轮停在红色图案上(记为SR),或者转轮停在黑色图案上(记为SB)。可能的结果就有4种。决策者面临的决策矩阵如下所示:

由此可知,所有行动的结果都依赖于最终的实际状态:如果你赌红色,那么转轮停在红色图案上你就赢,停在黑色图案上你就输。反之亦然。假如我们以10美元去下赌注,那么上述决策矩阵就变为:

因此,我们可以把行动看做是状态和结果之间的一个函数,即O[A,S]=A(S)。作为一个决策者,我们非常关注最后的结果以及它所带来的效用(utility)。但是,由于我们并不知道哪个状态最终会出现,所以,我们需要为状态指派概率,即确定状态出现的可能性。

在萨维奇的框架中,我们该如何计算期望效用呢?假如已经给定了行动A,那么,我们就可以把各种状态的概率与行动A所导致的结果的效用乘起来,即p(Si)u(A(Si))。其中,A(Si)是行动A在状态Si中所导致的结果。因此,萨维奇框架下的期望效用是:

undefined

有了这个期望效用公式之后,决策者就可以根据以下的原则来进行决策了:

行动A1比A2好,当且仅当,EU(A1)>EU(A2)

值得注意的是,萨维奇认为,上式中的概率p是唯一的,效用u也是唯一的。也就是说,“萨维奇通过上式表明,一个决策者的偏好只要满足他的公理条件,他就可以通过一个唯一确定的概率和一个几乎是唯一确定的效用来最大化他的期望效用,并以此对其行动前景进行评价和预测。”[3]79当然,如果两个行动的期望效用相同,那么就无所谓好坏之分了。

例如,在轮盘赌那个例子中,假定效用就是金钱,而且,我们面临的两个选择是:以10美元为赌注赌转轮停在黑色图案上(记为AB),或者以10美元为赌注赌转轮停在红色图案上(记为AR)。此外,由于转轮最终是停在黑色图案上还是红色图案上,是完全随机的,所以,这两种状态出现的概率都是1/2。根据萨维奇的期望效用公式,AR的期望效用为:

EU(AR)=p(AR)u(AR(SR))+p(AB)u(AR(SB))=(1/2)×10+(1/2)×(-10)=0

该结果与我们所期待的结果相同。同样地,以10美元为赌注赌转轮停在黑色图案上即AB的期望效用也是如此。因此,在这两种行动方案中,没有哪种更具优越性,这也是非常符合我们的直观的。当然,如果非要作出一个选择的话,那么,我们随机选择一个行动即可。

事实上,萨维奇是想利用“偏好”这一概念来定义行动的效用并刻画人们的决策过程。为此,它引入了一个二元偏好关系算子≥,该算子的意思是,决策者认为前一个行动好于后一个行动(至少不比后一个行动差)。因此,“萨维奇试图用理性偏好来为期望效用最大化原则进行辩护。他通过在偏好等级上加上一些限制条件,并给出了一个表征定理来表明,任何一个偏好满足那些限制条件的决策者都能够通过增加期望效用来自动为他们的行动进行排序。”[3]78萨维奇系统中最重要的一条公理就是“确定性原则”(sure-thing principle),即令A1和A2是两个备选行动,如果决策者在状态S中对这两个行动并没有明显的偏好,那么,不管A1和A2的结果是什么,都不会改变决策者的上述偏好。[4]21换句话说,S中的结果是一个“确定性的事件”,它并不依赖于人们是选择行动A1还是选择行动A2。

萨维奇框架非常简单、优美,而且在多数情况下都是非常恰当的。但是,正如杰弗里所指出的那样,该框架存在一些看上去并不那么合理的决策问题,由此作出的决策,往往不太令人满意。[5]8-9正如下面的这个“停车”案例[3]115-116所指出的那样。

假如你刚把车停在一个破旧的街区,一个男子走过来向你要10美元的“保护费”以保护你的汽车不受损。你意识到这纯粹是敲诈勒索,而且你也知道,那些曾经拒绝交“保护费”的人的车,挡风玻璃都坏了,而那些交了“保护费”的人的车却没有遭此“劫难”。而你此时又不能选择把车停在别处,因为你要参加一个非常重要的会议,而会议马上就要召开了。并且,换一块挡风玻璃得花400美元。你是否应该交“保护费”呢?

现在,假定你作如下推理。首先,这里无非有两种可能的状态:一种是该男子砸坏了你的挡风玻璃,一种是该男子没有砸坏你的挡风玻璃。其次,如果你给了他10美元,那么,可能的结果就有两种,一种是你支付了10美元给那个男子且你的挡风玻璃没有被砸坏,另一种是你支付了10美元给那个男子且你的挡风玻璃被砸坏;如果你不给他10美元,那么,可能的结果也有两种,一种是你没有支付10美元给那个男子且你的挡风玻璃被砸坏,另一种是你没有支付10美元给那个男子且你的挡风玻璃没有被砸坏。其决策矩阵如下:

在萨维奇看来,不管那两种状态的概率是多少,“不交给那男子10美元”的期望效用都比“交给那男子10美元”的期望效用要高一些,因为在所有的可能状态中,由前一个行动导致的结果都比后一个行动导致的结果要好,表现在决策矩阵中即为,在S1和S2这两种状态下,下一行的效用都比上一行的效用要高(决策者都可以多拥有10美元)。

但这是错误的。很明显,你最终将面临的情况是:如果你不给那男子10美元的保护费,那么你的挡风玻璃就会被砸坏;相反,如果你给了那男子10美元的保护费,那么你的挡风玻璃就不太可能被砸坏。以10美元的极小代价就可以避免挡风玻璃被砸坏的糟糕结果,所以你应该付那10美元。

三 证据决策理论

经典贝叶斯决策理论之所以会出现上述违背人们直观的决策问题,主要原因在于它忽略了下述事实,即我们的行动与世界的状态是密切相关的。“萨维奇的期望效用最大化是根据他的(期望效用)公式来定义的,而该公式是建立在一个假定上面的,即理性主体关于世界状态的可能性的信念与他的行动无关。”[3]115这种假定显然是有问题的。我们以一个简单的例子来说明这个问题。

假如一个学生正在考虑是否有必要对即将举行的考试进行复习。他的推理如下:如果他将顺利通过考试,那么复习就是浪费时间。同样,如果他没有通过考试,那么复习也是浪费时间。所以,不管最后是否通过了考试,复习都是在做无用功。因此,最佳的选择是“不复习”。

显然,这种推理是有问题的,因为复习可以提高他的考试通过率,也就是说,他成功通过考试的概率很有可能受到其所采取的行动(复习或者不复习)的影响。因此,在进行决策的时候,我们必须考虑行动对结果的概率的影响。

为了解决这个问题,杰弗里建议我们允许状态的概率随着我们拟采取的行动的不同而改变,即对同一状态在不同的情况下赋予不同的概率权重。比如,在上述的“停车”案例中,在“交10美元”的情况下,“挡风玻璃被砸坏”的可能性就非常小(比如0.01),而在“不交10美元”的情况下,“挡风玻璃被砸坏”的可能性就非常大(比如0.99)。同样,在刚刚提到的“考试”案例中,在采取“复习”这一行动的情况下,“通过考试”这一状态的概率可能是0.8,而在“不复习”的情况下可能是0.3。实际上,杰弗里的这一建议就是让我们用条件概率p(S|A)取代萨维奇公式中的非条件概率p(S)来计算期望效用。

当然,杰弗里之所以可以给出这样的建议,得益于他一个巧妙的技术处理,即杰弗里把行动、状态和结果均看做命题,而不是像萨维奇那样在行动、状态和结果之间作出明确的区分。如此一来,我们就可以谈论我们拟采取的某个行动命题的概率、某个状态命题的概率,以及由此导致的某个结果命题的概率了。对于效用来说也是如此。而且,我们还可以用概率来刻画行动和状态之间的关系,以及行动-状态对(action-state pairs)与结果之间的关系。因此,在杰弗里的系统中,行动的证据期望效用可以用下式来计算:

undefined

其中,wi是事情发生的所有可能方式,即决策空间Ω的所有单元素集wi(为了保持形式系统的简单性和一致性,我们假设Ω存在且是有穷可数的)。

把这种新的方法应用到前面提到过的“停车”案例中,我们会发现,一个恰当的概率指派可以导致“交10美元”这一行动获得一个较高的证据期望效用。比如,在“交10美元”的情况下,我们给状态“挡风玻璃被砸坏”指派0.01的概率,而给状态“挡风玻璃不被砸坏”指派0.99的概率;相反,在“不交10美元”的情况下,我们给状态“挡风玻璃被砸坏”指派0.99的概率,而给状态“挡风玻璃不被砸坏”指派0.01的概率。此时,我们面临的决策矩阵变为:

注:斜线右边的数字是我们指派的相关概率,斜线左边的数字是相关效用。下同。

此时,行动A1和A2的证据期望效用分别为:

EEU(A1)=(-410)×0.01+(-10)×0.99=-14

EEU(A2)=(-400)×0.99+0×0.01=-396

显然,行动A1的期望效用高于行动A2,因此,我们应该“交10美元给那男子”。

这也说明了杰弗里系统与萨维奇系统的最大区别,即p(wi|A)随行动A的不同而变化。而作出上述概率指派也是合理的,因为“交10美元”这个行动的确会极大地增加“我的挡风玻璃不会被砸坏”这一个优势结果的概率。

当然,萨维奇也意识到了在“停车”案例这类情况中,结果的概率依赖于我们拟采取的行动。他认为,在这类情况中,我们应该对那些可能的状态进行个别化处理,即对可能的状态进行一个划分(partition),以使得它们独立于行动。例如,我们可以对上述“停车”案例中的状态作如下划分[3]115-116:

S1:不管你怎么做,挡风玻璃都会坏。

S2:如果你交了保护费,那么你的挡风玻璃就不会坏;但是,如果你不交保护费,那么你的挡风玻璃就会坏。

S3:如果你交了保护费,那么你的挡风玻璃就会坏;但是,如果你不交保护费,那么你的挡风玻璃就不会坏。

S4:不管你怎么做,挡风玻璃都不会坏。

如此一来,期望效用就可以继续用萨维奇的公式来计算了。因此,只要我们对可能状态作一个恰当的划分,我们就可以找到一个公式,它可以给出该问题的正确答案。

但是,萨维奇的这种处理方式面临着一个难题,即我们需要找到一个划分,使得状态和行动在其中是概率独立的。这相对于杰弗里的理论,有许多的“不足”之处:

首先,在萨维奇的框架上,行动和结果并不具有概率,也就是说,p(A)和p(A∧S)是未经定义的,所以,我们无法在萨维奇的框架上来表述“状态概率独立于行动”这一思想,即p(A∧S)=p(A)p(S)。

其次,证据决策理论不仅让我们表达出行动和结果之间的概率关系,而且不管我们怎么处理此问题,它都会让我们得到相同的答案。一个命题的期望效用与其在任意划分下的期望效用是相等的。这种划分不变性(partition-invariance)非常重要,它“使得人们在小世界(Small World)中作决策时也可以采用期望效用最大化原则。”[3]121

四 因果决策理论

随之而来的问题是:证据决策理论是否真的没有任何缺陷呢?回答是否定的。事实上,后来人们发现,证据决策理论也存在一些问题。正如乔伊斯所说,“在一些决策问题中,我们对好消息的追求可以得到最优的结果。但这只是在主体的选择和期望结果的出现之间具有统计学的或证据性的联系且没有任何因果联系时才成立。当行动的证据性结果和因果性结果不一致时,证据理论就会告诉决策者应当优先追求好消息而不是好结果。包括我在内的许多哲学家都认为这是错误的。”[3]146下面我们以一个简单的例子来说明。

假如你正在考虑是否吸烟,而且你也知道,吸烟是一件非常愉快的事情。此外,最近的科学研究还表明,吸烟对身体无害,更不会导致肺癌,人们患肺癌是由于他们具有一种“吸烟基因”,该基因可以导致以下两种情况发生:(1)使得这些人觉得吸烟是一件非常愉快的事情;并且(2)使得这些人容易患上肺癌(但肺癌并不是由于吸烟所致)。在这种情况下,即吸烟不仅能让你觉得非常愉快而且对身体无害,你有理由拒绝吸烟吗?[6]

证据决策理论给出的建议是:拒绝吸烟。因为吸烟是某人具有吸烟基因的一个有力证据,所以,吸烟会大大提高该人患上肺癌的风险。而患上癌症远比享受吸烟的乐趣要糟糕得多。因此,证据决策理论建议你戒烟。但是,这种建议似乎并不合理。因为科学研究已经表明,吸烟并不会导致肺癌,吸烟仅仅是某人具有吸烟基因并因此很有可能患上肺癌的一个证据而已。如果你具有吸烟基因,那么,不管你是否吸烟,你都依然具有该基因。因此,戒烟并不能阻止你患上肺癌。也就是说,不管你是否具有吸烟基因,这都是你无法改变的事实。因此,你可以放心地选择吸烟并享受吸烟带来的乐趣。

大多数人认为后面那个论证更有说服力,理由如下:如果你拒绝吸烟,这也许是一个好消息,因为它减少了你患肺癌的风险;但是,拒绝吸烟并不能阻止你患肺癌,因此,拒绝吸烟即使有证据价值也没有任何实际价值。如果你赞同这种观点,那么,你就已经脱离了证据决策论者的阵营,转而加入了另一个新的决策论者的阵营:因果决策论者的阵营。[8]具有上述特征的决策理论就是因果决策理论。

因果决策理论的一种非常经典的表述方式来自斯科姆斯(B.Skyrms)[9]。斯科姆斯的想法是,寻找一种特殊的划分,它把Ω划分为大卫·刘易斯(David Lewis)所说的那种“依赖性假设”(“dependency hypotheses”)[10],这种理论将表明你所关注的那些结果是如何因果地依赖于你的行动的。这种划分中的每一个元素都将清楚地表明你潜在的行动是如何影响可能出现的结果的。我们把这样的划分叫做K-划分。于是,一个行动的因果期望效用就可以用下式来计算了。

undefined

事实上,当世界的因果结构已经给定的时候,证据期望效用与因果期望效用是一致的。也就是说,一个行动导致一个结果的趋势(tendency)恰好与给定行动下的结果的条件概率相吻合。但是,由于你的行动和可能的结果之间的因果关系是未知的,所以,我们必须先计算出所有可能的相关假设的证据期望效用,然后用它们各自的概率作为它们的权重进行加权求和。

当然,实现上述思想的方法还有许多。比如吉伯德( A.Gibbard)和哈伯(W.Harper)就建议我们用虚拟条件句来刻画行动的因果影响。[11]我们知道,虚拟条件句具有如下形式:“如果A成立,那么B也成立”(简记为A□→B)。一般说来,如果B不发生则A也不会发生,那么,A就是B的一个原因。所以,吉伯德和哈伯建议我们用下列公式来计算行动A的期望效用:

undefined

如此一来,我们就可以利用A的特性来得到好的结果,并将其作为我们行动的指南。不过,刘易斯认为,吉伯德-哈伯的方法以及其他类似的方法其实是同一方法的不同表述而已,它们和前面讲到过的通过K-划分来定义的因果期望效用是等价的。[10]

然而,乔伊斯认为,应用K-划分虽然可以获得直观上正确的结论,但我们为此付出的代价却是:我们必须找到一个正确的划分。这似乎又回到了萨维奇的方法上去了。所以,乔伊斯提出了另外一种方法,即“想象法”(imaging)来实现上述设想。[3]172-176他建议我们用下式来计算因果期望效用:

undefined

其中,pA是p在A上的象(image)。当然,我们也可以把pA看做一个概率函数。它是乔伊斯发明的一种计算行动功效值的方法,他通过把P(·A)与PA(·)等价来得到U(A)的正确值。想象法的作用是把集合A外面的世界的概率迁移到A中那些与其最相似的世界上去。在乔伊斯看来,这还是一种很不错的信念修正法。具体的做法是:当一个决策者在评估A的功效值的时候,他通过假定A为真来暂时修改他的观点,并且通过关于A-世界集中的世界之间的整体比较相似性的判断来给A-世界集中的┓A重新指派主观概率。所以,这也是一种判断“如果A为真,那么B将会怎么样”的认识论方法。[3]174-175

以此为基础而构建的乔伊斯因果决策理论可以很好地区分因果期望效用和证据期望效用,而且,它还允许我们把证据决策理论和因果决策理论看做是具有一个共同基础(即条件期望效用)的两种理论形式。

然而,因果决策理论本身也存在着一些问题。最近,伊根(Egan)就发现了它的一个问题。[12]比如,有一个“消灭所有疯子”的按钮,只要按下它,就可以杀死所有的疯子。保罗相信他自己不是疯子,并且非常希望能消灭地球上所有的疯子(因为他认为生活在一个没有疯子的世界上比生活在一个有疯子的世界上要舒服得多)。然而,保罗却认为只有疯子才会去按下那个按钮,并且保罗还认为,在一个有疯子的世界里活着还是比死了要好得多。保罗是否应该按下那个按钮呢?显然,不管从哪方面说,保罗都不应该按下那个按钮,因为他的这个行动很有可能导致他自己的死亡。

但是因果决策理论给出的答案是:他应该按下那个按钮。我们首先通过K-划分来考虑这个问题。这里有两种相关的依赖性假设:

K1:如果保罗按下按钮,那么他和所有的疯子都会死。但如果他不按下按钮,那么就没有一个疯子会死。

K2:如果保罗按下按钮,那么所有的疯子都会死但他依然活着。但如果他不按下按钮,那么就没有一个疯子会死。

在K1的情况下,按下按钮是一个很糟糕的想法;但在K2的情况下,按下按钮却是一个很不错的想法。至于不按按钮,则是一个折中的做法,因为在两种划分中,它都可以维持现状不变。但是,由于保罗认为他自己不太可能是一个疯子,因此,K2似乎更有可能发生;又由于对K2上的好结果的期待超过了对K1上的那种极不可能出现的坏结果的期待,因此,按下按钮就成了一个更好的选择。这个麻烦似乎源于下述事实,即保罗的行动与Ki是证据相关的,在不同的Ki下,就有不同的选择;但这个麻烦在因果解释下却并不存在,因为我们是用p(Ki)来计算因果期望效用的。因此,因果决策理论也不是一个完美无缺的理论。

五 小 结

萨维奇在《统计学基础》一书中提出了经典贝叶斯决策理论的完美形态,但是,它却不能很好地处理状态和行动具有依赖关系的情况,因而导致了证据决策理论的出现。该理论允许状态的概率随着所采取的行动的不同而不同,即以在执行行动A的情况下状态S的条件概率来取代萨维奇理论中的普通概率来计算行动的期望效用。这在很大程度上推进了贝叶斯决策理论。但是,一些悖论,特别是纽科姆难题的出现却让证据决策理论陷入了困境,因而导致了因果决策理论的出现。因果决策理论认为,行动和结果之间的关系必须是因果性的,而不是像证据决策理论所说的那种证据性的,所以,我们在计算行动的期望效用时,应该采用因果条件概率而不是证据条件概率。

综上所述,自从萨维奇在20世纪50年代系统提出经典贝叶斯决策理论以来,在过去的近60年中,哲学家们围绕着如何去计算行动的期望效用,如何为人们的选择给出一个合理的建议等问题进行了深入的探讨,发展出了证据决策理论和因果决策理论等不同形式的贝叶斯决策理论,让我们对人类决策和选择背后的理性原则等诸多哲学问题有了更加深入的理解。

摘要:贝叶斯决策理论是关于决策者在信息不确定的情况下如何作出判断和选择的理论。贝叶斯决策理论起源于18世纪人们对概率论的研究,但其最完善的理论形态却直到20世纪中叶才由萨维奇提出来,我们称之为经典贝叶斯决策理论。后来,又发展出了证据决策理论以及稍后的因果决策理论。考察贝叶斯决策理论的演进过程和研究动态,通过梳理其发展脉络而预测其发展趋势,对于我们研究和发展归纳逻辑理论及其应用具有重要的意义。

关键词:贝叶斯决策理论,经典决策理论,证据决策理论,因果决策理论

参考文献

[1]Bayes T.An Essay Toward Solving a Problem in the Doctrineof Chances[J].Philosophical Transactions of the Royal So-ciety of London,1763,53:370-418.

[2]熊立文.贝叶斯决策理论与归纳逻辑[J].北京师范大学学报:社会科学版,2005(2):108-113.

[3]Joyce J.The Foundations of Causal Decision Theory[M].New York:Cambridge University Press,1999.

[4]Savage L.The Foundations of Statistics[M].New York:Dover Publications,Inc.1972.

[5]Jeffrey R.The Logic of Decision[M].New York:McGraw-Hill,1983.

[6]Stalnaker R.Letter to David Lewis[C]//Harper W,Stal-naker R,Pearce G.Ifs.Dordrecht:Riedel,1978:151-152.

[7]李章吕.论证据决策理论的困境与出路[J].哲学动态,2011(6):84-89.

[8]Pollock J.Causal Probability[J].Synthese,2002,132:143-185.

[9]Skyrms B.Causal Decision Theory[J].Journal of Philoso-phy,1982,79:695-711.

[10]Lewis D.Causal Decision Theory[J].Australasian Journalof Philosophy,1981,59:5-30.

[11]Gibbard A,Harper W.Counterfactuals and Two Kinds ofExpected Utility[C]//Hooker C,Leach J J,McClennen E.Foundations and Applications of Decision Theory.Dor-drecht:Riedel,1978,1:123-162.

贝叶斯理论在质量管理中的应用 篇2

关键词:多品种 小批量 多变量质量控制 控制图 贝叶斯理论

The application of Bayesian theory in quality management

Chen Lichang Wang Ruijie Zhang Yonghua Zhang Tianshun

Abstracts:To meet the needs of the market,many machinery manufacturing enterprises are in accordance with the requirements of ordering the contract to organize more varieties of small batch production.Processing for specific parts,and sometimes is not the only indicator of quality control,and these indicators often there is some correlation between them alone,respectively,singlevariable quality control,the result is often less reliable.The study variety small batch production process quality control,improve the enterprises to ensure product quality,reduce scrap loss,improve efficiency,increase economic efficiency,have a very important practical significance.In this paper,and more varieties of small batch production environment characterized by relatively large fluctuations,the need to control the quality of indicators of the situation,discuss the Bayesian theory of multiple linear mathematical model of practicality,in order to achieve more multivariety small batch production control.

Keywords:Multiproduct Small Batch Multivariate Quality Control Control Charts Bayesian theory

【中图分类号】F270.7【文献标识码】B 【文章编号】1009-9646(2009)04-0026-03

随着市场竞争的加剧,现代企业所处的市场环境发生了深刻的变革,企业竞争越来越强调基于时间的竞争和基于客户需求的竞争。即一方面要求企业、制造商从产品制造方面充分满足顾客需求;同时要求产品交货时间尽可能短,并能快速响应顾客多样化需求。企业的生产方式逐步转向以柔性自动化生产为基础的各种先进生产模式,如计算机集成制造系统(CIMS)、敏捷制造(AM)、大规模定制(MC)等,在我国,随着市场经济的高速发展,产品的个性化趋势日益明显,越来越多的企业开始将单一规格、大批量生产的模式转向为多品种、小批量生产,多品种小批量生产方式开始占有越来越重要的地位[1,2]。多品种小批量加工过程的基本特点[3~5]:产品的品种规格多,专用性强;生产批量小,工艺复杂;制造多采用通用性设备;要求工人的技术熟练程度高;制造过程的连续性不强,经常交替生产,生产技术准备工作量大。针对多品种小批量制造过程波动相对较大的特点,本文提出贝叶斯理论的多重线性数学模型实现多品种小批量多变量质量控制。

1.多变量质量控制数学模型及控制图的建立

由于基于贝叶斯预测统计理论的过程质量控制图是将有关生产过程的历史检验数据与人们对过程的主观评价、预测和判断相结合,通过综合主、客观信息来建立过程的动态模型,对过程变化做出预测,从而在保证预测精度的同时,大大减少对样本容量的要求[4,6,7]。因此,它特别适合于多品种小批量生产的小样本质量控制。

1.1 多品种小批量多变量控制图的数学模型[8]。

如果在所研究的问题中,需要考虑某产品的m个质量特性指标的分组平均值的控制问题,不妨设为y1,y2,…,ym,记为Y=(y1,y2,…,ym),其期望值分别为β1,β2,…,βm,记为β=(β1,β2,…,βm),并假设期望值与目标值重合,它们之间的关系可以用如下数学模型表示:

y1=β1+u1

y2=β2+u2

  

ym=βm+um(1)

式(1)中,u1,u2,…,um为随机变量项,u=[u1,u2,…,um]T∽Nm(0,Σ),则u的分布密度函数为:

f(x)=1(2π)m|∑|12e[-12x′∑-1x]

模型(1)可看作是一种不含自变量的特殊多重线性模型,可以直接应用有关多重线性模型的贝叶斯推断结论。

对总体进行抽样,则m个质量特性指标y1,y2,…,ym相应的有n组观测数据yj1,yj2,…,ujm,j=1,2,…,n。根据模型(1),相应的误差项是uj1,uj2,…,ujm,j=1,2,…,n。则他们之间有如下关系:

y11y12…y1m

y21y22…y2m

… …

yn1yn2…ynm=

111[β1β2…βm]+

u11u12…u1m

u21u22…u2m

… …

u1nun2…unm(2)

建立模型(2)后,便可依据贝叶斯预测理论进行预测,进而构造出小批量生产的多指标质量控制方法。

1.2 先验分布中的参数估计。

先验分布中的参数可以通过事先获得的样本数据来求得。设x1,x2,…,xn为来自总体Nm(β,∑)的样本,其中xi是m维的向量,为了能充分利用贝叶斯的理论,首先对所获得的数据进行处理,即在抽样的时候选取每组样本的样本容量为n= 2r(r为正整数),然后将样本数据进行转换。转换的目的是为了使得新的样本服从均值为0的正态分布。

令:Z1=12(x1-xn)

Z2=12(x2-x1)

… …

Zn=12(xn-xn-1)(3)

则:Zi∽Nm(0,∑),i=1,2,…,n。

这样,转换后的新的样本各质量指标均值为0,各指标的样本方差为:

Si=1n-1∑nk=1(zik-zik)2,i=1,2,…,m,其中,zik=1n∑nk=1zik,i=1,2,…,m。

重复抽样过程p次(根据生产情况决定次数p),得到p组抽样样本。则1σ2i的样本均值和样本方差分别为:

Mi=1p∑pm=11Sim

Ni=1p-1∑pm=1(1Sim-Mi)2(4)

其中,Sim为第i个质量指标在第m组中的方差。

从另一方面,由于1σ2i∽Γ(ai,bi),根据Gamma分布的性质,则:

E(1σ2i)=biai

D(1σ2i)=bia2i(5)

由(4)、(5)式可得,Mi=biai,Ni=bia2i(6)

于是ai、bi 的估计值为:i=MiNi,i=Mi2Ni(7)

求得1σ2i∽Γ(ai,bi)分布中的参数ai、bi以后,就得到了协方差Σ的先验分布,即得到密度函数为:

f(x)=xi-1iie-ix,x>0

x≤0

求得先验分布以后可以通过贝叶斯方法求出更加合理的后验分布,也就是得到模型中的随机误差项u=[u1,u2,…,um]T∽Nm(0,∑)的参数Σ的分布[4]。

下面寻找均值先验分布中的参数C 、D

设x1,x2,…,xn为来自总体Nm(β,∑)的样本,其中xi是m维的向量,重复抽样过程p次(根据生产情况决定次数p),得到p组抽样样本。可利用极大似然估计法[6]估计均值分布中的参数C、 D 得:

=1p∑pi=1xi

=1p∑pi=1(xi-C)(xi-C)′(8)

其中,xi=∑nk=1xik,即每批中不同样本的相同质量指标的样本均值。

这样先验分布中的全部参数ai,bi,C 和D就确定了,在确定了参数β、Σ的先验分布以后,下面就可以对参数β、Σ进行贝叶斯估计。

方差的贝叶斯估计值为:2i=ai+12∑nk=1(ξik-βk)2bi+n2(9)

参数的贝叶斯估计值为:=E(β|ξ1,ξ2,…,ξn)=(∑+nD)-1(∑C+nDτ)(10)

其中Σ可以用样本方差代替。

1.3 多品种小批量多变量质量控制图的建立。

多品种小批量多变量质量控制图的建立过程如下:

首先利用历史数据,确定先验分布中的参数,再利用先验分布的参数和新抽取的样本数据来确定后验分布中的参数,然后利用均值和方差的期望值代替样本分布中的均值和协方差的贝叶斯估计值和∑^,最后构造出统计量。

x2M=(x-)′∑^-1(x-)(11)

针对统计量x2M,取一定的虚报概率α,即可以确定上、下控制限。这里由于统计量构造的特殊性(取值大于等于0),故其控制下限为0,控制上限就是x2a(m)。至此,就可构造一个完整的多指标控制图。当观测点的x2M值落在控制界限内,且无排列异常现象,则可以判断工序处于统计受控状态。否则说明均值向量对目标值有显著偏移,此时应针对问题查明原因,并对其予以排除。

2.应用实例

通过对国内某机床机械制造企业的调研,本实例选用的零件是落地铣镗床的主轴,关键工序为精磨工序(磨主轴外圆和孔)。从车间生产过程中连续检验20批次产品,获得主轴加工的数据,取3个质量特性指标:X1—外圆直径Φ160h9、X2—外圆直径Φ119.9h9、X3—孔Φ82H7。收集以上3个质量指标的检验数据,为方便处理,把得到的数据进行处理(取小数点后三位且同时乘以10)后得到数据见下表:

表1 不同子样本的参数测量值及各样本的X2、T2、F计算值

Tab.1 Subsamples of the different parameters of the measured value and Computed values of X2、T2、F of the samples

组号样本序号X1X2X3X2MT2F

1

19.888.799.120.0816 - 0.0163

29.958.819.180.69530.80940.1391

39.958.909.182.27710.59460.4854

49.508.709.050.52860.30010.1057

2

59.858.809.190.73751.09070.1475

610.19.019.282.48231.35480.4965

79.878.849.160.08420.97700.0168

89.868.759.171.88421.42900.1768

3

99.938.789.162.07070.38060.4141

109.608.879.130.21551.36130.0431

119.928.849.192.02990.08710.4060

129.898.929.052.00380.63450.4008

4

139.948.99.142.09031.38440.2181

1410.39.029.251.77970.00870.3559

159.708.999.131.69210.61370.3384

169.908.869.182.10910.81500.4218

5

179.968.829.131.47211.06120.2944

189.818.709.151.44560.32600.2891

199.998.779.171.37530.10990.1752

209.838.859.170.84711.00850.1694

在获得了该零件的三个质量特性后,下面分别求出按传统统计量T2、F与本文所讨论的统计量X2M计算出来的控制图的控制界限,画出各自的控制图,将其进行比较,以此验证统计量X2M的控制图的控制效果。具体步骤如下:

①首先,取前12个样本数据(分成3组,每组4个样本)对先验分布中的参数进行估计,按照式(3)构造数据,从而得到统计量数据Z,见表2:表2 统计量数据Z的计算值

Tab.2 Statistical data for calculating the value of Z

组号新样本序号Z1Z2Z3

1

10.53732-0.770630.23331

20.54439-0.805980.26159

30.54439-0.742350.19796

40.31815-0.56560.24745

2

50.46662-0.742350.27573

60.57974-0.770630.19089

70.50197-0.728210.22624

80.48783-0.784770.29694

3

90.54439-0.813050.26866

100.33229-0.516110.18382

110.51611-0.763560.24745

120.59388-0.685790.09191

②计算各组样本属性指标的样本均值Zik和方差Si ,见表3、表4:

表3 统计量数据Z的均值Zik(数量单位:×10-15)

Tab.3 Statistical data of the mean Z (the number of units:× 10-15)

组号Z1Z2Z3

10.486063-0.721140.235078

20.50904-0.756490.24745

30.496668-0.694630.19796

表4 统计量数据Z的方差Si

Tab.4 Statistical data variance Si

组号Z1Z2Z3

10.018810.017150.00112

20.003650.0010.00345

30.019560.025360.00945

③ 按式(4)计算出统计量数据Z的Mi和Ni值,对应的值如表5如下:

表5 统计量数据Z的Mi和Ni值

Tab.5 Z statistic data of the Mi and Ni values

属性指标Z1Z2Z3

Mi126.1091366.0197429.9732

Ni16403.69301638.1169484.9

再由式(7)即可以得到协方差先验分布的估计值,如表6所示:

表6 协方差先验分布的参数估计值i、i

Tab.6 Covariance parameters prior distribution estimatesi、i

属性指标Z1Z2Z3

i=MiN10.007690.001210.00254

i=M2iNi0.969510.444141.09082

④均值的先验分布中的参数估计值可由式(8)计算得到:

= (9.858 8.834 9.155)

=1.5498,1.1529,0.6003

1.1529,1.1489,1.0928

0.6003,1.0928,1.0613

根据式(9),计算方差的贝叶斯估计值2i,填入下表。

表7 用于贝叶斯估计的样本的样本方差及方差的贝叶斯估计值

Tab.7 Bayesian estimation for the estimated sample variance of sample variance and the estimated value of Bayesian

属性指标Z1Z2Z3

样本方差0.011330.003650.00306

2i0.007930.002720.00233

⑤按照式(10)即可计算出均值的贝叶斯估计值,得:

=[9.85833,8.83417,9.155]

这样,通过计算就可以得到按照统计量x2M=(x-)′∑^-1(x-)得到每组样本数据的统计量的值,如表1。同时,为了进行比较,分别按照传统的统计量T2=(X-X)′S-1(X-X)和文献[4]建立的F统计量进行计算,分别得到每组样本数据的统计量的值,也附在表1之中。

在计算出各样本的值后,就可以根据样本的值作控制图[9]。取虚报概率α= 0.005,按传统统计量T2=(X-X)′S-1(X-X)建立的控制图,可以得到控制图的控制界限上限(UCL)为0.8437,下限(LCL)为0;按统计量x2M=(x-)′∑^-1(x-)建立的控制图,可以得到控制图的控制界限的上限(UCL)为2.3165,下限(LCL)为0;按文献[4]建立的F统计量控制图,可以得到控制图的控制界限的上限(UCL)为0.5357,下限(LCL)为0。

对表1中的后三列数据用Excel分别画出控制图,得到三种控制图,分别如图1、图2、图3所示:

从所建的控制图可以看出,对于传统的T2统计多变量控制图,在多品种小批量的情况下(图1),计算得到的数据经打点后,有许多的点跑到了控制线之外,这样在实际控制过程中,就可能产生误判,因此不适用于多品种小批量生产过程的控制。而用X2统计量控制图与F 统计量控制图[1] (图2与图3)相比较可以发现,它们之间有较好的一致性,同时都能对生产过程进行较合理的判断,能较好地应用于多品种小批量生产过程的控制。

3.结束语

本文针对多品种小批量制造过程波动相对较大的特点,选用了适合贝叶斯理论的多重线性数学模型。根据贝叶斯理论的特点,选择适合多元分析的先验分布。确定了先验分布中的参数;在确定参数的过程中,将抽取的样本数据进行处理,使得处理后的样本数据能够充分反映样本信息而且方便后续数据处理。通过在多品种小批量机械制造企业的主轴加工的关键工序(精磨工序)开展多变量质量控制,摸索出对不同批次产品的多变量质量特性指标的贝叶斯理论的多重线性数学模型来监控工序的过程质量,实现多品种小批量生产多变量质量控制。通过实例证明,该方法可行、可靠,对实际生产具有一定的指导作用。

参考文献

[1] 李奔波.多品种小批量生产工序能力和控制图研究,重庆大学博士学位论文,2006.4

[2] 徐岚,刘嵘侃,陈亚兰等.SPC在多品种小批量生产线的应用研究[J].微电子学,2007,37(5):682~684

[3] 袁普及.基于成组技术的质量控制的研究.南京航空航天大学硕士学位论文,2003.5

[4] 韩玉启,朱慧明.多元质量特性的贝叶斯均值向量控制图 [J].南京理工大学学报,2003,27(5):561~566

[5] 王建稳.多品种小批量生产情形下的工序质量控制图[J].数理统计与管理,2002,21(4):34~37

[6] 王学明.应用多元分析 [M].上海:上海财经大学出版社.1999

[7] 胡兴才.基于小批量的统计过程控制研究与系统开发,南京航空航天大学硕士学位论文,2006.2

[8] 朱慧明、韩玉启.贝叶斯多元统计推断理论[M].北京:科学出版社,2006

贝叶斯理论 篇3

电梯群控系统(EGCS)用来管理多部电梯[1](3台或3台以上),作为一个有机整体,使用1个自动控制系统调度每一台电梯的运行,目的是提高垂直交通系统的运行效率[2]。

提高电梯群控系统效率,系统客流的分析是关键之一,只有正确把握电梯群控系统面临的客流状况,才能正确的进行梯群调度。国内外有学者通过遗传算法不断搜索寻优的方法来自动适应交通客流的变化,这种方法不事先确定电梯群控交通模式[3,4],虽然能自动优化出最佳派梯,但由于系统算法的复杂性,群控系统实时性差。有学者采用支撑矢量机进行电梯群控交通流预测,并取得了较好的效果[5,6];也有学者采用基于马尔科夫链的群控电梯上行高峰派梯方法[7],但是它们都处于实验室仿真阶段,真正实用有效的方法还有待于进一步研究。

本研究提出一种基于贝叶斯决策理论的实用新型电梯群控系统交通模式识别的方法。

1 电梯群控系统的交通模式

对电梯群控系统而言,建筑物的类型是系统的一个重要变量,不同用途的建筑物类型,群控系统所面临的客流模式或者说交通模式是不一样的。笔者曾经不考虑建筑物类型,以梯群中各梯的运行状态的组合作为电梯模式的划分,发现这种情况比较适合于群控组电梯比较少的情形,否则会发生电梯状态组合的“爆炸”,且存在控制算法实现困难等缺点。因此,本研究就以独家公司办公大楼来分析讨论群控电梯模式识别。电梯群控系统的交通模式一般分为[8]:①客闲状态;②平常状态;③上行高峰状态;④分区上行高峰状态;⑤下行高峰状态;⑥分区下行高峰状态;⑦午饭交通状态;⑧特殊动作状态;⑨乘客服务状态。独家公司办公大楼群控电梯交通模式可简化为:①、②、③、⑤、⑦、⑧。

2 电梯群控系统交通模式识别

2.1 电梯群控系统交通模式空间的确定

模式识别就是试图确定一个样本的类别属性,即把某一样本归属于多个类型中的某一个类型[9]。通过上述交通模式的分析,独家公司办公大楼群控电梯交通模式空间可确定为:

U={ω1,ω2,ω3,ω4,ω5,ω6} (1)

其中,ωj(1≤j≤6)为群控电梯系统的模式空间中的交通模式,分别定义为:

(1) ω1为空闲交通模式—大楼的客流稀少,乘客的到达间隔很长;

(2) ω2为平常交通模式—上行和下行乘客数量大致相同,并且各层之间的交通需求基本均衡;

(3) ω3为上行高峰交通模式—全部或者大多数乘客在建筑物的门厅进入电梯且上行;

(4) ω4为下行高峰交通模式—全部或者大多数乘客乘电梯下行到门厅离开电梯;

(5) ω5为午饭交通模式—上下行的乘客都很多;

(6) ω6特殊交通模式—主要的客流是朝着某一(二)层去或从某一(二)层而来,而该层不是门厅。

2.2 电梯群控系统交通模式识别特征空间Γ确定

在电梯群控系统模式识别当中,还必须确定模式识别特征空间Γ。在进行模式识别的时间段里,首先必须得到一些直接的测量数据,如群控组外呼信号和内呼信号等,然后必须对这些信息进行综合,以得到可用于交通模式辨别的特征值。为使问题简化,在可能的情况下应尽量减少特征值的数量。本研究根据对每种交通模式定义的分析,将特征空间Γ定义为:

Γ={x1,x2,x3,x4,x5}T (2)

式中 x1—一个时间段内总的客流量(总的乘客数);x2—进门厅的乘客数;x3—出门厅的乘客数;x4—最大特殊楼层客流量;x5—次大特殊楼层客流量。

以上5个特征值xi(1≤i≤5)实际上是对内外呼梯指令采样后的统计结果,这也是电梯群控系统模式识别过程中对采样数据的预处理过程。这些特征值能基本反映一个时间段的交通特征,对于辨别交通模式是合适的。一般选取5 min作为交通统计和模式识别的时间间隔。通过对上述特征的进一步分析可知,上高峰、下高峰和空闲模式的辨别与最大和次大特殊楼层客流量x4和x5无直接关系,而特殊交通模式和平常交通模式只与x4和x5有直接关系。

2.3 电梯群控交通模式识别分类器的设计

要完成电梯群控交通模式识别,模式分类器的设计也是必须的。用模糊数学来进行模式识别时,由于模糊数学的方法没有学习的功能,使得分类器的优化设计及修改模糊规则很不方便。而用神经网络进行模式识别时,学习样本制定比较困难,网络学习很麻烦。因此,本研究采用贝叶斯决策法进行电梯群控交通模式识别分类器的设计。电梯群控系统交通模式识别贝叶斯分类器的设计,实际上是要建立一个贝叶斯鉴别函数,它使电梯群控系统各交通模式之间有一个清晰的界—决策面,使得特征空间Γ中的一个特征向量归属于ωj(1≤j≤6)。

根据贝叶斯决策理论,必须首先知道电梯群控交通模式空间中各模式的概率,即必须事先知道概率P(ωj),(1≤j≤6),且undefined。具体地,依据每种电梯交通模式在24小时中所占的时间比例,就可以确定概率P(ωj)。

其次,对于特征空间Γ中反映电梯交通模式的具体特征向量x,在进行贝叶斯决策时,还必须知道每一种交通模式下的条件概率undefined。将一昼夜的时间按5 min为单位划分为m等分,则m=288,这样对所有采样到的特征值序列x进行预处理后,都可以将本研究所提出的6种交通模式的条件概率密度近似定义为正态分布。其实,特征值x是时间的函数,即x=f(t),所以对采样到的特征值x进行预处理的方法是,依据规则F(规则F是电梯专家的经验知识)将取自不同时间段的特征值量化为x′,这样x与x′形成了一一对应关系,即undefined与undefined之间形成一种映射关系。同时根据电梯专家的经验知识,确定条件概率undefined的条件概率密度函数值。这样,根据不同时间段的条件概率密度函数值就可以生成电梯不同交通模式的条件概率密度函数。上述过程本研究通过电梯上行高峰交通模式来进一步说明。一般来说,早上7:45~9:00是上班高峰时间,那么以5 min为时间间隔进行特征值提取,假设提取到的特征值如下所示:

x1=(5 5 0 0 0)Λt∈(7:45,7:undefined;

x2=(8 7 0 0 1)Λt∈(7:50,7:undefined;

x3=(12 11 1 0 0)Λt∈(7:55,8:undefined;

x4=(15 12 1 2 0)Λt∈(8:00,8:undefined;

……;

x12=(7 4 2 0 1)Λt∈(8:55,9:undefined。

经过上述步骤对特征向量的预处理后(该预处理中的量化是一种局部线性量化的方法),再结合电梯专家的知识经验就可以获得电梯上行高峰交通模式的条件概率密度函数,如图1所示。对于其他电梯交通模式采用类似的处理,对所有电梯交通模式的这种处理实际上是电梯模式识别分类器的“有师”自学习过程。这样用贝叶斯公式就可以求得对于一个具体的特征向量x,属于电梯上行高峰交通模式概率:

undefined

基于最小错误率的贝叶斯决策的决策规则或鉴别函数可表示为:

如果undefined,则x∈ωj (4)

因此,根据上述鉴别函数,如果知道电梯群控系统各种交通模式在特征向量x下的概率,就可以进行决策判断x属于哪一种电梯的交通模式。

2.4 电梯群控模式识别分类器的优化和临界决策

对于一个通过自学习设计完成的分类器,必须对其进行优化处理,否则会导致分类设计的失败。对分类器的优化实际上就是对分类器的训练过程,从特征空间Γ中取出大量的特征值对分类器进行模式识别训练,直到分类器的识别错误率为最低。

临界决策面在电梯群控交通模式识别当中可以表示为:

undefined

式中 i,j—电梯的两种交通模式,i≠j。

在本研究中,临界决策错误概率表示为P(e),则要求概率P(e)必须极小化。电梯的6种交通模式将特征空间Γ分为6个领域,分别为R1,R2,…,R6,则P(e)可表示为:

undefined

从上式可以看出,P(e)的值实际上就是电梯各种交通模式在决策面左右的重叠面积,因此要使P(e)的值极小化,则在特征向量的预处理过程中必须使电梯各种交通模式下的概率密度函数尽量地离散,使模式间的重叠面积尽量小,保证模式识别尽可能的正确。另外,如果的确碰到完全意义上的决策面判决,则模式识别为上一时间段的电梯交通模式。因此,本研究所采用的电梯群控交通模式识别方法也称基于最小错误概率的贝叶斯决策。

3 仿真实验和结果分析

本研究通过实验手段对电梯群控系统交通模式识别方法进行了仿真实践。笔者利用BP电梯控制器及其内嵌的虚拟井道信号系统构成单台电梯并组成4台群控电梯;另外,设计了专门的群控控制器和利用VB编程语言设计了呼梯指令模拟,用来产生内外呼梯指令(如图2所示)。通过呼梯指令模拟,可以人为产生本研究阐述的6种交通模式,以检验提出的基于贝叶斯决策的电梯群控模式识别的准确性和群控派梯的效率。

群控系统进行仿真实验的仿真参数设置,如表1所示。在本仿真中,群控电梯的派梯采用传统的最小长候梯算法,算法目标是降低乘客的乘梯服务时间(包括候梯时间和乘梯时间)。

电梯群控系统性能比较如表2、表3所示。从表2的数据来看,和无交通模式识别的群控系统相比较,基于贝叶斯决策交通模式识别下的群控系统在平均候梯时间和乘客乘梯时间两项电梯群控系统评价指标分别提高26.3%和22.3%,但电梯启动次数性能指标或电梯能耗指标略有下降,总体上不影响群控系统性能的提高。从表3的数据看,和基于支撑矢量机模式识别的群控系统性能相比较,基于贝叶斯决策交通模式识别的群控系统在平均候梯时间和乘客乘梯时间两项电梯群控系统评价指标分别提高19%和12.5%,且能耗也有所降低。从表2的数据与表3的数据还可以看出,提高电梯群控系统效率,客流模式识别是十分必要的,因为无论是哪一种模式识别方法下的群控系统,都比无客流分析的系统效率要高。

4 结束语

对电梯群控系统客流进行分析,并让群控系统自动适应客流的变化的研究对提高电梯群控效率是十分重要的。本研究提出的基于贝叶斯决策的电梯群控模式识别方法,通过仿真实验证明,该识别方法科学、合理,并且和其他的客流分析方法相比,能更好的提高电梯群控的效率。

摘要:为了提高电梯群控系统运行效率,针对国内外电梯群控交通模式识别研究存在的问题,提出了用贝叶斯决策理论对其交通模式进行识别。论述了电梯群控系统交通模式、交通模式鉴别的特征参数、交通模式识别分类器的设计及优化,并实现了电梯群控性能的提高。仿真研究结果表明,基于贝叶斯决策的电梯群控系统交通模式识别方法科学、合理,能提高群控电梯的运行效率。

关键词:贝叶斯决策,电梯群控系统,交通模式,模式识别

参考文献

[1]宗群,岳有军.电梯群控系统交通流的预测方法[J].系统工程与电子技术,2001,23(7):103-105.

[2]杨祯山,邵诚.电梯群控技术的现状与发展方向[J].控制与决策,2005,20(12):1321-1331.

[3]KIMJ H,MOON B R.Adaptive elevator group control withcameras[J].IEEE Transactions on Industrial Electron-ics,2001,48(2):377-382.

[4]ZHOUYong,YE Qing-tai.Dynamically dispatching methodaiming to reduce the servicing time in the EGCS[C]//Pro-ceedings of the 5’WorId Congress on Intelligent Control andAutomation,2004:2854-2858.

[5]YAN Xiao-ke,LIUYu,MAO Zong-yuan,et al.SVM-basedelevator traffic flow prediction[C]//Proceedings of the 6thWorld Congress on Intelligent Control and Automation,2006:8814-8818.

[6]XU Yu-ge,LUO Fei,YANG Hong.Destination RegistrationElevator Group Control System Modeling and DispatchingPolicy in Peak Traffic Pattern[C]//Proceedings of the 27thChinese Control Conference,2008:651-655.

[7]ZONG Qun,SUN Zheng-ya.The research of Elevator GroupDynamic Scheduling During Up-peak Traffic Based on POM-DP[C]//Proceedings of the 25th Chinese Control Confer-ence,2006:1705-1709.

[8]朱德文,牛志成.电梯选型、配置与量化[M].北京:中国电力出版社,2005:25-26.

基于朴素贝叶斯模型的邮件过滤技术 篇4

摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.

关键词:邮件过滤;朴素贝叶斯;机器学习

摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.

关键词:邮件过滤;朴素贝叶斯;机器学习

摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.

贝叶斯理论 篇5

可靠性设计理论的基本任务是:在故障物理学研究的基础上,结合可靠性试验以及故障数据的统计分析,提出可供实际计算的力学模型及方法。这样,就可以在机器研制阶段,即在机器的设计和样机试制阶段,估计或预测机器及其主要零部件在规定工作条件下的工作能力状态或寿命,保证机器具有所需的可靠性。近三十年来,建立在经典统计学基础之上的传统可靠性(优化)设计理论与方法得到了迅速发展[1,2,3,4,5,6]。为了使所估计或设计的机械结构具有较高的可靠度水平,传统可靠性(优化)设计方法要求必须有大量通过试验检验而得到的确实数据。然而,在工程实际中由于经济、能源、时间等因素的影响,大量的试验数据往往很难获得,只能得到有限数量的试验数据,在这种情况下传统的可靠性(优化)设计方法会带来很大的误差。

针对有限数量的试验数据的可靠性(优化)设计问题,国内外学者进行了大量的研究工作,如:用最大熵原理得到随机变量的概率密度函数,进而进行可靠性优化设计[7];将有限的数据用区间方法来描述,提出区间可靠性设计方法[8];将模糊数学应用到可靠性优化设计中,研究模糊可靠性优化设计方法[9];将证据理论和可靠性优化设计相结合,探讨证据可靠性优化设计方法[10]。近年来,有的学者用贝叶斯统计理论研究了可靠性评估问题[11]。贝叶斯理论的基本思想是把主观判断或经验与试验数据结合起来,提供类似于传统统计推断方法得到的结果,而这一结果更为合理。

本文应用贝叶斯统计理论和可靠性优化设计方法,给出贝叶斯可靠度的概念,提出了贝叶斯系统可靠性优化设计方法,建立了多失效模式的贝叶斯系统可靠性设计数学模型,发展了传统可靠性优化设计方法。

1 贝叶斯统计理论

贝叶斯统计学[12]与经典统计学的主要差别在于,前者有效地利用了先验信息,它将先验信息和样本信息结合起来,以提供类似于传统统计推断得到的估计。

θ是总体分布中的参数,π(θ)是θ的先验密度函数,在样本观察值x=(x1,x2,…, xn)给定情况下,θ的条件分布π(θ|x)被称为θ的后验分布。它是集中了总体、样本和先验三种信息中有关θ的一切信息,因此基于后验分布π(θ|x)对θ进行统计推断更为有效,也是最为合理的。下面给出π(θ)和样本都为正态分布情况下,π(θ|x)的分布计算方法。

正态均值θ(方差已知)的共轭先验分布是正态分布,设x=(x1,x2,…,xn)是来自正态分布N(θ,σ2)的一个样本观察值,其中σ2已知。此样本的似然函数为

p(x|θ)=(12πσ)nexp[-12σ2i=1n(xi-θ)2](1)

-∞<x1,x2,…,xn<+∞

现取另一个正态分布N(μ,τ2)作为θ的先验分布,即

π(θ)=12πτexp[-(θ-μ)22τ2]-θ+(2)

其中μτ2已知,由此可以推导出参数θ的后验分布为

π(θ|x)=(2πA)12exp[-(θ-B/A)22/A](3)

A=nσ2+1τ2B=nx¯σ2+μτ2x¯=i=1nxin

式(3)是正态分布,其均值μ1与方差τ12分别为

μ1=nx¯τ2+μσ2nτ2+σ2τ12=σ2τ2σ2+nτ2}(4)

从上面推导过程可知正态均值(方差已知)的后验分布是正态分布。在工程实际中,随机变量或随机参数常常不是正态分布,在这种情况下,可以通过等效正态变换[2]将非正态分布转化为正态分布,从而根据上述推导求出其后验分布的均值和方差。

2 贝叶斯可靠性设计

2.1 单失效模式贝叶斯可靠性设计

可靠性设计的一个目标是计算可靠度:

R=∫g(X)>0fX(X)dX (5)

其中,fX(X)为基本随机参数向量X=(X1,X2,…,Xn)T的联合概率密度,这些随机参数代表载荷、零部件的特性等随机量。当基本随机参数向量X在仅有小样本的情况下,用传统的可靠性设计方法来计算式(5)时,会带来较大的误差。在这种情况下,将先验信息和样本信息结合起来计算可靠度会得到理想的计算结果。

单失效模式贝叶斯可靠性指标定义为

βB=μgσg=E[g(X)]var[g(X)](6)

式中,g(X)、E[g(X)]、var[g(X)]分别为状态函数、状态函数的均值和状态函数的方差。

基本随机参数向量X的概率分布是用贝叶斯理论得到的后验分布,因此,可以获得单失效模式贝叶斯可靠度的一阶估计量

RB=Φ(βB) (7)

式中,Φ(·)为标准正态分布函数。

2.2 多失效模式贝叶斯可靠性设计

在工程实际中,结构系统的失效绝大部分是由多种失效模式引起的,因此考虑多失效模式的结构系统可靠性设计方法一直是人们所关注的问题。

考虑具有m种失效模式的结构系统,第i个失效模式的状态函数为

gi(X)=gi(X1,X2,…,Xn) i=1,2,…,m (8)

根据可靠度的定义,结构系统的贝叶斯可靠度可表示为

RSB=P(g1>0,g2>0,…,gm>0)=

∫∞0…∫∞0fg(g1,g2,…,gm)dg1dg2…dgm (9)

式中,fg(g1,g2,…,gm)为系统状态函数的联合概率密度函数。

由于应用理论方法往往很难得到系统状态函数的联合概率密度,并且复杂的多重积分难以求解,使得式(9)计算比较困难。因此,为了简化计算,人们提出了各种假设条件下的结构系统可靠性设计方法,如独立假设(完全无关)方法和最薄弱环节(完全相关)方法等。其中,独立假设方法计算简单,可以满足一般实际工程要求,因而得到了广泛应用。

设结构系统m种失效模式的贝叶斯可靠度分别为RB1,RB2,…,RBm,则在独立假设条件下结构系统可靠度为

RSB=i=1mRBi=RB1RB2RBm(10)

RBi=Φ(βBi)可由式(7)求得。

3 贝叶斯系统可靠性优化设计

贝叶斯结构系统可靠性优化设计的基本思想是:使机械结构达到最佳性能指标时,要求它的系统可靠度不低于某一规定水平。贝叶斯系统可靠性优化设计模型可用如下的确定型模型来求解:

minf(X)=f(X¯)s.t.RSBRS0qi(X¯)0i=1,2,,khj(X¯)=0j=1,2,,l}(11)

式中,RSB为贝叶斯系统可靠度;RS0为给定应满足要求的系统可靠度;qi(X¯)hj(X¯)分别为不等式约束和等式约束。

4 数值算例

图1为承受轴向载荷的空心压杆的计算简图。基本随机变量向量X=(r,E,d,t,L,F)T,其中,rEdtLF分别表示材料强度、弹性模量、压杆截面中径、截面厚度、压杆的长度和载荷力。载荷F是具有小样本的随机变量,其样本数为n=10,样本均值F¯=4.6kN,标准差σF=4.4kN,由经验知其先验分布服从正态分布,其均值和标准差分别为4.5kN、0.45kN;其他随机变量均服从正态分布,r的均值和标准差分别为379MPa、19MPa,E的均值和标准差分别为203GPa、5.86GPa,L的均值和标准差分别为2500mm、12.5mm。设所要求的系统可靠度RS0=0.999,下面用贝叶斯系统可靠性优化设计方法设计此压杆的截面几何尺寸d和t。

(1)首先建立目标函数,要求压杆的质量最轻,即求A-A截面的面积为最小f(x):

f(x)=πx1x2

取设计变量为x=(x1,x2)T=(d,t)T。

(2)各失效模式对应的功能函数分别为

g1(X)=r-Fπx1x2(强度失效)

g2(X)=π2E8L2(x12+x22)-Fπx1x2(稳定性失效)

(3)建立约束条件如下:

可靠度约束

RSB=RB1RB2≥RS0

式中,RB1为强度失效模式贝叶斯可靠度;RB2为稳定性失效模式贝叶斯可靠度。

几何尺寸约束

20≤x1≤80 3≤x2≤8

(4)最后进行优化求解,选取初值d=23.5mm,t=4mm,求得压杆设计处截面的最小尺寸为d=22.997mm,t=3.368mm。

5 结语

本文在贝叶斯统计理论和可靠性优化设计方法的基础上,研究了只有少量试验数据的可靠性优化问题,将主观判断或经验与试验数据相结合,建立了贝叶斯可靠性优化设计数学模型,给出了贝叶斯可靠性优化设计的数值方法,发展了传统可靠性优化设计方法,为解决小样本可靠性优化设计问题提供了新途径。

参考文献

[1]刘善维.机械零件的可靠性优化设计[M].北京:中国科学技术出版社,1993.

[2]张义民.汽车零部件可靠性设计[M].北京:北京理工大学出版社,2000.

[3]贺向东,张义民,刘巧伶,等.非正态分布参数的扭杆的可靠性优化设计[J].中国机械工程,2004,15(10):849-851,891.

[4]Zhang Yi ming,He Xiangdong,Liu Qiaoling,et al.Robust Reliability Design of Vehicle Componentswith Arbitrary Distribution Parameters[J].Interna-tional Journal of Automotive Technology,2006,7(7):859-866.

[5]Du X P.Saddlepoint Approxi mation for SequentialOpti mization and Reliability Analysis[J].ASMEJournal of Mechanical Design,2008,130(1):11-22.

[6]Noh YJ,Choi K K,Du L.Reliability-based DesignOpti mization of Problems with Correlated InputVariables Using a Gaussian Copula[J].Structuraland Multidisciplinary Opti mization,2009,38(1):1-16.

[7]Hee Y K,Byung M K.Application of Maxi mum En-tropy Principle for Reliability-based Design Opti-mization[J].Structural and Multidisciplinary Opti-mization,2009,38(4):331-346.

[8]Du X P,Sudjianto A,Huang B Q.Reliability-basedDesign with the Mixture of Random and IntervalVariables[J].ASME J.Mech.Des.,2005,127(6):1068-1076.

[9]Du L,Choi K K,Youn B D,et al.Possibility-basedDesign Opti mization Method for Design Problemswith both Statistical and Fuzzy Input Data[J].ASME J.Mech.Des.,2006,128(4):928-935.

[10]Alyanak E,Grandhi R,Bae H R.Gradient Projec-tion for Reliability-based Design Opti mization U-sing Evidence Theory[J].Engineering Opti miza-tion,2003,40(10):923-935.

[11]Touw A E.Bayesian Esti mation of Mixed WeibullDistributions[J].Reliability Engineering and Sys-tem Safety,2009,94(2):463-473.

贝叶斯理论 篇6

关键词:贝叶斯信度理论;VaR方法;normal/normalmodel;连续复利

一、VaR模型及其两种计算方法

风险价值VaR作为一个概念, 最先起源于20世纪80年代末交易商对金融资产风险测量的需要, 作为一种市场风险测定和管理的新工具, 则是由J.P.Morgan最先提出的。VaR是一种应用标准数理统计技术来测定金融风险的方法, 是通过密度函数或累积函数来表示风险的。在金融风险估计中, 借助于投资组合市场价值变化概率分布的密度函数或累积函数来表示投资的风险属性, 将各种市场因素所引起的风险整合为一个一维的度量值———最大潜在损失值, 就形成了金融市场风险度量的VaR方法。VaR的对象是某一金融资产或证券组合, 它们可以包括股票、债券及其他的各种金融衍生工具。严格的说, VaR描述了在一定的目标期间内收益和损失的预期分布的分位数。

例如, 持有期为1天, 置信区间为90%的某一证券组合的VaR是1万元, 根据VaR的定义, 其含义是, 我们有90%的把握, 该证券组合在未来的24小时内组合价值的最大损失不会超过1万元。

在传统的精算中, 贝叶斯理论是用于测算保费的一种方法。他采用历史数据和模拟参数共同估计未来保费。一般来说, 保险费的精算采用Poisson/gamma模型, 或者采用Buhrmann模型, 不会采用normal/normal模型。因为normal/normal会使得保费出现负数的情况, 与实际情况大相径庭。但是在其他的一些领域中, normal/normal假设却是十分有效且有科学依据的假设。

将这种方法应用于保险公司或其他金融机构的资产管理笔者认为将十分合适, 因为金融机构管理资产的收益率可以用连续复利来完全表示, 恰好与这里贝叶斯信度理论的normal/norma模型相吻合。

我认为的贝叶斯的信度理论能够很好运用于资产风险中的市场风险管理中去。中国正面临金融开放加速和市场爆炸性发展的阶段, 这个情况不符合历史模拟法的前提条件, 但是即便如此, 也要充分利用已有的数据, 才能纠正有误差的参数。另外蒙特卡洛模拟法对人员素质的要求太高, 同时开发成本也较高, 因此使用方差—协方差法成为目前计量VaR的主流方法。下面笔者简单介绍一下方差—协方差法和历史模拟法。

首先, 方差-协方差法。方差-协方差法是VaR计算中最为常用的方法。它假定风险因子收益的变化服从特定的分布 (通常是正态分布) , 然后通过历史数据分析和估计该风险因子收益分布的参数值, 如方差、相关系数等, 从而根据得出整个投资组合的VaR值。

其次, 历史模拟法。历史模拟法假定回报分布为独立同分布, 市场因子的未来波动与历史波动完全一样。其核心在于根据市场因子的历史样本变化模拟证券组合的未来损益分布, 利用分位数给出一定置信水平下的VaR估计。具体来讲, 它是根据每种资产的历史损益数据计算当前组合的“历史”损益数据, 将这种数据从小到大排列, 按照置信度c的水平找到相应的分位点, 从而计算出VaR值。

方差-协方差法有一个重要的假设———正态分布假设。从统计学的角度来讲, 正态假设是建立在中心极限定理这个基础上的。中心极限定理的原理是:一些现象受到许多相互独立的随机因素的影响, 如果每个因素所产生的影响都很微小时, 总的影响可以看作是服从正态分布的。但是很显然, 这个条件在现实中较难达到, 特别是在行政干预较多的中国市场上。因为, 政府的调控产生的影响并不能看作“微小”。这也解释了实证研究发现:中国市场收益率的厚尾现象比较严重, 用正态分布的假设可能还不能完全解决问题。由于收益率要使用有厚尾分布, 所以需要估计的参数较为复杂, 可信度较低。

历史模拟法直观有效, 利用现实的数据来确定概率分布, 从而省去了很多假设。比如, 方差—协方差法一般采用正态或厚尾分布假设。历史模拟法除了以上这些优势, 它也避免了模型参数错误导致预计概率分布错误的可能性。但这种方法没有考虑到未来的不断变化, 有其局限性。

总的来说, 方差—协方差法中的参数难以确定, 历史数据法难以把对未来的经济形势的估计在VaR中体现出来。针对方差—协方差法和历史模拟法的劣势, 本文采用贝叶斯的信度理论来重新建立模型。

二、贝叶斯信度理论方法

本文采用的方法是:假设interestforce (连续复利也就是收益率) 为随机变量x, x服从 (θ, σ12) 的分布, 其中θ为一随机变量, σ12表示由的样本方差估计的方差。xi是独立同分布的随机变量x的观测值, 观测值数量为n。

θ:N (μ, σ22) , 其中μ表示期望值σ22表示方差, σ22通过类似方差协方差法得到:

σiσj表示风险因子i和j的标准差, ρi, j表示风险因子i和j的相关系数, ρi, j表示整个投资组合对风险因子i变化的敏感度, 有时被称为Delta。

这里采用连续复利为随机变量, 而不用一般的单利计算, 是因为笔者认为连续复利更具有正态分布的特征:多种因素影响随机变量, 而且每种影响的效果较小。并且利用连续复利更容易累加计算, 不需要用到差分和微分。

这种方法的思路是:在θ给定时, 假设连续复利x服从正态分布, 正态分布的方差是从历史数据中获得的。X的期望θ则是一个随机变量, 也服从正态分布, 这个正态分布的两个参数是采用类似方差—协方差法的方法得到的。

这样, 本文提出的这种方法就克服了历史数据法不能通过参数来对未来进行估计的缺点, 也克服了方差—协方差法参数不准的特点。又因为这里x的实际分布不是的正态分布, 将会增大VaR值, 克服了历史数据法VaR值偏小的缺点, 使之能够运用于较为波动的市场行情。

方法的具体使用:

注:这里的exp指的是exponential (指数函数在英国精算体系中的表示方法)

首先表示出的先验分布:

舍去exp中常数项后有

然后表示出θ在观测值下的极大似然函数:

舍去exp中的常数项后有

将prior (先验分布) 与likelihood (似然估计) 相乘后得到后验分布的正相关量, 也就是θ在已知观测值x1x2……xi (用表示) 情况下的密度函数 (时间间隔为Δt) :

可以发现这是一个正态分布, 其中只有θ是随机变量, 这样得到:

那么得到

在给定θ的情况下, 我认为未来一段时间内xi+1, xi+2…xi+m的服从独立同分布的特征 (时间间隔为Δt, mΔt=1) , 根据连续复利积累值的特征, 我们现在要讨论的是xp= (xi+1, xi+2…xi+m) Δt的分布情况。

有: (xi+1, xi+2…xi+m) : (mθ, mσ21)

可得: (xi+1, xi+2…xi+m) Δt:N (mΔtθ, mΔt2σ21)

即:xp:N (mΔtθ, mΔt2σ21)

利用卷积和条件概率的思想, 有:

其中, θ是积分变量, f (θ) 是θ分布的密度函数, α是置信度。F (Z) 表示标准正态分布的概率累积函数是正态分布中的分位数

通过这个等式可以求出分位数, 在α置信度下x出现损失的区间为 (xp, μX)

其中, μX表示根据统计学的公式有

由于x在给定θ的时候是正态分布, 则有

E[θ|X]在前面已经算出, 即为μ。

所以单位资产单位时间内期望与在α置信度下可能值相差 (事实上, 单位时间内资产的分布在给定参数的情况下为对数正态分布) :

根据前面的假设x表示的是interestforce (连续复利) , 那么在置信区间里单位资产单位时间内可能出现的损失为

这种方法既吸收了历史模拟法的充分利用数据的优点, 也解决了历史模拟法不能有效运用参数来估计未来的缺点。另外, 我提出的这种方法延续了方差—协方差法采用多种风险因子来估计随机变量θ方差的特点。

采用这种贝叶斯信度理论的估计方法有一个缺点, 那就是茌式需要计算机采用数值解法才能解决。因为其中的f (θ) 表示正态分布的密度函数, 而表示标准正态分布的概率累积概率函数, 这个函数是不能用基本运算公式表示的。但是这种方法与蒙特卡洛模拟法相比, 已经简便了许多。

本方法除了可以应用于指数连接债券等非固定收益的稳定金融产品VaR测算之外, 还可以运用于股票等波动性较大的金融资产的VaR测定。但是由于这里采用的是连续复利服从正态分布的假设, 如果波动较为频繁, 那么连续复利的时间段有可能难以确定, 样本观测值的确定需要用一些特殊的手段。

笔者将在以后的学习研究中, 利用数据对模型进行实证研究。

三、结论

综合全文, normal/normalmodel在精算中一直不被重视, 因为其现实意义有限, 有可能出现与现实情况不符的负保费的情形。另外, 贝叶斯模型一般用于保费期望的计算, 本文着重讨论了贝叶斯模型概率分位数的应用, 并将此与VaR值相联系。我将这种思想融入投资中去, 建立新的有充分科学依据的理论模型。此模型可以综合历史数据法和方差—协方差法的优点, 建立关于连续复利 (interestforce) 的分布函数, 求得更为准确的VaR值。

摘要:传统的VaR方法通过方差—协方差法或者历史数据法进行测算, 但是这两种方法都有显著的缺点。文章通过贝叶斯信度理论 (Bayes Credibility Theorem) 针对传统VaR方法的一些缺点, 建立新的模型。

关键词:贝叶斯信度理论,VaR方法,normal/normalmodel,连续复利

参考文献

[1].Statistical Method[M].The Actuarial Education Company, 2010.

[2] .马玉林, 周林.沪市VaR估计误差

及其实证[J].统计与决策, 2005 (11) .

[3].黄宗远, 阳太林.ARCH模型在证券市场风险计量中的应用[J].经济与社会发展, 2004 (8) .

[4] .龙朝阳, 李伟.基于FIGARCH模型的中国股市VaR测量[J].财经论坛, 2006 (12) .

[5] .黄雄艳.上证指数的VaR风险测量及有效性研究[J].长沙大学学报, 2005 (6) .

贝叶斯理论 篇7

在数控系统的可靠性评估试验中,考虑到试验成本——无论是装置系统的昂贵,还是试验的费工费料,都不允许采用大量的试验样本及很长的试验时间。基于贝叶斯(Bayes)理论的可靠性评估方法综合了验前信息和样本信息,能有效减少可靠性试验的样本容量和缩短试验时间,节约试验成本[1,2,3]。Bayes理论的基本原理是利用其验前分布和样本信息来计算其后验分布,从而估算该变量的点估计和置信区间,并进一步推导其他相关可靠性特征量的估计值。其具体方法一般是以某一参数为随机变量,通过构造似然函数和验前分布函数,利用贝叶斯公式推导得到后验分布函数的形式,再利用可靠性试验得到失效数据来作为样本,估计概率密度函数或分布函数中的相关参数,最后得到各项可靠性指标。这一过程中,先验函数的确定和似然函数的构建是关键点,而难点是参数估计,关于参数估计问题国内外学者进行了大量研究[4,5,6,7,8,9]。

一般认为数控系统故障概率服从威布尔分布,文献[4]对威布尔分布的Bayes参数估计,用最直接的方法,一步一步进行数学推导,运用了大量的积分运算,整个过程计算量和计算难度都很大,增加了可靠性评估的工作量。文献[5]将威布尔分布转化为极值分布,再运用贝叶斯公式进行计算,虽然计算有所简化,但工作量仍然很大。针对这一问题,本文寻求一种新的Bayes评估计算方法,以避免大量的积分运算,减小计算工作量。文献[6]介绍了指数分布的Bayes评估方法,指数分布是一种常用的分布形式,而伽玛分布为指数分布的共轭先验分布,同时也适合描述机电产品的特征寿命,所以对指数分布的Bayes估计,可选择伽玛分布作为先验分布,这将很大程度地简化计算,相比于直接采用威布尔分布进行Bayes推导,效率是显著的。基于这一思想,本文首先将威布尔分布转化为指数分布,然后还原为威布尔分布的各参数估计。

1 将威布尔分布转化为指数分布

威布尔分布的概率密度为

f(t)=βη(tη)β-1exp[-(tη)β] (1)

式中,t为时间;β为形状参数;η为特征寿命。

其累积概率分布函数是在时间 ts上对概率密度的积分:

F(t)=0tsβη(tη)β-1exp[-(tη)β]dt

z=tβ,则dz=β tβ-1dt,那么

F(t)=1ηβ0tsβexp[-zηβ]dz

进一步令ηβ=θ,X=tβs,则

F(X)=1θ0Xexp[-zθ]dz

该分布即为指数分布,其密度函数为

f(x)=1θe-xθ (2)

θ=ηβx=tβ

由式(2)可见,x为关于tβ的随机变量,1/θ为指数分布的参数,它与ηβ相关。如果β已知,则可把x看作等同于t的随机变量,参数1/θ仅依赖于参数η,θ的验前分布等同于η的验前分布,再运用Bayes理论进行推断。当然,如果β未知,θ则同时依赖于ηβ,可采用多重Bayes方法推断。因为把β当作已知,所以转化会存在一定的误差,误差主要体现在变量xθ上。对x=tβ,x的误差取决于β的误差,β作为形状参数,一般来说,对于同批次、相同状况的机电产品,β理论上是一致的,可通过试验数据估计得到β值,其误差也不会太大;至于θ=ηβ,η存在的误差将被β次方地放大,但我们所关心的并不是θ的误差有多大,最终还是要被折算为其β次方根的误差,对于民用产品,这些误差应该是允许的,文后的例子也证明了这点。

2 先验分布的确定

Bayes的基本原理是利用样本信息修正先验信息,估计更接近事实的近似值,其公式为

π(θ/x)=p(x|θ)π(θ)m(x)p(x|θ)π(θ) (3)

式中,π(θ/x)为后验分布;p(x|θ)为似然函数;π(θ)为先验分布;m(x)为边缘分布。

可见后验分布取决于联合分布密度和先验分布,所以首先要确定所要推断变量的先验分布。由上文已知θ=ηβ,假设β的值已根据先验信息确定,那么θ完全依赖η,根据经验,取倒伽玛分布(IGa(a,b))作为数控系统特征寿命η的先验分布是可行的,于是可确定θ的先验分布π(θ)~ IGa(a,b),那么关键问题就转化为求解超参数ab,使倒伽玛分布尽可能好地描述数控系统故障间隔时间分布。超参数的求解可充分利用先验信息,这里采用先验矩方法求得。倒伽玛分布形式如下:

π(θ)=baΓ(a)(1θ)a+1e-bθ (4)

θ的均值和方差为[10]

E(θ)=ba-1 (5)

V(θ)=b2(a-1)2(a-2) (6)

通过已有信息——大批故障间隔时间数据,统计得到其均值和方差,即可解得ab的值。

3 数控系统可靠性的Bayes评估

假设数控系统可靠性试验采用定数截尾的方法,样本量为n台,其中失效数为r,根据式(2)似然函数为

p(x|θ)=[i=1rf(x)][1-F(x)]n-r=θ-rexp(-Xs/θ)

Xs=i=1nxi=t1β+t2β++trβ+(n-r)trβ

θ的先验分布为如式(4)所示的倒伽玛分布,根据式(3)及共轭先验的性质,得θ的后验密度的核也是倒伽玛分布IGa(a+r,b+Xs):

选择平方损失函数,θ的均值即为其点估计:

θ^=b+Xsa+r-1 (7)

θ服从倒伽玛分布,则1/θ服从伽玛分布:

θ-1∝Ga(a+r,b+Xs)

2(b+Xs)θ-1Ga(a+r,12)=χ2[2(a+r)]

其中,χ2[2(a+r)]为卡方分布,取置信水平为1-α,得θ的区间估计为[2(b+Xs)χα2(2(a+r)),2(b+Xs)χ1-α2(2(a+r))]

θ=ηβ,得η=θ1β,即可求得相应的参数估计和可靠性特征量,如平均无故障工作时间:

ΜΤBF=ηΓ(1+1m)

4 仿真数字算例

数控系统的可靠性评估过程,同样包括试验数据的收集整理,分布模型的假定与拟合检验,参数估计等内容,贾亚洲等[11,12,13]对国产数控系统进行了长期跟踪,对数控系统的失效分布模型、参数估计进行了大量研究,认为数控系统故障间隔时间分布符合威布尔分布。现以文献[13]中表2的故障时间数据作为历史数据,根据文献[13]最小二乘法计算得β=1.3612,可见该系统已进入早期损耗期,现将此值作为该状况下某数控系统故障间隔时间威布尔分布的形状参数。

通过计算机编程计算,ηβ1,ηβ2,…,ηβn的均值和方差分别为11 017.4479,134 483 580.1212,其中ηi(i=1,2,…,30)对应文献[13]中表2的故障间隔时间,由式(5)、式(6)得a= 3, b=22 035。即确定经验的故障间隔寿命服从倒伽玛分布IGa(3,22 035)。根据威布尔分布的形状参数为1.3612,ηβ的均值为11 017.4479,经计算特征寿命η约为932.18h,利用Monte-Carlo方法产生一组服从威布尔分布(形状参数为1.3612,尺寸参数为932.18,位置参数为0)的8个随机数序列,按大小顺序排列t1,t2,…,t8,作为仿真的试验数据。假设试验方案为样本量取8套同批次数控系统,失效数为5时定数截尾,则试验数据处理见表1,其中,n为样本量,T为定数截尾时的时间,tβi(i=1,2,…,5)为故障数据的β次方,Xs为tβi之和,r为截尾数。

设置信度1-α为90%,根据式(7)、式(8),得θ的后验点估计为9264.4,区间估计为

[129701.7χ0.12(16),129701.7χ0.92(16)]=[5509.8,13931.4]

进而可得η的点估计和区间估计分别为820.4和[560.07,1107.07],MTBF的估计值为758.05h。

表2列出了经验信息和试验数据及几种评估方法的比较,对文献[13]中的历史数据采用最小二乘法估计得到各参数,代表着经验信息,Bayes方法综合了先验信息与试验(仿真)信息,计算结果与仿真数据真实情况相近,但试验时间约节约一半,如果不采用Bayes方法,对仿真试验数据直接采用最小二乘法[14]处理,其估计的参数与实际相差甚远,说明小子样试验数据的处理不合适用线性回归方法,文献[13]选取33个样本正说明此问题。

5 结论

(1)通过先验信息近似估计出威布尔分布的形状参数,然后将威布尔分布转化为指数分布,再运用Bayes方法进行指数分布的参数估计。

(2)此方法避免了威布尔分布的复杂模型,减小了Bayes估计的运算量,计算过程简单,提高了算法效率。通过仿真数字算例可看出计算结果修正了先验信息,与实际情况吻合。

(3)如果单纯采用常规试验进行数控系统可靠性估计,一般要提供不小于20套的样本,而本例只使用8套样本,大大减少了样本数量;此方法还节约了试验时间。

摘要:数控系统故障概率符合威布尔分布,如果以威布尔分布来构造似然函数,运用Bayes方法进行可靠性估计,将涉及大量的积分运算,并且不便于选择合适的先验分布。为了减小计算工作量和提高评估效率,将威布尔分布转化为指数分布,并取倒伽玛分布为先验分布;采用先验矩的方法估计先验分布的超参数;利用伽玛函数性质进行指数分布参数的估计,并转化为威布尔分布特征寿命参数的点估计和区间估计,进一步推导计算其他可靠性指标。给出数字实例,证明该方法可行。

贝叶斯决策论 篇8

目前最常用的决策规则有最小错误率贝叶斯决策和最小风险贝叶斯决策。

1.1 基于最小错误率的贝叶斯决策

在模式分类问题中, 利用概率论中的贝叶斯公式, 尽量减少分类的错误, 可得出使错误率为最小的分类规则, 称之为基于最小错误率的贝叶斯决策。以两类分类问题为例, 假设向量为d维样本, 识别目的是要将归类于两种自然状态之一, 用、表示两种状态。类别状态是一个随机变量, 而某种状态出现的概率是可以估计的。即先验概率和

已知, 且+=1。但由于先验概率提供的分类信息太少, 所以必须利用由特征抽取得到的d维观测向量。为简单起见, 假定只用一个特征进行分类, 即d=1。自然状态下观察的类别条件概率分布应为已知。

和分别为类条件概率密度。利用贝叶斯公式

得到的条件概率密度称为状态的后验概率。因此, 贝叶斯公式实质上是通过观察把状态的先验概率转化为状态的后验概率。

基于最小错误率的贝叶斯决策规则为:如果>, 则把归类以状态, 反之<, 则把归类于状态。上面的规则可简写为:如果

则。

1.2 基于最小风险的贝叶斯决策

如上所述在模式分类的决策中, 使错误率P (e) 达到最小是重要的。但实际上有时需要考虑一个比错误率更为广泛的概念———风险, 而风险又是和损失紧密相连的。最小风险贝叶斯决策是考虑各种错误造成损失不同而提出的一种决策规则。

状态空间由c个自然状态 (c类) 组成。

决策空间由a个决策, i=1, .., a组成。

损失函数为;i=1, 2, .., a;j=1, 2, .., c。表示当真实状态为而所采取的决策为时所带来的损失。

2 正态分布时的统计决策

一个贝叶斯分类器的结构可由条件概率密度和先验概率

来决定。多元正态函数 (或者称为高斯密度函数) 是研究较多的密度函数之一, 如下将就正态分布概率模型下贝叶斯决策的判别函数进行讨论。

2.1 单变量正态分布

单变量正态分布概率密度函数定义为

其中为随机变量的期望, 为的方差, 为标准差。概率密度函数由两个参数和就可以完全确定出来。记为, 用来表示是以均值和方差所构成的正态分布的随机变量。

2.2 多元正态分布

多元正态分布的概率密度函数定义为

其中是d维列向量。是d维均值向量。是d*d维协方差矩阵。

多元正态分布被均值向量和协方差矩阵所完全确定。均值向量由d个分量组成, 协方差矩阵由于其对称性故其独立元素只有d (d+1) /2个, 所以多元正态分布是由d+d (d+1) /2个参数所完全确定。概率密度记为。

3 总结与展望

统计决策理论是处理模式识别问题的基本理论之一, 它在对大量数据进行统计分析决策方面有着很强的实效性, 对模式分析和分类器的设计有着实际的指导意义。贝叶斯 (Bayes) 决策理论方法是统计模式识别中的一个基本方法, 这种方法在对数据进行概率分析的基础上生成分类器 (决策规则) , 再应用生成的分类器对新数据依据概率方法进行分类。

模式识别从20世纪20年代发展至今, 人们的一种普遍看法是不存在对所有模式识别问题都适用的单一模型和解决识别问题的单一技术, 我们现在拥有的只是一个工具袋, 对一个需要解决的决策问题, 为选定一个较优的决策函数, 需要建立反映决策函数优劣的指标。风险函数就是这样的指标, 它是采取决策函数而参数真值为时所遭受的平均损失, 即为决策函数和参数的函数。风险函数愈小, 决策愈好。在这个原则下, 更具体且可行的准则有容许性准则、最小化最大准则、贝叶斯准则和最优同变性准则。决策函数的观点使识别问题的解决更注重了所采取行动的效果, 也使识别问题提法更加多样化, 从而开拓了某些新的研究领域。

摘要:模式识别是人类的一项基本智能, 同时它也是一门主要利用统计学、概率论、计算几何、机器学习、信号处理以及算法的设计等工具从可感知的数据中进行推理的学科。它与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系, 它与人工智能、图像处理的研究有交叉关系。模式识别的分类问题是根据识别对象特征的观察值将其分到某个类别中去。统计决策理论是处理模式分类问题的基本理论之一, 它对模式分析和分类器的设计有着实际的指导意义。贝叶斯 (Bayes) 决策理论方法是统计模式识别中的一个基本方法, 用这个方法进行分类时要求:a.各类别总体的概率分布是已知的;b.要决策分类的类别数是一定的。在连续情况下, 假设对要识别的物理对象有d种特征观察量, 这些特征的所有可能的取值范围构成了d维特征向量。这些假设说明了要研究的问题有c个类别, 各类别状态用来表示, i=1, 2..., c;对应于各个类别出现的先验概率P () 及类条件概率密度函数是已知的。如果在特征空间已观察到某一向量, 就是d维特征空间上的某一个点, 那么应如何把分类, 就是本文所要讨论的问题。

关键词:模式识别, 贝叶斯决策理论,探讨

参考文献

[1]边肇祺, 张学工等编著.模式识别 (第二版) [M].北京:清华大学出版社, 2000.[1]边肇祺, 张学工等编著.模式识别 (第二版) [M].北京:清华大学出版社, 2000.

[2]Richard O.Duda Peter E.Hart David G.Stork, Pattern Classification, Second Edition, China Machine Press;2006.[2]Richard O.Duda Peter E.Hart David G.Stork, Pattern Classification, Second Edition, China Machine Press;2006.

[3]J.G.F.Francis, The QR Transformation I, Comput.J., vol.4, 1961.[3]J.G.F.Francis, The QR Transformation I, Comput.J., vol.4, 1961.

贝叶斯理论 篇9

【关键词】金融市场;贝叶斯统计;风险测度

一、前言

随着金融市场的发展和全球化进程的不断深入,多种变量的融合,金融风险的测度愈加困难。为了使金融市场中不利事件的影响降到最小,规避风险,需要我们进行风险测度,近些年来。现有方法已经不能满足我们对于金融风险侧度的要求,这就需要我们探索新的方法,来应对金融市场的日益复杂化。

二、我国金融市场的风险构成

金融管理的三个层面是风险识别、风险测度、风险控制,其中,风险测度是风险管理的关键。传统统计方法现已很难准确的对金融风险进行分析,这就需要我们探索新的技术进行金融风险的测度。

风险是指某些不利事件发生的可能性,相比于其他风险,金融风险具有广泛性、强破坏性、传导性、规律性和可控性的特点。一旦发生金融危机,往往对多个领域,多个国家造成巨大的损失,但通过对几次金融危机的研究,我們也可以发现,金融危机不是不可避免的,也不是不可控制的,只要我们科学进行预估,这些危机都是可以避免的,所以需要我们特别注意金融危机的测度工作。

根据金融风险发生的多种原因和形式,可以把金融风险分为五大类,分别是市场风险、信用风险、操作风险流动性风险和法律风险。法律风险一般是国家规范、政府监督、法律法规的管理,不考虑度量问题。流动性风险在其他风险测度时都会对流动性因子成分进行分析,不用单独列出。所以当前主要进行测度的只有市场风险、信用风险和操作风险这三种。市场风险又称价格风险,一般是因为商品价格、股票、汇率等市场因素的变动引起的金融机构风险,是金融体系最常见的风险;信用风险指的是因信用等级跃迁、信用价差波动、违约等事件导致的风险,狭义上可以理解成一种违约风险。主要由金融机构经营情况引起;操作风险是金融机构由于内部人员、自身系统、或外部事件造成的风险。一般只存在于银行当中。

三、金融市场的主要成因

金融风险测度不仅是为了使我们规避风险或减少风险的,它的另一个主要作用在于透过量化数据,认清我国金融市场存在的不足和现实情况。从现实层面来讲,当前金融行业的市场风险主要是由最不可控的股票风险引起的。股票市场方面,股权结构不合理、市场做空机制与退出机制不完善信息披露机制不健全、不对等、政府干预过多、利率变动、国际金融炒家对人民币进行炒作,都是引起股票市场风险的主因。

信用风险方面,国有银行是以国家信用作为保证的,个别违约现象不能使整个金融市场混乱,最有可能引起信用危机的就是商业银行信用风险,雷曼兄弟的破产就是一例。当前,引起信用风险的主要因素是:投资和信贷导致金融风险累积。近十年来,我国信贷余额和GDP的比值,M2和GDP的比值都有所偏高,已经显现出风险的迹象;不良贷款的比重偏高。美国次贷危机大家还记忆犹新,我国企业的逃债、废债行为十分严重,扩大了银行不良贷款的比重;市场融资机制不规范,信贷资金运用约束性差。2010年,对GDP贡献率仅为1/3的国有企业拿到了90%的银行贷款,而占社会总产值60%的非国有企业只有不到10%的贷款,可见我国融资机制的不合理性;最后,宏观经济波动也会引发信用危机。

操作风险方面,操作风险的表现主要为内部诈骗、外部诈骗,操作失误等,主要原因有组织机构不健全,管理失控、内部机制不完善、业务流程设计不当、人员素质不高,专业素养和职业道德方面不达标。

四、如何用贝叶斯方法测度金融风险

贝叶斯方法是综合总体信息、样本信息和先验信息进行推断的一种统计方法,采用贝叶斯方法统计推断的全部结果,就是贝叶斯统计。

进行贝叶斯统计,首先要做先验分布选取,依据贝叶斯MCMC方法及贝叶斯统计软件,将经验数据输入Winbugs软件,根据模拟结果选取最优分布作为参数的先验分布,然后进行GARCH模型参数的后验分布确定及模型参数的贝叶斯估计,进行完之后对POP模型参数进行先验分布假定,最后进行模型的有效性检定。需注意的是,MCMC得到的马尔科夫链是否收敛于平稳分布是需要进一步检验的。目前检验方法有Gelman与Rubin的诊断方法和Brooks-Gelman两种。

市场贝叶斯分析方法是建立GARCH-POT模型,根据已有研究成果,GARCH-POT模型思路是假定模型参数互相独立,且选取正态分布作为参数的先验分布,然后联合似然参数得出模型参数的后验分布。再根据Pareto分布的参数选取参数先验分布,在据此对先验分布的超参数进行贝叶斯估计进而得出残差估计值。

对于信用风险和操作风险,都可以利用贝叶斯方法进行测度,基于现有研究成果,本文就不进行赘述了。

五、结语

现今频率统计度量模型对突发事件解释失效的情况下我国股市存在着不可忽视的风险。对此,我们要规范上市公司行为,完善股市的基本法规和制度,加强金融监管,防止投资者市场操控行为,合理把控信贷投资总量,积极支持实体经济的发展,并要加快体制改革,优化金融资源配置。对于金融市场的研究需要进行技术革新与升级。

参考文献:

[1]王彦红.基于贝叶斯分位回归的证券市场风险测度研究[D].湖南大学,2010.

[2]王灵芝.中国证券市场流动性风险的量化与管理研究[D].上海交通大学,2010.

[3]管皓云.基于多元Copula贝叶斯随机波动模型的投资组合研究[D].湖南大学,2011.

[4]谢伟峰.湖南地区工业转型升级的测度及金融支持研究[D].中南大学,2014.

作者简介:

一种增量贝叶斯分类模型 篇10

在信息技术时代,各种信息以几何倍数的形式增长,如何对这些信息进行整理分类成为人们所关心的问题。传统的分类也就是我们常说的非增量学习分类算法如朴素贝叶斯,神经网络等。它们有一定的局限性,因为我们需要手动标注大量的训练文本,导致大量时间的浪费。增量学习分类算法可以有效的解决这个问题,它通过在已有的知识基础上边学习边分类,同时在新增加知识库的基础上分类可提高分类的准确度。贝叶斯分类是一种可靠的分类方法。本文将贝叶斯分类和增量学习分类算法结合提出了一款增量贝叶斯模型,对理论方面进行了详细的说明还给出了实验验证。结果发现这款模型具有较高的可靠性。

2增量学习的思想

增量学习是以前训练学习结果的基础上,对新增加的样本数据进行学习。它是在没有忘记以前学习的知识连续学习过程。

将增量学习的思想运用于分类中就得到增量学习分类算法。它是将新增的样本作为增量,随着分类过程的推进,这些新增样本被逐一加到训练集这些样本杯加入到原始训练器进行训练,并用更新的训练器来预测未来实类类别,直至增量集为空。采用这种分类算法,随着训练样本的持续增加和增量学习过程的不断进行,所得分类器的分类精度会不断提高,它无需浪费存储空间,从而减少了时间,节省了存储空间。

3贝叶斯增量学习模型

这里当有新的样本加入时,当前的后验信息变成下一次更新过程中的先验信息。

4增量贝叶斯分类器算法

4.1算法设计

4.2算法描述

基于以上叙述,将算法思想整理并描述如下:

输出:分类器CIncrent-Bayes过程:

Step1:利用分类器D,学习分类器Cbayes;

Step2.1:利用现有的分类器Si,获得最大后验概率Pmax

Step3:对于反馈集用遗传算法生成最优特征子集来更新反馈集;

5实验

本次实验建立增量贝叶斯的分类模型,对搜素引擎检索的问句进行分类,从而让系统快速的查询答案类别对提升搜索引擎系统具有重要意义。

本次问句分类体系包括询问描述类、人物类、地点、数字、实体、时间,每个大类又包含一些不重复的小类,如人物包括人物列举和特定人物等等。

5.1实验过程

在训练过程中,先将已经分类好的问句类别进行问句内容的分词预处理和特征提取,将其表示成向量形式,建立最初的问句分类器在问句的分类过程中,当新问句到来时,将其向量化表示,然后根据已经建立好的分类器对该问句进行分类处理分类。具体含以下三点:

5.1.1问句样本的预处理

5.1.2问句样本的特征提取

设问句的类变量C={C1,C2...Ci},其中i=1,2,3...问句的特征提取主要选取一些能代表问句类型的特征项,常用的特征提取方法主要有文档频数,信息增益,互信息等。我们可以通过问句中的词法、句法、语义三个角度提取特征。

5.1.3利用增量贝叶斯算法实现问句分类

在问句分类过程中,不断有新的实例的加入,可以充分利用这些问句中的有价值的信息来更新分类器中的参数,实现增量式的动态学习,实现边学习先分类。

5.2实验结果

在本次试验中,我们对所设的6大类和各小类通过建立三种分类器模型即传统朴素贝叶斯分类器、改进贝叶斯分类器以及增量贝叶斯分类器。这里对增量式贝叶斯分离器还进行具体划分,根据增量集的多少分为增量贝叶斯分类器A,增量贝叶斯分类器B,增量贝叶斯分类器C。图1为各分类器分类准确率的结果。

5.3实验分析

通过以上实验看出利用增量贝叶斯建立的分类器分类效果最好且随着增量集的增加,分类精度越来越高。

6结论

随着数据化时代的到来,各种信息纷涌而至,对各类信息有效分类成为当下研究热点。传统的分类耗时长,分类效果低。本文提出了一款增量式分类模型可实现对样本学习和分类并行工作的,具有分类准确率高耗时短等特点,可靠性较高。

摘要:在大数据时代,如何对数据信息进行合理的分类管理十分重要。传统的分类是采用批量分类,不过当数据规模较大时,这种方法效果就不是那么好了。本文提出的一种增量贝叶斯分类模型,具有耗时短分类精度高,通过实验验证,可以看出分类效果显著。

关键词:大数据,批量分类,增量贝叶斯分类

参考文献

[1]郝春风,王中民.一种用于大规模文本分类的特征表示方法[J].计算机工程与技术,2007,43(15):170-172.

[2]丁厉华,张小刚.一种基于类支持度的增量贝叶斯学习算法[J].计算机工程,2008.34(22):218-222.

上一篇:梅特林克下一篇:情感解析