英文字母手写体训练

2024-05-23

英文字母手写体训练（精选6篇）

篇1：英文字母手写体训练

手写体英文字母的书写规范及练习

26个英文字母规范

一、书写要求

1、斜度：每个字母都要稍向右斜约5°左右，斜度要一致。 2、大写字母的书写规格是：上不顶天下立地。即笔画的上端稍离第一线，笔画的下端必须紧贴第三线，不许离线也不许出格。

3、占中间格的小写字母有a,c,e,m,n,o,r,s,u,v,w,x,z 13个，它们笔画的上端必须紧贴第二线，下端必须紧贴第三线，不许离线也不许出格。

4、占一格、二格的小写字母有b,d,h,k,l 共5个，它们笔画的上端必须顶第一线，下端必须顶第三线，不许离线也不许出格。

5、小写字母i和t也占一格、二格。但t的上端在第一格中间，短横重合第二线;i的小圆点在第一格中间稍偏下处。

6、占二格、三格的小写字母有g,q,y 3个，它们的笔画的顶端要紧贴第二线，下端要紧贴第四线，不可离线也不可出格。

7、占一格、二格、三格的小写字母有f, j, p 3个。其中f的上端稍离第一线(和大写字母一样)，下端紧贴第四线，短横重合第二线;j的小圆点与i的`小圆点位置相同，下面一笔的上端顶第二线，下端紧贴第四线;p的上端略高于第二线，约占第一格的三分之一，下端紧贴第四线。

8、要注意书写的规范，字母a,d,g,o,q等上端必须封闭，不可开口。

9、字母l, k的收笔处是圆钩，不可写成尖钩或竖弯钩。

10、字母r的收笔处不可多加一个弯。

11、字母g,j,y收笔的弯钩要自然弯曲，不可太长，也不可太钩。二、书写范例

三、书写笔画总结 (1)一笔完成的字母：大写：C G J L O S V W Z

小写：a b c d e g h k l m n o q r s u v w y z (2)两笔完成的字母：

大写：B D K M N P Q R T U X Y 小写：f i j p t x (3)三笔完成的字母：

大写：A E F H I (4)元音字母：

Aa Ee Ii Oo Uu

四、英语字母书写格式(顺口溜) 英语字母大小写,初学书写要规范; 大写一律上两格,原则不顶第一线; 小写有头上两格,b,d,h,k和l; 有尾下面占两格，g,q,y,p莫写错; 无头无尾中间格，十三字母无漏写; a,c,e,m,n,o,r,s,u,v,w,x,z;

中间i,t中上一个半，还有f,j三格点; p占第一格的三分之一;

所有字母略右斜，笔顺笔画须记请;

始学养成好习惯，大小宽窄要协调。

五、书写练习

______ ______________ ______________ ________________ _______________ ______________ ______________ ________________ _______________ ______________ ______________ ________________ _______________

______________ ______________ ________________ _______________

______________ ______________ ________________ _______________ ______________ ______________ ________________ _______________ ______________ ______________ ________________ _______________

______________ ______________ ________________ _______________

______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ _______________ _______________ _______________

_______________ _______________ _______________ _______________

______________ ______________ ________________ _______________

______________ ______________ ________________ _______________ ______________ ______________ ________________ _______________

______________ ______________ ________________ _______________

______________ ______________ ________________ _______________ ______________ ______________ ________________ _______________ ______________ ______________ ________________ _______________

______________ ______________ ________________ _______________

______________ ______________ ________________ _______________ ______________ ______________ ________________ _______________

______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ______________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ ________________ _______________

_______________ _______________ _______________ _______________

_______________ _______________

_______________

______________

_______________

_______________ _______________ _______________

_______________

_______________ _______________ _______________ _______________

_______________

篇2：英文字母手写体训练

2010-8-11 由编辑阅读：2962次

26个英文字母的大小写与顺序

英文字母起源→ 示图表达A－牛头 B－房子、鸟嘴 C,G－房角 D－门 E－举着双手的人 F－沙粒 H－荷花 I－手 K－皇帝 L－鞭子 M－水or波浪 N－鼻子 O－圆的东西 P－嘴 Q,R

篇3：英文字母手写体训练

关键词：手写,识别,特征提取

在学生考试、问卷调查等活动中,采用人工的方式对选择性题目答案进行统计是一项比较繁琐的工作。当然,在很多考试中,客观题评阅采用了OMR技术。考试时要求考生根据规定在答题卡上填涂客观题答案,阅卷时通过提取每个选项中填涂的灰度值判定该选项是否被选中实现客观题的自动评阅。这种方式要求考生答题时必须使用规定的填涂笔,并严格遵守填涂格式的规定,给考生带来了一定的限制,填涂时间上也消耗较大。并且在问卷调查等活动中,也不适合采用填涂答题卡的方式。因此,本文提出了一种基于手写英文字符识别算法实现自动评阅的方法,让被试者灵活、高效的进行答题,而不受答题用笔、填涂格式等限制。

目前,对字符的识别方法很多,如神经网络(BP)算法、模板匹配[1]等,但大多都需要进行二值化、降噪、归一化、细化、提取轮廓、模板匹配、训练学习等大量的运算处理,使得识别的运算量大大增加,实现起来非常复杂,从而降低系统的实时性,并且在纯英文字母识别系统中这些方法显得大材小用。虽然英文字母包括26个,但在考试、问卷调查等活动中,大多只包括A～D四个字符,最多包括E和F,字符个数少,因此,根据字母的结构特征,只要能找出

一种能将它们分别区分开的特征组合,就可以将英文字母进行分类,识别出单个字母。本文提出了一种基于图像欧拉数和特征向量的英文字母识别算法,该算法只需对图像进行简单的预处理,就可提取特征进行识别,整个流程如图1所示。

1 图像预处理

手写字符图像中因为每个人的写法不规范,存在较大的随意性,很显然存在一定的噪声。对图像进行预处理就是为了降低噪声,便于后面对字母的切分和特征的提取,提高最终识别的正确率。这里的预处理分为二值化图像、滤波除噪和扩展收缩三步。

1.1 图像二值化

二值化处理是利用图像中要提取的目标物与其背景在灰度上存在差异的特点,将图像中的物体和背景以明显不同的灰度级区别开,以压缩数据存储量,简化后期处理。常用二值化方法有最优阈值法、OTSU法、迭代阈值法、Berson算法及Kamel-Zhao算法等。迭代阈值法是一种基于逼近思想的方法,从路径规划的角度上是最优阈值,在图像目标区域和背景区域存在明显差异的情况下,这种算法效果非常理想。本文图像中的英文字母和背景灰度差别较大,并且实现起来较为简单,因此采用这种方法。首先取图像灰度取值范围中值作为初始阙值T0,然后按照下式进行迭代,直到Ti+1=Ti,或者差值小于某一极小数时迭代结束,并取此时的Ti为分割阈值。

使用Ti作为阈值将背景与字符良好地区分。其数学表达式如下:

其中f(x)为图像的灰度。图2(a)是对原始图像二值化后的结果。

1.2 滤波降噪

通过前面的二值化处理,可以去除或减轻部分噪声,但不能完全滤除。本文采用二值形态学的基本运算来去除字母图像中残留的噪声。首先对图像进行收缩,收缩的算法是:如果邻点是0,则将该点从1变为0。通过收缩可以滤除字符中的黑色噪声;然后再对图像进行扩展,扩展的算法是:如果邻点是1,则将该点从0变为1。通过扩展可以滤除背景中的白色噪声。进行收缩和扩展后还可以有效地填满不希望存在的空洞,保证下一步欧拉数计算的正确性。图2(b)是对图1(a)滤波降噪后的结果。

2 字母分割

2.1 行切分

行切分就是要将一行行字符从图像中切分出来,形成单行字母文本图像数据。对输入的二值化字母图像从上到下逐行扫描并计算每个扫描行的像素,以获取图像的水平投影。字母图像沿行方向的水平投影中的每个波峰与图像中的每个文本行相对应,而在相邻的两行之间的空白区域存在较宽的投影信息为0。因此通过对整幅图像在水平方向的投影图像进行分析,找到投影波峰所对应的文本行的位置,从而可以计算出每行的行距;其次对所有行的行距累加求和后,求出字母图像的标准行距,以标准行距对图像进行行的粗切分;最后在每一个粗切分的行附近上下扫描,进行细微调整,选取最合适的分割位置。图3(a)是行切分的结果。

2.2 字切分

字切分是从切分出的字母图像行中将单个的字母图像切分出来,字切分的正确与否直接影响最终识别的结果。与行切分相同,字切分可以利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隔实现,但与行切分相比,字母之间的间距远不如行间距明显,垂直投影上的空白间隔部分不如行与行之间的空白间隔部分宽,分布也不均匀,使得字切分比行切分困难。

利用上一步行切分的结果,可以获得字母的高度信息,因为字母一般是方形的,从而可以估计出字母的基本宽度并利用它进行粗切分;对粗切分出的每个字母,以此宽度信息进行衡量,以粗切分的起始位置为出发点,向左右两方向进行搜索,对起始位置进行细微的调整,从而使得字的切分更准确。图3(b)是进行字切分的结果。

3 字母细化与连接

因手写字符时可能会出现粘连、断裂等情况,影响识别的效果,且识别主要依据轮廓形状而不是线条的宽度,因此对待识别字母进行细化有助于突出形状特点和减少冗余信息。所谓的细化就是经过一层一层的剥离,从原来的图中去掉一些点,但仍要保持原来的形状,直到得到图像的骨架。26个英文字母中线条都是相连的,没有独立的线条,因此进行细化的同时检查字母的骨架是否线条保持连续性,否则进行插值填充。目前使用最多的细化算法是边缘侵蚀细化算法,比如Hilditch细化算法、Rosenfeld细化算法[2等。

本文选择Rosenfeld细化算法,利用邻域扫描目标图像并进行细化。同时,再进行扫描时,将所有连续的像素分在同一个集合,如果最终出现两个以上的集合,则分别提取该集合中上、下、左、右4个边缘像素,计算其与另一个集合中同一行(列)的边缘像素的距离,如果距离小于某个阈值,则在它们之间进行插值,直到所有像素都在同一个集合中为止。

4 字母识别

将每个字母从图像中切分成单个的图像后,就可以进行字母的识别。不同的英文字母具有不同的特征,对其进行快速而高效地分类,有助于系统对其做出正确的识别。同时高效的分类,可以大大缩小下一步模板匹配的范围,进而提升系统的识别速度。本文通过提取英文字母的特征量,对26个英文字母进行分类,将每个待识别字母的匹配范围尽可能地缩小,以降低识别所需的时间。

4.1 欧拉数计算

欧拉数(Eu)最通常用于测量空间完整性的方法,即对空洞区域内空洞数量的度量,是一种应用广泛的对物体进行识别的特征。对于二维图像,欧拉数定义为连接体数与其中的空洞数之差,计算公式为:欧拉数=连接体数-空洞数,Eu=C-H。欧拉数给出的图像拓扑特征具有平稳、旋转和比例不变的特性,对输入图像的要求不高。根据欧拉数的不同可以将英文字母集合分为3个子集:欧拉数为-1的是B;欧拉数为0的有A、D;欧拉数为1的有:C、E、F、G。这样缩小了识别的范围,便于下一步的识别。

定义行图段是二值图像的每一行中被0或图像边界所分隔的值为1的单一像素或多个像素,图段的大小最小是1,最大不超过行的长度。定义行图段的相邻数为图段相邻行中对应图段大小范围内的图段数,最小是0,最大是N/2+1,N是图段的大小。由与行图段相邻的上一行产生的相邻数称为上相邻数,与行图段相邻的下一行产生的相邻数称为下相邻数。如图4中的第二行的行图段数为1,大小为5,它的上相邻数为2,下相邻数为1。

对图像按由上而下的方式逐行扫描一次,则计算该图像欧拉数的公式[3]为:

其中,Vnk表示二值图像第n行,第k个图段所对应的上相邻数。很显然,当某一行没有图段时,则该行对欧拉数没有任何贡献,因此当k=0时,Vnk=1,即Vn0≡1。

4.2 特征向量提取

使用欧拉数只是将字母分成了三类,还无法将所有的目标区分开。但每个字母轮廓的变化都蕴含着大量的信息,通过对这些信息的提取也可以对其分类。以字母“A”为例,从左至右对其进行列扫描,用每列像素由白变为黑的次数作为特征值,第一列由白到黑交替一次,所以特征值记为1。将图片从左至右,依次扫描,可得到一系列特征值,将这一组特征值称为垂直特征向量,记为VTD。同理,从上至下进行按行扫描,记录每行由白变为黑的次数,也可以得到一组特征值,将其称为水平特征向量,记为HTD。VTD和HTD就是进行字符识别所需要的特征向量,它们完整准确地记录了目标字母的结构特征。

因手写字符随意性较大,会出现横不平、竖不直等现象,这样会影响目标的VTD或HTD向量。为解决这个问题,采用相邻的相同的特征值只计一个的方法,这样既可以避免上述问题的产生,又可以压缩数据量,简化识别运算。如图5中的左右两个字符“A”,虽然在写法上存在较大的区别,但它们的水平和特征向量相同,都分别为VTD(121)和HTD(1232)。

在使用欧拉数分类的基础上,提取目标的VTD和HTD,可以进一步的进行分类,从而实现目标识别。字母识别的算法如下:

1)扫描图像,计算欧拉数(Eu),如果为-1,则字母为B,退出;

2)如果不为-1,则进行行扫描,计算水平特征向量(HTD);

3)根据Eu和HTD进行分类匹配,匹配成功,得到识别结果,退出;否则转下一步;

4)进行列扫描,计算垂直特征向量(VTD);

5)根据Eu和VTD进行分类匹配,匹配成功,得到识别结果,退出;否则进入特殊字符处理。

5特殊处理

由于手写字符的随意性,提取出来的字符图片即使是相同的字符,字符也会有存在很大的不同,因此会存在无法识别的字母。这些无法识别的字符可能是应该被识别出来的有效目标,但也可能是被划掉的错误答案等。为保证最终识别的正确率,对无法完成识别的特殊字符,利用关键点进行最后一次识别。

扫描骨架对象,提取出其中所有的“交点”作为关键点。如果关键点的个数过多,则认为该字符为无效字符;否则,分析关键点的个数及之间的位置关系,再结合欧拉数和特征向量确定结果。

6 结论

对该算法进行了模拟,通过对大量对象的识别,证明了该算法的可行性和高效性,识别结果也具有较高的正确率。但算法需要更多的考虑特殊情形,以进一步提高识别率。

参考文献

[1]路浩如.手写体汉字识别问题综述[J].计算机应用与软件,1994,11(2):1-8.

[2]Joseph Vybihal,Danielle Azar.Hilditch's Algorithm for Skeletonization Software Systems.Kendall Hunt Pub.2008.

篇4：英文字母大写规则

1. 英语句子开头的第一个字母要大写。如：

What color is it?它是什么颜色？

My name is Gina. 我的名字叫吉娜。

2. 人称代词I在句中总是大写。如：

I am a student. 我是一个学生。

He and I are in the same school. 他和我在一个学校。

3. 地名、国名和人的姓和名等的专有名词第一个字母要大写。如：

I live in the city of Beijing. 我住在北京城。

My pen pal is from America. 我的笔友来自美国。

Li Ping and Wang Yanfang are close friends.

李萍和王艳芳是好朋友。

4. 一些称呼用作称呼语时第一个字母要大写。如:

Thank you, Mother. 谢谢您，妈妈。

Granny, is this your ticket?老奶奶，这是您的票吗？

5. 表示语种、民族、某国人的名词或形容词第一个字母要大写。如：

He can speak some Japanese. 他会说一点儿日语。

Mr Green likes the Chinese food. 格林先生喜欢中国食品。

6. 星期、月份名称的第一个字母要大写。如：

We always stay at home on Sunday. 我们在星期天总是呆在家里。

His birthday is on July 5th. 他的生日是七月五日。

7. 一些大型节日名称的第一个实词的第一个字母要大写。如：

Teachers’ Day is coming. What are you going to give your teacher?

教师节到了。你准备送点什么给老师？

Brad and Li Lei are talking about their May Day holidays.

布拉德和李雷正在谈论他们的五一长假。

8. 由普通名词构成的专有名词词组，除其中的冠词、较短的介词或连词外，每个词的第一个字母都要大写。如：

We are going to visit the Great Wall next week.

下周我们将去参观长城。

Would you like to climb Qomolangma? 你想爬珠穆朗玛峰吗？

9. 常用语OK总大写。

——How is your father? 你的父亲身体怎样？

——He is OK. 他很好。

——Let’s go swimming. 我们去游泳吧！

——OK. 行。

10.一些缩写词的每个字母都要大写，No.、Nov.等只第一个字母大写。如：

USA(=the United States of America) 美国 UN(=United Nations) 联合国 WTO(=World Trade Organization) 世界贸易组织 I’m No. (=number) 1. 我是一号。

11. 人名前的称呼或头衔第一个字母要大写。如：

Mr Smith lives in China. 史密斯先生住在中国。

Miss Green teaches us English. 格林小姐教我们英语。

Uncle Wang is such a friendly man that he always helps others.

王叔叔是一个如此热心肠的人，以至他总是帮助别人。

12. 大型会议、文件、条约名称的每个实词的第一个字母都要大写；书名、报刊名等的第一个字母要大写；文章标题中的每个实词的第一个字母都要大写。如：

China Daily中国日报 How to Learn English 如何学习英语

13. 直接引语中，句首字母要大写。如：

“Then,” I said. “You have been making a mistake, and the letter is not in the apartment.”

“那么”，我说“你一定弄错了。这封信并不在那栋房子里。”

14. 诗歌的每一行的第一个单词的第一个字母要大写。如：

I’ll Try 我要试试看

Christina Rossetti 罗塞蒂

The little boy who says “I’ll try”, 说“我要试试看”的小男孩，

Will climb to the hill-top. 他将登上成功的顶峰。

The little boy who says “I can’t”, 而说“我不会”的小男孩，

Will at the bottom stop. 他将在山脚下止步不前。

“I’ll try” does great things every day, “我要试试看”每天在干大事，

“I can’t” gets nothing done. “我不会”只能让你一事不成。

Be sure then that you say “I’ll try”. 因此你务必说“我要尝试”。

篇5：英文字母手写体训练

字符识别长期以来都是采用传统的识别方法, 对印刷体字符的识别率一般只是稳定在96%左右, 未能进一步提高, 而对手写体字符的识别, 其研究还处于探索阶段, 其识别率还相当低, 因此, 为了提高识别率, 就必须寻求新的方法和途径。

20世纪80年代中期, 人们已经开始利用人工神经网络解决手写体数字识别问题。人工神经网络为OCR研究提供了新的手段, 它具有一些传统技术所没有的特点:1) 具有很强的分类能力, 可以在特征空间内形成任意复杂的决策区域;2) 硬件实现后的神经网络分类速度比传统方法快得多;3) 分类器便于训练, 无需人为过多的干预。特别是对手写体字符识别问题, 神经网络技术更显示出独特的优越性。

目前研究的神经网络字符识别系统可划分为两大类.第一类系统实际上是传统方法与神经网络技术的结合, 这也是本文采用的方法.这类系统分为两块, 第一块主要完成样本模式预处理和字符特征抽取任务, 第二块是用前面获得的模式特征来训练神经网络分类器, 从而达到识别字符的目的。这类系统充分利用了人的经验来获取模式特征以及神经网络的杰出分类能力来识别字符, 是人们通常采用的方法。第二类系统省去了特征抽取工作, 整个字符直接作为神经网络的输入, 这类系统的神经网络结构的复杂度大大增加了, 首先输入模式维数的增加导致网络规模的庞大, 使得网络的训练、学习非常困难。此外神经网络结构上要消除模式变形的影响。通常这类网络都采用局部连接的方式减少网络的复杂度, 并采用共享连接权的策略增强网络抗变形 (输入模式) 的能力。

由于人工神经网络具有并行处理和很强的容错性等特点, 因此有可能大大提高手写体字母数字识别的准确率和速度。目前神经网络手写体字母数字识别系统的识别水平已与传统模式方法相当, 且大有提高的余地。本文阐述了利用BP网络进行手写体字母 (小写) 、数字识别的一些尝试, 取得了令人满意的测试结果。

2 预处理和特征抽取

2.1 样本集的获取和预处理

实验中所用的手写体数字样本集由1000个数字组成, 它们是在屏幕上随意书写后, 由象素点提取程序提取数据并存入磁盘文件, 每个数字由6×8的网格数据组成。

实验中所用的手写体小写字母样本集由400个字母组成, 它们也是在屏幕上随意书写后, 由象素点提取程序提取数据并存入磁盘文件, 每个数字由8×10的网格数据组成。

图1给出了部分原始数字图象和处理后的图像样本和部分原始字母图像和处理后的图像样本。

2.2 特征提取方法

字符是由弧线和直线构成的, 弧线的弯曲方向和程度不同, 字符的形状也就不一样。但是同一类不同形状的字符, 它的端点数、交叉点数, 点与点之间的相对位置及弧线的弯曲方向基本上是稳定的。而这些特征反映了字符的拓扑结构, 是字符的重要特征。

我们所采用的特征提取方法是:在手写 (用鼠标模拟) 过程中, 由于鼠标会在屏幕上留下轨迹, 所以只要从鼠标按键到鼠标起键, 分别记录下鼠标经过的最大最小横纵坐标值, 就可以分别将数字、字母划分为6×8和8×10的结构 (如图1所示) 。在确定好字符所占的区域之后, 对于每一个网格, 按照12×16的点阵提取象素点, 如果在12×16的点阵上存在象素点的象素值为字体颜色, 则认为相应网格取值为1, 否则取值为0。

例如:图1中数字2提取的特征值为:

0011100100100000100000100001100011000110001111111

字母a提取的特征值为:

00111000010011000100010010000100100001001000110010011100110101000110001000000001

所得到的数据作为神经网络输入层的输入数据。

在生成训练集时, 不但要把上述数据存入磁盘文件, 同时, 还要将目标值 (数字2和字母a) 也分别写入磁盘文件, 作为训练集数据。

3 识别和训练

3.1 神经网络的结构及其优化

我们采用的是误差反向传播的BP网络, 选一层隐含层, 网络结构如图2所示。输入层神经元的数目即为输入样本的维数 (数字48, 字母80) , 输出层的神经元数目为10 (数字) 和26 (字母) , 分别对应10个数字和26个字母。至于隐含层神经元数目目前只有在实验的基础上经验选取, 在实验中, 我们将数字识别神经网络的隐含层神经元设置为20, 字母的设置为40。

3.2 识别的实现

构造48×20×10的前馈BP神经网络模型用于数字识别 (字母识别用的是80×40×26) 。输入层含有48个神经元, 对应图像被划分为48个小区域, 每个神经元取值范围可为0或1。若取0, 表明该区域内不含任何图像信息, 若取1, 表明该区域内含有图像信息。输出层是10个神经元, 对应10个数字, 隐含层是20个神经元。所有神经元都采用Sigmoid特性, 即。网络输出误差的度量采用均方误差准则, 即。式中Ti为第三层 (输出层) 第i个神经元的目标输出;Vi L为输出层第i个神经元的实际输出。

网络采取全连接的方式, 它的自适应过程采用误差逆向传播 (EBP) 的学习规则, 学习过程中各神经元之间的连接权重按下列关系进行调整:

W (n) =W (n-1) +ΔW (W (n) 为第次迭代中的权重值, ΔW为本次权重调节量)

对于输出层, 权重调节量为:

ΔWqm (n) =ησmVq+μΔWqm (n-1) (η为学习率0<η<1、μ为惯性系数0<μ<1)

其中, σm= (Tm-Vm) (1-Vm) Vm (T为目标向量, V为输出层输出向量)

对于隐含层, 权重调节量为:ΔWij, k (n) =ησi, kVj, k-1+μΔWij, k (n-1) (η为学习率、μ为惯性系数)

其中, (假定神经元h在K+1层上, i在K层上, j在K-1层上)

本实验中, 经调试发现, 取η=0.1, μ=0.4时, 学习与收敛速度为最佳。

3.3 网络的训练

训练程序中, 将随机数函数产生的随机数作为本次训练的记录序号, 从训练集中取出输入向量以及目标向量, 根据上面的误差反传算法调整网络神经元之间的权重, 每次训练10000次, 所得到的误差如图3、图4所示:

4 结论

本系统对数字的识别率相当高, 平均识别率达到98%, 而对小写字母的识别率则较低些, 但平均识别率仍可达到90%。分析认为, 对于数字识别所使用的训练集比较大, 有1000多条, 而用于小写字母识别的训练集则比较小 (产生训练集比较繁琐) , 仅有300多条, 是产生这个差别的原因。实验结果图如下:

本系统采用Visual Basic6编写, 在Windows 2000环境下调试通过。实验结果表明, 本系统具有运算速度快, 识别率较高的特点。数字的平均正确识别率达98%, 字母的平均正确识别率在90%左右, 并具有良好的容错能力。如果让系统学习更多的样本, 则识别率将会进一步提高。

参考文献

[1]冯天瑾.神经网络技术[M].山东:青岛海洋大学出版社, 1994:44-50.

[2]施善昌.自动识别原理与应用[M].北京:人民邮电出版社, 1989

[3]曹焕光.人工神经元网络原理[M].北京:气象出版社, 1992

[4]焦李成.神经网络系统[M].西安:电子科技大学出版社, 1990

[5]王明会, 潘新安.神经网络在手写体数字识别中的应用[J].通信学报, 1992, 13 (5) :60-64.

[6]Haykin S.神经网络的综合基础[M].2版.北京:清华大学出版社, 2001:156-252.