清贫课件内容简介

2024-04-22

清贫课件内容简介(精选7篇)

篇1:清贫课件内容简介

清贫课文主要内容

清贫课文主要内容

我从事革命斗争,已经十余年了。在这长期的奋斗中,我一向是过着朴素的生活,从没有奢(shē)侈(chǐ)过。经手的款项,总在数百万元,但为革命而筹(chóu)集的金钱,是一点一滴的用之于革命事业的。这在有些人看来,颇(pō)似奇迹,或认为夸张;而矜(jīn)持不苟(gǒu),舍己为公,却是每个共产党员具备的美德。所以,如果有人问我身边有没有一些积蓄,那我可以告诉你一桩趣事。

就在我被俘(fú)的那一天---一个最不幸的日子,有两个兵士,在树林中发现了我,而且猜到我是什么人的时候,他们满肚子热望在我身上搜出一千或八百大洋,或者搜出一些金镯(zhuó)金戒指一类的东西,发个意外之财。哪知道从我上身摸到下身,从袄领捏到袜底,除了一只怀表和一支自来水笔之外,一个铜板都没有搜出。他们于是激怒起来了,猜疑我是把钱藏在哪里,不肯拿出来。他们之中有一个,左手拿着一个木柄(bǐng)榴弹,右手拉出榴弹中的引线,双脚拉开一步,做出要抛掷的姿势,用凶恶的眼光盯住我,威吓〔hè〕地吼道:

“赶快将钱拿出来,不然就是一炸弹,把你炸死去!”

“哼!你不要做出那难看的样子来吧!我确实一个铜板都没有;想从我这里发洋财,是想错了。”我微笑着淡淡地说。

“你骗谁!像你当大官的人会没有钱!”拿榴弹的.兵士坚决不相信。

“绝不会没有钱的,一定是藏在哪里,我是老出门的,骗不得我。”另一个兵士一面说,一面弓着背重来一次,将我的衣角裤裆过细地捏,总企望着有新的发现。

“你们要相信我的话,不要瞎忙吧!我不比你们国min党当官的,个个都有钱。我今天确实是一个铜板也没有。我们革命不是为着发财啦!”我再向他们解释。

等他们确知在我身上搜不出什么的时候,也就停手不搜了,又在我藏躲地方的周围低头注目搜寻了一番,也毫无所得。他们是多么的失望呵!那个持弹欲放的兵士,也将拉着的引线仍旧塞进榴弹的木柄里,转过来抢夺我的表和水笔。然后彼此说定表和笔卖出钱来平分,才算无话。他们用怀疑而又惊异的目光,对我自上而下地望了几遍,就同声命令地说:“走吧!”

是不是还要问问我家里有没有一些财产?请等一下,让我想一想,啊,记起来了,有的有的,但不算多。去年暑天我穿的几套旧的汗褂裤,与几双缝上底的线袜,已交给我的妻子放在深山坞(wù)里保藏---怕国军进攻时,被人抢了去,准备今年暑天拿出来再穿。那些就算是我唯一的财产了。但我说出那几件“传家宝”来,岂不要叫那些富翁们齿冷三天!

清贫、洁白、朴素的生活,正是我们革命者能够战胜许多困难的地方!

篇2:清贫课件内容简介

众所周知,选入中学语文教材的文学作品大多是“依照美的法则创造出来的”(叶圣陶《文学作品的鉴赏》),都是“以语言或它的书面符号……文字为物质手段,构成一种表象和想象的形象”,“作用于欣赏者的再创造的”(王朝闻主编《美学概论》)。因此,语文课件应当也能够调用多种媒体,实现配乐朗诵、图像显示、录象播放等多种功能,使得语言文字声情并茂、形象可感,从而最大限度地调动学生的想象和联想,引导他们透过语言文字这一“思维外壳”,去接受作者的审美经验,感知形象,体会情味,领悟理趣。

但是,在实际的语文课件的使用中经常出现由于运用过滥,导致结果适得其反的现象。课件展示的内容多而繁杂,看的、听的、画的、唱的、演的应有尽有,铺天盖地,光怪陆离,令学生眼花缭乱,应接不暇。一节课下来,学生在课堂上是轻轻松松、快快乐乐,下课后却发现课堂上并没有留下多少有用的东西,对课文并未深入下去,甚至于一节课下来,部分学生还不能准确、流利地读通文本,更谈不上掌握思想主题、理解文本的丰富内涵、感受艺术特色并进行有效的语言训练了。这样的语文课件只是迎合了学生(尤其是低年级学生)追求新鲜的猎奇心理,某种程度上也刺激了学生隐藏的浮躁情绪。这样的语文课件冲淡甚至代替了学生对文本的接触和深入,本末倒置。语文课低效甚至是失败的原因可能是多方面的,但语文课件的内容展示不当也是一个重要原因。

那么。语文课件应该展示什么呢?

重要作家的介绍。阅读中“知人论世”是个重要的读书方法。了解作者的人生经历,了解作者的思想观念、创作风格等,可以帮助学生站在作家的立场上解读文本,真正地去把握作者的写作意图,从而领略意趣、理趣。另外,作家尤其是创作大家的经历、创作总是与时代风云紧紧结合在一起,了解一些作者(尤其是文学大家)的特殊经历,对于丰富学生的文史知识、文学史知识、激发学生的读书兴趣大有裨益。在语文课件中,文学作品的作者的人生经历、创作风格、创作成就、经典话语、别人对其代表性评价等等都可以作为课件展示的内容。同时,精选展示几幅作者的经典照、故居照、手迹照等会带给学生历史感,为学生创造出有利于学习的情境,并可以激发学生课后进一步了解作者和他的作品的兴趣。传统的教学辅助工具如黑板等由于自身的限制,对以上这些无法有效地展示。当然,有关作家的资料数不胜数,纷纭繁杂,我们需要在大量占有的同时加以甄别、筛选,对于不同的课文,也没有必要面面俱到。如学习经典课文《背影》,制作的课件可以介绍作者朱自清“宁愿饿死也不领美国的救济粮”这种坚贞不屈的经历,介绍朱自清清新质朴的创作风格及代表作品如《桨声灯影里的秦淮河》《荷塘月色》《匆匆》等等,可以展示朱自清本人及其故居(如江苏扬州就有朱自清的故居)的照片等。

与文本相关的内容。毫无疑问,课件中关于文本内容的展示对于最大化地发挥语文课件的作用具有重要的意义。关于文本写作的背景资料、文本中涉及的事、物图片都对帮助学生深入、准确地走进文本有着重要的作用。教学《阿长与<山海经>》,展示文本的写作背景资料,可以让学生领会到鲁迅在充分感受到现实生活中的世态炎凉后,转而通过回忆往事来寻求安慰、歌颂普通劳动人民的深意。学习《核舟记》,展示核舟图片以及中国古代、现代微雕艺人的艺术品,这样必然会弥补学生对核舟及微雕艺术了解甚少的不足,同样也会让学生在欣赏、惊叹微雕艺术品的巧妙绝伦的同时感受中国劳动人民的智慧和精湛的技艺。当然,并不是文本中涉及到的事物均适合用课件展示。有时对文本中的物件作不必要的图形展示会在无形中束缚学生丰富的想象力,削弱文本本来具备的对学生思维的多向重构功能,从而浅化了文本的内涵,这样的课件使用效果只能是适得其反。

教学过程。随着现代教学技术培训的不断推进和普及,广大的语文教师制作的语文教学课件精致、美观、全面、详尽。有的教师将课堂教学的每个问题均用课件展示,课堂教学过程中教师提一个问题,点一下鼠标,学生忽而看屏幕,忽而阅读文本,忽而思考……这样造成教师为鼠标所控制,学生跟着老师实际上也是跟着鼠标应付不迭,课堂节奏出现不必要的紧张,甚至是混乱。其实,教师课堂提问不借助于课件而直接通过口头,对于学生的听力是一种很重要的训练,而听力正是语文学科的培养目标之一。而且,师生面对面的语言交流,简洁、真诚,更能营造一种和谐的课堂氛围。这对于一节课而言是多么的重要啊!当然,一组精练、总领全文的“问题组”一次性地展示出来,学生带着一个“问题组”阅读文本,结合问题深入文本,接受启迪,感悟、内化,提高了学生的学习效率从而提高了课堂效率,那又是必要的。值得注意的是,有的教师在课件中将教学的流程以精当的表述呈现出来——如“读一读”“想—想”“品一品”“议一议”“练一练”等——这些既体现了教学过程又体现了学生学习的过程(也是方法),这应当值得学习、借鉴。但有的教师把课件当成了板书的替代品。他们只是把教案上的文字打进电脑,用演示文稿形式输出,在电脑上或投影屏幕上加以演示而已。如有位教师制作的鲁迅的《故乡》这一篇小说的课件,全篇的内容就是文字材料的说明,什么作者的介绍,什么时代背景介绍,什么文章的主题,什么文章的结构,什么小说的人物形象概括等等。虽然是运用了现代科技手段上课,但其作用却依然与传统手段无甚差别(甚至效果还会更差,因为内容被固定死了),只是用电脑代替粉笔板书或幻灯投影的工作而已。这种情况其实仅仅是形式上的多媒体课件,只注重手段(工具)的“多媒体课件”,而实际上已经脱离了多媒体教育的意义,都无法体现课件作为高科技教学手段在语文教学中所应发挥的作用。

声音资料。以往的黑板展示的教学内容是视觉化的,后来虽有录音机的运用,但由于多方面条件的限制,往往不能更好地发挥效果。现代教育技术的发展为声音在语文课堂一展身手提供了极佳的平台。在语文课堂教学中,课文范读、配乐朗诵、背景音乐以及有助于课堂教学的歌曲都为课堂教学插上了腾飞的翅膀,让我们的语文课堂声形并茂,情趣盎然,激发了学生的学习兴趣,大大提高了课堂效率,同时也对学生进行了美的熏陶和艺术的感染。比如《在烈日和暴雨下》一文,我们可以选择《二泉映月》,此曲让学生通过听觉上引发的悲凉、凄惨之感去初步感悟主人公祥子在恶劣的环境下拉车的痛苦感受,无形中为完成教学任务铺设了一个台阶。但是,语文课件中的声音内容应适可而止,与整个教学设计应是有机的整体,切不可本末倒置。例如如果教师的朗读水平较高,那就不宜再借助于课件中的朗读音频。课件中的音乐资料不宜太多,否则语文课会变为音乐课,学生的注意力、兴趣被声音吸引,会忽略了对文本的深入和探究。

动态性内容。语文课件还可以展示文本中比较抽象的、暂时与学生距离较远的抽象内容。如《食物从何处来》中“光合作用”的过程,《花儿为什么这样红》中“酸碱性与色彩的关系”“光谱与色彩的关系”等等,这些由于暂时超出了学生的认识水平,也比较抽象难懂,语文课件中的动态展示会化难为易,化看不见摸不着为具体可观。

拓展性资料。“语文的外延与生活相等。”语文课堂教学应围绕文本,又不能囿于文本。语文课件中将结合文本推荐的相关读物、资料搜索的网站网址呈现出来必然可以提高训练要求的明确性,减少学生课后进一步学习的盲目性。

尽管多媒体在教学中发挥着独特的优势——集声音、文字、图像、动画于一体,集知识性、趣味性、生动性于一身,有效地突破了重难点,高效地完成了教学任务,但它毕竟是教学的辅助手段,不能代替教师的一切活动,更何况,有的课文素材不足,课件所起的作用也就更小了。我们在利用语文课件为课堂教学服务时,不能忘记,那是“手段”,是“工具”,课件是为更好地完成教与学的任务服务的,它不能成为牵着教师鼻子走的绳索,而应成为教师“撑杆跳”的跳板。况且,学生创新能力的培养,教师起着至关重要的作用。如果注意不到这些,教学节拍的连贯性、课堂的生动性、师生间的协调合作以及学生主体地位的体现将成为泡影,由此导致的呆板的教学思路就更无法谈及对学生创新能力的培养。

篇3:优化课件界面,突出重点内容

一、利用单点具有较强的引人注目力,突出重点

单独的一个点,其自身没有明显的方向性,只有一种“求心性”的属性。因此,在画面上的一点,不论它是大是小,或在任何位置上,都会使观者的视线集中在它上面,成为视觉中心。也就是说一个点的存在有较强的引人注目力和扩张感,产生视觉中心。在课件制作中,为了突出或强调某一部分的视觉效果,可以将这一部分单独呈现在画面上。

如标题的呈现,通常将文字标题单独呈现在一个画面,由于文字是一种高度抽象的、将信息传达和情感传达完美结合的表意符号,具有极强的思想表现力,能给人丰富的想像空间。文字标题作为画面中的点单独存在,它的注目力与扩张感能引起学生对标题的思索。如果在标题旁插入图片,图片的直观性、形象性更能吸引学生,这时学生的注意力会被分散,不利于学生对主题的回忆与思索。

二、利用两个点并列能产生视觉扩张,引导学生进行对比学习

在画面上有两个点,如果这两个点的大小相当,人们的视线就会在这两个点中反复移动,产生一种“线”的感觉。这种能吸引视线在两点间往返移动的特性,有利于进行对比学习。如在讲解两个设备时,把两个设备放在同一个画面,让学生进行对比异同加深理解要比把两个设备分别放在两个画面的效果好。

如果这两个点大小不同,大的点首先引起视觉的注意,而点越小积聚性越强,人们的视线会逐渐移向小点,并停留在小的点上。在课件画面上,可以把直观性的图片设计为大点,直接强调某内容;而将需要进行理性思维的文字设计为小点,对图片进行补充。这样,学生在看画面时,首先注意到图片,通过图片先获得一个感性认识,再把视线集中到文字上,通过对文字的思考,把感性认识转化为理性认识,对教学信息有深刻地理解与记忆。

三、利用异形点特别注目,强化关键词

当画面上有多个点时,如果其中一个点出现变异,则这个点会引起注意。点的变异形式可以多种:

大小变异:画面上多个点的形状相同,有一点大于或小于其它点,不论这点在哪个位置,将成为视觉中心。在课件中,在一大段文字里可以通过改变某些关键词的字号使其突出。

色彩变异:在画面中某一点的色彩与其它点不同,将成为视觉中心。在课件中,通常对正在讲的内容进行变色,以增强该“点”的视觉冲击力,吸引学生。

形态变异:在画面中某一点的形状与其它点不同,将从背景中突出自身,成为视觉中心。在课件中,一般的构图元素是静止的,如果在画面上插入一个动画,不管它的内容如何,首先成为视觉中心。如果这个动画是对教学内容的解释,可以活跃课堂,帮助学生理解内容;如果这个动画与教学内容无关,就会干扰学生的注意力,应尽量避免。在课件中,也经常用下划线体、阴影等字形来突出重点。

方向变异:在画面中某一点方向与其它点不同,将成为视觉中心。如在课件中,采用“文字块”进行排版时,一般用横排——符合中国人从左到右,从上到下的视觉习惯,如果出现竖排文字块,首先会引起注意。在逐条引出文字时,文字从画面哪个方向出现的动画效果多种多样,只要其中一条出现的方向与其它不同,也将引起注意。

四、利用线条的表情,创造情境

不同方向的线条,具有不同的表情性格,会影响学生的视觉心理。水平线会使人联想到地平线、海平线,给人广阔、宁静、平衡和安定的感觉;垂直线给人庄严、宏伟、高大的感觉;斜线给人跳跃、向上、冲刺前进的感觉;曲线给人动力、优美、韵律感。

在排版时,应根据线条的表情和教学内容的需要选择排列方式。如在画面上展示数量较多的设备仪器时,为了不让学生感觉需要接收很多内容而产生压力,希望学生安静的观察,这时最好按照水平方向排列;如在介绍某位伟人时,为了给学生塑造伟人崇高的精神面貌,这时最好把图片素材按照垂直方向排列;如要体现画面的纵深感,最好采用斜线排列。

五、利用面的分割,优化信息呈现

课件中的画面,首先要根据内容分为信息区和美化区,如果美化区过大,则影响信息量,如果信息区过大,则影响学生的学习效果。在进行版面分割时,既要符合教学原则,又要符合面的艺术原则,一般情况下,信息区占整个画面的60%-70%,教学效果较佳。

六、利用空间特性,呈现主题内容

对于整个画面,视觉中心一般是在画面中心偏上一点,所以重点内容应放在画面中心偏上方。如果要用图案美化画面,一般把图案放在画面边沿,以给主题内容的呈现留下较宽的空间。

另外课件画面中的很多元素都具有方向性,具有方向性的物体会对观看者的视线产生一个引导作用,使观看者的视线沿着该方向移动,所以一般要在物体方向的前方留有足够的空间,否则会让人感到憋闷。在物体的前方留出较多的空间,能给物体一个运动去处,同时也加深物体的运动趋势,有利于物体本质的呈现。

在我们进行课件界面设计时,如果有意识的利用界面构图各要素的特性,就能根据教师的教学需求,更好的突出内容重点。

参考文献:

[1]项国雄,周勤.多媒体课件设计基础[M].高等教育出版社

[2]游泽清.多媒体画面艺术基础[M].高等教育出版社

[3]谢幼如,等著.多媒体教学软件设计[M].电子工业出版社

[4]陈丽婷,许益成.多媒体CAI课件的用户界面设计[J].中国科教博览

[5]郭秀敏.认知心理与多媒体课件界面设计[J].河北广播电视大学学报

[6]蔡文慧.课件设计中屏幕界面设计应注意的问题[J].南京大学学报

篇4:清贫课件内容简介

在E-learning环境下的教学过程中,多媒体学习资料不可避免地被大量使用。而课程录像作为整个教学中重要的课件部分,往往提供下载或在线点播服务。然而一堂课的长度往往在45分钟以上,而学生希望能在短时间内找到其所感兴趣的知识点并进行浏览。基于语音内容的关键词检索方法正好可以用在这一领域。

为了实现基于内容的语音关键词检索,常用的方法是利用语音识别技术将待检索文件进行全文[1]或部分识别生成词或音节的Lattice[2],再采用文本检索和图搜索算法对识别结果进行整理以找出与关键词匹配的部分。为了获得较可靠的识别结果,该方法对待检索文件的语音质量要求较高,且要求有较大规模的语言模型配合以尽量覆盖语音文件中的所有词汇,避免词表外词OOV(Out-Of-Vocabulary)情况。但课件涉及领域广泛,且其中大量使用专业术语,这将造成严重的OOV问题。除此之外也有直接利用关键词所对应的语音特征,使用连续动态规划的算法在待检索文件中计算置信度,并取其值较高的区域得到检索结果的方法[3,4,5]。这种方法避免了前一种方法所面临问题,但由于很难事先有效地做出索引,大部分搜索在实时状态下完成,引入了较大的实时计算量,不能直接应用在E-learning课件点播这样对实时性要求较高的应用领域。

为此,本文在基于矢量匹配的检索算法基础上做出一定改进,使用一种基于矢量量化结合连续语音识别的检索方法来设计,并实现语音检索系统。该方法在矢量量化阶段对声学模型中的特征矢量进行聚类,并生成基于符号化的码本向量的特征矩阵,这样再使用一种快速的符号匹配算法便大大降低了实时检索时所需的计算量。在利用语音识别算法进行验证的阶段,也采用基于音素(Phoneme)的解码器,从而使整个过程基于声学特征进行,也就最大程度上避免了OOV的问题。

1 声学模型及矢量量化

为了说明矢量量化在系统中的具体应用,本节将首先简单介绍矢量量化的对象,即本系统中采用的声学模型及模型中的特征向量。然后简要介绍系统采用的矢量量化的方法及生成特征矩阵的过程。

1.1 声学模型及特征向量

隐马尔可夫模型(HMM)[6]是语音识别系统中最常用的声学模型。该模型由一组描述观测值和马尔可夫链的概率参数表示。λ=(A,B,π)。对于一个有限状态集合S={s1,s2,…,sN}和t时刻的状态qt有:

表示马尔可夫链上各个状态的转移概率:

表示t时刻处于sj状态且观测值为vk的输出概率:

表示马尔可夫链初始状态的概率分布。

在设计实际系统时,本文利用HTK工具[7]定义并完成隐马尔可夫声学模型的训练。模型采用三音音素(Tri-Phoneme)作为基础单元,每个单元中的有效状态数取为3个(不包括在使用HTK工具训练时定义的起始/终止状态)。其中每个状态采用26维基于MFCC的特征向量来描述,具体来说即为13维的MFCC系数(包括能量E0)及其一阶差分。并且由于采用LeftRight形式的模型,对于转移概率参数A,做出了适当的限制以符合语音信号的实际特征,即:

在输出概率B的定义与描述上,系统采用混合高斯模型(GMM)拟合其概率密度函数。具体地,对于一个状态的输出概率,采用最多4个高斯分量进行拟合。另外,除了根据汉语拼音的音素定义所有三音模型之外,本文还定义了用于表示字与字之间短时停顿的模型“sp”和用来表示较长时间停顿的模型“sil”。

1.2矢量量化及码表

矢量量化技术被广泛用于图像音频的压缩编码,其特点在于有效地对目标向量空间进行划分[8],从而实现聚类,降计算量。

在本系统的设计中,对于声学模型中所有三音音素单元的有效状态所对应的特征向量组成的向量空间,使用矢量量化技术进行聚类。该过程相当于对特征向量空间进行划分,形成有限类别的子空间,这样可以降低整个声学模型中马尔可夫状态的类别数,从而大大加快寻找关键词可能出现片段的速度。本系统具体在实施矢量量化的过程中使用LBG算法对所有状态的特征向量进行训练,并使用欧氏距离作为测度向量距离的标准得到码本。这样经过聚类,本系统中最终使用的码本由482个码字及其所对应的特征向量组成。

至此,原始的声学模型便可以根据码本重新组织。新的声学模型的数据结构在尽可能多地保留原声学模型信息的基础上进行了简化,以便考虑在之后用于搜索过程中可以提高查找的效率。这一数据结构中声学模型中某三音的一个有效状态的信息在文件中存储的格式即如图1所示。其中第1行为该状态在码表中的码值,第2-4行分别记录该向量对应的三音中第一个音,中心音以及最后一个音。第5和第6两行记录了该状态前向允许状态和后向允许状态的码字,并以‘-1’表示不存在符合条件的情况,这些信息一起可以还原出完整的三音。比如对于图1中码值为411的状态,其前向允许状态59所对应的模型中,三个音分别为{h n sh g d ch wh s r zh k}、{u3}和{a3 aa3een3},且可接三个音分别为{h g wh}、{u3}和{a3 aa3 o3 ee3een3}的前向允许状态178。这样,状态178+59+411就可以表示模型中所有以{h g wh}、{u3}和{a3 aa3 een3}作为三音的单元。数据结构中的最后一行保存的是模型转移概率的值,即Aii和Aii+1。

另外,对于每个状态的输出概率参数B,需保存用于拟合其输出概率分布的高斯分布。在本系统中模型中所有使用的高斯分布也都经过编号(共1775个)并保存其均值与协方差矩阵,因此,对于每个状态保存用于拟合其输出概率密度函数所使用的高斯分布的编号及其权值。如图2所示。

特征矩阵的建立相当于对每一个音频文件内部的声学特征做出一个简单的编码,使之成为一个符号集合。特征矩阵为一个二维矩阵,保存与语音课件中每一帧的特征向量最相似的若干状态的码值。这里选取这些状态时使用最近邻原则,根据语音帧所计算出的特征找到模型中与之欧氏距离最近的若干状态予以保存,并根据相似度进行排序。对于具体保存状态的个数由实验中得到的经验数据确定,具体在第5节中分析。

2 快速匹配算法的设计

快速匹配算法用来初步处理关键词检索请求,其目的在于迅速找出关键词在语音课件中可能的出现位置(包括起始点和终止点)。为此,该算法必须高效完成搜索特征矩阵的工作,由于是初步检索,对检索的正确率要求不是很高,但需要保证较高检出率,并将结果交给后续验证部分筛选处理。

2.1 关键词状态序列

关键词的输入为中文,因此在进行匹配算法前需要对其进行转换,使之成为状态序列格式的符号串。在这一过程中,输入的关键词首先通过词典文件转换成音素串的形式,这里需要在字与字之间插入表示短时停顿的‘sp’。接着将音素串中相邻的音素进行组合,形成三音模型的符号串。

这样输入关键词的序列就通过转换与特征矩阵中的符号一致,并可以进行搜索匹配。

2.2 快速搜索算法

对于关键词状态序列S={s1,s2,…,sk},由于实际语音在各个状态上停留的长度会根据相应音节的长度及说话人的习惯而不同,因此,实际候选结果段的状态序列应具有形如S'={s1*,s2*,…,sk*}的形式,其中*号表示连续多个相同状态的重复。在设计匹配算法的时候,还应考虑序列由于噪声干扰等原因出现的断裂和缺失等情况。具体来说,应从以下几种情况进行考虑:

(1)状态序列未能包含关键词序列中开始的若干状态,即S'={si*,si*+1,…,sk*}其中i>1;

(2)状态序列未能包含关键词序列中终止处的若干状态,即S'={s1*,s2*,…,sj*}其中j<k;

(3)状态序列未能包含关键词序列中其他若干部分的状态,即S'={s1*,s2*,…,si*,sj*,…,sk*}其中j-i>1。

以上一种或多种情况可能在一条搜索路径中同时出现,因此在搜索过程中需要设定一组门限值来限定允许出现状态缺失的长度及次数。为此规定θloss_len为状态缺失长度门限,即状态序列中缺失的连续状态数少于θloss_len时,即:

情况(1)中:满足i-1<θloss_len;

情况(2)中:满足k-j<θloss_len;

情况(3)中:满足j-i<θloss_len)。

则仍认为该状态序列为候选序列。

另规定θloss_num为缺失次数门限,即状态序列中出现情况(1)、(2)和(3)的次数总和若小于θloss_num则认为该状态序列仍为候选序列。

搜索过程在特征矩阵上逐帧进行,搜索时定义若干条路径用以记录搜索的当前状态及其对应的起始终止位置。由于特征矩阵中的状态都经过排序,故对于每一帧来说,搜索自上而下查找与关键词状态序列相匹配的对象,若找到则将当前帧记录到一条候选路径中。另外,由于存在前面所述的序列状态缺失情况,特别当遇到某条候选路径出现情况(3)时,当前候选路径无法预测在若干帧之后是否会出现序列上的后续状态。因此,我们设计了一个缓冲区,若在缓冲区的范围内,之前发生状态缺失的路径又重新找到了后续状态,则仍然认为该路径为候选路径,否则将其丢弃。如图3所示。

在图3中,搜索路径1和搜索路径2都发生了状态缺失的情况,搜索路径1在缓冲区用完之前未能找到其应有的后续状态而被丢弃,搜索路径2则在缓冲区用完之前重新找到其后续状态,故仍然被作为候选路径予以保留。为了维护各个路径所处于的不同状态,在实现搜索算法的过程中定义了如下包含三种路径的状态集合:

S:{Healthy,Hold,Delete}

其中,Healthy状态表示该路径为候选路径,且经过当前帧的搜索之后成功找到了状态序列的后续状态;

Hold状态表示该路径为候选路径,但在之前某个据当前帧小于缓冲区距离的一帧开始,状态序列的后续序列均未能找到;

Delete状态表示该路径之前处于Hold状态,且当前帧时,处于Hold状态的时间已经超过缓冲区的长度了,可以将其从候选序列集合中删除。因此任何路径只可能在某一帧的时候处于Delete状态。

当利用以上方法对整个特征矩阵完成一次搜索时,在候选路径集合中就包括了所有可能的关键词区间。在具体系统实现中,为了尽量保证检出率,即充分考虑各种状态缺失情况,需将θloss_len和θloss_num设置的相对较大,而由此带来的误报数较多的问题则须由下一部分的验证模块处理,去除候选结果中的错误项。这两个值的设置由实验数据确定,具体见第5节中的分析。

3 利用语音识别验证候选结果

对于快速匹配算法得到的候选结果结合,系统利用逐条进行连续语音识别的方法进行解码。得到的结果与待检索关键词进行比较从而去除误报结果。

3.1 连续语音识别解码

系统中的连续语音识别模块参考HTK中Token Passing算法[9,10]的实现,在音素级对每一个候选结果集中的语音片段进行解码,产生音素串。Token Passing算法实际上就是Viterbi算法的一种改进。由于在大词汇量连续语音识别中声学模型中包含的识别单元(一般为音素)数量比较大,Viterbi算法需要逐个计算从前一帧这些识别单元到当前帧的转移概率大小,计算量过大,Token Passing算法就将每一帧中每一个识别单元抽象成一个Token,保存该单元存在于当前帧所拥有的概率值,并将此概率较小的Token舍弃从而保证合适的计算量。对于第j帧语音各个Token中的概率更新的公式为:

sj(t)=max i{si(t-1)+logaij}+logbj(k)(1)其中,aij和bj(k)即为声学模型中的转移概率和输出概率,这里取对数计算。

在具体的系统实现中,词汇表被构建成树状结构[11],即根据词汇表中所有中文字的音素串序列建立Trie树,树上的节点分为两种类型:Phoneme节点和Word节点。每个中间节点都与模型中的一个实际识别单元(三音音素)相对应,根节点与“Sil”模型对应,两者都为Phoneme节点。而叶子节点为Word节点,记录自根节点到该叶子的父节点的路径所表示的相应中文字。这些特点保证了从该树状词汇表的根节点到叶子节点的每一条路径代表一串可以表示一个中文字的音素。

Token的裁剪算法[12]包括两个部分:(1)对每一帧的解码之前进行,负责根据预设的最大Token数将Token集合的规模裁剪到该最大数以下,这部分通过对所有现有Token根据其中中的概率值进行排序以淘汰末尾若干个概率值偏低的Token来实现。(2)对每一个更新概率值时进行,这里需要设置一个门限,在每一帧的解码过程中将概率值小于此门限的Token舍弃。这一门限在系统中利用前一帧时所有Token中的最大概率乘以一个系数来确定,因此该门限在解码过程中需要动态更新。

3.2 验证筛选

在将所有候选语音段进行连续语音识别解码后,这些语音段就转换成一系列的音素串,将其逐个与关键词所对应的音素串比较相似度,去除相似度较低的条目并得到最终的检索结果。

这里相似度的计算采用Levenshtein距离[13]作为评价标准,根据关键词的音素串长度设定门限,当Levenshtein距离小于该门限时即认为两个音素串相似,并保留该结果并加入检索最终结果集。

4 基于网络课件点播系统的检索平台

在系统实现中,利用上海交通大学网络教育学院的课件点播系统构建了一个用于测试检索的Web平台,其中利用矢量量化生成特征矩阵的过程作为预处理阶段单独运行,生成的特征矩阵文件存放于服务器上。其他检索算法的实现被包装在COM组件中供处理检索任务时调用。系统的工作流程如图4所示。其中右边虚线框中的预处理模块需要在检索前运行。

在课件点播网站上,用户通过输入中文关键词进行课件内容检索,检索请求被发送到服务器端处理,完成后检索结果在用户界面中以下拉列表显示,用户可以点击列表中的结果开始定点播放课件。如图5所示。

5 系统性能分析

在系统中使用的课件单个文件长度在50至60分钟之间。数据从四门不同课程的30个课件中获得,这四门课包括管理学和计算机专业课程,其中两门课授课老师为男性,两门为女性。

5.1 特征矩阵

在特征矩阵的生成过程中,选取保留与特征向量最相似的状态个数对系统性能有着很大的影响。首先,如果保留的状态数不够,可能出现该帧在特征矩阵中对应的那列没有包含正确的状态从而导致搜索算法遇到特征序列断裂的情况。为此定义在保存一定数量状态下的正确状态覆盖率为:

其次,如果保留的状态数过多,会造成特征矩阵文件过于庞大,在检索是增加搜索压力。为此,通过实验分析,我们得出表1中的数据,并最终选取在特征矩阵中每帧保存30个状态。

5.2 θloss_len和θloss_num的选择

θloss_len和θloss_num的大小在搜索过程中决定了算法的容错性能,这两个门限设得越大则越有可能尽检出课件中包含的所有关键词段。但门限设得太大也会使误报率升高,从而使验证算法需要处理更多的候选结果,并影响最终的检索正确率。为了表示不同的θloss_len和θloss_num对性能的影响,这里先定义下面两个性能指标:

由于门限的设置与关键词对应的状态序列长度有关,故设置θloss_len时使用其长度与当前关键词状态序列长度的比值表示,根据表2的数据,在系统实现中采用θloss_len=0.2×序列长度,该结果在θloss_num=4时得到θloss_num对系统的性能影响相对较小,但对搜索算法运行时的性能有影响,表3和表4分别对不同的θloss_len的情况下系统的性能做出分析。其中平均检索时间在Pentium IV 2.8G,1G内存的计算机上运行得到。

5.3 检索系统整体性能

最后,在选定了系统的所有参数后,可以对系统处理检索请求的性能做出评价,这里仍然使用正确率与检出率作为评判指标,表5对不同长度的关键词进行检索的性能做出分析。

可以看出,在关键词长度较短时,相应语音片段也较短,出现断裂、错误的概率相对较小,快速算法中的容错处理能保证较好的检出率。而随着关键词长度的增加,容错算法的性能出现下降。这与传统的基于特征向量空间的检索方法[14]的性能有一定的相似性,但由于验证筛选算法是基于识别的一个过程,又避免了基于纯向量空间匹配算法中关键词长度越长正确率越低的问题(在文献[14]中二字词的检索正确率为67.2%,而三字词为59.5%)。在正确率方面,由于没有像文献[2]中的基于Lattice的检索那样拥有N-best的属性,也没有语言模型的加入,整体性能有改善余地。但考虑到其他实验系统一般都基于新闻联播、演讲等质量较高的文件,而本系统处理的是实际上课的录音,难免受上课老师口音及语速等关系的影响,系统的整体性能基本满足了设计要求且完全避免了OOV问题的影响。

6 总结

基于内容的语音检索涉及到语音识别、搜索、匹配等相关技术。本文通过设计与实现基于矢量量化和模糊搜索配合连续语音识别方法的系统,给出一个应用于实际教学课件语音文件并旨在克服OOV问题的实践方法。其中矢量量化旨在降低实际搜索匹配时的计算时间,快速匹配算法则通过增加容错措施保证在其运行后给出具有较高检出率的候选结果集,而基于Token Passing的简化了的语音识别解码过程被用于最终筛选之前的候选结果。通过实验数据,系统的在处理常规的长度在2至4个字的关键词时有较高的检出率,在正确率方面也总体保持在一个较好的水平。但也仍然有进一步提高的余地,如在关键词长度较长时检出率还需要进一步提高,在关键词长度为常用的2个字的情况下正确率也有一定的改进余地。这些问题可以考虑适当引入额外的容错处理或者在验证筛选时建立适当的语义模型来改进。

摘要:为了在远程教育环境中满足多媒体课件的关键词检索需求,描述了一种基于矢量量化(VQ)及连续语音识别(CSR)的关键词检索系统的设计与实现。该系统首先利用矢量量化算法对声学特征空间进行聚类并生成码本;接着利用该码本对语音文件逐帧进行处理并保存若干与该帧特征最相似的码表向量所对应的码值做成特征矩阵;然后利用改进的快速符号查找算法从特征矩阵中找出若干候选结果段;使用经简化的连续语音识别算法对候选段进行验证筛选,从而得到最终的结果。在此基础上利用一些测试数据给出其性能表现并做出分析。

篇5:评《清贫思想》

自己的一生是个什么样的?自己应该如何生活?在与朋友谈论时,我常常问他们,生命到底怎样度过才算是不浪费呢?谈论的话题往往是金钱,工作,房子,儿女,每当话题谈论到人生境界的时候,我便常常被人笑为迂阔,在今天的生活里,有酒有肉吃,有电视看还要谈论什么人生境界?我常常觉得正在玩麻将或扑克牌的亲人或朋友生活得那样单薄。我们时时都在谈论拥有,谈论股票,谈论金钱,谈论这些浮世之中货真价实把握得住的东西,然而我们真的数过我们的心灵中是否也是青青苍苍呢?还是一旦回到家中便被孤独落寞所包围,不知身是何世。《清贫思想》谈论的便是纯属心灵的事,作者的主人公们为了心灵的安逸自愿选择一种清贫的生活,和一种似乎是很傻的行动,然而在莞尔一笑之后,我们的心灵是否有所触动呢?只要是一个拥有爱美之心,心灵的灵光还未被泯灭的人都会为之感动,为之久久叹然不已。

有一个故事是本阿弥光悦的故事。光悦年轻时,有一次看见小釉屋的宗是所拥有的濑户肩冲的那把有小把手的陶制茶罐,顿时被吸引住了。从此朝思暮想着无论如何也要得到它。但它标价昂贵,要金币三十枚。换算成现代货币的话,简直就是天价。光悦没有这笔钱,但心里想得到这把茶罐的冲动却越来越强烈,以至于茶饭不思。宗是被感动了。他把光悦找来,告诉光悦,他愿意将这把茶罐减价出让给他,光悦断然拒绝了他的好意。光悦认为茶罐本来值三十枚金币,不能让他贬值。于是他将自己庄园卖了,换了金币十枚,又千方百计地筹借了二十枚,分文不少地以最先谈定的价格买下了它。

篇6:苜蓿清贫滋味

草头,又称金花菜,是江南人对苜蓿嫩头的称呼。农历三四月,苜蓿正是枝叶葱茏的时候,掐其嫩头枝茎约一寸许,就是可食用的草头,江浙两省的一些地区,又往往称其为秧草。清明前后,以秧草来烧咸肉河蚌羹,最是当时的美食。

今日的草头上得厅堂,登得樽俎,但在古代,苜蓿的滋味,却是苦涩中带着几分清贫气息。

苜蓿原产伊朗地区,汉代时,出于增强军事能力的需要,在从西域引入良种战马的同时,苜蓿也作为优质的饲料被引入中国。这种含蛋白质极高的植物,在中原很快普及开来,所谓“汉家天马出蒲梢,苜蓿榴花遍近郊”(唐 李商隐《茂陵》诗)。在作为饲料的同时,苜蓿的幼苗也开始成为蔬菜。只是,彼时的苜蓿苗,没有旺油热炒去其苦涩,只是在贫民的餐桌上充馔而已。

在唐诗中,苜蓿开始以饲料之外的姿态进入文学典故的殿堂,唐开元中,在太子的东宫中任左庶子的薛令之,因为单位伙食供应不佳,在单位的墙上发帖抗议:

朝日上团团,照见先生盘。盘中何所有,苜蓿长阑干。饭涩匙难绾,羹稀筋易宽。只可谋朝夕,那能度岁寒?

左庶子在唐代是正四品上,官职不算低,想不到官府供应的伙食竟然如此粗劣:盘中的菜食,惟有一团卖相不佳的苜蓿。唐人以饭粒滑润不粘箸匙为美,而薛令之吃到的却是粘成一团饭勺舀不起的饭,其劣可知。配饭的羹,则稀到筷子捞不起内容物。这样的供应,无怪薛令之要大大不满了。而单位领导唐玄宗见了这样的牢骚,却是不悦,提笔批示说:“啄木嘴距长,凤凰毛羽短。若嫌松桂寒,任逐桑榆暖。”就这待遇,爱留不留。最高领导态度如此,薛令之总算见机,自动称病辞了职回老家。留下个“苜蓿盘”的苦涩典故,来形容教师或底层官员的清贫生涯。

篇7:清贫与轻贫

百分之九十五的中国知识分子有必要看清现状,轻度的贫穷是他们共同的命運。他们的境遇虽好过工人、农民,却远逊于那些“生财有道”的贪官和奸商。真正的知识分子倒不在乎轻度的贫穷,他们能从事业中找到快乐,也有功成名就的信念,这项补偿到位了,他们就决不会怨天尤人。

近日,我读罗素的《西方哲学史》上卷,读到一则有趣的故事。古希腊哲学家泰勒斯生性傲岸不群,长期闭门谢客,潜心研究哲学。有一次,他听到愚氓以不恭之词对哲学和哲学家说三道四,嘲笑他是一无是处的傻瓜笨蛋。泰勒斯一怒之下,决定用最有效的方式和最雄辩的事实反击世人,证明他作为哲学家,并不短缺赚钱的本领。那一年希腊全境荒歉,橄榄收成极差,泰勒斯便以低廉的价格大量收购榨橄榄油的工具,翌年橄榄大面积丰收,他再将榨油工具出租,因其在工具租赁业界的垄断地位,索价不菲。事后,泰勒斯将赚来的大笔金钱用于救济穷人,又心安理得地干回他的老本行。古往今来,能赚大钱的知识分子大抵有点接近泰勒斯这种情形,他们甘于轻度的贫穷,乐趣全往事业学问中去寻求,认为奢侈的生活徒然使人脑满肠肥,反而可憎可厌。谁说他们是傻瓜笨蛋?他们是不露声色的聪明人。

世间确实有一些“怪物”,热爱那些不以营利为终极目的、来钱来得最慢的事业,有时要隔数十年,甚至一两个世纪才能见到成效。塞万提斯写长篇小说《堂吉诃德》是一个例子,莱特兄弟发明飞机也是一个例子。凡·高当年画《向日葵》和《鸢尾花》,半文不值,现在这两幅作品的价格却飙升至1亿多美金,变成了天文数字,足以使终身未曾脱贫的“阿尔的倒霉蛋”惊出一身热汗来。

人类的精神财富多半是由清贫者创造出来的,古今圣哲中的孔子、庄子、墨子、苏格拉底、帕斯卡尔、尼采、梭罗等,全是清贫者,他们的思想至今仍未褪失馨香和亮泽。佛祖释迦牟尼出家前贵为王储,却放弃富贵荣华甘于清贫,在艰苦的修行中大彻大悟,普度众生。

传统意义上的中国知识分子口不言利,尽管如此,“清贫”的第一义(“贫寒”)仍嫌太过,第二义(“贫苦而有志节”)甚好,轻贫相当适度,不至于令他们的精神扭曲变形。不少思变者暗暗谋求暴富起来的那天,然而他们使出来的全是跟不上趟的慢动作,想想也就罢了。

上一篇:妨害司法罪的名词解释下一篇:有趣搞笑生日祝福语