语音控制

2024-05-13

语音控制(精选十篇)

语音控制 篇1

语音不仅是人与人之间进行信息交流最直接、最方便和最有效的工具,也是人与机器之间进行通信的重要工具。过去的二三十年中,图形用户界面(Graphical User Interface,GUI)作为人与机器的通信接口取得了很大的进展,但使用GUI仍然摆脱不了手的操作,某些场合仍有不便。因此,语音用户界面(Voice User Interface,VUI)成为人们的下一个目标,人们希望通过声音可以对机器发出指令。

语音识别有着非常广泛的应用领域,例如智能家电、智能家居、智能导航、智能玩具等等,这些领域下,语音识别提高了设备的易用性。另外,在某些场合,操作者需要用手控制其它设备,比如驾驶员驾驶过程中,或者非常强调响应时间,比如军事训练种情况的紧急处置,这些场合不允许操作者进行复杂的操作,语音控制就成为一项必要的选择。

语音识别属于数字信号处理的研究领域,其算法初期是依靠计算机、数字信号处理器等来实现的,但随着微电子学和集成电路技术的新进展,近年来不断有语音识别集成电路投放市场。其中,ICRoute的LD3320就是一款性价比较高的芯片。

1 LD3320芯片介绍

LD3320是一颗基于非特定人语音识别(SI-ASR,Speaker Independent Automatic Speech Recognition)技术的语音识别/声控芯片。该芯片集成了语音识别处理器和一些外部电路,包括ADC、DAC、麦克风接口、声音输出接口等。该芯片不需要外接任何的辅助芯片如Flash、RAM等,直接集成在现有的产品中,即可以实现语音识别/声控/人机对话功能。

LD3320完成非特定人语音识别,每次识别最多可以设置50项候选识别句,每个识别句可以是单字、词组或短句,长度为不超过10个汉字或者79个字节的拼音串。另一方面,识别句内容可以动态编辑修改,因此可由一个系统支持多种场景。

芯片采用48脚QFN塑料封装,工作供电为3.3V。芯片内部电路的简要逻辑图如图1所示。其核心是语音识别运算器,配合输入、输出、AD/DA转换等模块,完成语音识别的功能。LD3320还支持并行和串行接口,串行方式可以简化与其他模块的连接。

2 LD3320的应用电路设计

LD3320的基本应用电路由一个微控制器(MCU)和LD3320组成。电路中的主控MCU芯片,是为了完成对LD3320芯片寄存器的操作。

对LD3320芯片的各种操作,都必须通过寄存器的操作来完成。比如设置标志位;读取状态;向FIFO写入数据;识别完成后获得识别结果等。例如在编辑关键词语时,主控MCU通过把关键词语的拼音串设置进LD3320相关寄存器来完成编辑。

其寄存器大体可以分为以下几类,FIFO数据缓存器、语音识别控制寄存器、音量调节、模拟电路和其它的辅助寄存器。寄存器读写操作有2种方式,即标准并行方式和串行SPI方式。LD3320寄存器的地址空间为8位,编号从00H到FFH,可参考文献[3,4]。

本文选用的主控MCU是51内核的单片机STC10L08XE。演示的软件程序全部烧录在MCU的内置Flash中。主控MCU直接控制LD3320完成所有和语音识别相关的工作。

电源设计可以使用NS公司的LM1117-3.3芯片,为LD3320提供3.3V的电压;音频输入和输出,可以使用柱极体MIC和0.5W的小喇叭;语音识别完成后,为了实现对后续电路的驱动,可以利用MCU的串行口与其它模块进行连接。

主控MCU与LD3320的连接关系如图2所示,MCU的P0端口的8根线和LD3320并行方式连接,控制线也分别连接。此外还连接了复位信号和中断信号。对LD3320来说,复位信号(RSTB)由MCU发出,而中断信号由LD3320发出,MCU负责接收。

另外,还有一些辅助电路,比如麦克风的偏置、喇叭音量的控制,以及电源的去耦等,这里不作详细介绍。

3 LD3320的软件编程

3.1 编程模式

主控MCU通过读/写LD3320的寄存器完成操作。用户有两种编程模式:"中断模式"和"轮询模式"。

所谓中断模式,就是系统的主控MCU在接收到外界一个触发后(比如用户按动某个按键),启动LD3320芯片的一个定时识别过程(比如5s),要求用户在这个定时过程中说出要识别的语音关键词语。过了这个过程后,需要用户再次触发才能再次启动一个识别过程。

所谓轮询模式,就是系统的主控MCU反复启动识别过程。如果没有人说话没有识别结果,则每次识别过程的定时到时后再启动一个识别过程;如果有识别结果,则根据识别作相应处理后(比如播放某个声音作为回答)再启动一个识别过程。

3.2 程序流程

语音识别的操作流程是:

(1)语音识别用初始化(包括通用初始化)。在此步骤中,对各寄存器进行初始化设置。

(2)写入识别列表。LD3320是一个基于词库的语音识别芯片,在此步骤中,应将待识别的短语写入识别列表。列表的规则是,每个识别条目对应一个特定的编号(1个字节),不同的识别条目的编号可以相同,而且不用连续,但是数值要小于256(00H~FFH)。

(3)开始识别,并准备好中断响应函数,打开中断允许位。

(4)响应中断。如果麦克风采集到声音,不管是否识别出正常结果,都会产生一个中断信号。而中断程序要根据寄存器的值分析结果。读取BA寄存器的值,可以知道有几个候选答案,而C5寄存器里的答案是得分最高、最可能正确的答案。

如果不用中断方式,也可以通过查询方式工作。在"开始识别"后,读取寄存器B2H的值,如果为21H就表示有识别结果产生。在此之后读取候选项等操作与中断方式相同。

LD3320芯片还具有MP3播放的功能,在这里不再进行介绍。

4 结论

LD3320的功能是完成有限词组的非特定人语音识别,我们将其应用在一个虚拟环境下战术训练课题中。战术训练中,常常需要下达一些短口令,而在我们所设计的训练环境中,如果口令采用键盘或鼠标的方式进行输入,显然有违设计的初衷。所以,我们使用LD3320设计VUI控制电路,用语音识别的方式,将获得的识别结果再转换成串口信号,输入计算机,达到语音控制的目的。

实践证明,这种方式可以满足语音控制的要求,但是语音识别的速度,即实时性还有待改进。

摘要:语音控制机器已经成为人机界面设计的一种重要手段。LD3320作为一款语音识别专用芯片,集成了语音识别处理器和一些外部电路,实现了有限词汇的非特定人语音识别。文章介绍了LD3320芯片的基本功能、电路设计以及控制软件的编写。

关键词:语音识别,集成电路,LD3320

参考文献

[1]柳春.语音识别技术研究进展[J].甘肃科技,2008,24(9):41-43.

[2]姚天任.数字语音处理[M].武汉:华中科技大学出版社,1992,4.

[3]ICRoute Ltd..LD3320开发手册[EB/OL].http://www.icroute.com/web_cn/DownLoad.html

语音控制 篇2

智能生活,换成简单的说法便是简便生活,动一下拇指,发出点声音,便能解决之前必须手动才能完成的操作。在整个软件行业,不论是苹果手机、苹果电脑,还是百度输入法、腾讯的微信、米聊、UC的浏览器以及新浪的微博等等一些应用程序,都已经成为当下很多人以此取代传统短信进行交流的必备工具,这些软件在手机终端上面都有语音控制的功能。语音控制成了智能的一项标准。

在未来的物联网时代,“语音命令—得到反馈”的互动模式将进一步延伸。生活中的电器将被赋予“说”与“听”的功能,人们的生活将不再需要手动操作。

机器人语音交互实验平台>项目已列入了研究规划。“出发!对1号主变进行巡检。”一声令下,一个身高1米多的巡线机器人自动启动,沿着变电站内的小路,根据指令开始工作。语音控制功能不但能够有效利用用户个性化的语音,提高系统的识别准确率;而且能够提高用户输入词表的方便性和灵活性。随着指令发出者年龄的变化,还可以选择合适的语音替换用户原来的语音模型,使得语音智能平台具备更强的适应性,识别效果不会随着时间变久而变差。

除了在智能机器人开发领域中,智能家居建设方面也开始着重语音控制技术。随着智能家居行业内的大发展,以及随着时间的推移智能家居行业内的技术越来越成熟,同时随着科学技术的突飞猛进以及社会的进步,一切都变得可能,一切都会慢慢实现。手机做到了可以控制智能家居控制系统,只要将家中设置一台中枢式的控制设备,接收手机命令,通过一些技术即可实现随时随地的自由控制、管理家中所有的家用电器,这些操作都可以在手机操控端上完成。那么在手机操控端上加“语音控制”的软件,通过语音声控,给手机发出命令,从而实现语音控制家庭中各种产品,这个也就不会是梦想。

智能语音控制技术在智能家居领域的广泛应用,将实现一加一大于二的效果。在未来,语音控制技术将是智能家居设计方案中的主要部分。语音控制技术的成熟将为物联网的快速发展奠定基础。

Siri与智能语音控制 篇3

在各类故事中,人与机械的交流总是令人充满想象的空间。比如《一千零一夜》中四十大盗的藏宝窟:只要来人说一声“芝麻开门”,大门就会打开;说一声“芝麻关门”,大门则会关上。不过,当计算机出现之初,人们与它只能直接通过机器语言来交流,这些机器语言由成千上万个“0”和“1”组成,并且被打孔机打在长长的纸带上。当DOS和UNIX出现后,就可以通过输入指令来让计算机从事相应的工作。图形界面的出现则是人机交流的一大飞跃,直到今天,无论我们是用鼠标,还是用手指在屏幕上点点戳戳,本质上都是基于图形界面的人机交流。那么,有没有可能我们说什么,就能让电脑执行什么呢?这的确是个很吸引人的课题。从本质上而言,无论智能手机还是机器人,都是电脑的一种存在形式。如果它们能够“听懂”我们的指令,并按照指令来行事,那真是很方便的一件事情。

也许有读者会说,这其实很简单,比如语音拨号,只要说出想要联系的人名,手机就会拨打此人的电话,这个功能在很早以前就已经实现了。不过,这仅仅是最初级阶段的语音识别:它基于的是手机自身的数据库,也是用手机自身的功能搞定拨号;而且,即使用户吐字清晰,并且电话簿没有重名,面对好几个“张军”、“张君”、“章均”,手机也会晕菜,更别提很多地方的用户“王”、“黄”不分等发音的差别了。这样简单的功能,本身已经是out了,让我们看看iPhone 4S搭载的Siri能够做什么。

惊艳的Siri

如果在几个月前看到右上图中的对话,或许你会以为这是一个人在与朋友聊天,而如今我们都知道,这是在Siri在评测中给出的回答。此外,通过网上大量的视频,我们还能够了解到Siri更加丰富的应用,比如设定和优化路线、天气预报等等。Siri的功能实现有着强大的后盾,首先是对话式的界面以及相应的语音识别数据库,其次是基于云计算的数据搜索和服务查询,最后则是各类功能的智能型整合。它的智能化程度超越了以往的各类语音识别应用软件,借助它的算法和数据库,Siri可以判断出你说的地方是宾馆还是超市,你想找的东西是化妆品还是食品。我们可以用一个应用例子来分析Siri都在做什么:对于“I like a romantic place for Italian food near my office(我想在我办公室附近找个浪漫的,有意大利食品的地方)”这句话,Siri 回答:“I am looking for a Italian restaurant which reviews say are romantic near your work in San Jose...(我在寻找一个你在San Jose工作地点附近的拥有浪漫点评的意大利餐馆)”。首先,Siri会根据上下文了解用户的需求条件是办公地点附近的,拥有意大利食品的浪漫之处,进而判断,意大利食品只能在意大利餐馆(要注意到,用户根本没有提restaurant这个词汇)得到,然后,它会通过GPS或者无线基站服务锁定用户大致位置,用云端的数据库搜索(远程平台)寻找该位置附近用户评价为“浪漫”的意大利餐馆,并把结果反馈给用户。

Siri起源于美国政府2003年投资的“个人学习型助理”研究计划,这一计划先后资助SRI International等多家公司和研究机构进行新一代的智能助理的研究,它们能够从经验中学习和推理,并听从指令完成特定的任务。此后SRI将这一部分分离出来成为Siri,又进行了商业融资并进一步开发。2010年,苹果斥资2亿美元收购了Siri,并将Siri应用放在App Store中销售,但在iPhone 4S上市后停止了销售,使之变成目前iPhone 4S独享的功能。而且,它已经被整合为iOS的一部分,可以想象,苹果未来的机型都可以搭载这一功能,而每次对系统的更新也会使Siri的用户受益。

智能语音控制与局限

以Siri为代表的智能语音控制与传统的语音控制相比最显著的区别是前者是模糊的、可学习的,而后者只能使用特定的指令,就像四十大盗的藏宝窟只对“芝麻开门”和“芝麻关门”两条指令产生响应,而智能语音控制则要灵活得多,只要包含有“开门”和“关门”这样的语句,它都会根据上下文环境来判断是否发出开关指令。一个典型的例子是,用户通过Siri提问“纽约的天气如何?”得到回答后,再提问“那么洛杉矶呢?”此时Siri依然会给出洛杉矶的天气信息,而不是到洛杉矶怎么走,或者是洛杉矶有多少人口。不过,智能语音控制实现的条件要求相当高。首先,程序必须要有足够优化的算法,以实现对语音的高效识别和判断。其次,要有足够庞大的云端数据库和足够的带宽,以便执行搜索和反馈。最后,平台要有相应的功能,用户既不能让iPhone 4S去打扫卫生,也不能让它变出一个美女来聊天。

智能语音控制的前景非常美好,Siri也是非常吸引人的功能,但任何事物都有一定的局限性。Siri对语音的识别并非准确无误,发音不准确会造成识别困难,而且目前苹果还没有开放中文的Siri功能,这是因为由单词和中文字组成的句子的语义识别算法有较大差异。此外,模糊化的语音控制本身也是一柄双刃剑,因为要有一定的容错性,因此很难判断接收到的语音和指令是否得到授权。据传苹果准备在iOS 5.1中加入更加基础的应用,如收发电子邮件的支持,添加或删除通讯录等等,这些功能可能需要用户的密码授权才能完成。

其他平台的智能语音控制

尽管苹果不是手机平台实现语音控制的第一家企业,但它绝对是做得最好的一家企业。在智能手机平台上,目前能够与iOS相提并论的只有Android,而且Google公司的搜索引擎无论在功能上还是信息量上都是最出色的,云端技术也非常强大,这也使广大Android用户对类似的功能充满了期待。事实上,早在苹果在系统中植入Siri之前,Android平台上已经出现了大量的语音识别软件,比如日本的NTT Docomo公司提供的Speakey和Voice IT。在Siri大红大紫之后,Iris、Speaktoit等Android平台第三方语音识别软件也借机火了起来。不过,这些软件的“智商”和“能力”都无法与Siri相提并论。我们也希望Google能够凭借自己强大的技术后盾做出类似的应用,不过在Android 4.0中提供的Voice Action也仅仅是过去传统语音识别的增强版。

一些智能型玩具和智能型机器人也能够理解用户的语音并完成一些云端提供的服务,但它们与智能手机平台的侧重点不同。比如腾讯推出的“Qrobot”在娱乐方面的功能就相当强大,可称得上是老少咸宜的互联网应用型智能玩具,连笔者都动心考虑给孩子买一台玩玩。总而言之,目前的智能语音控制技术只能算作刚刚起步,但我们对它的未来充满期待。

语音控制海尔Pad1011 篇4

海尔Pad1011整体采用黑色外观, 配合银色侧边设计, 增添了平板的时尚感。背部采用磨砂材质, 起到防滑的作用又能够避免留下指纹痕迹。机身厚度仅8.6mm, 重量为560g。10.1英寸的屏幕具备178度可视角度, 采用1290×800的高清润眼屏幕, 不仅可以呈现清晰的画面, 同时能够保护用户视力。

Pad1011采用Android2.3系统, 搭载的Tegra3四核处理器, 四颗主核可以提供流畅的网页浏览、高清播放、2D/3D游戏等;而伴核则负责常在待机、处理邮件、收发微博等工作, 以降低功耗, 平衡平板的资源。

作为海尔Pad1011的突出亮点, 具备国内首款语音控制功能, 在车载状态下可实现保持连接的“免提”模式, 提供语音启动导航功能、读邮件信息以及语音控制进行回复, 提供可了安全的驾车环境。

海尔Pad1011还配备了远端屏幕分享技术, 该技术可以实现平板电脑与电视、电脑、手机等设备之间的影片、音乐等的传送, 可将平板电脑上的视频传送到电视上, 也可以将手机上的图片发送到平板上, 实现资源共享。不仅如此, Pad1011的远端屏幕控制, 可以通过操作Pad, 即可将键盘、鼠标等指令传送到远端, 实现多屏合一。

海尔Pad1011在数据传输方面同样采用了前沿技术, 蓝牙4.0能够实现在最低功耗前提下提供极速传输, 最高速率可达25Mbps, 有效传输距离达到了60米。而阵列式双天线布局的WIFI设计, 能保持最强的讯号接收, 最大限度控制无线通信系统的覆盖范围。

语音控制 篇5

Welding Workcell

ABSTRACT: This paper describes work underway to evaluate the effectiveness of voice recognition systems as an element in the control of a robotic welding workcell.Factors being considered for control include program editor access security,Preoperation checklist requirements, welding process variable control,and robot manipulator motion overrides.In the latter two categories, manual vocal control is being compared against manual tactile control and fully automatic control in terms of speed of response, accuracy, stability, reliability.And safety.Introduction

Voice recognition technology is now recognized as a potential means for easing the workload of operators of complex systems.Numerous applications have already been implemented, are in various stages of development, or are under consideration.These include data entry,control of aircraft systems, and voice identification and verification for security purposes.Voice control has also been proposed for use aboard the space station.One prime area for application would be control of some functions of robots used for intraand extravehicular inspection, assembly, repair,satellite retrieval, and satellite maintenance when a crewmember is serving in a supervisory capacity or the system is operating in a teleoperation mode.Voice control of sensors and process variables would free the crewmember’s hands for other tasks, such as direct control or override of the manipulator motion.Similarly, the workload associated with control of many onboard experiments could be eased through the use of this technology.This paper describes the application of voice recognition for control of a robotic welding workcell.This is a complex system involving inputs from multiple sensors and control of a wide variety of robot manipulator motions and process variables.While many functions are automated, a human operator serves in a supervisory capacity, ready to override functions when necessary.In the present investigation, a commercially available voice recognition system is being integrated with a robotic welding workcell at NASA Marshall Space Flight Center, which is used as a test bed for evaluation and development of advanced technologies for use in fabrication of the Space Shuttle Main Engine.In the system under development, some functions do not yet have automatic closedloop control, thus requiring continuous monitoring and real-time adjustment by the human operator.Presently, these ovemdes are input to the system through tactile commands(;.e..pushing buttons.turning knobs for potentiometers, or adjusting mechanical devices).Since the operator monitors the process primarily visually, he must either look away from the process to find the proper button or knob or rely on“muscular memory”much as a touch-typist does.In the first case, the time of response to a deviant condition may be excessive.In the second case, there is an increased probability of a secondary error being introduced by the operator.A voice recognition system could reduce the response time required from the operator.The probability of pushing the wrong button should similarly be reduced.Also, operator fatigue should be minimized.Since the operator can continuously monitor the process during override input, the effect of the change can be observed more quickly.Thus, if the desired value is exceeded and reverse correction is required, it should be accomplished more quickly, allowing less overshoot.This reduction in oscillation about the desired value makes the system more stable.Another factor that can be improved is operator safety.In a safety-critical situation,the robot’s operation can be halted immediately by use of the “emergency stop,’’ or E-stop, mode, which is initiated, conventionally, by depressing a large button.If an operator inadvertently finds himself in a hazardous situation, it may be necessary for him to initiate the E-stop sequence.Should the operator not be within reach of the button,however, he may be unable to take the necessary action, and, as a result, could suffer serious injury.Having the capability of stopping the robot by issuing a voice command could significantly improve the operator’s safety by enabling him to stop the robot even when not within reach of the E-stop button.Manual corrections are occasionally required to adjust the location at which the weld filler wire enters the weld pool.Proper entry location is absolutely critical to sound weld quality.Adjustments are made either by manually adjusting mechanisms that hold the wirefeed guide tube or by issuing tactile commands to a servomechanism.Use of a voice recognition system could eliminate the need for the operator to place his hand within the working envelope of the robot end effector or, if servomechanisms are employed,could improve speed of response and stability.Another aspect of robot operation in an industrial environment that is very important is the security of a program editing capability of the system.Under no circumstances should any unauthorized person be able to enter this programming mode and alter the robot’s program.A voice recognition system can provide the necessary security by allowing access only for individuals who are authorized and whose voices can be identified by the system.Background

Robotic welding is under development by NASA and Rocketdyne for the automation of welds on the Space Shuttle Main Engine that are presently made manually.The programmability of a robot can reduce the percentage of welding defects through a combination of consistency and repeatability unattainable by its human counterparts.To do this, the robot is programmed to a nominal weld path and level of weld process parameters(i.e., current, travel speed.voltage,wire addition rate).Some adjustment of these values is often necessary due to conditions changing during the weld.A human making a manual weld accomplishes this adjustment readily, while a robot must rely on the limited talents of sensors and the ability of the operator to override functions when necessary.System Integration

The basic elements of the workcell system are shown diagrammatically in the illustration.The ultimate goal of the system development work in progress is to generate robot manipulator programs and weld process programs off line, download them to the workcell supervisory computer, then use sensor subsystems to make closed-loop corrections to the robot path and process variables.Offline programming is being done with an Intergraph modified VAX 780/785-205 computer system with Interact color graphics workstations.Deviations between the programmed robot path and the actual required path are observed and corrected by a sophisticated vision-based sensor developed for this application by Ohio State University.This sensor system is also designed to permit measurement of the molten weld pool surface dimensions and correct welding current level to maintain the weld pool dimensions within desired limits.Presently, a number of functions are still controlled manually, and manual overrides capability is required for all functions.As stated in the Introduction, use of voice recognition may improve the accuracy and speed of response of these manual overrides.To explore this technology, a Votan VRT 6050 stand-alone voice recognition terminal has been integrated into the workcell.This system provides continuous speech recognition of up to 10 sets of words with 75-150 words per set.The integration of the voice recognition system is broken into analog and discrete signals for control.The voice recognition system connects to the control computer through a standard RS232-C communications link.Discrete Control Signals

In this project, most of the control circuitry is based on discrete digital signals.This is due to the on/off state nature of the circuits to be controlled in the robot controller.The circuits of the system to be controlled by the voice recognition control computer(VRCC)by discrete signals are the emergency stop circuit and the positive jog and negative jog circuits for motion control.Since the safety of the operator is paramount in any automated workcell, the voice recognition system should be incorporated as a safety feature.To accomplish this, the VRCC has been interfaced into the workcell emergency stop circuit.The emergency stop circuit in the robotic workcell will shut down the welding process and the mechanical motion of the manipulators.Through the use of a digital signal from the VRCC, a relay is energized that interrupts the necessary circuits in the weld power supply and robot controller.With the use of the voice recognition system as a safety control for this workcell, we have added a third level of redundancy into the emergency stopping ability of the operator(in addition to the present emergency stop buttons).Manipulator motions are controlled through an axis select button in conjunction with a positive or negative jog button that is depressed by the operator.Once the operator has selected an axis, he depresses one of the jog buttons for the desired travel distance.This function was selected to be controlled by the VRCC because of its utilization during automatic operation of the manipulator to correct trajectory errors.The circuitry necessary to control this operation draws the signal to ground through the activation of relays for the positive or negative jog motion.Because motion is achieved only as long as these signals are active low.they can be controlled by discrete digital signals from the VRCC.Analog Control Signals

There are many variables that affect the quality of weld during the welding process.but the welding current has the greatest effect over a small range of values.It was for this reason, that the welding current was chosen to be controlled by the voice recognition system.The welding power supply controls the current level through a voltage circuit that uses a range of 0-10 V DC.These voltage values are converted to current levels from 0 to 300 A for welding.A digital-to-analog converter is used in conjunction with a multiplying circuit.The converter allows the VRCC to control a voltage level that is used by the weld power supply to achieve the proper welding current.The multiplier circuit is necessary to allow the weld power supply to be controlled by the other subcontroller used in the workcell.Experimental Investigation

The accuracy and speed of response of corrections to robot manipulator motion and welding process variables made with the VRCC are being compared with those made with the original control system.Step input errors to robot motion and welding current are introduced randomly into the robot program.By graphically recording relevant system output signals,the time required for the operator to detect the change and initiate corrective action may be measured.Response accuracy and stability may also be gaged through similar analysis of the relevant recorded system output signals.Conclusions

Future work will investigate voice control of welding filler wirefeed speed and location of wire entry into the weld pool.Also to be investigated is voice control of welding arc voltage override.Later, restriction of access to the robot program editor by voice recognition may be implemented.The use of voice recognition technology for manual supervisory control of industrial robot systems is very promising.This technology has application for aerospace welding due to the need to have constant human supervision over a multitude of process parameters in real time.Future development of this technology will permit rapid expansion of its application to both robotic and nonrobotic processes.Acknowledgment

Special thanks to Mr.Jeff Hudson of Martin Marietta Corporation for assistance in the preparation of the illustration presented in this article.References

[1] C.A.Simpson.hl.E.McCauley.E.F.Rolland.J.C.Ruth.and B.H.Williges.“System Design for Speech Recognition and Generation.” Hutnnn Factors.vol.27.no.2.pp.115-1-11.1985.[2] National Research Council.Committee on Computerized Speech Recognition Technologies.Automatic Speech Rerop1irior1 in severe Environments National Research Council.1984.[3] E.J.Lerner.“Talking to Your Aircraft.” Aerospace America.vol.24.no.2.pp.85-88.1986.[4] J.T.Memlield.“Bosing Explores Voice Recognition for Future Transpon Flight Deck.” Ariarinn Week and Space Techno/-og!.vol.124.no.16.pp.85-91.1986.[5] A.Cohen and J.D.Erickson,..Future Uses of Machine Intelligence and Robotics for the Space Station and Implications for the U.S.Economy.' IEEE J.Robotics and Automarion.vol.SMC-16.pp.1 11-12 I.Jan.iFeb.1986 [6] “Automation and Robotics for the National Space Program,” California Space Institute Automation and Robotics Panel.Cal Space Repon CS1185-01, Feb.25, 1985.[7] “Advancing Automation and Robotics Technology for the Space Station and for the U.S.Economy.” Advanced Technology AdvisoryCommittee.NASA TM 87566.Mar.1985.使用语音识别技术控制的焊接机器人工作单元

摘要:本文论述了使用声音识别技术的焊接机器人工作单元在工作过程中的效果、程序编辑者接近机器人的安全﹑试行运转的必要性﹑焊接过程的控制变量﹑机器人操作者的动作规范等因素给与考虑。在焊接过程控制和操作动作两个方面,按照反应速度﹑定位精确性﹑焊接稳定性﹑焊接可靠性和安全性把人工声音控制与手工触觉控制和完全自动化控制进行了比较。

绪论

声音识别技术已经成为可能缓解操作者工作负担的一种有潜力的复杂系统。许多应用已经落实,或正陆续开发,或正在研究之中。这些措施包括数据的输入﹑飞机的控制﹑和以安全为目的的语音识别。

许多应用语音控制技术还建议用于太空站.一个主要的应用领域将机器人控制功能用于太空舱内检查、装配、维修、卫星回收、维修卫星,是在船上服务的监督能力和系统运作模式的反馈.声音感应器和过程控制的变数将使船员影响他手上的其它工作,例如直接控制或推翻的操纵议案。同样,利用工作量控制机载实验这种技术可以缓解许多工作负担。

这份文件描述应用语音识别控制的焊接机器人工作单元。这是一个复杂的系统,涉及多个传感器及控制投入各种机械操作件和变化多样的工艺参数。虽然许多功能是自动化,且为人类监督管理能力所控制,但在必要时随时准备超越这些功能。在当前的调查中,在美国航天局的马歇尔空间飞行中心可供商业使用语音识别系统结合了焊接机器人工作单元的技术,这一技术作为试点的评价和开发先进技术并用于制造航天飞机主发动机。在系统开发中,有些功能尚不具备自动跟踪控制,因此需要不断地人力监测和实时调整操作。目前,该系统投入方案是通过触觉指令(即: 推动按钮.旋转电位计、或者调整机械装置)。由于操作过程中,主要监测者必须考虑在远离的过程中寻找适当的按钮或把手或靠像打字员一样那种打字时的肌肉记忆。第二种情况,可能由于操作者的的二次反应而增加了错误发生的可能性。

一个语音识别系统可减少操作者的反应时间。操作者按错按钮的可能性了同样的也会减少。并且,操作者劳累也会大大减小。

由于在方案运行的过程中操作者不断监测,可以更快地观察到运行状况改变所带来的影响。因此,如果超过了预期值,应该更快纠正,,但不能太过度。这对减少振荡,使系统更加稳定的实现了预期的价值。

另一个因素是可以改善操作者的安全.。在一个安全的紧急情况下,机器人的操作者可以采取紧急停止来停止其运行,这种紧急停止模式一般来说是设置一个大按钮,按惯例是一种经常用的方式。如果操作者无意中发现自己在危险的情况下,这时也许他有必要采取紧急停止这种模式。如果操作者不能够按到的按钮,可他也没有能力采取必要的行动时,这样下去,他可能会受重伤。如果操作者者能通过发出声音指令来停止机器人的运行那将会大大的改善操作者的安全,即使操作者在不能按到紧急停止按钮无法停止机器的情况下也将很安全。

手工调整有时候需要适应焊丝填充到焊接溶池中的位置。填充到正确合适的位置是焊接质量的关键。既可通过手工调节机制来控制送丝导管也可给自动控制装置发出移动指令来进行调整。使用语音识别系统可以让操作者者不必再把机器人控制效应得指令文件拿在手中,如自动控制装置被使用,可以改善操作的反应速度和运行稳定性。

另一方面,编辑系统程序权限的安全是工业机器人在作业环境中很重要的一个安全。在任何情况下,任何未经授权的人能进入程序编辑模式,并且可以改变机器人的控制程序。一个语音识别系统,可提供必要的安全,使他们那些久久是获得授权的人的声音,才能被机器人系统识别。

背景

美国航天局正在开发焊接机器人并且焊接自动化设备来代替目前正在用手工焊接的航天飞机的主发动机。使用该机器人的程序,可以通过用手工来难以做到的焊接一致性和重复操作来达到减少焊接缺陷的比例。为此,焊接机可以编成控制额定的焊接通路和所需要的焊接过程参数,(即焊接电流、焊接速度、焊接电压、送丝速度等)。当焊接条件改变的时候做一些有价值调整是很有必要的。一个人用手工来操作焊接时作出调整是很容易的,但是机器人的调节靠传感器的智能和必要的人工操作者的方案调节。

系统综述

机器人工作系统的基本情况如图表所示,最终的系统开发工作是编辑操作的程序和焊接过程生产线的控制程序,下载这些程序到控制工作单元的电脑,然后使用子系统传感器修正机器人的运行路径和过程,使其可变。利用VAX 780/785-205电脑连接到彩色图形处理工作站来进行图表处理实现脱机设计。机器人由于程序编辑和实际需要之间的偏差是通过俄亥俄州大学研究的精密的视觉传感器来发现和纠正的。这种传感系统也设计成允许测量焊接溶池表面尺寸和改变电流大小来调节焊接溶池保持理想的形状。目前,仍有许多功能人工控制,而且各个方面的功能都需要人工的操作。如前绪论中所述,引进声音识别技术可以改进人工操作的准确性和反应速度。为研究这项技术,Votan VRT 6050声音识别单机终端被引入到机器人的工作单元中。这个连续的语音识别系统可以提供多达10套,每套有75—150句话。

把语音识别系统的模拟和离散信号输入控制。语音识别系统通过RS232-C的通信连接到控制主机。

图1焊接机器人系统设计

离散控制信号

在这个项目中,大多数控制电路是基于不同的数字信号。这主要是用在一些国产性质的机器人控制器上的。通过语音识别技术控制的计算机来控制的电路系统是通过一种离散信号来控制,这种信号有紧急停止电路和积极响应和消极响应电路的功能。

因为任何自动化工作单元中操作者的安全是必须保障的,所以应把语音识别系统的安全也考虑在内。为达到这一目标,贞技术已引入紧急停止电路的工作单元。机器人工作单元中的紧急停止电路将会停止焊接过程的终止操作者的操作。通过使用数字贞信号,需要中断焊接动力供电线路和机器人控制器的继电器被广泛使用。由于在这一工作单元中使用的语音识别技术这一安全系统,我们又增加了第三种供选择的紧急停车的方案(除了现在已经有的紧急停车按钮)。

方案是通过操作者在轴配合正按钮或负按钮之间选择来实现控制的。一旦操作者选择了轴,它可以在理想的距离之内控制负按钮。这种功能的选用是通过控贞信号来控制的,因为贞信号的使用在自动操作中可以纠正运行的错误。在这一操作中有必要通过继电器的正负极的地面信号来达到目的。只因为这些信号很微弱才能达到目的。他们可以通过贞信号远距离控制。

模拟控制信号

有很多因素影响焊接过程的质量,但是焊接电流对焊接质量的影响绝不是一个小的因素。正因为如此,所以焊接电流被选择为声音识别系统控制的对象。

使用0—10V直流电压来控制焊接电源从而控制电流大小,这种电压可以使电流在焊接过程中从0—300A之间变化。数子—模拟转化器配合的电路在广泛的使用。这种转换器允许贞信号控制电压的大小从而使电源能提供合适的焊接电流。这种电路必须允许焊接电源通过工作单元中的其它辅助设备来控制。

实验研究

在准确性和反应速度方面通过贞信号控制的各种焊接过程与原始的控制系统进行了比较。目前焊接机器人操作的的输入误差提和焊接电流已经被引入到机器人程序中。通过图表记录了系统相关的信号,可以通过操作者发觉错误和纠正这一错误所需要的时间来衡量。反应的准确性和稳定性也可以通过类似的记录仪器来分析系统信号的输入。

结论

今后的工作将会把语音控制技术应用到焊丝填充速度焊丝填入溶池位置的控制,也会将该技术用在弧焊电压控制上。以后,那些现在在机器人编程受到限制的的方案在采用语音识别技术之后有可能实现。

利用语音识别技术控制工业机器人系统非常有前景的。由于航空焊接需要大量人力监管过程实时参数控制所以这项技术已申请用于航空焊接。这一技术的未来发展将可迅速扩展为机器人的应用和非机器人的处理过程。

致谢

在此特别感谢Martin Marietta 公司的Mr.Jeff Hudson协助编作本篇论文。

参考文献

语音控制 篇6

关键词:语音控制 安全保障 蓝牙 车用系统 模块化

中图分类号:TP273 文献标识码:A 文章编号:1674-098X(2016)02(b)-0007-02

随着信息产业的快速发展,简单的控制操作机器已经不能满足人类的欲望,利用语音识别技术让机器理解人类的语言,以及实现人机交互成为新的研究内容。对用户来说,这种人机交互的方式当是最自然的一种方式。同时,使人们在车内的时间也可以产生许多的综合效益,将成为未来汽车厂商竞争的焦点。依靠大量物理按钮的传统车载终端无疑分散了驾驶者的注意力,非常危险。在这种情况下,语音识别技术被日渐应用在汽车上来实现一些智能操作。使车主“只动嘴不动手”的车载语音识别技术将是一个非常有效的解决方案。

基于此,笔者创造性地提出基于QNX的车机蓝牙无线监控系统,运用模块化的设计理念,采用蓝牙短距离无线传输技术、体征监测技术和语音识别技术,完成驾驶员与车载终端的无线交互。该方案不仅增强用户操控的便捷性,对于提升汽车品牌人性化方面和行车安全系数也具有极其重要的意义。

1 方案介绍

1.1 人机交互模块

该模块以蓝牙耳机为载体向车载终端发送请求命令,或主动接收推送信息,以实时监测和显示车辆的运行状态参数。方案采用基于Multi-agent、面向任务的人机交互框架。将人的命令通过人机交互模块,转换为汽车ECU控制的信号,使人与车和谐统一起来。蓝牙是实现无线通信的硬件基础。该方案采用的是ROK101007/1模块,支持USB、UART和IIC,具有声音和数据传输功能,符合蓝牙1.1版本并通过了FCC/ETST认证。

1.2 传感器模块

该方案采用的是MEMS传感器与光纤光栅传感器相结合的传感器监测技术。MEMS传感器是采用微电子和微机械加工技术制造出来的新型传感器,将微电子技术和精密机械加工技术融合在一起,实现微电子与机械系统的一体化,其体积和能耗小,可实现许多全新的功能,便于大批量和高精度生产,单件成本低,易构成大规模和多功能阵列。光纤布拉格光栅传感器的传感信号为波长调制,测量信号不受光源起伏、光纤弯曲损耗等的影响,是实时生命体征监测系统的理想选择。

根据两种传感器的特点,在驾驶座椅背上安装光纤光栅传感器,用以对驾驶者进行生命体征的实时监测。在汽车中控方向盘、底盘安装MEMS传感器,对汽车行驶状况进行监测并及时反馈。可以说,该模块给驾驶者和车辆提供了全面的保护,大大增加了行车的安全性。

1.3 语音识别模块

识别系统本身由训练和识别两个部分组成:训练就是建模的过程,预先分析出语音特征参数,制作成语音模板存放在语音参数库中;识别过程就是把得到的语音参数通过处理与库中已知参数模板作对比,采用判决方法找到最接近语音特征的模板,就可得到识别结果。这一过程由固定在车载终端中的微型计算机实现,计算机中存储有语音数据库,并可以对声音信号进行处理。

鉴于语音识别技术还不够成熟,同时驾驶环境复杂,这个模块多用于对驾驶者对汽车非的驾驶性操作,不仅使驾驶更加智能高效,还可以大大减少非驾驶性操作对驾驶者的影响,使驾驶者更能全身心投入到驾驶中,极大地避免了安全事故的发生。

1.4 信号切换模块

该模块完全通过蓝牙、车载终端和手机之间的信号传递实现,通过按下蓝牙耳机上的控制按钮,蓝牙会向车载终端发送断开连接的请求,车载终端在接收到信号后自动断开与蓝牙耳机的连接,同时内部的智能连接系统控制驾驶者的手机与蓝牙耳机建立连接,此时驾驶者便可以实现对手机的语音操控。这一模块完全虚拟化数字化,体现了未来驾驶操作的数字化发展方向。

2 工作流程简介

此方案采用模块化的工作方式。布置在汽车座椅后背的光纤光栅传感器对驾驶员的身体状况进行实时监测,布置在汽车中控方向盘、底盘的MEMS传感器对汽车行驶状况进行实时监测。驾驶员通过车内蓝牙耳机和人机交互系统进行信息处理对汽车实行语音控制。

2.1 驾驶者体征及汽车行驶监测

通过安装在座椅后背上的光纤光栅传感器,车载系统可以在行车过程中实时监控驾驶者的呼吸、血流、心跳等生命体征,当驾驶员在行车过程中其数值达到监测临界时,车载系统会通过车载音响语音提示+座椅震动提醒驾驶员生命体征出现问题,需停车休息。若此时还没有刹车,车载系统会自动对汽车进行制动,直至驾驶者的生命体征恢复正常。

通过安装在汽车中控方向盘、底盘的MEMS传感器,车载系统可以对汽车行驶状况进行监测,当汽车在行驶过程中出现异常时传感器会迅速将信息传递给车载系统,并通过显示屏报警。通过存储在系统数据库中的错误应对方案,显示屏上会同时提供驾驶者几条解决建议,驾驶者可通过反馈的信息自行处理。

2.2 蓝牙语音智能控制

通过蓝牙耳机,驾驶者可以建立与车载系统之间的无线连接,并且同时启动语音识别模块,从而通过语音指令代替传统的手动操控,实现开关空调、开关音乐、开关窗户顶棚等非驾驶性操作,保证驾驶者坐在座位上只需对着话筒,按需要发出语音指令,就可以实现对系统的语音控制,而驾驶员的注意力仍能专心驾驶,提高驾驶乐趣的同时保证了安全性。

2.3 来电无线接听

该方案通过信号切换模块,使得通过蓝牙接听来电与语音控制车载系统得以共存,当有电话来时,驾驶者通过按下蓝牙耳机上的控制按钮,来进行车载终端和手机等移动设备的信号切换,便可以无线接听电话,免去了传统接听电话时需要一只手拿手机的麻烦。当电话挂断时,驾驶者可以选择再次按下控制按钮恢复与车载终端的信号连接,也可以保持与手机的信号连接,通过Siri系统来语音控制手机。

2.4 附加功能

2.4.1 车辆自锁及防盗功能

本功能实现携带蓝牙耳机的驾驶员在离开车一定距离后,车载终端接受不到蓝牙信号,车辆会自行落锁,避免忘记关锁,从而有效防盗。

2.4.2 车辆位置监控

该功能建立在车载GPS系统、蓝牙信号传输与其云同步的APP相结合的基础上,驾驶者可通过手机上的配套APP查看汽车所在位置及汽车与人距离的,方便驾驶者在车海中找到自己的爱车。

2.4.3 一键求救

该功能是在与120求救系统互联的前提下,车主可在车辆或人发生事故或不适时按下蓝牙耳机上的求救按钮,车载系统接收到蓝牙信号后向120急救中心发出求救。

参考文献

[1]王淑华.MEMS传感器现状及应用[J].微纳电子技术,2011,48(8):516-522.

[2]蔡欢欢.MEMS传感器在汽车电子中的应用[J].电子原件与材料,2014,33(5):97-98.

[3]李海涛.基于QNX的车机蓝牙无线监控系统[J].电子与应用,2014,40(2):115-117.

语音识别的无线控制家电装置 篇7

一、系统总体构成

系统包括两个主要的部分, 即用户终端和控制终端。系统用户端的电气部分由MCU最小系统、语音识别、无线通信、按键检测、液晶显示模块组成。而系统控制端电气部分则由MCU最小系统、无线通信、控制驱动组成。其组成框图如图1所示。

二、控制系统硬件电路设计

(一) MCU模块。系统中的控制器采用单片机来实现。MCU模块包括单片机最小系统、复位电路、外部晶振电路, 因为和它联合工作的模块用电电压为3.3V, 所以在MCU中采用的单片机为STC12LE5A60S2型号。

(二) 语音识别模块。系统中的语音识别模块采用LD3320, LD3320是一块基于非特定人语音识别技术的语音识别/声控芯片, 可提供真正的单语音识别解决方案。芯片上集成了高精度的A/D和D/A接口, 不再需要外接辅助的Flash和RAM, 即可以实现语音识别/声控/人机对话功能。并且, 识别的关键词语列表示可以动态编辑的。其主要特征如下:一是非特定语音识别技术:不需要用户进行录音训练;二是可动态编辑的识别关键词语列表:只需要把识别的关键词语以字符串的形式传送进芯片, 即可以在下次识别中立即生效;三是真正单芯片解决方案:不需要任何外接的辅助Flash和RAM, 真正降低系统成本;四是内置高精度A/D和D/A通道:不需要外接AD芯片, 只需要把麦克风接在芯片的AD引脚上, 可以播放声音文件, 并提供550m W的内置放大器。五是高准确度和实用的语音识别效果:支持用户自由边界50条关键词语, 在同一时刻, 最多在50条关键词中进行识别, 终端用户可以根据场景需要, 随时编辑和更新这50条关键词语的内容。

(三) 无线通信模块。系统中采用NRF24L01芯片作为无线通信模块, nRF24L01是一款工作在2.4GHz~2.5GHz的世界通用ISM频段的单片无线收发器芯片。无线收发器包括:频率发生器、增强型“Schock Burst”模式控制器、功率放大器、晶体振荡器、调制器、解调器。输出功率、频道选择和协议的设置可以通过SPI接口进行设置。当工作在发射模式下发射功率为-6d Bm时, 电流消耗为9m A, 接收模式时为12.3m A, 掉电模式和待机模式下电流消耗更低。

(四) 液晶显示模块。所用液晶显示器为1602。由于单片机I/O口不够用, 所以需要在LCD1602液晶显示模块增加了一个串转并芯片74ALS164。

(五) 控制驱动模块。采用HK4100F继电器驱动, 当进入一个低电平, 三极管T饱和导通, 5V的电源加到继电器线圈的两端, 导致继电器吸合, 它的常开触点闭合, 相当于开关闭合, 接通控制电路。

三、系统调试

(一) 在调试语音模块时。由于供电电压使用的是电脑USB口取电, 通过5V转3.3V电源模块转换给主控单片机和语音模块共同供电导致供电电流太小使语音模块内部出现异常从而不能识别指令, 语音模块初始化时要由主控单片机往语音模块芯片寄存器读写数据时需要时间, 单片机上电后不能立刻识别指令需要等待一两秒后才能进入正常识别状态, 在识别指令时要对着麦克风说出预先设定的命令并且发音要标准否则识别就会出错, 语音识别本身要求的外部环境也决定着识别结果的正确与否, 所以调试时选择相对安静的环境得到的结果也相对理想。

(二) 在调试无线通信模块时。出现过只发送一次信号就不再发送的问题, 后来检查程序发现是无线模块设置发射次数不正确。而因为发送寄存器没有立即清空的原因, 导致系统调试时, 只循环一次就不再循环的情况。

(三) 在调试LCD显示模块过程中。在以下函数中出现问题, 把下面加粗字体中的CY改成ch时, 程序出错, LCD1602无法显示。

在编写液晶显示模块程序时, 以下初始化函数比较简单, 即:

(四) 在系统联调时。遇到软件内存不够的情况, 原因是程序过于冗长, 变量过多, 再加上一开始使用的软件是盗版软件, 所以程序内存超出了芯片的存储空间。通过课本与网络查找相关的解决办法作为参考, 经过多次的修改, 终于将程序编写得更加精简。而在联调时无线模块发射成功, 但有时收不到数据, 偶而能接收。经多次调试得出结论是时序延时问题。

四、结语

该装置能够对用户的语音进行正确识别, 并转换为控制指令, 通过无线网络发送至家电控制端, 进而控制家电设备的工作状态。

摘要:本文介绍了一种基于语音识别的无线控制家电装置, 先由语音芯片采集并识别语音, 再通过无线通信的方式, 将信号发送至控制端, 从而控制家用电器。

关键词:语音识别,无线通信,LCD

参考文献

[1]李虹.C语言程序设计[M].南京:南京大学出版社, 2010

[2]王静霞.单片机应用技术 (C语言版) [M].北京:电子工业出版社, 2009

[3]谭晖.nRF无线SOC单片机原理与高级应用[M].北京:北京航空航天大学出版社, 2009

具有语音功能的水温控制系统 篇8

本系统采用SPCE061A单片机、Pt1000及其外围电路设计了具有语音播报和显示功能的水温控制系统。凌阳十六位单片机SPCE061A实现温度处理和控制, Pt1000和电压放大电路实现温度信号采集, 系统通过PID算法实现对电炉通断控制。

该系统可以实现在烧水过程中对水温的控制, 极大地方便了人们的生活。该系统可应用于锅炉等需要进行温度控制的工业设备上, 能提高设备的安全性, 节约能源。

1. 研究内容

随着电子技术的快速发展, 具有语音功能的设备越来越多地在工业, 交通, 通信等领域得到应用。具有语音功能的设备的理论和技术也日趋完善和成熟。人们对设备语音化的实际需求也越来越迫切, 使得具有语音功能的实用化产品不断出现。语音技术的发展使得许多系统更加友好, 更方便用户对系统的控制, 比如说具有语音功能的手机、具有语音功能的家电控制系统。本系统设计的是一个具有语音功能的水温控制系统, 对象为1升净水, 加热器为1千瓦电热炉。要求能在40摄氏度至90摄氏度范围内设定控制水温, 静态控制精度为0.2摄氏度。并具有较好的快速性与较小的超调, 以及十进制数码管显示、温度曲线打印、语音播报温度等功能。

2. 方案设计

该设计包括测量和驱动控制两部分, 以下为两部分的方案设计和元器件选择。

(1) 测量部分

采用温度传感器铂电阻Pt1000。铂热电阻的物理化学性能在高温和氧化性介质中很稳定, 它能用作工业测温元件, 且此元件线性较好。在0—100摄氏度时, 最大非线性偏差小于0.5摄氏度。铂热电阻与温度关系是

其中Rt是温度为t摄氏度时的电阻;R0是温度为0摄氏度时的电阻;t为任意温度值, A, B为温度系数。

(2) 驱动控制部分

采用SPCE061A单片机实现驱动控制, 该单片机内置8路ADC, 2路DAC, 且在集成开发环境中, 配有很多语音播放函数, 用SPCE061A实现语音播放极为方便。另外, 比较方便的是该芯片内置在线仿真、编程接口, 可以方便实现在线调试, 这大大加快了系统的开发与调试。

3. 系统组成

本系统组成包括CPU、数据采集、键盘设定、语音播放、数据显示、打印、加热部分等模块。系统通过这几个模块的共同作用完成具有语音功能的水温控制系统, 并实现温度曲线的输出、打印, 系统组成框图如图3-1所示。

语音播放:语音播放通过键盘设定的温度值, 并播报整数温度变化。

键盘设定:用于温度设定。共KEY1、KEY2、KEY3三个按键。

数据采样:通过Pt1000和电压放大电路采集的电压信号经AD转换后, 换算成温度值, 用于播报和显示。

数据显示:采用三位八段数码管显示设置温度并在按下KEY3键后显示测量的温度, 测量的温度显示到小数点后1位数字。

串行口传输:将采样温度值, 上传至PC机, 描绘曲线并打印。

继电器/热电炉:通过三极管控制继电器的开关来完成对热电炉的功率控制。

4. 主程序

主程序主要完成对系统的初始化, 系统初始化部分包括系统时钟、I/O口、中断设置 (开外部中断) 。这里将系统时钟设置为49MHZ, 单片机的串行输入输出接口初始化, 初始化按键扫描程序, 开启FIQ_TMA中断。

在本系统中, 主程序不断循环的扫描任务标志变量, 根据标志变量的值执行相应的动作。主要任务包括键值处理、语音播报处理、PID计算和继电器控制等。如图4所示是主函数流程图。

5. 系统功能

系统上电后, 通过KEY1和KEY2设定需要加热的温度。该设定值会通过数码管显示, 在设定到需要加热到的温度后按下KEY3, CPU根据设定的温度值数据控制电炉开始加热, 同时温度采集系统开始工作。在按下KEY3的同时数码管清零, 并开始显示采集到的水的温度, 测量的温度在数码管上显示到小数点后1位。温度采集系统每5s向系统传送一次数据, 该数据不但会在数码管上显示出来并通过语音系统播报整数值的温度, 而且会通过串口上传至PC机。同时系统通过PID算法计算该温度是否达到了设定的温度, 若已达到设定温度, 则断开继电器从而停止加热, 若未达到, 则重复以上过程。在温度达到设定温度后系统停止加热, 语音系统提示温度已达到用户需要的值, PC机通过收集到得温度值数据绘制温度曲线图。

6. 结语

由于SPCE061A的时钟最高可达49M, 32个I/O口, 而且具有一定的语音处理功能等, 这些都为我们实现电路提供了非常便利的条件。同时也因为开发环境友好, 易用, 方便同时配有语音播放函数, 这些大大加快系统开发设计。本系统核心是控制算法的设计和实现, 各方面指标基本达到设计要求。

参考文献

[1]第三届全国大学生电子设计竞赛组委会.第三届全国大学生电子设计竞赛获奖作品选编 (1997) [M].北京:北京理工大学出版社, 1999.

[2]黄军辉, 董晓倩, 李建波.单片机原理与应用-凌阳SPCE061A[M].北京:人民邮电出版社, 2008, 2.

[3]阎石.数字电子技术基础[M].北京:高等教育出版社, 1998, 12.

[4]童诗白, 华成英.模拟电子技术基础[M].北京:高等教育出版社, 2001.

[5]张培仁, 张志坚, 高修峰.十六位单片微处理器原理及应用 (凌阳SPCE061A新世纪电子信息工程系列教材) [M].北京:清华大学出版社, 2005, 5.

[6]卢胜利.基于凌阳SPCE061A设计实验平台的专业综合设计教程[M].北京:机械工业出版社, 2007, 1.

[7]李学海.16位语音型单片机SPCE061A实用教程:基础篇[M].北京:人民邮电出版社, 2007, 3.

[8]李晓白, 秦红磊.凌阳16位单片机C语言开发[M].北京:北京航天航空大学出版社, 2006, 9.

[9]刘幺和, 宋庭新.语音识别与控制应用技术[M].北京:科学出版社, 2008, 2.

[10]孙余凯, 吴鸣山, 项绮明.传感技术基础与技能实训教程[M].北京:电子工业出版社, 2006, 11.

智能语音风门控制系统的开发设计 篇9

风门控制系统的安全性直接关系到矿井的通风、安全及运输的通畅。但目前的风门控制系统在使用一段时间后, 大多因控制系统的可靠性问题而被拆除。为实现煤矿井下通车风门的智能化, 提高矿井通风系统的稳定性、可靠性, 提高智能化、人性化, 保证矿井的安全生产, 我们研制了智能化语音控制的风门控制系统。

一、控制风门系统的工作原理及功能

1. 系统的组成。

语音风门控制系统的部件安装如图1所示。对于两风门系统, 在回风巷和进风巷分别装有两台控制器, 一个电子锁, 一个门位置检测器。智能控制器上安装有光敏传感装置、手动操作按钮、语音扬声器以及门状态显示器。每个门内外各有一个智能控制器。光敏传感装置由头灯照射申请开门, 门限位置传感器安装于风门框架上部, 用于检测风门的开、闭位置;发光指示器显示风门状态, 手动操作按钮用于光敏传感装置故障时用来开门, 风门的开闭由人工完成, 控制器控制电子锁。系统的供电来自附近的127 V交流电源。

2. 工作原理。

根据人员所处的不同位置, 每一道门的开门申请有内外开门申请之分, 人员在两道门之间可照射的光敏传感装置为内申请开门, 人员在两道门之外可照射的光敏传感装置为外申请开门, 控制器内部组成原理如图2所示。

当人员从回风巷向进风巷行进至第一道门时, 头灯照射在第一道门控制器上的光敏传感装置, 如果这时第二道门处于关闭状态, 那么控制器会打开电子锁, 并语音提示门已经打开。如果第二道门此时处于打开状态, 控制器会保持电子锁的锁定状态, 并语音提示对方门已经打开请稍候。

当人员穿过第一道门行至第二道门时, 头灯照射在第二道门控制器上的光敏传感装置, 如果这时第一道门处于关闭状态, 那么控制器会打开电子锁, 并语音提示门已经打开。如果第一道门此时处于打开状态, 控制器会保持电子锁的锁定状态, 并语音提示对方门已经打开请稍候。当人员从进风巷向回风巷行进时, 与上述同理不再论述。

3. 功能介绍。

为了提高控制系统的稳定性、可靠性和实用性, 风门控制系统不仅要保证风门的正常开闭, 还设计有以下功能:

一是语音提示。在申请开门时带有语音提示, 语音报告是否门已经打开或不能打开的原因。二是门状态互锁。前面门打开的情况下不能开门。三是多种风门开闭方式。通常情况下, 人员通过头灯照射控制器上的光电传感器完成风门的门锁打开控制。如果光电传感器出现故障, 可以按手动按钮开门。在某些特殊情况下, 如控制系统出现故障、风门安装调试、检修维护等, 可通过强制开门开关打开门锁。

二、智能语音风门控制系统的硬件设计

智能语音风门控制电路由本安电源、单片机电路、语音电路、输入输出接口电路及扬声器组成。

本安电源按照GB 3836.4-2010设计, 为电路板提供安全用电。输入电压是附近供电开关送来的交流127 V, 经变压降为17 V交流, 然后整流调压, 具有多级过电流过电压保护, 满足本安电源的技术要求。

单片机采用STC系列单片机STC90C52。STC90C51系列单片机是STC推出的新一代超强抗干扰、高速、低功耗的单片机, 指令代码完全兼容传统8051单片机, 12机器时钟和6机器时钟周期可以任意选择, 内部集成MAX810专用复位电路, 5 V单片机工作电压可以在5.5 V~3.3 V, 并最多可以61 K程序代码空间和1280个字节的随机存储器。39个通用IO口。在系统可编程 (ISP) , 在应用可编程 (IAP) , 无需专用编程器, 带有看门狗、EEPROM。

语音电路采用ISD2520, 并附加了功率放大电路推动扬声器发声。ISD2520语音提示电路采用ISD2520芯片做数字录音器件。录放音时间可达20 s。可连续录放亦可通过地址线A0A9选择分段录放。事先将各种提示音录入芯片中, 单片机通过判断用户的不同操作, 选择不同提示音提示用户进行各种操作。CPU通过片选与写信号对语音芯片及录放电路进行录放控制。ISD2520芯片输出的声音信号功率比较小, 为此增加了音频放大器使得能驱动扬声器。

考虑到工业生产环境, 为了增强电路抗击电磁干扰的能力和增加系统工作的可靠性, 所有信号的输入输出接口均采用了光耦隔离。

三、自动风门的软件设计流程

电路板上电后, 单片机STC90C52开始初始化, 完成后检测两道门的状态, 即是关门还是开门, 该信号由位置检测器提供。

如果有人申请开门, 光电传感器接收到信号以后经光耦隔离的输入输出接口电路将信号送给单片机STC90C52。

如果对方的门已经关闭, 那么就断开本门电子锁, 并语音提示请通过。

如果对方的门已经打开, 那么就保持关闭本门电子锁的状态, 并语音提示前面门已经打开, 请稍等。风门控制系统的软件程序流程如图3所示。

初始化参数

检测门状态检测开门申请

打开电子锁

语音提示

图3自动风门控制系统的软件程序流程图

四、结论

本文介绍的智能化控制风门系统具有以下主要技术特点:一是采用智能化控制器实现风门的控制, 具有性能稳定、安全系数高、使用方便等优点。二是采用语音提示, 使得人性化程度得到提高。三是结合煤矿井下环境特点, 研制了光敏检测传感器, 首次实现了头灯照射申请开门的方式。四是充分考虑了现场的实际情况, 采用冗余技术和硬件, 确保控制的准确、安全与可靠。五是采用多种开门方式, 使得在各种情况下都能够方便地操作控制风门的开闭。

智能风门控制系统通过软、硬件有机结合, 采用硬件、冗余技术措施, 确保控制系统的可靠性。本系统采取了一些提高系统可靠性、安全性的措施, 克服了目前风门自动控制系统普遍存在的问题, 完善了系统的功能, 可以适应不同的现场条件及要求, 是一个可靠性高、使用维护方便的系统。

监控室力控系统软件网络版一套 (带5个客户端) , 上位机一台

参考文献

[1]陈绍华.机械设备电气控制[M].广州:华南理工大学出版社, 2012

[2]闫希合, 姜雪艳.程控自动压力平衡风门的研制及应用[J].煤矿机械, 2011 (11) :58—60

[3]吴厚强.井下自动风门电路设计[J].矿山机械, 2012, 34 (4) :154—155

[4]刘军, 彭担任.煤矿井下风门的连锁与报警[J].煤矿机械, 2005 (11) :121—122

[5]杜从商.PLC编程应用基础[M].北京:机械工业出版社, 2010

[6]吴海卫, 张宜明, 吴征艳.矿用自动风门技术的发展及其分析比较[J].工矿自动化, 2010 (1)

[7]邵昊, 蒋曙光, 秦俊辉, 等.基于PLC控制的自动风门程序设计[J].煤炭科学技术, 2008, 36 (4) :65—68

[8]罗忠, 柳洪义, 田洪海.现代机械产品智能优化设计方法及其应用[J].东北大学学报 (自然科学版) , 2008, 29 (7) :1004—1007

语音控制 篇10

越来越多的智能家居进入人们的生活, 如何对智能家居进行简单有效的控制是一个难题, 而基于语音控制的智能家居更具人性化[1]。为此本项目设计了手表式无线语音控制系统方案代替人工接触电源开关, 通过简单的语音指令控制家用电器。实践证明, 该方案经济可靠, 具有良好的实用性。

2 系统组成

本方案主要由指令识别模块识别指令, 传达指令信息到单片机, 指令识别成功后, 再由单片机控制无线发射模块发送指令, 接受模块接收并处理信息[2]。示意如图1所示:

下面分别介绍这几个模块的选择:

语音模块选择LD3320芯片, LD3320是一颗基于非特定人语音识别技术的语音识别芯片, 它能识别关键词的内容动态地传入芯片中。无线收发模块选择DF无线发射模块/PT2272无线接收模块。

整个系统分两部分, 即发射端和接收端, 发射端主要由语音识别模块、单片机主控系统、DF数据发射模块和电源模块构成。接收端主要由PT2272无线接收模块、电源模块和开关控制电路组成。

3 硬件电路设计

硬件设计主要包括了语音识别模块、单片机主控系统、发射模块、接收模块和电源模块。

3.1 语音识别模块设计

语音识别模块由LD3320语音识别芯片及外围元件组成, LD3320与单片机连接的工作原理框图如图2所示。LD3320每次识别的过程就是把用户说出的语音内容, 通过频谱转换为语音特征, 再将这个转换后的语音特征和“关键词语列表”中的条目一一进行匹配, 最优匹配的一条即作为识别结果。

3.2 单片机主控系统设计

本方案选用STC11L08XE单片机作为主控器, 单片机通过并行读写方式与语音识别模块LD3320相应管脚进行连接, 普通I/O口接DF发射模块[3]。单片机提供汉语拼音给LD3320筛选语音结果, 接收识别结果后执行结果对应的程序, 再通过发射模块发送新的结果。

单片机工作原理框图如图3所示:

3.3 发射模块设计

单片机模拟PT2262编码信号控制发射数据, DF发射模块采用ASK方式调制, 以达到控制多设备、体积小、功耗低的效果。发射模块设计如图4所示:

3.4 接收模块设计

接收模块由PT2272模块与模拟电器电路组成, PT2262经天线接收到信息后, 改变端口的状态, 通过控制开关管进而控制模拟电器电路的电源开关, 接收模块的工作框图如图5所示。

4 软件设计

程序设计主要包括语音识别程序、语音指令程序和发射程序三部分。系统启动后, 语音识别程序启动语音识别模块和接收语音识别模块的识别结果, 识别后执行语音指令程序, 得到的新结果发往发射程序, 发射程序控制DF数据发射模块发出, 之后再次启动语音识别模块, 等待下一个指令。整个无线语音控制程序如图6所示:

4.1 语音识别程序设计

单片机首先检测芯片是否空闲, 空闲则设定编号和载入关键字数据, 然后等待LD3320的语音结果, 有结果则进入语音程序, 否则重来[4]。识别程序如图7所示:

4.2 语音程序设计

语音程序以选择分支语句为主体, 一个语音对应一个分支, 执行不同的子程序, 最终得到该语音引起的新变化代表的结果。语音程序如图8所示:

4.3 发射程序设计

系统获取语音程序结果后, 程序写入的地址码和数据码根据语音命令的不同而不同, 单片机模拟PT2262编码原理发送编码。

发射程序如图9所示:

5 测试与结论

在空旷的空地与几间相邻的房间进行智能家居的实际控制测试, 不同场景分别测试100次。

测试环境1:将一个无线接收模块放在一个固定的空地上, 测试者戴着手表式无线语音控制设备, 对接收端由近及远, 每隔20厘米对发射模块喊出口令进行实时的控制。

测试环境2:将一个无线接收模块放在同一个固定的房间内, 测试者站在房外戴着手表式无线语音控制设备, 对接收端由近及远, 每隔20厘米对发射模块喊出口令进行实时的控制。

测试环境3:在测试环境2保持静音情况下测试, 测试每100次呼叫的有效响应次数。

测试环境4:在测试环境2中引入40分贝音乐情况下, 测试每100次呼叫的有效响应次数。

采用本方案的无线语音控制的智能家居系统结论:

(1) 在空旷地带控制范围达9.3米, 正常的家庭室内控制范围也能保证7米, 符合普通家庭使用;

(2) 静夜环境下语音识别率达96%;

(3) 在人正常说话环境下语音识别率达88%;

(4) 有无障碍物对发射信号的影响不大。

摘要:越来越多的智能家居进入人们的生活, 如何对智能家居进行简单有效的控制是一个难题。设计一个无线语音控制系统, 主要由语音识别模块、单片机、无线发射模块和无线接收模块组成。编程中, 通过简单地设置芯片的寄存器, 将“你好”这样的关键词传入芯片中, 芯片就可以识别“你好”。试验结果表明语音模块可以准确识别口令并通过无线发射模块发送信号, 实时控制电器的电源通断。本系统可以代替人工接触电源开关更方便地控制家中的电器。

关键词:智能家居,单片机,语音遥控,无线

参考文献

[1]高小平.中国智能家居的现状及发展趋势[J].低压电器, 2005, (04) .

[2]李守容.智能家居系统设计分析[J].科技创新导报, 2012, (15) .

[3]付蔚, 唐鹏光, 李倩.智能家居语音控制系统的设计[J].自动化仪表, 2014, (01) .

上一篇:目标设想下一篇:探究式式教学方法