足球机器人

2024-05-22

足球机器人(精选十篇)

足球机器人 篇1

人工智能作为一门独立的研究学科,始于二十世纪五十年代。随着自动化信息技术的迅速发展,特别是计算机这一强有力的运算工具的进步,对人工智能的系统研究半个多世纪以来,己取得了一系列成果,从“深蓝”系列计算机解决的单智能体静态可预测环境中的问题求解,到最近的多智能体动态不可预测环境中的问题求解,成为了人工智能研究的代表性问题。由于机器人足球赛的特点,决定了足球机器人的机-机对抗和人-机对抗正是研究多智能体理论的一个合适平台。由于设计制造机器人的过程不仅可以提高学生的动手能力,更可以提高学生的动手能力和创新能力。所以,机器人足球赛在高校学生实践比赛中占有很大的地位。本文则阐述了如何利用一些简易的机械结构实现机器人的获球、持球、送球、抛球以及变形防守的功能。

二、一号机器人

2.1获球

固定直板用于档球,有孔的地方与厚板的连接采用类似合页的结构,联合其他结构从而实现在电机的带动下曲板的移动 (也可以利用墙面挡住) ,从而获球。具体机械过程:利用铰链连接固定端与抱臂,它的顺时针转动利用电机点动(防止直板的阻碍使电机长时间超荷工作烧坏)实现,逆时针转动利用劲度系数合适的弹簧或电机。为防止直臂影响尺寸超出范围,可采用折叠式(让直臂在展开前收在底盘下)。

2.2持球、送球

如图:在上述获球之后,利用类似叉车的结构将球从抛球筒前方送进。机构细化:利用滑轮将升降架和电机连接,电机启动,升降架上升,实现送球功能或攻击功能。停止电机,在重力的作用下,升降架下滑,回复原位,为防止在上升的时候皮球的外漏,加上圆筒形防护网。

2.3抛球

当球滚入轨道后,将会在最低处被挡住,然后利用电机带动轴转动,从而对球产生一个沿轨道方向的力,实现击球。机构细化:利用电机带动弹片的转动,从而实现击球功能。

2.4进攻

在对方获球后将插架塞入对方机器人的车身下,然后启动电机,将对方的机器人抬起,拖延时间到对方持球达到规定时间后,制造对方犯规。

三、二号机器人

3.1变形

通过变形让机器人实现尽可能的大面积防御。机构细化:在刚开始时,将网揉成一团。图中的孔处采用销连接,在里外的两个钩上采用劲度系数不同的弹簧,以做到在此杆折叠时,外面的弹簧处于拉伸状态,里面的处于压缩状态。

3.2紧固

为了防止弹簧偏离预定槽道,可采用筒状或细铁丝缠绕固定等措施。

四、防守

对于两个机器人,为了防止对方采用撬起的攻击策略,所以机器人的四周采用斜坡形结构。

五、改进方案

一号机器人由于用于获球、持球、抛球、进攻,所以它的重心应尽量靠后。同时,也应该做的重些;由于前驱可以让机器人的动作快捷,便于追赶,所以采用前轮驱动较好。而且应尽量遵循力学的规律,防止侧倾;二号机器人,则要控制其顺利的变形以及变形时全身的稳定性。

参考文献

[1]谢进, 万朝燕, 杜立杰.《机械原理》.北京:高等教育出版社, ;

足球机器人作文 篇2

我和爷爷先动手安好了球场和球门。用一个小钢珠做足球,又将小运动员放进球场。一切准备就绪,我和爷爷开玩了。

我和爷爷各拿一个遥控器操控自己的运动员。我把钢球放到球场中央,奶奶吹响了哨子,比赛开始了。只见两个运动员像快马一样飞奔向足球。不好,我慢了一步,爷爷的运动员将球踢走了。它带着球箭一般向我的球门冲来。这样强的攻势我不得不退守,没等我的运动员退到球门边,对方就一脚把球射了过来,球就像一颗小炮弹向球门飞了过来。我的心紧张得提到了嗓子眼儿,连忙按下向前键,让小机器人火速向球门冲去,把球又踢了回去。就这样一次次攻击一次次退守,直到奶奶哨声响起,上半场比赛结束了,我擦了擦汗长吁了一口气。

下半场开始了。我很想获胜,减少了防守的次数,加大了进攻的次数。我每次射门都要离爷爷的大门近一些。哈哈,爷爷,我的机会来啦!在爷爷大门的附近,我重重地按下了射门键,心里满怀希望“哇!”进球了,我高兴地跳了起来。直到结束爷爷一个球也没进。

微型机器人足球简介 篇3

足球机器人系统,在硬设备方面包括机器人小车、摄像装置、计算机主机和无线发射装置(见系统总图)。从功能上分,它包括机器人小车、视觉、决策和无线通讯4个子系统。

视觉子系统是机器人的眼睛。它由悬挂在球场中圈上空2米的摄像头摄取图像,由装在主机内的抓图卡将图像数字化,送入主机内存,再由专用软件对图像进行理解。由于双方各有不同颜色的队标(黄色和蓝色),而机器人也有不同的队员色标。这样计算机就可以通过颜色分割辨识出全部机器人与球的坐标位置与朝向。也就是进行模式识别。

装在主机中的决策子系统根据视觉系统给出的数据,应用专家系统技术,判断场上攻守态势,分配本方机器人攻守任务,决定各机器人的运动轨迹,然后形成给各小车左右轮轮速的命令值。

无线通讯子系统通过主机串行口拿到命令值,再由独立的发射装置与装在小车上的接收模块建立无线通讯联系,遥控场上各机器人的运动。

足球机器人预测误差反馈导航算法 篇4

机器人足球比赛是集机器人技术和足球运动于一体具有高度挑战性的项目,包含了传感器信息提取与融合、图像识别、无线通信、动态决策、行为控制等诸多技术环节[1],而运动导航控制是最基本、最重要的一环,它是完成射门、截球、跑位等技术动作的基础,导航控制的目的就是使机器人快速、精确地从初始点到达目标点,导航控制的性能会对技术动作的完成效果产生很大的影响,从而影响比赛结果。现在较常用的导航控制方法主要有PID控制,PID模糊控制[2,3,4],还有轨道追踪方法如文献[5-6],以及在预测机器人航向变化趋势基础上提出的预估控制方法[7]和基于神经网络的预测控制方法[8]。本文在预估控制方法的基础上,提出了首先预测机器人的运动状态进行预测控制,然后对控制命令进行误差修正的机器人导航算法。

1 比赛中球、机器人的几何模型与物理模型

不论在实体机器人控制过程中还是在仿真平台进行控制模拟实验,都要以机器人的几何特征和运动学特性为基础。仿真比赛[9]中球的物理模型为一个直径5 pixels的桔红色高尔夫球,与轮式机器人相比质量很小,且只能做直线运动。球在机器人的推动作用下开始加速运动,当速度最大时球已经脱离了推动它的机器人,然后在与地面摩擦力作用下作减速运动,并最终速度减为零。球的运动学方程[9]为:

式中:Vt,Xt,Yt为t时刻球的运动速度与位置坐标;Vt-1,Xt-1,Yt-1为t-1时刻球的运动速度与坐标;ξ为由摩擦引起的加速度;Δt为两时刻间的时间间隔;θt-1为t-1时刻球的运动方向。

机器人外观上是一个两轮正方形小车,在比赛之前可以为每个球员选择不同的表面图形以易于识别,机器人在前进过程中,它的运动不仅受到摩擦力的影响,更主要是取决于马达电机的转速。通常把电机转速分为127级(-127~127),当转速为负值时,电机反转,机器人向后运动。如果两个轮子的线速度一样,则机器人保持原方向角作直线运动,否则它会转弯作曲线运动。根据运动学知识,可以算出机器人转弯时的圆弧半径,以确定机器人在下一时刻应在的位置。机器人做曲线运动的动力学方程[9]为:

式中:VM取左、右轮速中绝对值较大的一个;Vm取左、右轮速中绝对值较小的一个;R为机器人转弯的半径;ω为机器人的角速度;L为机器人小车的宽度;V为机器人的线速度;β为在时间间隔T内机器人转弯的角度。

根据上述机器人运动学式(2),可以计算机器人小车在控制命令VM与Vm的作用下经过时间间隔T后的坐标位置(XT,YT),假设机器人的初始位置坐标为(X0,Y0),相对x轴正方向的初始偏置角度为α0,则:

(1)当机器人向前运动且左轮速度大于右轮速度时,或者当机器人向后运动且右轮速度大于左轮速度时,即机器人的运动轨迹为相对某圆心点的一段圆弧曲线且顺时针方向运动时(如图1所示),(Xt,Yt)计算公式为:

(2)当机器人向前运动且右轮速度大于左轮速度时,或者当机器人向后运动且左轮速度大于右轮速度时,即机器人的运动轨迹为相对某圆心点的一段圆弧曲线且逆时针方向运动时(如图2所示),(Xt,Yt)计算公式为:

2 预测误差反馈导航算法

在机器人实际移动过程中或者是在仿真平台的实验过程中,导航控制中预测角度与目标角度存在偏差(如图3所示),传统PID控制函数在每个采样周期或者接收仿真平台的环境数据结束后根据目标方向与采样方向的偏差值来计算控制命令,从而使机器人朝目标方向运动,然而在机器人进行数据采样从而生成控制命令的时间里它在上一周期发出的指令将发生作用,即指令滞后一个周期执行[8],或者在仿真平台中“每个机器人和球根据上一周期的运动状态、本身的机械特性和它接收到的控制字计算出新的位置、角度和速度”[7],也就是说根据第一个采样周期接收到环境数据生成的控制命令要在第二个周期才能对机器人的运动状态发生作用,然后在第三个周期显示出来或者在采样数据中体现出来。所以,根据采样数据直接计算得出的控制命令不能实现对机器人的精确控制。预测误差反馈导航算法的基本思想是根据机器人本周期采样数据得到球的运动状态以确定目标点,再依据机器人的运动状态包括坐标、角度、线速度、角速度和机器人运动学模型预测下一周期机器人的位置坐标和方向角,然后用传统的PID控制函数计算得出机器人朝目标点运动的控制命令,最后根据式(2)~式(4)预估计控制命令作用后机器人方向角与目标方向的偏差及控制命令对机器人线速度大小的影响对控制命令做出修正。具体流程如图4所示。

对控制命令的修正一般首先考虑角度偏离误差,如图4所示,假设预测机器人在初始PID控制命令作用后角度为θ1,目标方向角为θg则对控制命令的修正如公式(5)所示:

式中:k一般根据机器人的转角性能取0~1之间;VL和VR为初始控制命令;VL′和VR′为预测误差修正后新的控制命令。当机器人方向角调整到目标方向时进而对速度误差做出修正,根据预测机器人在初始PID控制命令作用后的坐标Cp和的目标点坐标Cg的距离|Cg-Cp|修正方法如式(6)所示:

式中:根据机器人朝向当目标点Cg位于预测机器人坐标位置Cp前方时α取正,反之α取负,同时由于受机器人左右轮转速范围限制α大小取0~1之间。

因此本算法主要包含两个步骤的预测,一是对机器人下一周期状态的预测;二是对控制命令作用结果的预测,以及根据预测所进行的误差修正。在进行误差修正时不仅要考虑预测方向角与目标方向角度的偏差,同时也要保证机器人的线速度尽量高,在撞击球的过程中机器人的线速度越大碰撞就越激烈,球获得的加速度就越大,从而使机器人在比赛中具有强劲的进攻性能和稳固的防守能力。

3 实验结果

用上述方法在FIRA SimuroSot 11vs11的仿真平台上进行实验,并与客户端框架程序提供的传统PID算法进行比较,机器人运动初始坐标为(479,159),初始方向角0°,目标点坐标(900,610),目标方向角90°;用两种导航算法控制机器人朝目标状态运动时,记录各个采样周期机器人的位置坐标及方向角,结果如图5,图6所示。

由图5、图6对比可见,图6的机器人朝向目标点(target)运动的轨迹接近一条直线,较图5的曲线运动轨迹准确性更高;另外,在机器人起跑和靠近目标点(target)时,图6比图5花费的时间(即采样周期)更少,显示了更快的收敛速度。另外选取5个不同的目标点,目标方向角90°,机器人运动初始坐标为原点(0,0),初始方向角0°,比较两种不同导航方法所用时间,统计结果(时间单位:周期)如表1所示。

4 结语

本文在预测控制的基础上进一步增加了对控制命令作用效果的预测,从而对控制误差进行修正,保证了控制的准确性,提高了机器人向目标状态运动的收敛速度。仿真实验表明,该方法较传统PID控制方法在时间性和收敛性方面均表现出更优的性能。

参考文献

[1]杨林权.机器人足球竞赛与设计[M].武汉:华中科技大学出版社,2009.

[2]田琦,张国良,刘岩.全方位移动机器人模糊PID运动控制研究[J].现代电子技术,2009,32(5):131-133.

[3]徐建安,邓云伟,张铭钧.移动机器人模糊PID运动控制技术研究[J].哈尔滨工程大学学报,2007(6):115-119.

[4]刘祚时,邝先验,吴翠琴.基于模糊PID的足球机器人运动控制研究[J].工程设计学报,2006,13(8):224-227.

[5]郭路生,杨林权,吕维先.基于Bézier曲线的机器人足球射门算法[J].哈尔滨工业大学学报,2005(7):921-923.

[6]范宗涛,许东来.基于Hermite曲线的机器人足球射门算法[J].计算机与现代化,2010(8):55-57.

[7]龚建伟,黄文宇,陆际联.轮式移动机器人航向跟踪预估控制算法[J].机器人,2001,22(3):193-196.

[8]GU Dong-bing,HU Huo-sheng.Neural predictive control for a car-like mobile robot[J].International Journal of Robotics and Autonomous Systems,2002,39(5):2-3.

小型足球机器人的无线通信系统设计 篇5

摘要:介绍了一种用于Robocup F-180小型组足球机器人比赛的无线通信系统的设计。包括发送端和接收端系统的硬件设计和实现及其软件设计。给出了一种适应于这套系统的通信协议,包括物理层的编码设计、纠错编码设计和帧结构设计。

关键词:串行通信 无线通信 机器人

足球机器人是一个极富挑战性的高技术密集 密集型项目,融小车机械、机器人学、机电一体化、单片机、数据融合、精密仪器、实时数字信号处理、图像处理与图像识别、知识工程与专家系统、决策、轨迹规划、自组织与自学习理论、多智能体协调以及无线通信等理论和技术于一体,既是一个典型的智能机器人系统,又为研究发展多智能体系统、多机器人之间的合作与对抗提供了生动的研究模型。它通过提供一个标准任务,使研究人员利用各种技术获得更好的解决方案,从而有效促进各个领域的发展。其听理论与技术可应用于工业生产、自动化流水线、救援、教育等实践领域,从而有效推动国家科技经济等方面的发展。机器人足球 从一个侧面反映了一个国家信息与自动化领域的基础研究和高技术发展水平。

目前,国际上有机器人足球比赛分为两大系列――FIRA和Robocup。本文所要论述的系统所应用的F-180小型足球机器人比赛就是RoboCup系列中应用较广泛的一种。

F-180小型足球机器人足球比赛的示意图如图1所示,比赛双方各有5名机器人小车在场上。足球机器人系统在硬件设备方面包括机器人小车、摄像装置、计算机主机和无线发射装置;从功能上分,它包括机器人小车、视觉、决策和无线通信四个子系统。

(本网网收集整理)

其中无线通信系统是衔接主机和底层机器人不可缺少的一环,它必须保证从主机端到机器人底层之间的数据传送是可靠的,从而使得机器人比较能够顺利流畅进行。由于比赛双方都有多个机器人同时在场地上跑动,要求无线通信有一定的抗干扰性。无线通信系统的性能相当程度上直接影响着机器人的场上表现。

1 系统的设计及实现

比赛中从摄像头来的视频信号经过计算机处理之后得到控制小车用的数据信息,而无线通信系统的就是将这些数据信息及时准确地送达场上的每一个机器人小车,系统采用广播方式,各机器人根据特定标志识别发给自己的有用数据,从而进行决策与行动。整个系统的框图如图2所示。

1.1 发送端的硬件设计

发送端主要用PIC16F877单片机实现编码和对发射机的控制,计算机通过串行口发送数据,经过PIC16F877编码后再通过PTR3000无线通信模块将数据发送出去。

所采用的PIC16F877单处机是MICROCHIP公司推出的8位单片机。采用RISC指令系统和哈佛总线结构,最高运行的时钟频率可达20MHz,因而指令运行速度快。它有很宽的工作电压范围,可直接与3.3V的PTR3000无线通信模块配合使用。

TR3000无线数据收发模块是一种半双工收发器,采用NORDIC公司的nrf903无线收发芯片,工作频率采用国际通用的.数传频段ISM,频段915MHz,工作频率可以在902MHz~928MHz可变。采用GMSK调制,抗干扰能力强,特别适合工业控制。灵敏度高,达到-100dBm,最大发射功率+10dBm,工作电压为2.7V~3.3V。它最多有169个频道,可满足需要多频道的场合,最高数据速率可达76.8kbps。因而完全可以满足小型组机器人通信的数传速率与距离的需要。

本系统中PIC16F877就是采用20MHz的时钟信号,能够满足即时收发数据以及编码的需要。整个系统中包含两种电源,无线通信模块的电源为3.3V,而MAX232又需要+5电源。信号线的连接也要考虑两种电平的匹配问题,在必要的地方要加上电平转换电路。

首先单片机要接收来自计算机端的数据,计算机串口输出的信号经过MAX232由232电平转换为TTL电平。但是由于单片机采用3.3V电平,因而MAX232输出的信号需经过电平转换才能输入单片机,电平转换可以采用TI公司提供的典型电平匹配电路(见图3),也可采用74LVCXX系列逻辑门来转换。

由于PIC16F877只有一个异步串行口,因而要通过16C550通用同步异步收发器(USART)芯片来扩展一个异步串行口。这样就可以保证从计算机串口输出的数据与无线通信的数据速率不同,从而使原始数据经过通信编码及打包数据量增加之后也能及时传送,并且在必要时也能将接收数据送回计算机端,实现半双工通道。系统的电路图如图4。从图4可以看出PIC单片机采用并口对16C550进行初始化配置。由于16C550共有10个寄存器,且占用了8个地址,因而PIC单片机用RA0、RA1、RA2三个通用I/O口做地址线选择16C550的各个寄存器。单片机可以不断通过RB1、RB2引脚检测TXRDY、RXRDY信号获知ST16C550是否接收到数据,还是已经发送了数据。还可以通过把16C550设置成中断方式使每接收到一个字节数据便产生一次中断使INT信号有效,单片机进入中断处理程序,从而使单片机的执行效率更高。

单片机通过自带的异步串行口输出数据到PTR3000通信模块。由于nrf903芯片接收和发送数据共用一个引脚,因而需要其他电路来解复用。最简单的方法就是在单片机的TX引脚先接一个10kΩ的隔离电阻,再与RX和PTR3000的DATA引脚相连。但是这种方法有两个缺点,它会造成发送的数据串入到单片机的接收引脚中,另外发送信号的驱动能力受到了极大的限制。因此,本系统采用了74HC244三态缓冲器作为隔离(见图4中虚线框内所示),并且通过单片机的RB4控制收发状态,因而在半双工方式下发送信号与接收信号可以互不干扰地传送。

对于通信模块工作状态的控制主要包含表1所列的这几个信号,通过单片机的普通I/O口即可控制。

表1 PTR3000工作工作模式配置表

PTR3000工作模式STBYPWR-DWNTXENCS正常工作:接收0000正常工作:发射0010掉电模式01XX待机模式10XX

1.2 发送端的软件设计

当系统复位时,单片机首先要对PTR3000无线通信模块和16C550的寄存器进行编程初始化。PTR3000的初始化编程是通过同步串行信号进行的,总共有三个信号CFG_CLK、CS和CFG_DATA,分别连接到单片机RC3、RB7、RC5引脚。PIC16F877单片机本身就有同步串行口功能模块,但是由于PTR3000的同步串行数据位为14位,并非整数字节,而且14位数据必须一次初始化完成,因此实际通过普通的I/O口编程来实现这14位的同步串行信号更方便一些。在整个初始化期间CS信号必须一直为高电平。这14位初始化字的定义见表2。在初始化同步串行信号输出时最高有效位在先。在对PTR3000编程前先其状态为接收状态以免在其他频率造成无线干扰,编程完成后就可以将状态改为发射状态了。

表2 PTR3000初始化控制字各位定义

Bit参数名称符  号

参   数

位  数0~1频段FB必须为了10(表示为选择频段915±13MHz)22~9频点CHf=902.1696+CH・0.1536(MHz) 10~11输出功率POUT发射功率≈-8dBm+6dBm・POUT212~13时钟分频输出Fup“00”=>Fup=fxtal

“01”=>Fup=fxtal/2

“10”=>Fup=fxtal/4

“11”=>Fup=fxtal/82

接下来对16C550的初始化设置。由于PIC16F877自身的并行口对16C550进行初始化编程设置各个寄存器,需要注意的只是在输出每一个字节之前先要通过RA0~RA2输出相应字节的地址信号。在初始化设置时将16C550的波特率设置低于76.8kbps,以保证接收的数据能够通过PTR3000即时发送。

1.3 接收端的硬件设计

接收端装在每个机器人小车上,由于机器人小车的控制采用DSP控制器TMS320LF2407,因而在接收端PTR3000无线通信模块就采用TMS320LF2407来控制。通过PTR3000接收的数据直接输入DSP,由DSP进行解码,从而做出决策和发出控制信号。因而无线通信系统的接收端电路相对发送端要简单得多,只需用TMS320LF2407代替发送电路中的单片机与PTR3000模块相连接即可。PTR3000的初始化编程也就由2407的普通I/O口来实现,只不过在初始化编程之后依旧保持PTR3000处在接收状态。

2 协议的设计

2.1 物理层的编码设计

物理层的编码设计要根据所采用的物理器件和物理信道的特性来决定。本系统采用PTR3000无线通信模块在接收模块中为了获得0直流电平就需要在所传输的数据中逻辑“0”和逻辑“1”的数量相等。只有满足上述条件接收部分才会获得很高的接收正确率。长时间空闲也会导致接收部分的0直流电平漂移,因为长时间的空闲实际上一直发送的是逻辑“1”。

由于PTR3000的这些特性,很自然就想到采用曼彻斯特编码(Manchester)(也称为数字双向码(Digital Biphase)或分相码(Biphase,Split-phase)。它采用一个周期的方波表示“1”,而且它的反向波形表示“0”。由于方波的正负周期各占一半,因而信号中不存在直流分量。在异步串行通信中有一个起始位“0”,因此将停止位“1”长度也设为一位,这样在一个字节共10位信号中也就不存在直流分量了。只是加了曼彻 斯特编码之后原来一个字节的数据现在要两个字节才能传送。

图4

有一些数字节,不会在进行曼彻斯特编码之后的数据串口出现,但是在一个字节中也具有0直流分量的特性,也有很高的接收正确率。这类数据字节如:0xF0、0x0F、0xCC、0x33等。从码型看来其中0xF0码型定时性能是最好的(其码型见图5),它很容易使异步接收器达到同步并且不会发生错误。由于0xF0的这种特性就可以用它做同步码元,在空闲的时间内通信系统就通过一直发送同步码元,使接收端保持同步,而且也可以保持接收模块的0直流电平状态。

2.2 纠错编码设计

为了在有一定外界干扰的情况下,保证主要与机器人之间的无线通信依然稳定可靠,必须采取一定的抗干扰措施,这可以采用纠错编码来实现。可以选择纠错编码方案有(14,8)分组码、(7,4)分组码和循环码,需要使用两字节的长度发送一字节的有效信息;(5,2)分组码和循环码,交错码、(21,8)分组码和缩短循环码、(21,9)BCH码、(21,12)BCH码,需要使用三字节的长度发送一字节的有效信息。

系统中使用了(7,4)分组码,并在实际中取得了较好的效果。它的构成方式如下:

假定不做任何处理的原码格式为:

其高四位的监督码为:

A2A1A0

其低四位的监督码为:

B2B1B0

则编码后成为两个byte长度:

1X7X6X5X4A2A1A0 0X3X2X1X0B2B1B0

其中每个字节的最高位作为标志位,用于表示高四位和低四位,高四位用“1”做标志,低四位用“0”做标志。接收端通过检测标志进行重组和解码。对于译码基本方法有维特比译码和使用监督矩阵译码,可根据具体的编码方案灵活选用。

2.3 帧格式设计

一般数据帧包括帧头、机器人标识、数据、数据校验、保留字节等内容,通常按照下面的格式排列:

帧头机器人标识数据保留字数据校验

为了保证帧能够准确接收,帧头的设计至关重要。一般帧头需要两个或两个以上的字节,并且应该选择数据中出现几率较低的数值和组合。在这个系统中可以采用一般数据中根本不会出现的数据字节如0xF0、0xCC作为数据帧头。而其它类型的帧(如开球或暂停等命令帧),则可以选择在0xF0之后加上其它的字0x33、0xC3、0x3C、0x0F等构成。这种帧头组合在一般的数据中是不会出现的,因而可保证帧同步不会出错。场上的每个机器人通过数据帧中的机器人标识来识别属于自己的数据,由于场上只有5个机器人,因而机器人标识只占用一个字节。

这套通信系统采用了PTR3000无线通信模块进行无线传输,并运用了单处机的编解码使这套系统工作更加稳定可靠,使数据通信及时正确地传送到场上的每个机器人,完全满足小型组足球机器人比赛的通信速率和正确率要求。

足球机器人 篇6

我校从2004年起组织学生参加国内外Robocup机器人竞赛,并取得了较好的成绩:2004年中国机器人大赛Robocup 2D仿真组冠军;2009年伊朗机器人国际公开赛3D仿真组季军;2010年新加坡世界杯3D仿真组冠军;2011年土耳其世界杯3D仿真组季军;2011年中国机器人公开赛3D仿真组冠军;2011年江苏省机器人大赛3D仿真组冠军等等。机器人竞赛的全面开展对提升我校电类专业学生的创新实践能力和增强就业竞争力发挥了积极作用,也加深了我们对自动化类课程实践教学重要性和必要性的认识,强化了我们对学生动手能力的训练,促进了我们对学生基本素质的培养。

学生创新实践能力通过机器人竞赛的成绩来体现,并在竞赛实施过程中得以培养和提高。近年来,我们贯彻教育部质量工程建设,在实施机器人竞赛过程中,以校级大学生机器人创新基地为龙头,积极开展教学改革。在教学团队建设、课程体系建设、注重实践教学、重视学生第二课堂等方面全面开展了大学生创新与实践能力培养新途径的探索。开展了如何培养学生的兴趣、如何在实验中发挥学生的主体作用、如何鼓励学生利用课余时间进行电子系统开发、如何营造创新环境、如何培养学生的创新意识、如何提高学生的创新能力、如何激发教师的指导热情等课题研究,积累了一定的经验,取得了一定的成效。在这过程中逐步形成了一个竞赛经验丰富的教学团队和一套卓有成效的竞赛培训体系。但是如何以机器人竞赛为载体,促进大学生创新与实践能力培养,我们还有很多需要探索和改进的地方,本文从以下几个方面进行改革。

一、竞赛教材的编写

以培养学生的创新实践能力为目标,完善培训课程设置、完善培训教学大纲、完善培训教材。建立完善的培训教学计划和培训体系。形成一年级普及兴趣班、二年级提高班、三年级综合班、暑期强化集训班的层次化集训体系,分别编写相关行之有效的集训教材;建立完善的、随着科技进步不断更新优化的实验教学体系;不断研制开发综合性、设计性培训实验项目。

设计一个参加Robocup球队,根本问题是设计一个多智能体系统,能够进行实时的反应,表现出目标指导的理性行为。目标与环境动态的实时变化,由于足球比赛的状态空间极大,不可能用手工的方法来编码所有可能的情形和智能体的行为。这使智能体能学习如何有策略的进行比赛变得极为重要,因此必须对课程的内容进行合理地选择。我们的选择思路是尽量涵盖机器人学的主要内容,使学生对机器人有一个整体的认识,同时必须突出重点,深入浅出,使学生掌握课程的关键知识。因此,选择仿人机器人和轮式机器人为对象,以机器人运动学、动力学和控制系统设计为主线,机器人传感器主要介绍光电编码器和视觉传感器,驱动器重点介绍直流伺服电机和舵机。机器人运动学和动力学部分主要难点是复杂的空间变换、运动学和动力学关系,这些内容即使对机械类的学生来说学起来也是相当困难的。如果要求学生完全掌握是不符合实际的,而且过多地纠缠在复杂的公式推导,学生难以理解反而会失去兴趣。因此,在讲授过程中简要介绍坐标变换、运动学和动力学原理。这样,学生以相对简单的对象进行学习,再通过仿真试验就可以对运动学和动力学原理有比较深的理解。认识到复杂的机器人系统不过是计算过程比较复杂而已,这一点对增强学生信心是非常重要的。在智能体协作方面,通过简化的人类足球赛策略模式,加以改进提升,形成有效的进攻与防守策略,让高智能算法理解起来不会太困难,这样改革教学内容和讲授方式可以减轻学生心理压力,进而学好本门课程的内容。

二、智能机器人实验平台建设

智能机器人实验平台主要包括轮式机器人实验系统和类人机器人实验系统两个主流的机器人平台。通過这两个平台的建设提高学生的动手和创新能力。

依托与网络机器人中央地方共建实验室的建设,建立轮式机器人实验系统,系统中机器人配备摄像头、激光和声纳等传感器,学生可以从中学习信息如何进行采集、如何进行处理和如何进行利用等多种知识,学习如何编写程序实现一系列的功能。

在类人机器人实验系统中,机器人各关节的运动及运动姿态由位于关节处的电机控制,依据所使用的电机个数的不同,机器人有不同的自由度,训练学生通过控制电机来实现机器人的行走、舞蹈及踢球等各种动作,将书本上的运动学及逆运动学的知识生动地再现。

三、学生兴趣的培养

兴趣是最好的老师。依托学院机器人竞赛创新基地和学生组织“Apollo社团”,进行科学的培训与管理,促进学生的素质与素养得到整体提高。培养的具体方法如下。

1.实验场所、实验设备、实验器材和文献资料对参赛同学全天候开放,分层次制订培训计划,使不同层次的学生都以最快的进度完成计划内容,让每一个参赛学生都能获得充实感、成就感。

2.树立培训榜样,使骨干队员充满自豪感,全力引跑,形成一种“比、学、赶、帮”的气氛。

3.建立竞赛获奖光荣榜,进行优秀作品展示,长期激励低年级同学。

4.积极邀请机器人方面的专家、应用能力强的优秀教师、高年级优秀获奖选手做学术和学习经验报告。

在培养学生的创新意识方面,我们进行过一些有益的尝试。如2010年机器人世界杯竞赛,学生任彦达、李立森、黄文伟应用自己所学的数学知识,完成了仿人机器人的全向行走、远距离射门、快速起身等动作的设计,并用一个多月的时间完成了算法的调试,最后在竞赛中取得了优异的成绩。由策划设计到实现调试,到答辩交流,整个过程和经历让学生终生难忘。机器人竞赛的操作性很强,侧重于锻炼学生的动手能力。竞赛使那些具有良好的理论基础、实践动手能力强,特别是具有创新意识和协作精神的学生有了施展自己才能的空间。在目前就业形势严峻的情况下,参加过我们集训的同学其实践能力都较为突出,在毕业时都找到了较为满意的工作,并得到用人单位的好评。今后我们将在集训项目的选择、竞赛指导的安排上进一步强化学生实践能力的培养。

此项工作得到南京邮电大学通达学院教改项目(TD00511JG11)、南京邮电大学教改项目(JG00511J79、JG00511J78)资助。

大场地足球机器人视觉系统优化设计 篇7

1场地校正

通过摄像头采集得到的原始场地图像,不可避免地存在着一定的变形,为了图像处理的准确,就要对图像进行校正,校正的目的就是对图像进行恢复后,得到基本无畸变的图像,以适应比赛的需要。在MiroSot 11vs11中,由于场地的变大,一个摄像头已经不能拍摄到整个场地的图像,因而要使用两个摄像头。两个摄像头的使用对视觉系统的校正提出了更高的要求。

通过分析比较各校正算法的特点,我们使用了高次多项式进行矫正。根据图像畸变的特性,可用坐标间的多项式变换来表示几何畸变,设原图像为undefined,受到几何形变影响变为undefined,这里undefined表示失真图像的坐标,它已经不是原坐标undefined,则原图像的空间坐标undefined和被矫正图像对应点的空间坐标之间的关系式为[1]:

式中n为多项式的系数;aij,bij为待定系数,显然校正精度与所用校正多项式次数有关,多项式次数越高,位置拟合误差越小。但随n的增加,也必然导致计算量的急剧增加。通过对大场地比赛系统的场地分析,我们采用了二元三次多项式,在保证校正精度的同时,有效减小了计算量。此时式(1)可写为:

undefined

由式(2)可知,要实现空间坐标变换,关键要确定式(2)中的系数aij,bij,从而通过反变换将几何畸变图像恢复成原图像。 本系统中利用现场定标方法,由图像中的标准点确定场地的标准形状,从而进一步确定aij,bij。最终判定出所采集图像的畸变程度。

在本系统中,利用二元三次多项式,则至少需标准点数为M=10。标准点的选择与矫正的精度有密切关系,所以标准点的选择应尽量均匀,考虑到场地的每个位置,即在场地上选择尽可能多的标准点。MiroSot 11vs11中,我们在每个半场上选择25个标准点,共有50个标准点,如图1和图2所示。校正后效果如图3和图4所示:

根据高次多项式变换算法基本上可以将图像的变形矫正到最小,即图像拼接时拼接线基本上是直的。所以可以直接将两副图像拼接起来而不加其他处理。如图5所示,两副图像拼接后,中间拼接部分对应的很好,中圈也对接的很好。

2颜色空间

在比赛系统中常用的颜色模型有RGB、HSI、YUV等,RGB属于基础颜色空间,它是面向硬件的颜色空间,图像采集设备最初采集到的颜色信息都是RGB值;YUV属于正交颜色空间,它的提出主要是为实现彩色电视与黑白电视系统的兼容;HSI属于认知颜色空间,它是最符合人类视觉感受的颜色模型[2]。结合比赛视觉系统的要求,我们采用了HSI颜色空间。

HSI空间中三个分量是相互独立的,改变其中任意一个,都不会对其他分量产生影响。H为色调信息,S为饱和度,I表示亮度,其中H、S对比赛中颜色识别的影响较大,而对于I因场地亮度变化较大,其值对识别的影响较小,根据比赛实时性的要求,为减小运算量,在颜色识别中我们忽略了亮度信息,只是通过H和S的阈值来识别颜色信息。RGB与HSI的转换公式为[3]:

undefined

其中

θ=arcundefined

undefined

因H值的转换公式较为复杂,考虑到比赛实时性的要求,本文建立了从RGB到H的映射表,比赛中通过查表的方式得到RGB值所对应的H值。经验证该方法对于比赛的实时性和精确性都能较好的满足。同时鉴于11vs11采用双摄像头的特殊性,我们针对左右半场分别建立了颜色库,从而对颜色信息实现了更精确的识别。

在赛前颜色样本采集过程中分别建立各个颜色分量的上、下阈值[4],从而在颜色空间中建立与目标颜色相对应的线性色库。HSI操作界面如图6所示:

对于颜色搜索,本文采用了全局遍历与局部搜索相结合的算法,首先通过正向遍历查找我方队标、球和对方队标,同时通过judge()函数判别目标色块的真伪、方位、角度等信息,然后以目标色块为中心,确定局部搜索区域,从而进一步确定机器人的队员号码。程序框架如下:

3结束语

针对FIRA的Mirosot大场地足球机器人系统的特殊性和复杂性,进行了视觉系统的优化设计。采用高次多项式对图像畸变进行了矫正;采用HSI图像模型对场地信息进行处理和目标分割与识别;在实时性和准确性等方面达到了较高的性能。已于河海大学“e龙”队的半自主足球机器人上得到了应用,在国际、国内的比赛中均取得了优异的成绩。

参考文献

[1]刘金根.一种基于现场定标的光电图像畸变校正算法.光子学报,2004,33(6):732~735

[2]周军,李振兴,李奎,郝达飞.Mirosot中基于不同颜色空间的图像分割比较研究.哈尔滨工业大学学报,2006,38(增刊):1335~1338

[3] Donald Hearn,M.Pauline Baker.COMPUTER GRAPHICS.Beijing:Prentice-Hall International,Inc,1998.564~582

[4] Goh Pit Khiam,Leong Kum Cheong,Chen Yen Yo,Liao Bao Chen.SOCRATES-TEAMDESCRIPTION PAPER.FIRA RoboWorldCongress 2006,Proceeding.Dortmund,Germany:FIRA,2006.195~198

基于遗传算法的足球机器人路径规划 篇8

机器人足球比赛近年来在全世界广泛盛行,其中足球机器人的路径规划问题也成为当下学术界的研究热点。遗传算法由于其自身的智能性搜索、强鲁棒性和内在并行性等特点,在路径规划、自动控制和模式识别等领域得到广泛应用。

足球机器人系统

足球机器人子系统

对足球机器人进行路径规划主要达成两个目标:一是为了完成某项动作,二是为了避障以实现安全的运行。足球机器人的路径规划具有复杂性、随机性、多目标和多约束等特点[1]。足球机器人系统由以下几个部分组成:

1)机器人小车子系统:由多个机器人小车组成;

2)视觉子系统:由摄像机、图像识别系统组成;

3)通讯子系统:由无线电发射板组成;

4)决策子系统。

足球机器人系统如图1所示,首先由视觉子系统进行场景识别,然后传递给决策子系统处理,再通过通讯子系统发出指令,最后足球机器人完成动作[2]。

决策系统为仿真足球机器人系统的核心,主要分为四部分:

1) 信息处理层:接受外部信息进行处理,转换坐标信息;

2) 分区决策层:进行场地分区,确定机器人队形和分配角色;

3) 路径规划层:路径规划层接收到上一层分区决策层所传递的信息,本层的主要任务是对机器人完成任务所需的运动轨迹进行规划,因此足球机器人是否能够顺利地完成任务是本层的关键,也是决策系统的关键;

4) 运动层:执行该机器人所分配的任务。

运动学模型

足球机器人运动学模型

本文采用的足球机器人是两轮差动式移动机器人,由其两个轮子共轴并且进行独立驱动。设机器人当前的位姿为P=[x c, y c, zc]T,速度为V,左右轮的速度为VL和RV。则足球机器人的位姿与速度关系由下式表示:

其状态空间有三个分量:x、y和θ,但是控制分量却只有两个:线速度和角速度,或者是VR和VL[3]。因此,必须增加如下约束方程:

足球机器人可看作直线或曲线运动,其运动学模型表示如下:

其中,L为足球机器人的边长,MV、mV分别为较大和较小的轮速,X0、0Y为机器人当前的坐标,α0为机器人当前的方向角。

小球运动学模型

足球只能做直线运动,并且在没有外力的作用下,足球所做的运动是匀减速直线运动。表示如下:

其中,tV、Xt、tY表示足球在t时刻的运动状态,Vt-1, Xt-1, Yt-1表示足球在t-1时刻的运动状态,α表示由摩擦力产生而的加速度,∆t表示时间间隔,θt-1表示足球在t-1时刻的运动方向。

用遗传算法进行路径规划

遗传算法流程

遗传算法是一种智能化搜索寻优技术。它从某一初始群体出发,按照一定的操作规则,不断进行迭代计算,最终逐步逼近最优解。它具有智能化搜索、并行化算法、通用性强和全局最优解等特点,在众多学科领域得到广泛应用。

用遗传算法进行路径规划,其流程如下:

1)初始群体生成

初始种群为随机生成的、从出发点到目标点的任意一条可行路径的集合。初始群体的规模大小将会影响到遗传算法收敛的速度和精度准确性。

2)染色体编码

遗传算法是对个体的基因进行操作,变量与个体之间映射是通过编码来实现的。用十进制栅格序号表示路径节点,用栅格序列表示一条染色体,染色体为不定长染色体。

3)适应值计算

式中,n为该个体所通过的栅格总数,D为该个体中相邻序号之间的直线距离之和[5]。

4)遗传操作

遗传操作是对编码后的个体进行操作, 遗传算法首先由初始种群开始,初始种群是由一些初始解组成,初始种群不一定包含最优解,遗传算法主要通过对种群进行选择、交叉和变异这三个遗传操作,最终收敛到最优解。

实验仿真

首先建立足球机器人运动学模型。设机器人的当前位置为 (x (t) , y (t) ) ,方向为θ (t) [θ (t) ∈2π],运动速度v (t) ,其中t表示机器人的运动时间。起始点R,终止点G,假设足球机器人在短时间t内的速度为恒定,则可列方程如下:

其中,k=0, 1, 2,…,N-1;为采样周期。

进行种群初始化设置。选择路径上的任意点为一个集合,组成一条染色体,即路径。设起始点R (Rx, Ry)和目标点G (Gx, Gy) 已知,在避障区域Φ内,将线段RG进行m等分,并且在等分点做垂线得到VL1, VL2, (43) , VLm[6]。再将垂线n等分,则在避障区域Φ内,就得到m×n个路径点,表示为VLi (x (j) , y (j) ) ,如图2所示。

再将起点到终点之间所有经过的路径连接,即构成一个染色体,表示为Ci={VL1 (x (i) , y (i) ) , VL2 (x (j) , y (j) ) , …,VL2 (x (k) , y (k) ) }。然后进行障碍物检测。采用面积法判断球场的机器人是否为障碍物,其仿真结果如图3所示。

选取适应度函数为:f=A+B,

其中,

最后进行足球机器人路径规划的仿真,结果如图4~7所示。

可以看出,遗传代数的不同对足球机器人的路径规划有很大的影响,遗传代数增加时,路径规划逐渐变好,但是相应的运算时间也会增加。因此在实际当中,需要综合考虑,选取最优遗传代数。

结束语

本文研究了足球机器人的运动学原理,讨论了遗传算法在足球机器人路径规划中的应用,进行仿真实验并比较了不同遗传代数对路径规划的影响。

参考文献

[1]张海英, 范进桢.移动机器人路径规划研究现状及展望[J].微型机与应用, 2011, 30, (2) :12-16

[2]朱大奇, 颜明重.移动机器人路径规划技术综述[J].控制与决策, 2010, 6, (3) :23-26

[3]吴丽娟, 徐心和.基于遗传算法的足球机器人比赛中障碍回避策略的设计[J].机器人, 2001, 23, (2) :142-145

[4]邓志燕, 陈炽坤.基于改进遗传算法的移动机器人路径规划研究[J].机械设计与制造, 2010, 10, (8) :221-224

[5]张帆, 周庆敏.基于遗传算法的移动机器人路径规划仿真[J].机器人技术, 2008, 24, (6) :282-285

自主式足球机器人控制系统设计研究 篇9

关键词:足球机器人,DSP,控制系统

0引言

目前, 国内外ROBCUP自主式机器人足球比赛已经引起科技工作者的广泛关注。比赛中所采用的自主足球机器人实际上是一个自主工作的小车, 自主机器人内部装载有完整的嵌入式计算机控制系统, 机器人不需要外界提供计算能力, 可以完全自主地收集和处理周围环境信息, 进行行为决策。在机器人的顶端安装有视觉传感器, 为机器人提供周围环境的视频信息。此外, 机器人还可以配备超声波、红外线或其他传感器, 用来对环境进行距离探测和障碍探测。在多机器人参与比赛的时候, 为实现机器人间的通信, 还安装了无线通信系统, 共享已经探测到的环境信息, 构成多机器人的协作系统。机器人还配备有可充电电池组, 为嵌入计算机、传感器、驱动电机提供电能。

1自主式足球机器人系统

自主式足球机器人系统的具体构成多种多样, 总体系统结构归纳起来主要可分为3种类型, 其结构框图分别如图1、图2、图3所示。

在图1所示的方案中, 机器人具有单一的高性能计算机系统。该计算机系统不仅用于系统决策规划, 还通过运动控制卡负责控制机器人底层的行为。这种方式的优点是形式简单。但是, 在这种方式中, 由于计算机系统还需要处理对计算资源需求很大的环境建模 (传感器信息处理、融合) 、决策规划等问题, 有可能会导致机器人底层行为控制性能差。另一方面, 由于体积等的限制, 这种方案中的计算机系统一般用的是工控机, 工控机的插槽资源很有限, 常常会出现运动控制卡和图像采集卡等争插槽的情况。

在图2所示的方案中, 机器人同时具有主计算机和下位机。主计算机是一高性能的计算机系统, 专司环境建模、决策规划等工作。下位机由一较低档的计算机充当, 负责封装机器人的底层行为 (如移动、转弯、踢球、护球等) 和某些传感器信息的预处理 (如声纳、里程信息等) 。主计算机和下位机之间通过串行连接等方式进行通信。这种方案给了机器人构成上的灵活性, 上位机的选用可以很灵活 (如可临时使用笔记本等) , 去掉主计算机, 下位机还可起很多作用, 机器人仍能用来做许多移动机器人实验和进行教学活动。

在图3所示的方案中, 由DSP板或微处理器板及驱动器负责机器人的底层行为控制。这种方案往往是自行开发底层控制软件乃至硬件。从硬件成本角度来说, 可以做到最低, 而且从开发角度来说, 自主度和灵活性最高。但是采用这种方式, 系统开发的工作量一般来说是最大的。目前, 因开展足球机器人活动本身有着培养人才和进行多种研究的性质, 这种方式还颇受欢迎。

2控制系统的设计

2.1 控制系统的硬件平台设计

足球机器人性能的优劣除了由可靠、有效的机械结构来保证外, 其主控系统的核心CPU是机器人的大脑。CPU的选择不仅决定了主控系统设计的性能, 同时制约了其他系统的设计。足球机器人多采用8位、16位或32位单片机作为微控制器, 例如康奈尔采用MOTOROLA的MC68HC16。由于目前的足球机器人车体多为三轮或四轮, 采用单片机对实现多电机控制来说, 其硬件设计存在结构相对复杂, 算法控制实时性差等缺点, 因此本文采用美国TI (德州仪器) 公司的TMS320LF2407A微控制器。2407A DSP控制器具有丰富的外围接口, 它将DSP的高速控制能力和面向电机的高效控制能力集于一体, 使机器人控制系统外围电路的设计大大简化, 而且算法控制的实时性提高, 使系统更为简单, 稳定可靠。其电气连接示意图如图4所示。

2.2 控制系统软件设计

控制系统软件设计的关键是算法的选择, 这将决定整个足球机器人的性能。由于足球机器人是离散系统, 每隔一段时间采集一次左右轮的速度, 所以本文设计采用了增量式的PD算法, 即:

e (n) =r (n) -y (n) 。 (1)

u (n) =u (n-1) +Δu (n) 。 (2)

Δu (n) =kp[e (n) -e (n-1) ]+kie (n) +kd[e (n) -2e (n-1) +e (n-2) ] 。 (3)

其中:r (n) 为第n次的输入量;y (n) 第n次速度反馈量;u (n) 为第n次的输入控制量;e (n) 为第n次的偏差量;kpkikd分别为PD控制的比例、积分、微分系数。

3实验结果与分析

经过现场实验测定, 足球机器人的左右轮起动、制动所需时间见表1。上位机给定速度和电机正、反转时的转速见表2。

从表1和表2不难看出足球机器人起动时间以及制动时间都比较短, 机器人电机无论正转还是反转左、右轮的输出线性都很好, 两轮的协调性也好, 机器人运行稳定。整个系统设计合理。

参考文献

[1]徐国保, 尹怡欣.智能移动机器人技术现状及展望[J].机器人技术与应用, 2007 (3) :29-34.

[2]余群明, 王会芳.足球机器人运动控制算法研究[J].湖南大学学报 (自然科学版) , 2006, 33 (6) :42-45.

[3]东北大学机器人研究室.微型足球机器人设计与开发—讲座连载[J].机器人技术与应用, 1999 (5) :25-28.

足球机器人 篇10

近年来, 研究学者从生物学和社会学的角度来观察和设计多机器人系统, 出现了许多智能的机器人协作方法, 如遗传算法[2]、蚁群算法[3]、强化学习[4]等, 其中人工免疫系统 ( artificial immune sys-tem, AIS) 所具有的分布式系统和自组织、并行计算、识别能力、动态网络平衡和学习能力等特性以及强大的信息处理和问题求解能力使它成为研究多机器人系统协调协作的一个重要方法[5]。如文献[6]提出了一种基于人工免疫系统的异构多机器人联盟形成方法, 利用人工免疫系统的隐喻机制为面向动态未知任务的异构多机器人联盟形成问题提供了一种新的思路和解决方法。文献[7]基于人工免疫系统, 提出了机器人自主合作的任务分配算法, 该算法通过抗原刺激的自我强化学习来实现任务分配, 提高了系统性能。

对于Robocup中型组足球机器人比赛, 机器人必须随时对复杂多变的动态环境做出决策, 如何智能的协调个体与整体之间的协作关系, 完成带球射门的任务, 是本文的主要研究内容。

1 足球机器人体系结构

人工免疫系统是受免疫学启发, 模拟免疫学功能、原理和模型来解决复杂问题的自适应系统。

Jerne的免疫网络模型[8]较好的解释了免疫调节机制。基于Jerne的独特型免疫网络模型, Perel-son提出了独特型网络[9]的概率描述方法, 将免疫系统视为由免疫细胞或者分子组成的调节网络, 免疫细胞以抗体间的相互反应和不同种类免疫细胞间的相互通信为基础, 抗原识别是由抗原相互作用所形成的免疫网络完成的。免疫系统内每个抗体的双重结构决定了同时具有识别和被识别的可能, 系统内众多抗体之间的激励和抑制作用形成一个网络系统, 处于稳定状态。

在基于Jerne免疫网络理论的基础上, 建立足球机器人个体混合式体系结构, B细胞的免疫反应对应本能控制层, T细胞的免疫反应对应智能控制层的学习模块, 如图1 所示。

机器人通过感知层中的传感器获得当前状态下, 该机器人所能感知到的抗原, 同时机器人之间通过相互通信, 各机器人将其环境信息及状态动作, 也就是抗体代表, 传送给该机器人。通过对这个信息的提取, 即抗原提呈, 并结合自身感知到的抗原信息, 对所得到的抗原进行匹配。

对抗原进行匹配, 并得到B细胞对该抗原的亲和度, 对抗原进行识别, 机器人进行快速反应。利用B细胞产生的抗体与抗原及其它抗体间的激励和抑制作用, 智能控制层对机器人的基本行为进行合理的规划, 结合任务分配模块, 实施决策, 机器人个体自主选择合适的行为, 并通过执行机构执行 ( 产生抗体) , 同时将机器人的抗原抗体信息存入记忆库。

利用B细胞之间信息的共享和不同B细胞产生的抗体之间的相互作用, 体现机器人之间的协作性。随着任务的进程, 机器人搜集到更多的环境信息和任务执行情况, 利用免疫系统中T细胞对B细胞的调节作用, 即机器人的学习能力, 对机器人智能控制层进行优化。

借鉴人工免疫系统的分布性, 构建分布式的机器人群体体系结构。免疫系统中, B细胞产生的抗体之间的激励和抑制作用, 在足球机器人系统中表现为机器人之间的行为策略互相影响, 最后机器人个体自主选择合适的行为, 由执行机构执行。T细胞对B细胞的调节作用, 表现为足球机器人系统随着环境和时间的改变, 系统进行优化。而B细胞之间的信息共享以及不同B细胞对同一抗原的互相作用, 表现为机器人之间的协作性, 足球机器人系统结合机器人内部行为间的相互作用力, 在获取环境信息自主作业的同时选择恰当的机器人进行协作, 更好的完成任务。使足球机器人系统具有很强的实时性、动态适应性和鲁棒性。

2 足球机器人免疫系统模型及其算法

在构建足球机器人个体体系与群体体系结构后, 结合独特型网络模型和机器人的智能性, 建立出不同角色的机器人产生的不同抗体与外界抗原及其它抗体间相互作用关系的足球机器人免疫 ( soccer robot immune, SRI) 系统, 其模型如图2 所示。

足球机器人免疫系统与人工免疫系统之间的对应关系如表1 所示。机器人之间的通讯采取黑板模式的通讯。

2. 1 SRI系统模型参数定义SRI系统可表示为

式 ( 1) 中, ENV为环境信息, R为免疫B细胞集合, 即本方机器人集合, 表示为

式 ( 2) 中, i = 1, 2, …, m; m为机器人个数。CR为机器人Ri的通讯范围, 在其通讯范围CR内的机器人RjCR可以定义为

ENV定义为

式 ( 4) 中, RES表示SRI系统的资源, 包括时间与空间以及其他信息, Ag为抗原集合, 表示为

式 ( 5) 中, TAg为环境抗原, 是目标信息和障碍信息的集合, EAg为通信抗原, 为教练的命令以及其他队友的请求。

2. 1. 1 抗原激励值gi

当机器人Ri感知到目标T时受到的激励为:

式 ( 6) 中, α1、α2、α3为常数, 0 ≤ α1, α2, α3≤ 1 , 且α1+ α2+ α3= 1 ; dit为二维平面内机器人位置P ( Ri) 与球的位置P ( T) 之间的距离, 表示为

Oij为任务出现的频率,

式 ( 8) 中, θti为机器人运动方向相对于机器人正前方的夹角, θoi为目标相对于机器人正前方的角度, 如图3 所示。

定义机器人中心为机器人坐标原点, 机器人正前方为机器人坐标y轴正方向, x轴正方向符合右手坐标系; 世界坐标的原点为球场中心, 机器人进攻方向为y轴正方向, x轴正方向符合右手坐标系。

Roi为机器人角色特征, 不同的角色具有不同的进攻度 ( 队员进攻的倾向性) 和侵略性 ( 以自身为中心的活动区域大小) , 例如, 定义前锋具有最高的进攻度和较高的侵略性。

2. 1. 2 抗原的自强化调整

当机器人Ri发现它无法独立完成任务时, 其他机器人接受到请求信息后会根据自身情况响应协作。为尽快完成协作任务, 将响应机器人作为抗原激励值的一个奖励信号, 对机器人Ri的抗原激励值进行强化, 则

式 ( 9) 中, w为参数, n为在响应协作的机器人个数, dij为协作机器人Rj与机器人Ri的距离,

式 ( 10) 中, θtj为球相对于协作机器人Rj的夹角。

2. 1. 3 抗体间的相互作用力

对于目标T, 机器人Ri与其他响应协作的机器人RjCC都会产生抗体, 这些抗体之间存在激励与抑制的关系。

设响应协作的机器人RjCC对机器人Ri产生的抗体间相互作用力为gij, 则

式 ( 1) 中, α4、α5为参数, 0 ≤α4, α5≤1 , 且 α4+ α5=1 ; θij为机器人RjCC相对于机器人Ri的角度。当作用力为激励时, gij符号为+ , 抑制时gij符号为- 。

2. 1. 4 机器人行为与策略

机器人的策略制定是基于环境状态和系统内部状态共同决定的, 通过机器人的行为函数来执行。机器人之间的协作通过机器人之间的请求与回应来完成任务。

设定机器人的行为有探测Ex、发现目标Ga、处理目标Pr、请求帮助Rq和响应协作Rp五种基本行为状态。

以前锋角色为例说明本方协作进攻过程中的行为控制策略变化情况。前锋机器人Ri处理目标的过程可细化为: 接近球Ap T、进攻At T、射门Ko三种行为状态。

则前锋Ri在完成一个进攻动作过程中的行为控制策略如下图所示:

2. 1. 5 抗体激励水平及浓度

基于Farmer提出的抗体分子的激励水平及浓度的动态方程, 在SRI系统模型中, 计算抗体激励水平及浓度的动态方程如下

式中, α、β 为常数, N为抗体总数, Ai ( t) 为t时刻第i个机器人的激励水平, ai ( t) 为t时刻第i个机器人的激励浓度, ki为抗体i的自然死亡率。

综上所述, 基于SRI的足球机器人之间互相通讯与交流, 其协作方式不断得到进化, 同时, 机器人通过对随时变化的环境做出决策, 个体处理问题的能力也得到提高。

2. 2 基于SRIS的足球机器人协作算法

算法的主要步骤如图5所示:

3 实验与结果

3. 1 仿真环境与实验室环境

仿真环境为18 m ×12 m的足球赛场, 机器人实验室环境为9 m ×6 m的足球赛场, 使用直径为490 mm ×464 mm的机器人, 每个机器人都可以感知视野范围内其它机器人和足球的速度及距离位置信息, 机器人根据角色的不同具有一定的基本行为。设定机器人的最大移动速度为2. 5 m/s ( 距球较近时速度低, 较远时速度高) , 时间步长为0. 1 s, 全向视野范围r = 4 m。机器人的射球距离为3 m, 即当机器人在距对方球门3 m范围内, 可完成带球射门的任务。

设定双方球员以不同颜色标注, 己方机器人为紫色, 使用SRI算法, 对方机器人为蓝色, 采用有限状态机 ( finite state automaton, FSA) 方法, 足球为橙色。仿真环境下双方各有5 名机器人, 实验室环境下由于条件限制双方各有3 名机器人, 分别为1 号前锋, 2 号协前锋, 3 号协后卫, 4 号后卫, 5 号守门员。

可知, 本方机器人集合构成了一个SRIS系统, 它们的反应行为是抗体, 行为之间的激励或抑制决定系统的行为决策。

3. 2 仿真结果与实验结果

在Windows XP系统的计算机上, 使用Visual C ++ 6. 0 进行仿真, 并与基于有限状态机的机器人协作在相同环境与时间300 s ( 所有进攻过程时间总和) 下的带球进攻结果进行50 次仿真结果的比较, 图6 为基于SRIS算法的一次成功的仿真进攻过程截图, 图中定义己方的进攻方向为图中向右方向, 对方的进攻方向为图中朝左方向。

图6 ( a) 中, 本方1 号前锋即将拿球, 1 号检测到在其前进方向的左前方有较多对方球员, 无法左转进攻, 于是向其他机器人发出协作请求, 同时在带球后, 右转躲避对方机器人的抢球行为。

图6 ( b) 中, 本方2 号协前锋接受到1 号的请求信息后, 响应协作, 向离自己最近的对方球员 ( 对方1 号) 前进, 阻碍其抢球的行为。本方3 号协后卫跟随本方1 号的行为, 避免1 号发生紊乱, 将球射入本方球门的情况。本方1 号前锋在转弯过程中检测到其右后方有对方球员, 可能会干扰其行为, 向本方其它机器人发出协作请求。此时, 本方2 号机器人已成功并继续阻拦对方1 号的行为, 于是本方3 号响应协作请求, 对离本方1 号最近的对方机器人 ( 对方2 号) 进行阻拦。

图6 ( c) 中, 本方1 号前锋右转弯成功, 同时本方3 号机器人也阻碍了对方2 号的行进速度与方向。本方1 号检测到在其正前方, 对方机器人都比较远, 且夹角较大, 于是本方1 号发起进攻行为。

图6 ( d) 中, 对方机器人由于协作性不够强, 都朝向足球的方向前进, 发生了拥挤行为, 使得本方1号成功摆脱它们的拦截, 处于有利的进攻地位, 本方1 号发起进攻射门动作。

表2 为对应图6 各图场上机器人 ( 守门员除外) 的世界坐标位置变化情况, 定义球场中心为世界坐标的原点, 乙方进攻方向为世界坐标y轴正方向, 世界坐标x轴正方向符合右手坐标系。

相同仿真环境下, 与采用FSA方法的机器人协作在相同条件下进行20 次, 每次时间为时间300 s ( 所有进攻过程时间总和) 的带球进攻仿真, 对结果进行比较。

成功进攻指在比赛过程中, 未发生球出界、对方机器人抢到球、机器人拥挤造成比赛停止等现象。平均成功进球率指成功进攻次数与进攻次数之比。平均成功进球率为进球数与进攻次数之比。

仿真结果对比表如表3所示。

将SRIS算法应用于实际足球机器人实验室环境, 图8 为其中一次成功的进球过程截图, 在相同条件下的实际环境对比结果如表4 所示。

机器人实验室环境为9 m × 6 m的足球赛场, 定义球场中心为世界坐标的原点, 乙方进攻方向为世界坐标y轴正方向, 世界坐标x轴正方向符合右手坐标系。使用直径为490 mm ×464 mm的机器人, 实验室环境下, 如图8 中所示的小禁区尺寸为1 800 mm ×400 mm, 大禁区尺寸为4 875 mm × 750 mm, 场地白线宽度为100 mm, 球场中圈半径为1 000 mm。

由图8 ( a) 可知, 双方呈现对抗姿态, 红队1 号感知到球在其前方位置, 前进拿球, 同时感知到对方球员的位置信息, 判断自身无法独立完成带球射门的任务, 向红队2 号机器人发出请求协作信息。

图8 ( b) 中, 红队2 号接收到红队1 号的协作请求信息, 并对信息响应, 判断离它最近的对方球员, 进行防堵, 阻碍蓝队2 号抢球。此时, 红队1 号带球向球门前进, 并加速运动躲避蓝队1 号的抢球行为。

由图8 ( c) 可知, 红队2 号成功的阻挡了蓝队2号的行为, 红队1 号加速前进, 顺利的躲开了蓝队1 号。

图8 ( d) 为成功进球的结果。

与仿真对比试验在相同环境下, 与采用FSA方法的足球机器人协作进行进攻比较。

由于实验室环境的影响, 两种方法的平均成功进球次数和平均成功进球率都有一定程度的下降, 但是SRI系统足球机器人协作算法仍能保持较为满意的结果。

通过仿真实验及数据可以得出, SRIS算法可以成功的实现足球机器人合作带球进攻的过程, 并且SRIS算法比FSA算法在相同条件下, 平均成功进球率提高了12% , 而平均成功进球率提高了11% , 在实验室环境下提高了10% 次平均进球次数, 平均成功进球率也提升了8% 。

4 结论

本文研究了Robocup中型组全自主足球机器人协作进攻的问题, 基于人工免疫系统特性对足球机器人体系结构进行了改善, 构建了适用于足球机器人的人工免疫网络模型并给出其对应的协作算法, 该算法的突出特点是: 利用免疫网络中环境对机器人的激励和不同角色机器人之间的激励和抑制, 选择合适的机器人进行协作, 避免机器人资源的浪费。

实验表明SRIS算法较好的提升了足球机器人系统的性能和协作能力, 提高了机器人的成功进攻率和成功进球次数, 该算法比机器人原有的基于有限状态机的协作更好。

参考文献

[1] 王磊, 唐华斌, 孙增圻, 等.多机器人系统形成联合协作的综合评价算法.清华大学学报 (自然科学版) , 2005;45 (4) :505—508

[2] Suzuki M.Planning of diverse complex cooperative robot actions using multi-stage genetic algorithm.IEEE International Symposium on Computational Intelligence in Robotics and Automation (CIRA 2009) , 2009:8—14

[3] 张银玲, 牛小梅.蚁群算法在移动机器人路径规划中的仿真研究.计算机仿真, 2011;28 (6) :231—234

[4] 王腾, 李长江.基于强化学习的全自主机器人足球系统协作研究.科学技术与工程, 2011;11 (5) :979—982, 1011

[5] Chen Pin-Chang.Using immune network in nonlinear system identification for a 3D parallel robot.Information Technology Journal, 2009;8 (6) :895—902

[6] 姜健, 闫继宏, 臧希喆, 等.基于人工免疫系统的异构多机器人联盟形成.计算机工程与设计, 2009;30 (9) :2246—2248, 2253

[7] GAO Y.Task allocation algorithm based on immune system for autonomously cooperative multi-robot system.Intelligent Automation and Soft Computing, 2009;15 (2) :263—273

[8] Jerne N K.The immune system.Scientific American, 1973;229 (1) :52—60

上一篇:燕赵代有才人出下一篇:地面数据