计算机视觉运用范例(12篇)
计算机视觉运用范文篇1
关键词:动画,计算机动画,多媒体,视觉设计
计算机动画产生于20世纪60年代初,至今已有40多年的历史,但目前人们对计算机动画还存在一些误解和偏见,如计算机动画就是Flash”,包含了高难度技术的计算机动画才是好的计算机动画”等。本文介绍了计算机动画及其分类,重点阐述了计算机动画中的技术与艺术及其间的关系。
一、计算机动画的定性
当人们看到一件物体时,即使它马上消失了,它在人的视觉中还会停留大约十分之一秒的时间,这就是视觉暂留”现象。科技论文。也就是说,当图像序列中的一幅幅独立图像按照一定的速率连续播放时,人的眼睛会把每幅不同的画面连接起来,在我们脑中产生物体在运动”的印象。所以,动画是利用视觉暂留现象,使图像序列中的一幅幅静态图像在人的眼前呈现出的连续运动的画面。科技论文。所谓计算机动画是指利用计算机产生图像序列中的一幅幅静态图像,并且用计算机控制动画的播放。
二、计算机动画的分类
计算机动画发展到今天,己经产生了多种类型,从不同的角度可对其进行不同的分类:从应用的角度,计算机动画可分为动画片、游戏动画、信息传播动画、教学动画、装饰动画等;从流通角度,计算机动画可以分为网络动画和非网络动画;从制作角度,计算机动画可以分为人机动画、机制动画、编程动画;从视觉角度,计算机动画可以分为平面动画(二维动画)和立体动画(三维动画);从图像格式角度,计算机动画可以分为位图动画与矢量动画;从制作软件角度,可以分为FLASH动画、3DSMAX动画、MAYA动画等等。
三、计算机动画中的技术与艺术
计算机动画蕴含着极强的技术性和艺术性。科技论文。从技术层面上讲,它是计算机的应用技术,如:计算机建模技术、图形图像处理技术、音频视频处理技术、特效制作技术、后期合成技术、编程技术,等等。从艺术角度上讲,它可以是文字的艺术、绘画的艺术、动作的艺术、音乐的艺术、创作的艺术等等。
(一)计算机动画的技术性
无论是哪一种计算机动画的制作,都要有相当的技术作为基础。这种技术首先体现在对计算机动画设计软件和硬件的驾驭能力上。由于计算机动画制作所涉及的软件与硬件非常多,而且这些软硬件处于不断更新换代之中。企图轻轻松松很快熟练掌握这些技术是不容易的。
1、硬件上的难点
熟悉各种硬件的性能、找到不同硬件的最佳组合、熟知硬件间的兼容、熟练使用多种计算机硬件、了解不同硬件功能的差别、实现硬件之间的功能互补及资源共享等。要解决这些难题除了理论上的分析,更需要长时间的实践。
2、软件上的难点
就软件而言,其种类也非常繁多,有综合型的也有专业型的;有音频视频的,也有图像和动画的;有平面的也有立体的;有静态的也有动态的,有菜单命令控制的,也有脚本语句或编程实现的。要熟悉各种软件的操作和使用,需要长时间的练习,尤其对于利用脚本语句或编程实现的计算机动画,要经过对计算机语言方面进行专业地学习才能够掌握。
不仅如此,计算机动画制作除了必须具备丰富的形象思维能力外,还必须具备敏捷的理性思维能力,这种能力贯穿于计算机软硬件的操作及动画角色、场景设计的流程控制上。因此,只有熟练掌握计算机动画设计所需要的技术,才能保证计算机动画制作的质量和效率。
(二)计算机动画的艺术性
动画是一门艺术,正如动画大师宫崎骏曾这样评论动画艺术,他说:我看到了动画的制作是何其慎重且值得珍惜的事业……动画是一个如此纯粹、素朴,又可让我们倾注想像力以表达的一门艺术……它的力量不会输给诗、小说或戏剧等其他艺术形式。”计算机动画是利用计算机技术进行视觉设计和听觉设计的艺术。视觉设计是针对眼睛官能的主观形式的表现手段和结果。计算机动画中有画”、有音”、有动”,它是画”的艺术、音”的艺术、动”的艺术。画面中的色彩、线条、形体、构图即是画”的艺术;音乐中美妙的节奏、韵律即是音”的艺术;正如英国动画大师诺曼·麦克拉伦(NormanMclarlen)说:动画是画出来的运动”的艺术,计算机动画中动作设计、镜头的变化、角色的安排、场景的布置及转换、动画物体变化的快慢速度的处理,即是动”的艺术。计算机动画通过文字、图像、声音、动作等多媒体准确地传达信息,体现出计算机动画的艺术性,同时也展现出视觉设计和听觉设计的魅力。
在创作手法上,计算机动画也体现出它独特的艺术性。计算机动画经常运用夸张、幻想、变化、虚构、神似等手法来反映人们的生活、理想和愿望,并且能产生非常强烈、奇趣、出人意料的银幕视听效果,给人予的强烈的感染力和影响力。另外,计算机动画的风格也是其艺术性的体现。或细腻、或粗犷、或幽默、或严肃、或现代、或民族…不同的风格给人以不一样的艺术感受和回味。
(三)计算机动画技术和艺术的关系
技术和艺术是计算机动画不可或缺的两个方面,二者并非相互对立的而是相辅相成,贯穿于动画制作的始终。例如,计算机动画中出现什么样的画面构成是艺术的问题,如何出现这样的画面构成是技术的问题;计算机动画中应该出现什么样的动作是艺术的问题,如何出现这样的动作是技术的问题;技术是艺术表现的基础和前提,艺术是技术实施的目的。忽视计算机动画的技术,就不能实现预期效果;忽视计算机动画的艺术,便会遏制艺术的追求,削弱计算机动画的感染力和价值。所以,计算机动画中的技术和艺术应和谐互融、完美结合,才能充分展现计算机动画的无限魅力和价值。
四、计算机动画的鉴赏
计算机动画的鉴赏可分为:技术鉴赏、艺术鉴赏、功能鉴赏。所谓技术鉴赏,是指欣赏时主要着眼于动画的技术运用效果。如建模的精细程度、图像处理的品质、音频视频的同步性、程序控制的精确性与流畅性等;所谓艺术鉴赏,是指对动画的审美进行的鉴赏。如画面的美感、动作的表现、音乐的运用、镜头的变化、角色的安排、场景的布置及转换、情节的设计、创意的表现、艺术风格等;所谓功能鉴赏,是品评动画的功能是否完美。如动画的导航功能(按钮链接、鼠标跟踪、界面设计)、表现功能(演示效果)、表述功能(文本描述)、测试功能(学习效果的测试,常见于多媒体课件类动画)、多媒体控制功能(声音、动画的播放及交互性)等。
五、后记
计算机动画既是一门技术,也是一门艺术。计算机动画的制作技术是值得专业人士终身研究的,计算机动画的艺术魅力也是值得动画制作者毕生追求的。它是一个博大精深、丰富多彩的专业门类。只有精湛的技术和卓越的艺术完美结合,才能产生魅力无穷的计算机动画。
参考文献:
[1]王宏建,袁宝林.美术概论[M].北京:高等教育出版社,1994:1-65
[2]吴冠英.动画美术设计[M].北京:高等美术出版社,2001.4:13-25
[3]孙立军,李捷.现代动画设计大全[M].石家庄:河北美术出版社,2001.7:5-8
[4]吴起.3DSMAX4精彩范例制作[M].北京:北京希望电子出版社,2001.6:32-45
[5]李显,周进.数字影视后期制作高级教程[M].北京:中国青年出版社,2001.2:52-68
[6]赵子仁.Animato:Pr电脑动画的活动画面制作技术[M].北京:电子工业出版社,2000.6:8-12
[7]苑玉峰.分形几何与分形艺术.中国图像图形[J],2001.3:35
[8]索晓玲.动画影片画面欣赏[M].北京:北京广播学院出版社,2003:7-8
[9]孙立军.影视动画影片分析[M].北京:海洋出版社,2006,6:2-56
计算机视觉运用范文篇2
[论文摘要]随着计算机三堆技术在影视特效和动画制作方面应用的不断深入,计算机三维技术对于影视广告设计和影视栏目包装等影像作品的影响也越来越大,它能创造出完全由计算机虚拟出传统手法无法获取的镜头运动、角色动画或奇幻场景及一些令人惊叹的视觉特效,实现了科学技术和艺术的完美结合。为创意的发挥开辟了崭新的天地,如何有效地将计算机三维图形技术运用到影视广告设计中去,已经成为当今广告界最关注的话题之一。
计算机辅助设计(computeaideddesicln)自1946年在麻省理工学院诞生以来,开始只是应用于航天、自动化、生物等高科技领域,80年代以来CAD开始在各个应用领域普及,而三维图形技术的发展却比计算机辅助设计慢得多,计算机三维技术的最初雏形最早能够追溯到1962年。那一年在马塞诸塞州科技学院(MassachusettsInstituteofTechnology)里念书的沙赦冷搏士(lvanSutherland,Ph.D)写了个程序可以直接在“阴极射线管”(CathodeRayTube)上,在各种不同的立体几何图形上画一些“光线”(Linesoflight)。这种程序他把它叫做“基本图”(Sketchpad),可以使用光笔交互地处理、显示二维和三维线框物体,这个系统主要还是用于飞机的模拟。到60年代中期,实时全色彩渲染的动画系统开发成功,但这时的绝大多数阴极射线管(CRT)显示器却是单色的,不能够在计算机显示设备上预览,在今天看来,这种程序简直就像“原始人”一样,但是就是这个“原始人”打开了一扇在电脑应用领域里全新的大门——计算机图形图像技术。计算机图形图像技术经过四十几年的发展,逐步发展成为蕴藏着巨大商机的热门领域,计算机三维技术则是这个领域中一门重要技术并逐渐成为影视特技、计算机三维动画、影视广告设计、电子游戏、虚拟现实、互联网视频信息处理等技术中的一个重要的组成部分,而且其应用领域还在不断拓宽,正在改变着电影和影视广告设计行业的整个前后期制作和传播流程。计算机三维技术由于其高效、自由的特点在国际影视制作舞台上得到了空前高速的发展。好莱坞作为世界电影制作的最前沿,同时也是展示美国计算机三维技术的舞台,其电影产品对计算机三维技术的应用能力,以及所诞生出来的影视作品中所展现的艺术成就也是走在世界前列的。正是因为计算机三维技术具有种种传统技术所不能达到的能力和优势,这种技术几乎已经成为当前影视制作的通用技术。
近几年在我国上映的好莱坞大片,从早期的《侏罗纪公园》、《星球大战》、《泰坦尼克号》、到最近的《哈里波特》、《寂静岭》、《世界大战》、《加勒比海盗》、《魔戒》、《金刚》、《北极特快》、《贝奥武夫》等,在运用计算机三维特技方面取得了全球性的轰动,同时也给影视广告设计界带来宝贵的经验,推进了CG技术在全球影视广告设计范围内的广泛应用。所谓CG技术,即计算机图形图像技术的英文ComputerGraphics缩写,是在1977年美国导演乔治·卢卡斯导演的美国影片《星球大战》大获成功后而风靡全球的,在《星球大战》中首次应用了计算机技术,在拍摄该片时,美国没有一家特效制作公司能够制作这部电影特效,卢卡斯便自己组建了工业光魔,用来开发和制作这部电影中所需要的特殊效果,全片用到了300多项特效制作技术,这是计算机技术第一次在电影特效制作方面的尝试。1989年凭着科幻片《终结者》一举成名的美国另一位导演詹姆斯·卡梅隆推出了策划已久的科幻片《深渊》,在这部电影中,LIM为其制作了大量的特殊效果,其中首次制作了一个全CG的水柱变形影像,同时运用了数字技术制作了海底的高级智慧生物,由于CG的制作使观众看到了全新的视觉效果,其影像也更为真实。这在当时观众中引起了一片惊叹之声,LIM凭借《深渊》很快在影视特效领域中开拓了一片新天地,对此,詹姆斯·卡梅隆这样说道:“视觉娱乐影像制作的艺术和技术正在发生着一场革命,这场革命给我们制作电影和其他视觉媒体节目的方式带来了如此深刻的变化,以至于我们只能用出现了一场数字化文艺复兴运动来描述它。”
计算机技术在动画制作方面的应用成绩是有目共睹的,从第一部彩色影院动画片《白雪公主》征式上映以来,其中除了少数的偶动画、沙动画、针幕动画、水墨动画等特种动画以外,动画片基本上都是二维动画片的天下,但自从1995年皮克斯公司推出世界上第一部纯三维动画长片《玩具总动员》以来,动画片市场的重心就逐渐向计算机三维动画转移,几乎每部三维动画影片都是“票房炸弹”。从《玩具总动员》的1.92亿美元,到《怪物史瑞克》的2.67亿美元,再到《海底总动员》的3.287亿美元——三维动画影片的票房可谓节节攀升。《怪物史瑞克》中那浓密的森林、绿油油的草地,《海底总动员》中那奇幻的海底世界,《汽车总动员》中那些表情生动但又真实无比的汽车,三维动画所带来的惊人的视觉效果,是二维动画无法比拟的。三维动画依赖的计算机三维技术通过电脑强大的运算能力来模拟现实,需要完成建模、赋材质,调动作、渲染等步骤。除了视觉效果“逼真”之外,与传统的二维动画相比,三维动画还具有许多突出优势:它不受帧数的限制,在模拟动作灯光都设置妥当的前提下,渲染程序可以自动产生足量的画面,使影片看起来如同现实一般流畅自然:在着色方面,三维动画的渲染步骤是一次性的过程,不必再像二维动画那样逐帧着色,大大减少了重复劳动。
随着计算机三维技术在影视特效和动画制作方面应用的不断深入,计算机三维技术对于影视广告设计和影视栏目包装等影像作品的影响也越来越大。它能创造出完全由计算机虚拟出传统手法无法获取的镜头运动、角色动画或奇幻场景及一些令人惊叹的视觉特效。实现了科学技术和艺术的完美结合。其变幻无穷的表现力及高效的工作方式,彻底地将专业人员从大量的摄录实景、繁琐的剪辑过程和昂贵的设备中解放出来,为创意的发挥开辟了崭新的天地,节约了宝贵的时间。如何有效地将计算机三维图形技术运用到影视广告设计中去,已经成为当今广告界最关注的话题之一。
计算机视觉运用范文1篇3
关键词:美术教学计算机辅助教学优越性
在科学技术发展的今天,集声、光、电等为一体的多媒体技术,以其高效、快捷、全面传授知识,保存、收集资料相互交流等优势,极大促进了整个教学的改革和发展。其中以形象直观的美术教学最为受益。计算机辅助教学,因其能激发学生的学习兴趣、促使学生主动学习、提高课堂教学效率等诸多优点,而成为现代课堂教学中最常用的教学手段之一,广泛应用在中小学各学科的教学中,美术教学也不例外。使用计算机辅助教学,能更好地突出教学重点,突破教学难点。特别是在突破传统教学的诸多难点上,计算机可以发挥无可比拟的优越性。中小学美术教学中的难点,是在教材的教授过程中,学生对知识的难以理解之点,技法的难以掌握之处。以下举例介绍计算机辅助教学解决中小学美术教学难点的一些应用。
1获得独特的视觉效果
使用计算机辅助教学可以充分利用计算机的特点,根据教学需要,获得独特的数码虚拟视觉效果,协助教师突破教学中的难点。美术欣赏课有很强的直观性,使用计算机辅助教学,通过数码投影仪,就可以将作品清楚地放大展示,让学生在欣赏课上能够真正地“欣赏”。以七年级第十四册《现代生活的视觉语言》一课为例,通过欣赏不同年代、不同形式的标志,使学生开阔眼界,丰富知识。标志很小,教师拿在手中展示,学生想要看清楚都很费劲,更别说欣赏了,对教师而言,同样也不便于知识的讲解。而若通过计算机和数码投影仪,将各种标志投影成2米见方的影像,就可以让课堂上的每个学生都能看得清楚,达到最佳的审美感受。同时还可以放大局部进行有针对性地观察,教师结合知识重点、难点进行分析讲解。由此,视觉的传达与知识的传授相得益彰,让学生在审美体验中学习和提高。
欣赏三维造型艺术时,计算机辅助教学不仅可以用通常的视觉方式,让学生欣赏到物体在某一视觉角度的造型或其内部构造,而且可以做出“动感显示”效果,让三维物体旋转起来,欣赏到它的各个侧面,让学生体会到物体的立体感、空间感。比如九年级第十八册《现代建筑》一课中,计算机辅助教学可以按预先设置路线,带领学生虚拟浏览一座建筑物的内部装饰、陈设,使学生有现场感、真实感,真切地感受到不同时代、不同地域、不同空间的建筑风格,同时,也会真正理解它的三维结构。利用计算机辅助教学,产生真实新奇的视觉效果,独特的感染力,将使学生对这一课留下难忘的印象。
2动态展示变化的过程
计算机具有强大的多媒体功能,集文字、图像、图形、声音、动画和视频为一体。教师可以根据教学需求,通过计算机表现许多传统教学技术不能表现的事物和现象,如演示形象生动的动画,声情并茂的有声画面,色彩丰富的教学图片等。CAI可以使抽象问题形象化,静态问题动态化,在解决那些教师难以表述而学生又难以理解的问题上,动态展示变化的过程,突破教学难点。
在工艺与设计课的教学中,有关工艺制作的程序、步骤和方法复杂、严谨,技法的要点、难点较多,教师要做大量的示范。教师要想利用课堂时间演示一个完整制作过程,不是一件容易的事,如绘制“简单图案”教学,仅其中的上色环节,就不是一遍两遍能完成的,非常耽误时间,而且没有办法让全班学生都能看清楚。在传统教学中,很多教师往往只好口头教授,稍作演示,这样的教学,学生往往不能掌握技法上的难点。利用计算机辅助教学,我们可以将图案制作的完整程序制作成图文并茂的幻灯片进行放映,从绘制草图、拷贝、涂色,到最后调整、修改,色彩转换,都非常方便、快捷,整个过程展示清晰明了又独特,学生边看放映边学习,印象深刻,教学难点轻松解决。
3通过整合培养美术欣赏能力
美术欣赏能力的培养历来是美术教育教学的难点。把艺术作品不同元素间的相互关系在大脑中形成反射,调动学生的多种感觉器官,利用知识经验进行综合加工,是形成审美情感和审美理解的过程。使用计算机,可以容易地将多种媒体融合在一起,并方便地展示给学生,突破美术欣赏能力的培养教学中的难点问题。
在计算机辅助的美术欣赏课中,把音乐和美术、电影与美术有机地结合起来,可以图文并茂、声色俱全的表现深刻主题,能充分有效的培养学生的审美理解力、创造力。如欣赏《格尔尼卡》时,如果只看课本中的小幅图片,学生会因为对作品内容及产生背景缺乏一定的认识,而印象不深,难以产生共鸣,影响了学生对美术作品的审美欣赏。计算机辅助教学可以将画子投影到大屏幕上,用声情并茂的语言稍加提示作品背景、内容,通过鼠标指针,指点画中细节,引导学生观察,同时播放合适的背景音乐……这时学生就开始自觉地“设身处地”,进入某种情景,产生审美同情。
计算机视觉运用范文篇4
【关键词】运动目标检测视频图像OpenCV
一、绪论
随着计算机技术日新月异的发展,计算机视觉,模式识别,人工智能,多媒体技术,越来越受到人们的重视的快速发展。广泛地被定位对象使用运动跟踪和检测,监测和智能人机交互和分析他们的行为,一旦发现有异常行为的对象,监控系统发出警报,提醒人们注意和及时的治疗,改善人类的人工监督注意力浪费资源等问题。计算机视觉是通过计算机代替人的眼睛和大脑感知外部环境,分析和理解。
1.1OpenCV技术介绍
视觉处理算法的OpenCV提供了非常丰富的,它部分是用C写的,有它的开源特性,妥善处理,无需添加新的外部支持进行编译和链接,生成程序的完整实现,所以很多人们用它做算术移植,OpenCV的可正常运行的系统DSP和MCU系统正常重写代码。
二、运动目标检测
运动目标的检测在整个视频监控系统的底层,各种高级应用,如目标跟踪,目标分类,目标行为的随访,了解互惠的基础。运动对象检测装置,从在实时目标视频流中提取,目标通常设置面积和颜色特性。结果运动目标检测是描述一些静态功能的“静态”的目标前景。根据上下文,其中环境可分为两大类静态背景下运动目标检测和动态背景运动目标检测,本章与实际纸工作主摄像机静态背景运动目标运动结合,不会发生前景对象的运动目标检测检测算法。
2.1运动目标检测的基本方法
目标检测和提取已在目标跟踪应用程序中的重要地位。目标检测和提取的精度直接影响结果和准确性的跟踪。一个良好的各种环境动目标检测算法的应能适用于监测,在正常情况下,移动体检测算法可以根据场景被监视在室内或室外监测算法被分成室内和室外监视算法,则可以按照使用特定算法的方法分为连续帧差分方法,背景减除法和光流法。
2.1.1帧间差分法
对于许多应用,图像的连续帧之间的差检测出图像的顺序是非常重要的一步。场景中的任何可观察到的运动将反映在场景图像序列的变化,如果能检测到这种变化,我们可以分析的运动特性。
2.1.2背景差法
基于该原理的背景差分方法非常简单,基本操作过程示于(4.2)如下:首先使用式(4.3)来计算背景图像之间的差fbk当前帧fk,然后根据下式(4.4)是差分图像的Dk值化和形态学滤波处理,并获得当该区域的通信区域比给定的阈值RK进行连通区域分析的结果,它成为检测对象,并且该区域是区域目标在区间的,你能确定的最小边界矩形的目标。
其中T是二值化设定阀值。
2.1.3光流法
光流是指在图像模式(或表观的)运动的表观亮度。用“表观运动”,主要是由于光流的运动图像不能有部分信息只以确定,例如,区域性或亮度轮廓点更均匀的亮度不能唯一确定的运动对应的点,但观察到的运动。这解释了光流和该流不一定是由物体的运动所产生的光,而运动的主体不一定会产生光流体育场不一定是唯一的。
三、目标跟踪算法的研究
目标对象的运动信息的条件的先验知识下跟踪,通过从信息源的实时数据来估计所述目标状态,以实现所述目标位置和运动趋势判定。运动目标跟踪问题是一个复杂的估计。研究精度高,性能稳定,目标跟踪方法的适用性仍面临巨大挑战,具有重要的理论意义和实用价值。
3.1图像匹配法
通过图像匹配方法可以识别要跟踪的运动对象,并确定它们的相对位置。早期跟踪涉及的目标位置的变化的两个图像之间的测量计算出的相关函数,跟踪点是,这两个图象相匹配的最佳位置,这是相关函数的峰值。
3.2基于团块的目标跟踪
基于团块(BLOB)的基本原理是用于图像分割候选像素跟踪算法,它决定像素是否属于背景或属于定位或属于其他区域。基于跟踪算法的质量也可称为基于图像分割的跟踪,分割结果刚够目标和背景之间的区分,而传统的图像分割算法需要目标轮廓的精确显示。分裂台球在目标,纹理特征和图像的深度信息的一般特性。
四、结语
随着在军事领域的计算机视觉,智能交通监控,视频运动目标检测与跟踪的发展必将得到更广泛的应用和发展。在本文中,历时四个月中,主要研究的OpenCV实现运动目标检测与跟踪的应用,实验结果表明,该系统具有良好的鲁棒性和准确性,实现毕业设计的预期目标,在工作和问题结合起来实际应用中。
参考文献
[1]刘瑞祯,于仕琪.OpenCV教程基础篇[M].北京:北京航空航天大学出版社,2007.
[2]彭达.VisualC++多媒体编程技术[M].北京:人民邮电出版社,1999.
[3]丁金铸.基于图像处理的运动目标检测跟踪系统的设计与实现[D].华中师范大学,2007.
[4]王建中,姜昱明.基于块匹配的运动对象检测算法[J].微电子与计算机,2005,22(1):10-12.
[5]林少丹.VC++程序设计基础[M].北京:人民交通出版社,2009.
[6]唐双发.基于OpenCV的车辆视频检测技术研究[D].华中科技大学,2009.
[7]李庆忠,陈显华,王立红.视频监视中运动目标检测与识别方法[J].计算机工程,2004,30(16):30-33.
[8]胡晓峰,吴玲达,老松杨,司光亚.多媒体技术教程[M].北京:人民邮电出版社,2002.
[9]韩鸿哲,王志良,刘冀伟,李郴,韩忠涛.阴影消除的自适应背景建模[C].第二届全国智能视觉监控学术会议论文集,2003,35-39.[10]张玲,叶海炳,何伟.一种基于边缘信息的改进车辆检测方法[J].重庆大学学报(自然科学版),2004,27(11):56-58.
[11]J.B.Kim,H.J.Kim.EfficientRegion―basedMotionSegmentationforVideoMonitoringSystem[J].PatternRecognitionLetters,2003,3(24):113-128.
[12]王春平,朱元昌,黄允华.基于图像信息的跟踪算法分析[J].火力与指挥控制,2000,25(1):64-67.
[13]杨枝灵,王开.VisualC++数字图像获取处理及实践应用[M].北京:人民邮电出版社,2003.
计算机视觉运用范文
关键词:计算机视觉;跟踪算法;综述;人数统计
中图分类号:TP391文献标识码:ADOI:10.3969/j.issn.1003-6970.2013.03.003
0引言
计算机视觉作为一门多学科的交叉领域,涉及图像处理、计算机图形学、模式识别、人工智能、人工神经网络、计算机、数学、心理学、生理学和物理学等。本文是对视频人数统计技术的综述,属于智能视频监控范畴。
由于智能视屏监控的挑战性以及其巨大的应用价值,越来越多的学校、研究所以及公司的研究人员投入到该领域中来。麻省理工学院、卡内基梅隆大学以及其他国外著名大学成立了专门的计算机视觉及多媒体方向的实验室;Nice和Objectvideo等公司已经针对飞机场、国界线等应用场合开发了一些相应的智能监控系统。国际上的高级视频和录像(AdvancedVideoandSignal-BasedSurveillance)论坛每年都会举办PETS(PerformanceEvaluationofTrackingSystems)会议专门针对于人群行为分析,包括群体人数统计,人流密度估计;对单个人员以及群体中个体进行跟踪;特殊群体和特殊事件检测等。本文主要针对视频人数识别这个研究方向,从基于特征点、颜色与形状信息、模板匹配三种不同类型识别跟踪方式分析了近些年来国内外的研究工作及最新进展,通过对各种不同识别方法比较,对当前亟需解决的问题做了详细的分析。
1人数识别研究现状
人数统计算法融合了运动物体检测、行人检测与分割、形状分析、特征提取和目标跟踪等多个领域的技术。从采用的手段来讲可以分为直接法和间接法:直接法(或称基于检测的),即首先在场景中检测出每个行人,再计数。第二种称为间接法(也称为基于映射或基于度量的),一般是建立场景特征与行人数量的函数关系来测算人数。在行人高度密集的场景中,间接法比直接法更加可靠,主要因为直接法无法有效分割每个行人,特别是在行人高度密集的场景中,从20世纪90年代起到目前为止这近20年里,出现了众多的视觉跟踪算法,1988年,Aggarwal和Nanadhakumar对运动图像分析算法进行了总结,将算法分为两类,一类是基于光流法的分析,另一类是基于特征点的分析,此后在视觉跟踪领域中,又出现了许多新的方法,目前,视频中人数的跟踪方法大致分为三类,分别是基于区域的跟踪、基于特征点的跟踪、基于模板和模型的跟踪,这种分类方法概括了目前大多数视觉跟踪算法,因此下面用这种分类方法对视觉跟踪算法进行介绍。
1.1基于特征的人数识别
基于特征的人数跟踪算法选取目标的某个或某些局部特征作为相关时的对象,这种算法的优点在于即使目标的某一部分被遮挡,只要还有一部分特征可以被看到,就可以完成跟踪任务,另外,这种方法与卡尔曼滤波器联合使用,也具有很好的跟踪效果。这种算法的难点是:对某个运动目标,如何确定它的唯一特征集?这也是一个模式识别问题,若采用特征过多,系统效率将降低,且容易产生错误,文献对这一问题进行了讨论,在特征提取时,一般采用Canny算子获得目标的边缘特征,而采用SUSAN算子获得目标的角点信息。有关基于特征的跟踪算法还可参见文献。在2009年,Albiol使用角点个数作为场景特征来估测人数,首先通过Harris角检测器检测出图像角点,然后进行角点匹配以区分人身上的角点和背景角点,Albiol认为每帧总人数与人身上角点的个数成正比例关系,以此估测人数,算法虽然简单,但在PETS2010“人数统计与密度估计”竞赛中取得优胜。2010年,Conte等“”基于Albiol的方法提出改进。采用的SURF(SpeedupRo.bustFeature)特征点以代替角点,同时,Conte等不仅考虑到特征点个数对人数估测的影响,还考虑到透视投影(拍摄距离d)密度人群遮掩(特征点密度p)对于估测的影响,同时对所有SURF点进行分组回归以提高精度,在这个基础上张茂军等相比Conte等的研究成果在处理远距离人群上精度提高,主要因为使用“非最大抑制聚类”——对不同拍摄距离的人群采取不同的聚类标准,有效解决远距离人群的类过大问题,提取人身上特征点的方法是在掩模上直接检测特征点,使得特征点个数更加稳定,有利于SVM预测。
1.2基于区域的人数识别
基于区域的跟踪算法基本思想是:首先得包含目标的模板(Template),该模板通过图像分割获得或是预先人为确定,模板通常为略大于目标的矩形,也可为不规则形状;然后在序列图像中,运用相关算法跟踪目标,对灰度图像可以采用基于纹理和特征的相关,对彩色图像还可利用基于颜色的相关。
McKenna等首先利用色彩和梯度信息建立自适应的背景模型,并且利用背景减除方法提取运动区域,有效地消除了影子的影响;然后,跟踪过程在区域、人、人群三个抽象级别上执行,区域可以合并和分离,而人是由许多身体部分区域在满足几何约束的条件下组成的,同时人群又是由单个的人组成的,因此利用区域跟踪器并结合人的表面颜色模型,在遮挡情况下也能够较好地完成多人的跟踪。Marana等认为低密度人群在图像上体现出粗糙纹理特征,而高密度人群则体现出精细纹理特征。文献分别采用自组织理论和Minkowsld不规则维度理论从图像纹理特征预测人群密度。Lin等则结合Harr小波变换(HWT)和支持向量机(SVM)进行行人头部轮廓检测,从而达到人数统计的目的。文献利用颜色和形状信息实现人头的检测,包含两个步骤:黑色区域提取和形状分析。通过对HSV空间V通道的像素设置阈值这种方法有效地检测出黑色区域,同时可以少受光照变化和阴影的影响。使用一种基于形状描述的快速弧形结构提取方法实现人头检测。姬红兵等提出了一种基于局部特征的目标跟踪算法,通过多尺度分析方法,根据颜色和空间上的相似性将目标分割为多个区域,每个区域由一个团块表示,团块包含了该区域所有像素的颜色均值、形状和位置,根据团块特征构造目标的外观模型,定义团块的匹配准则,通过团块匹配进行目标跟踪。
1.3基于模板匹配的人数识别
采用模板匹配识别跟踪方法首先将图像序列转换为一组静态形状模式然后在识别过程中和预先存储的行为标本相比较,
部分学者在运动前景提取的基础上使用了轮廓匹配方法对目标进行定位,文献使用了半圆模型搜索前景中人头肩所在位置,然后使用Snake模型与卡尔曼滤波相结合对目标进行跟踪目标,但Snake模型比较适合单目标的跟踪,当行人发生重叠时,定位精度会有一定的下降;在此基础上文献提出使用含有人harr特征分类器(使用头肩部上半身样本),对行人重叠情况下的检测精度有一定的提升。文献提出使用垂直摄像头降低行人之间的遮挡程度,通过对基于AdaBoost的人头检测本方法,建立一个良好的人头检测分类器。然后根据运动人头的特征去除误检区域。最后配合过线跟踪实现出入口人数统计。
2视频跟踪问题中的难点
从上面的阐述可以看出,各种方法都有自己的优点和不足,是在文献基础上分析得到的几种具体识别方法的比较结果,由于各种方法在设定理想情况下都有较好的准确率,所以不对各种方法的准确率做出比较,而是从各种算法的复杂度、鲁棒性、先验知识需求、高密度复杂人群适应性(有遮挡出现)等方面进行相对的比较分析,分析结果如表1。
2.1视觉跟踪问题中的难点
从控制的观点来看,视觉跟踪问题所面临的主要难点可以归结为对视觉跟踪算法在三个方面的要求,即对算法的鲁棒性、准确性和快速性。
鲁棒性是指视觉跟踪算法能够在各种环境条件下实现对运动目标持续稳定的跟踪。影响人数跟踪系统鲁棒性的最主要原因在于目标处环境的光照变化以及部分遮挡引起的运动目标不规则变形和全部遮挡引起的目标的暂时消失。当运动目标所处环境的光照发生改变时,采用图像灰度信息或色彩信息作为跟踪基础的视觉跟踪算法一般都会失效,而基于图像特征的方法往往不受光照改变的影响,如利用运动目标的边缘信息能有效避免光照变化对运动目标的影响,但在复杂环境中要将运动目标的边缘和周围其它目标边缘区分开来是非常困难的,遮挡问题是视觉跟踪算法中又一难点问题,利用单摄像机解决遮挡问题也一直是视觉跟踪领域中的热点。而利用多摄像机可以在很大程度上解决这一问题,但正如前所述,多摄像机的应用又会引入新的难题。
在视觉跟踪研究中,准确性包括两个方面,一是指对运动目标检测的准确性,另一个是指对运动目标分割的准确性,对运动目标检测准确性的目的是尽量避免运动目标虚检和漏检,从而提高对真实运动目标的检测概率。由于实际复杂环境中存在大量噪声。至今已经出现了上千种各种类型的分割算法,但由于尚无通用的分割理论,目前并没有一种适合于所有图像的通用分割算法。
一个实用的视觉跟踪系统必须能够实现对运动目标的实时跟踪,这就要求视觉跟踪算法必须具有快速性但是,视觉跟踪算法处理的对象是包含巨大数据量的图像,这些算法往往需要大量的运算时间,很难达到实时处理的要求,通常,简单算法能够实现实时跟踪,但跟踪精度却很差;复杂算法具有很高的跟踪精度,实时性却很差,一种通用的减小视觉跟踪算法运算量的方法是利用金字塔分解或小波变换将图像分层处理。
3展望与结束语
3.1展望
实现一个具有鲁棒性、准确性和快速性的视觉跟踪系统是当前视觉跟踪技术努力的方向。但视觉跟踪技术在这几个方面中每前进一步都是非常困难的,因为该技术的发展与人的感知特性的研究紧密联系在一起,由于目前对人的感知特性没有一个主流的理论,其数学模型更是难以建立。同时,在计算机视觉中大多数问题是不确定的,这就更增加了视觉跟踪技术发展的难度。但是,近几十年来,数学理论方面取得了巨大的进步,因此合理的使用在数学理论方面的知识提高系统的性能能够很好的解决视觉跟踪问题。例如现在已经应用在诸多领域的模糊算法,神经网络等提高系统性能,简化计算复杂度。
3.2结束语
计算机视觉运用范文篇6
关键词:云计算;蚁群优化;CO2分析;数据融合;并行计算
中图分类号:TP391文献标志码:A
SpatialdatafusionalgorithmofCO2basedoncloudcomputingplatform
HUJun.guo*,QIHeng.nian
CollegeofInformationEngineering,ZhejiangAgricultureandForestryUniversity,Lin’anZhejiang311300,China
Abstract:
InordertofusethemassiveCO2dada,whicharecollectedbythemobilesensornetworkfromuncertaintimeandspace,thepaperanalyzesthecollecteddata.First,wedividethetestareaintom*ngrids,,andanalyzeCO2concentrationfromeachvaliddataofeverygrid.Second,accordingtothestrongcomputingpowerofcloudcomputing,weputforwardcombinedcloudmodelanddesigncommonclouds,breedingclouds,visualcloudsandadjacentclouds.Theyrunsrelativelyindependentlyinthecloudandinteractswitheachcloud,formingdistributedparallelcomputingsystem.Third,wemodifytheantsfamily,anddesigncommonants,breedingants,visualantsandadjacentants.Allkindsofants,whichwalkbytheirownrules,areassignedtodifferentcloudsandworktogetherharmoniously,withthepheromonesandtheoptimalsolutionexchanginginlocalcloudandbetweenglobalcloudsbythecloudserver.Finally,inLing'anofZhejiangprovincewesimulate11080data,anduseCloundingV2simulationplatformtodoalotofexperiments.Itshowsthataftersearching105timesthealgorithmreachingstabilization,theoptimizationcapabilityis60timesasstrongasthesinglealgorithm,andthattheantsincommonclouds,breedingclouds,visualcloudsandadjacentcloudsareset2∶2∶1∶1cangetthebestperformance.
InordertofusethemassiveCO2dada,whichwerecollectedbythemobilesensornetworkfromuncertaintimeandspace,thepaperanalyzedthecollecteddata.First,thetestareawasdividedintom*ngrids,,andCO2concentrationwasanalyzedfromeachvaliddataofeverygrid.Second,accordingtothestrongcomputingpowerofcloudcomputing,thepaperputforwardcombinedcloudmodelanddesigncommonclouds,breedingclouds,visualcloudsandadjacentclouds.Theyranrelativelyindependentlyinthecloudandinteractedwitheachcloud,formingdistributedparallelcomputingsystem.Third,thepapermodifiedtheantsfamily,anddesignedcommonants,breedingants,visualantsandadjacentants.Allkindsofants,whichwalkedbytheirownrules,wereassignedtodifferentcloudsandworkedtogetherharmoniously,withthepheromonesandtheoptimalsolutionexchanginginlocalcloudandbetweenglobalcloudsbythecloudserver.Finally,inLinganofZhejiangprovincetheauthorssampled11080data,andusedCloundingV2simulationplatformtodoalotofexperiments.Theresultshowsthataftersearching105timesthealgorithmreachesstabilization,theoptimizationcapabilityis60timesasstrongasthesinglealgorithm,andthattheantsincommonclouds,breedingclouds,visualcloudsandadjacentcloudsareset2∶2∶1∶1cangetthebestperformance.
Keywords:
cloudcomputing;antcolonyalgorithm;AntColonyOptimization(ACO);CO2analyzing;datafusion;parallelcomputing
0引言
CO2是大气中主要的温室效应气体,其大量排放已造成全球气候变暖。据统计,从1906年起全球平均气温已增加0.74℃,若温度再升高2℃,将对人类造成毁灭性的灾难[1]。控制CO2排放直接关系到人类的生存和发展,已引起全球的极大关注。2009年《哥本哈根协议》中就发达国家实行强制减排,到2022年要求减排率达到1990年的25%~40%,对发展中国家采取自主减排要求。中国作为负责任的大国,积极主动减排,承诺到2022年单位国内生产总值CO2排放比2005年下降40%~45%。2009年底,国务院总理在国务院常务会议中,进一步强调应对气候变化工作的重要性,并提出相应的政策措施和具体行动[2]。但是,如何监测和控制CO2排放,各地没有统一标准,执行难度非常大。
近年来,在国家政策的大力引导下,不少学者提出了监测
大气CO2浓度的方案,主要有三种措施:
1)在指定点建立观察站,进行长年累月的监测,并记录监测数据[3-5],但只能在某个点上监测CO2浓度;
2)采用网格化测量方法[6-8],对监测区划分成N个网格,测出每个网格的CO2浓度,但网格监测需人工进行,无法实行长期实时监测;
3)以我校为首的低碳与物联网联合实验室提出采用Ad.Hoc无线传感器网络监测CO2浓度[9],虽能实现长期、实时监测,但现在还只能应用于非常小的区域。
针对此,本文提出基于移动车载的CO2浓度监测系统。由于移动系统的采集点会不断变动,因此获得是时间上不同步、空间上不固定的海量的CO2浓度数据。如何对这些大规模、时空不确定数据进行融合,是本文要解决的关键问题。
1问题描述与模型建立
为了能在不同时间和空间获取CO2空间浓度数据,可以把移动车载CO2浓度监测系统架构在城市出租车、公交车等移动平台上。随着移动平台的运动,能采集到不同点的CO2浓度。设有M个CO2浓度监测终端架构在移动平台上,在T时间内每个终端采集N次数据,由于M个终端同时在工作,在T时间内共采集到M×N个不同时间、不同空间的CO2浓度数据。但是,如何求解这个城市CO2浓度分布情况呢?或者说,如何从这M×N个点中取出有效个点来表示城市CO2浓度分布情况呢?
众所周知,随着日照强度的提高,植物的光合作用增强,能提高吸收CO2的能力;汽车排放尾气、工厂燃烧煤等都释放CO2,并且CO2分子有扩散能力,会从排放源向四周扩散。也就是说,CO2浓度会随时间和空间而变化。本文以CO2浓度时空平滑度因子表示CO2变化程度,并作如下定义。
2研究方案确定与算法实现
2.1研究方案
从第2章的分析中可以看出:从m×n个区域中各取出一个CO2浓度值,使得这些点的平滑度最小,是一个NP难问题。解决NP难问题的方法很多,如模拟退火算法、遗传算法、蚁群算法、神经网络算法等。但这类算法运算时间比较长,很难保证在较短时间内融合海量的CO2数据,确保分布情况的实时表现。近年来,随着云计算的兴起,通过云计算平台实现密集型数据处理已经成为可能。郑湃等[10]提出了兼顾时间开销、数据依赖性和负载均衡三方面指标的数据布局策略与方法,在云计算平台中有效降低跨数据中心数据传输导致的时间开销;赵俊华等[11]提出建立基于云计算的电力系统计算平台,从云计算的物理组成、系统架构、软件技术等方面详细讨论分析电力系统云计算平台的实现;王鹏等[12]分析了在云计算平台中数据密集型计算的特点,并指出云计算编程模型要解决的基本问题,分析国际上代表性的编程模型,并对这些编程模型的特点进行了比较,为数据密集型计算提供强有力的技术支撑;Hanawa等[13]提出D.Cloud的云计算模式,并实现测试并行软件和分布式软件的性能,此模式不仅可对云计算系统进行自动配置还可同时测试多种软件实例;Google公司构造MapReduce编程规范[14]来简化云计算平台的编程,用Map(映射)和Reduce(化简)两个简单的函数来构成运算基本单元,用户只需提供自己的Map函数以及Reduce函数即可并行处理海量数据。
综上所述,云计算平台已经能实现海量密集性数据运算。但针对NP难问题,若没有合理的算法,云计算平台也无能为力。而蚂蚁优化算法是非常优秀的智能算法,尤其有很强的并行能力,非常适合在云计算环境中,以解决复杂的智能计算问题。不少学者已经对蚂蚁算法的分布处理和并行技术进行研究,为其在云计算平台中应用提供基础。Chu等[15]提出并设计实现了蚁群系统(AntColonySystem,ACS)的并行处理,它将一个蚁群平均分为多个小的蚁群,每个蚁群对应一个处理器,并行求解每个蚁群有各自任务,然后用三种通信方法更新信息素。并在TSP问题中应用,取得比ACS和蚂蚁系统(AntSystem,AS)更好的效果。陈等[16]提出了并行蚁群算法中处理机间信息交流的两种策略,使得各处理机能够自适应地选择其他处理机以进行信息交换和相应信息素的全局更新。并且还提出了一种确定处理机之间进行信息交流的时间的策略,可以根据解的分布情况自适应地确定信息交流的时间,以取得全局收敛速度和解的多样性之间的平衡。吕强等[17]提出通过多个蚁群的并行协作来处理任务,蚂蚁在解的构造过程和信息素更新过程中共享同一个信息素矩阵。Wang等[18]提出基于交叉熵的分布式蚁群算法来解决网络中的多限制路由问题,并在模拟仿真中有很快速的求解功能。Takova等[19]提出蚁群优化算法的分布式处理应用,并用此解决网络分割问题,取得比较好的性能和作用。Sameh等[20]提出结合主从处理器和信息交换方法,主处理器产生从处理器进程,并获取从处理器的最优解。局部搜索和信息素更新都依赖于从处理器。从处理器独立交换解,并降低主处理器通信处理瓶颈。
借鉴众多学者的研究成果,本研究在云计算环境下,利用蚁群算法的并行寻优能力,以融合海量的CO2数据。论文根据蚁群优化算法的特点,提出组合云模型:设计普通云、繁殖云、视觉云和邻接云,并建立分布式并行蚁群算法,相应地改造蚂蚁家族,设计普通蚂蚁、繁殖蚂蚁、视觉蚂蚁和邻接蚂蚁,蚂蚁在各自云朵中的主机上运行,并以自身规则行走。蚂蚁从Rki(表示第Ri个区域中的第k个点)行走到Rmj,经过所有区域完成一轮循环,并在云朵内部更新信息素,且对优越的个体进行云朵之间信息素更新,使局部更新和全局更新相协调,最终获取最优解,实现CO2空间浓度平滑分布。
2.2设计组合云计算模型
云计算环境是在整个Internet中进行,云计算控制中心根据用户的请求,将计算任务分成若干子任务,再动态地将各子任务分配给云计算平台的计算设备。各子任务完成后,其计算结果通过Internet重新汇总到控制中心,最后再反馈给用户。但对于一个完整的计算任务,如何对其进行任务分解,如何把子任务分配到云计算平台的各个计算终端,是一个巨大的挑战。本文针对计算CO2分布问题的特殊性,提出组合云模型,设计普通云、繁殖云、邻接云和视觉云,每朵云有自己的计算模式。并且,普通蚂蚁位于普通云,繁殖蚂蚁位于繁殖云,邻接蚂蚁位于邻接云,视觉蚂蚁位于视觉云。每朵云自主形成计算群,信息素在云内部局部交换和通过云服务器在云朵之间交换相结合。如图1,云终端提交的CO2分布计算任务被分配到普通云、繁殖云、视觉云和邻接云中计算。
为了描述方便,对文中出现的词汇和表达作个统一,全局指整个云平台,局部指某朵云,个体指独立主机。以下分别对普通云、繁殖云、视觉云和邻接云作定义。
定义2普通云。普通蚂蚁在普通云中运行。云朵内每台主机存在n只普通蚂蚁,其以信息素为主要指导因素计算,每只蚂蚁完成一轮运算更新个体信息素;在局部周期内以云朵内部信息素为主,局部计算周期结束后,云内主机都需向普通云服务器汇集信息素和最优解,并更新云内局部信息素和最优解;在全局周期内以各云朵产生的全局信息素(来自全局最优解)为指导。并且,普通云服务器可获得全局云服务器的信息素,云内各主机又能从局部云服务器获取共享信息素,以有效更新个体私有信息素。
定义3繁殖云。繁殖蚂蚁在繁殖云朵中运行,云中最优解可与全局最优解相互更新。云朵内的每台主机存在一只繁殖蚂蚁,蚂蚁按自身规则边运行边繁殖,一轮结束后产生的优秀解向繁殖云服务器汇报,同时获取局部最优解作为繁殖蚂蚁下轮行走路径。
定义4视觉云。视觉蚂蚁在视觉云中运行。视觉云相对比较独立,不受其他云影响。云朵内每台主机运行n只视觉蚂蚁,其以自身规则运算,求出的优秀解在云内汇集,并向普通云和繁殖云提供局部最优解。
定义5邻接云。邻接蚂蚁在邻接云中运行,其计算模式与视觉云类似,差异在于云内存在的是邻接蚂蚁,云内主机是按邻接蚂蚁规则进行。
定义6每朵云内部的服务器称为局部云服务器,它管理云朵内的各主机;整个云计算平台的服务器称为全局云服务器,它管理每朵云的局部服务器。
每朵云在其内部独立计算,云内主机每轮计算结束就向局部云服务器提供最优解,同时各主机又会从局部云服务器获得云内最优解;局部云服务器根据解的质量向全局云服务器汇报最优解,并且全局云服务器也会提醒局部云服务器更新当前的最优解。普通云中以信息素指导工作,各个主机内存有个体私有信息素,也可访问局部共享信息素,并且信息素更新与最优解同步。因此,云朵内部相对独立运行与云朵之间相互作用,实现局部最优与全局最优并进。
2.3设计分组蚁群优化算法
为了使蚁群优化算法能和云计算平台相适应,需对蚂蚁进行分布式并行处理,把其分配到不同的云朵中,同时要让各云朵内的蚂蚁并行运算。本文对基本蚁群算法进行改进,在蚂蚁家族中设立四种不同类型的蚂蚁,四种蚂蚁分别分布于不同的云,并行运算,共同协作,最优解共享,最终完成任务。其中:第一类蚂蚁具有繁殖功能,称为繁殖蚂蚁;第二类蚂蚁有视觉功能,称为视觉蚂蚁;第三类蚂蚁能感知邻接区域能力,称为邻接蚂蚁;最后一类是普通蚂蚁。
2.3.1问题说明
根据第1章所描述的,在T时刻内获取M×N个CO2浓度值,这M×N个数据被分成m×n个区域,如图2所示。每个区域有Ci个数据,即R1区域有C1个点,R2有C2个点,…,Rmn有Cmn个点。现要从R1,R2,…,Ri,…,Rmn区域中各取一个数据组成m×n个数据,使其所组成的CO2分布最平滑。在本文中假设蚂蚁在寻优中是从第Ri个区域走向与其相邻接的区域,如图2,将M×N个数据划分为m×n个区域,区域按R1,R2,…,Rmn编号。
定义7蚂蚁从R1区域选择点i,从R2区域选择点j,以此类推,直到走完Rmn区域的k点,这样所构成的行程称为蚂蚁路径或蚂蚁行程。
2.3.2普通蚂蚁
1)普通蚂蚁定义。
在普通云中运行的蚂蚁称为普通蚂蚁,它能感知信息素,并根据各条路径上的信息量决定其转移方向。普通蚂蚁的信息素来自于本主机中的蚂蚁、普通云内的蚂蚁和其他云中表现优秀的蚂蚁,而对于蚂蚁自身不用考虑信息素的来源,其只需根据个体私有信息素表行走。
2)普通蚂蚁行走规则。
sklij表示Ri区域中的第k个点(设记为点Rki)到Rj区域中的第l个点(设记为点Rlj)的平滑度,则sklij=(|Δc|E)2+(F|Δd|)2+(|Δt|G)2,其中:Δc表示Rki与Rlj两点的CO2浓度差值,Δd表示RkiRlj两点距离,Δt表示Rki和Rlj点采集CO2数据的时间间隔,E,F,G是一个给定的常量。由于普通云中各主机蚂蚁并行运行,现考虑在主机H上,有M只蚂蚁,在t时刻点Rki和点Rlj之间的路径上的信息素浓度为τklij(t);在0时刻,各条路径上信息量相等,设τklij(0)=C(C为常数)。蚂蚁a(a=1,2,…,M)在运动过程中,根据各条路径上的信息量决定转移方向。pklij(a,t)表示在t时刻蚂蚁a由点Rki到点Rlj的概率:
pklij(a,t)=[τklij(t)]α[ηklij]β∑m∈Rj[τkmij(t)]α[ηkmij]β,m∈Rj0,mRj(1)
其中:ηkmij为点Rki和点Rlj之间启发信息,一般取ηkmij=1/skmij;α为在RkiRlj两点上残留信息的重要程度;β为启发信息的重要程度;m表示Rj区域中的点。
经过n个时刻,M只蚂蚁在主机H上走完所有的区域,完成一次循环。每只蚂蚁所走过的点组成一个解。随着时间的推移,路径上原有的信息素会逐步挥发掉,同时,有蚂蚁经过的路径会留下相应的信息素,因此,要对各路径上的信息素进行更新:
τklij(t+1)=(1-ρ)*τklij(t)+Δτklij(2)
Δτklij=∑Ma=1Δτklij(a)(3)
其中:ρ为信息素挥发系数,取值范围为ρ[0,1);Δτklij表示本次循环中RkiRlj两点上的信息量的增量;Δτklij(a)表示蚂蚁a在本次循环中在RkiRlj两点之间的路径上留下的信息素,其值常按以下模型计算:
Δτklij(a)=QLa,蚂蚁在本次循环中经过点RkiRlj0,其他(4)
其中:Q为常数,La为蚂蚁a在本次循环中所行走路径的总CO2平滑度和。
2.3.3繁殖蚂蚁
1)繁殖蚂蚁定义。
繁殖蚂蚁分为局部繁殖蚂蚁和全局繁殖蚂蚁,它能按前一轮最优解方向行走,繁殖出的新蚂蚁能进一步优化前一轮的最优解。记繁殖云中的蚂蚁集合为BC,存在蚂蚁k,在主机H上运行。它从起点出发,访问了所有区域,其行程解集记为{k,Pk,Lk|1≤k≤M},其中:k表示蚂蚁k,Pk表示蚂蚁k的路径,Lk表示蚂蚁k行程的CO2平滑度总和,M表示BC集合中蚂蚁数量。并记min=MIN(k,Pk,Lk),1≤k≤M,则min表示行程中CO2平滑度最小的蚂蚁,Pmin表BC集合中CO2平滑度最小的路径,Lmin表示CO2最小平滑度和,本文把min作为局部繁殖蚂蚁。另记视觉云中的蚂蚁集合为VC,邻接云中的蚂蚁集合为AC,普通云中的蚂蚁集合为CC,设minc=MIN(BC,VC,AC,CC)为BC,VC,AC,CC集合中平滑度最小的蚂蚁,则在云全局计算周期内,将minc作为繁殖蚂蚁。在云局部周期内,繁殖蚂蚁按Pmin路径行走;在云全局周期内,繁殖蚂蚁按Pminc路径行走。繁殖蚂蚁每经过一点就能繁殖出一只新蚂蚁,新蚂蚁按自身规则向未走过的点行走。
2)繁殖蚂蚁行走规则。
在云计算平台中,设min为繁殖蚂蚁,其不受云内外的其他蚂蚁影响,按Pmin路径行走,经过点Rki(1≤i≤m×n,1≤k≤Ci),以一定的概率繁殖出邻接蚂蚁、视觉蚂蚁、普通蚂蚁中的一只蚂蚁Ai,Ai选择不属于Pmin路径的点并以自身规则行走。Ai走完所有区域也作为这轮解集中的一个解。而min继续向前走,继续繁殖,直至完成路径Pmin。
2.3.4视觉蚂蚁
1)视觉蚂蚁定义。
在视觉云中计算的蚂蚁称为视觉蚂蚁,可感知平滑度。它能感知当前节点下两个区域的平滑度,并以较大的概率往平滑度最小的方向行走。设视觉蚂蚁a位于当前点Roi,Rpj,Rqk,使得sopij+spqjk最小,则蚂蚁a以较大的概率往Rpj行走(其中Ri与Rj相邻,Rj与Rk相邻)。
2)视觉蚂蚁行走规则。
在视觉云中的主机H上,设蚂蚁a在t时刻位于点Roi时,按概率Popij(a,t)选择下一个区域Rj的第p点。
Popij(a,t)=Ci/(Ci+Cj),使得sopij+spqjk最小
Cj/(Ci+Cj)(Ci-1),使得sopij+spqjk非最小(5)
其中:Popij(a,t)表示蚂蚁a在t时刻从Ri区域的第o个点走向Rj区域的第p个点的概率,Ci和Cj表示Ri和Rj区域的点的个数。
2.3.5邻接蚂蚁
1)邻接蚂蚁定义。
邻接蚂蚁存在于邻接云中,它可感知与下个区域相邻接的、已走过区域的CO2浓度,能综合考虑邻接区域情况,并以此指导选择下一个区域的点,以较大概率选择与邻接区域比较光滑的点。
2)邻接蚂蚁行走规则。
邻接蚂蚁a当前位于Ri区域中的k点,见图3,下一步要选择Rj区域中的一点。假设与Rj相邻接的区域有Rd、Ri、Re、Rf,其中Rd中的p点和Ri中的k点已走过,现以较大概率选择与Rpd、Rki所形成的平滑度最小的点,记为:
pkyij(a,t)=sykji+sypjd∑Cjx=1sxkji+sxpjd
其中:y∈Cj,pkyij(a,t)表示蚂蚁a在t时刻从点Rki到Rj区域的任意一点y的概率,sykji表示点Ryj到点Rki的平滑度值。
2.4算法实现步骤
步骤1云终端提交计算CO2浓度空间分布请求。
步骤2云服务器形成四朵云:普通云、繁殖云、视觉云和邻接云,并把蚁群算法的计算任务分配到相应的朵云中。
步骤3任务在云朵中的主机上并行进行。
1)普通云中运行的是普通蚂蚁,其按私有信息素表指导行走,云中各主机蚂蚁完成一轮后,从共享信息素表中获取新的信息素,继续下一轮行走,并以当前这轮中的优秀蚂蚁更新共享信息素表。云中各主机并行,以同样方式行走。当解达到给定要求时,终止。
2)繁殖云中运行的是繁殖蚂蚁,云中各主机蚂蚁取得云内局部最优解或全局最优解作为下一轮的繁殖蚂蚁,繁殖蚂蚁按前轮最优路径边走边繁殖,形成新的解集,再求出新的繁殖蚂蚁,继续求下轮的解集,并把每轮生成的优秀解提供给普通云更新共享信息素表。云中各主机并行,以同样方式行走。当解达到给定要求时,终止。
3)视觉云中运行的是视觉蚂蚁,云中各主机蚂蚁能感知当前节点下两个区域的平滑度,并以较大的概率往平滑度最小的方向行走。各主机以n只蚂蚁完成所有区域为一轮,将当前轮中优秀的解向上汇报,为普通云和繁殖云提供解集。当解未达到给定要求,继续下一轮;否则就终止。
4)邻接云中运行的是邻接蚂蚁,云中各主机蚂蚁也以自身规则行走,将产生的优秀解向上汇报,也为普通云和繁殖云提供解集,当解达到要求时终止;否则就继续循环。
步骤4求出满足条件的解,寻优结束,解散云集。
步骤5通过云服务器把最优解返回给云终端,云计算结束。
3实验与仿真
为了验证算法的有效性,本文以浙江省临安市为测试地点,模拟100辆公交车装载CO2采集终端,在运行中实时采集CO2数据,本次实验共采集11080个数据,分成25×25的网格。并开发CloundingV2模拟软件,以信息技术实验室的60台主机组成云计算平台,并对实验数据进行大量测试,得出三个结论。
1)普通云、繁殖云、视觉云和邻接云中的蚂蚁数量比设为2∶2∶1∶1性能最佳。①仅取普通云和繁殖云,云内蚂蚁数量比设3∶1、2∶1、1∶1、1∶2、1∶3、1∶4,每种比例都做了8次实验,每次最优解在4821左右,计算出平均轮数,发现普通蚂蚁比繁殖蚂蚁为1∶1时,在取得4821解所需运行轮数最少,见图4。②仅取普通云和视觉云,云内蚂蚁数量比设4∶1、3∶1、2∶1、1∶1、1∶2、1∶3,每种比例也做了8次实验,在取得相同最优解时,普通蚂蚁比视觉蚂蚁为2∶1时,所需运行轮数最少,见图5。③仅取普通云和邻接云,云内蚂蚁数量比设4∶1、3∶1、2∶1、1∶1、1∶2、1∶3,每种比例也做了8次实验,发现普通蚂蚁比邻接蚂蚁为2∶1时,所需运行轮数最少,见图6所示。
因为蚁群优化算法以蚂蚁信息素更新为基础,所以普通蚂蚁对算法贡献最大;而繁殖蚂蚁能在前一轮最优解基础上强化搜索,能较好地找出更优的解,其贡献也非常大;视觉蚂蚁以较大概率向与当前节点最平滑的点行走,邻接蚂蚁以较
大概率选择与附近点所构成的平滑度最小,这行走规则与实际行走相符,故对算法也有一定贡献,而它们又往往会以一定的概率突破此规则,同时也避免算法停滞。最后选择普通云、繁殖云、方向云和视觉云之间比值2∶2∶1∶1性能最佳。2)云计算平台的蚁群优化算法收敛速度快、稳定性高、鲁棒性好。对模拟数据进行了8次实验,结果见图7。在8次实验中,前40轮中都快速收敛,平滑度从5600左右立即降至4860左右,寻优能力强。因为云平台有60台主机在并行工作,求解速度快,并且繁殖云、视觉云和邻接云为普通云作巨大贡献,使得蚂蚁信息素更新更趋向于有效解。40轮之后,8次实验基本都缓慢收敛,并在105轮左右基本趋向稳定,这时主要依赖繁殖云、视觉云和邻接云中以较优解为基础所生成的随机性蚂蚁在起作用,因此寻优速度降低;但因依赖之前的较优解,寻优不至于停滞。在105轮后基本结束,算法表现出稳定性高、鲁棒性好。并随机取了一次计算结果,通过ArcGIS软件的Kriging算法实现CO2分布描图,结果见图8,颜色越深说明CO2浓度越高。
3)对CloundingV2模拟软件进行改造,使其在单机上运行。在单机上运行8次所取平均解与云平台平均解进行比较,发现单机在780轮左右取到5200解(见图9),云计算中只需要在13轮左右就能达到(见图10);单机在10860轮达到5000左右并基本达到稳定,而云计算在205转达到4750左右,可见云计算平台寻优能力远远高于单机。
4结语
随着无线传感器网络的快速发展,对其采集到的海量数据进行存储与分析具有巨大的挑战。论文所提出的采用云计算平台对移动车载系统所采集的CO2数据进行融合有一定的创新性,尤其提出组合云模型,能给不同的云安排不同的任务,充分发挥每朵云的作用;同时也改造蚁群算法,使其能在云平台中运行,进一步提高组合云模型计算能力。
本算法虽然已经在60台主机上运行,但云的规模还比较小,下一步要在以下两方面所有突破:一要考虑是否能在整个校网中运行,使其存储、计算能力更大;二要考虑算法是否可在Hadoop云计算平台运行。
参考文献:
[1]
IntergovernmentalPanelonClimateChange(IPCC).Climatechange2007:Thephysicalsciencebasis[M].NewYork:CambridgeUniversityPress,2007:1-223.
[2]
中国承诺大幅降低单位GDP碳排放.中国日报网[EB/OL].[2011-05-01].省略/hqzx/tjqhdh/2009.12/04/content_11364678.htm.
[3]
PUYI.FEN.SensitivitytestofthedistributionofIndianoceansurfaceCO2partialpressureonthephysicalandbiochemicalprocessesbyatwo.dimensionaloceancarboncyclemodel[J].ClimaticandEnvironmentalResearch,2009,14(3):301-308.
[4]
张弥,温学发,于贵瑞,等.二氧化碳储存通量对森林生态系统碳收支的影响[J].应用生态学报,2010,21(5):1201-1209.
[5]
BERBIGIERP,BONNEFONDJM,MELLMANNP.CO2andwatervaporfluxesfor2yearsaboveEurofluxforestsite[J].AgriculturalandForestMeteorology,2001,10(8):183-197.
[6]
BALDOCCHID."Breathing"oftheterrestrialbiosphere:Lessonslearnedfromaglobalnetworkofcarbondioxidefluxmeasurementsystems[J].AustralianJournalofBotany,2008,5(6):1-26.
[7]
马晓明,王东海,易志斌,等.城市大气污染物允许排放总量计算与分配方法研究[J].北京大学学报:自然科学版,2006,42(2):271-275.
[8]
IDSOSB,IDSOCD,BALLINGCR.Seasonalanddiurnalvariationsofnear.surfaceatmosphericCO2concentrationwithinaresidentialsectoroftheurbanCO2domeofPhoenix,AZ,USA[J].AtmosphericEnvironment,2002,36(10):1655-1660.
[9]
GreenOrbs.Along.termkilo.scalewirelesssensornetworksystemintheforest[EB/OL].[2011-06-01].省略.
[10]
郑湃,崔立真,王海洋,等.云计算环境下面向数据密集型应用的数据布局策略与方法[J].计算机学报,2010,33(8):14720-1480.
[11]
赵俊华,文福拴,薛禹胜,等.云计算:构建未来电力系统的核心计算平台[J].电力系统电动化,2010,34(15):1-8.
[12]
王鹏,孟丹,詹剑锋,等.数据密集型计算编程模型研究进展[J].计算机研究与发展,2010,47(11):1993-2010.
[13]
HANAWAT,BANZAIT,KOIZUMIH,etal.Large.scalesoftwaretestingenvironmentusingcloudcomputingtechnologyfordependableparallelanddistributedsystems[C]//2010TheThirdInternationalConferenceonSoftwareTesting,Verification,andValidationWorkshops.[S.l.]:IEEE,2010:6-10.
[14]
Wikipedia.MapReduceframework[[EB/OL].[2011-04-04].en.省略/wiki/MapReduce.
[15]
CHUSC,RODDICKJF,PANJS,etal.Parallelantcolonysystems[J].InternationalSymposiumonMethodologiesforIntelligentSystems,LNCS2871.Berlin:Springer,2003:279-284.
[16]
陈,章春芳.并行蚁群算法中的自适应交流策略[J].软件学报,2007,18(3):617-624.
[17]
吕强,高彦明,钱培德.共享信息素矩阵:一种新的并行ACO方法[J].自动化学报,2007,33(4):418-421.
[18]
WANGHUA,WANGGANG,MAJUN.Adistributedantcolonyalgorithmbasedoncross.entropyformulti.constraintsQoSrouting[C]//The9thInternationalConferenceonAdvancedCommunicationTechnology.[S.l.]:IEEE,2007:1809-1814.
[19]
TAKOVAK,KOROECP,ILCJ.Adistributedmultilevelantcoloniesapproachforgraphpartitioning[J].Informatica,2008,32(3):307-317.
计算机视觉运用范文篇7
1.1自动化程度高
计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。
1.2实现无损检测
由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。
1.3稳定的检测精度
设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。
2计算机视觉技术在食品检测中的应用
20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚20多年,但是发展很快。
2.1计算机视觉技术在果蔬分级中的应用研究
计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图象处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco.J[15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。
2.2计算机视觉技术在禽蛋检测中的应用研究
禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和BET算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。MertensK等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。
2.3计算机视觉技术在检测食品中微生物含量的应用研究
计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar.B等[26]人采用计算机视觉技术、光散射技术(BARDOT)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有,对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征和微生物数量进行识别,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。
2.4计算机视觉技术在其他食品产业中的应用研究
里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。GokmenV等[33-34]通过对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率的关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等[35]人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等[36]人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。
3展望
新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。
3.1检测指标有限
计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大[37]。例如,Davenel等[38]通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花萼和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。Nozer[39-40]等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。
3.2兼容性差
计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是,同一套系统和设备很难用于其它种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等[41]利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。Majumdar.S等[42]利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。
3.3检测性能受环境制约
计算机视觉运用范文1篇8
关键词:美术教学计算机辅助教学优越性
在科学技术发展的今天,集声、光、电等为一体的多媒体技术,以其高效、快捷、全面传授知识,保存、收集资料相互交流等优势,极大促进了整个教学的改革和发展。其中以形象直观的美术教学最为受益。计算机辅助教学,因其能激发学生的学习兴趣、促使学生主动学习、提高课堂教学效率等诸多优点,而成为现代课堂教学中最常用的教学手段之一,广泛应用在中小学各的教学中,美术教学也不例外。使用计算机辅助教学,能更好地突出教学重点,突破教学难点。特别是在突破传统教学的诸多难点上,计算机可以发挥无可比拟的优越性。中小学美术教学中的难点,是在教材的教授过程中,学生对知识的难以理解之点,技法的难以掌握之处。以下举例介绍计算机辅助教学解决中小学美术教学难点的一些应用。
1获得独特的视觉效果
使用计算机辅助教学可以充分利用计算机的特点,根据教学需要,获得独特的数码虚拟视觉效果,协助教师突破教学中的难点。美术欣赏课有很强的直观性,使用计算机辅助教学,通过数码投影仪,就可以将作品清楚地放大展示,让学生在欣赏课上能够真正地“欣赏”。以七年级第十四册《现代生活的视觉语言》一课为例,通过欣赏不同年代、不同形式的标志,使学生开阔眼界,丰富知识。标志很小,教师拿在手中展示,学生想要看清楚都很费劲,更别说欣赏了,对教师而言,同样也不便于知识的讲解。而若通过计算机和数码投影仪,将各种标志投影成2米见方的影像,就可以让课堂上的每个学生都能看得清楚,达到最佳的审美感受。同时还可以放大局部进行有针对性地观察,教师结合知识重点、难点进行分析讲解。由此,视觉的传达与知识的传授相得益彰,让学生在审美体验中学习和提高。
欣赏三维造型时,计算机辅助教学不仅可以用通常的视觉方式,让学生欣赏到物体在某一视觉角度的造型或其内部构造,而且可以做出“动感显示”效果,让三维物体旋转起来,欣赏到它的各个侧面,让学生体会到物体的立体感、空间感。比如九年级第十八册《现代》一课中,计算机辅助教学可以按预先设置路线,带领学生虚拟浏览一座建筑物的内部装饰、陈设,使学生有现场感、真实感,真切地感受到不同时代、不同地域、不同空间的建筑风格,同时,也会真正理解它的三维结构。利用计算机辅助教学,产生真实新奇的视觉效果,独特的感染力,将使学生对这一课留下难忘的印象。
2动态展示变化的过程
计算机具有强大的多媒体功能,集文字、图像、图形、声音、动画和视频为一体。教师可以根据教学需求,通过计算机表现许多传统教学技术不能表现的事物和现象,如演示形象生动的动画,声情并茂的有声画面,色彩丰富的教学图片等。CAI可以使抽象问题形象化,静态问题动态化,在解决那些教师难以表述而学生又难以理解的问题上,动态展示变化的过程,突破教学难点。
在工艺与设计课的教学中,有关工艺制作的程序、步骤和方法复杂、严谨,技法的要点、难点较多,教师要做大量的示范。教师要想利用课堂时间演示一个完整制作过程,不是一件容易的事,如绘制“简单图案”教学,仅其中的上色环节,就不是一遍两遍能完成的,非常耽误时间,而且没有办法让全班学生都能看清楚。在传统教学中,很多教师往往只好口头教授,稍作演示,这样的教学,学生往往不能掌握技法上的难点。利用计算机辅助教学,我们可以将图案制作的完整程序制作成图文并茂的幻灯片进行放映,从绘制草图、拷贝、涂色,到最后调整、修改,色彩转换,都非常方便、快捷,整个过程展示清晰明了又独特,学生边看放映边学习,印象深刻,教学难点轻松解决。
3通过整合培养美术欣赏能力
美术欣赏能力的培养历来是美术教育教学的难点。把艺术作品不同元素间的相互关系在大脑中形成反射,调动学生的多种感觉器官,利用知识经验进行综合加工,是形成审美情感和审美理解的过程。使用计算机,可以容易地将多种媒体融合在一起,并方便地展示给学生,突破美术欣赏能力的培养教学中的难点问题。
在计算机辅助的美术欣赏课中,把和美术、与美术有机地结合起来,可以图文并茂、声色俱全的表现深刻主题,能充分有效的培养学生的审美理解力、创造力。如欣赏《格尔尼卡》时,如果只看课本中的小幅图片,学生会因为对作品内容及产生背景缺乏一定的认识,而印象不深,难以产生共鸣,影响了学生对美术作品的审美欣赏。计算机辅助教学可以将画子投影到大屏幕上,用声情并茂的语言稍加提示作品背景、内容,通过鼠标指针,指点画中细节,引导学生观察,同时播放合适的背景音乐……这时学生就开始自觉地“设身处地”,进入某种情景,产生审美同情。
计算机视觉运用范文篇9
关键词:计算机三维技术;影视;娱乐;
三维动画丰富的表现手法,如自由的灯光设置,任意的夸张变形,丰富的材质贴图以及特效的制作,增强了影视作品的艺术表现力,超越了一般影视艺术的表现局限,充分发挥设计者的想象力和创作思维的表现力,几乎不受到外界的任何阻挠。动画形象的塑造和特技的运用,更赋予影视作品以独特的艺术魅力,形成了一种传统影视手法无法达到的视觉与艺术境界,审美的特征和超现实的独特个性,人们在实际生活中没有或无法看到的现象,都可以在动画中得到实现,极大地满足了观众的心理需求,使电影电视更具欣赏力与吸引力。许多创意优秀、反响强烈的影视作品,在制作中都有三维动画合成技术的支持。三维软件是一门利用计算机来实现产品几何造型的技术。它是在三维造型软件基础上发展而来的。三维造型通常包括了线架模型、表面模型和实体模型三大类,其中以实体模型的三维表现性最强。
一、三维动画作品的构图
一般来说,制作一个专业级的三维动画作品至少要经过建模、绘制材质纹理、设置骨骼、设计动态、力场模拟、动作调试、设置灯光、合成渲染等步骤。精通并熟练运用三维动画技术需多年不懈的努力,同时还要随着软件的发展不断学习。三维动画在影视广告中的应用,除了涉及自身动画领域的专业内容外,还必须了解影视广告创意与执行的全过程。
在影视广告作品中,三维特技动画实际上是从属于影视广告的动画,它运用特技手段让观众在短时间内最透彻、最省力、最准确地了解广告的内容,并以其自身的魅力来感染观众,从而加快广告的传播速度。影视广告动画一定是服从于广告策略与创意的,并不能脱离策略与创意独立存在,更不能喧宾夺主,为了形式表现而表现。特效如果不能恰到好处地运用而到处泛滥,自然是毫无新意,形成受众的感知麻木。设备与技术投入的确可以使画面更精美、视觉更愉悦,但是也耗费更多的时间、精力与金钱,可以说是无止境的。当创意与技术实现互动的时候,才可以达到影视广告理想的沟通效果。
二、计算机辅助设计对于三维技术的推动作用
计算机辅助设计自1946年在麻省理工学院诞生以来,开始只是应用于航天、自动化、生物等高科技领域,80年代以来CAD开始在各个应用领域普及,而三维图形技术的发展却比计算机辅助设计慢得多,计算机三维技术的最初雏形最早能够追溯到1962年。那一年在马塞诸塞州科技学院里念书的沙赦冷搏士写了个程序可以直接在“阴极射线管上,在各种不同的立体几何图形上画一些“光线”。这种程序他把它叫做“基本图”,可以使用光笔交互地处理、显示二维和三维线框物体,这个系统主要还是用机的模拟。到60年代中期,实时全色彩渲染的动画系统开发成功,但这时的绝大多数阴极射线管(CRT)显示器却是单色的,不能够在计算机显示设备上预览,在今天看来,这种程序简直就像“原始人”一样,但是就是这个“原始人”打开了一扇在电脑应用领域里全新的大门――计算机图形图像技术。计算机图形图像技术经过四十几年的发展,逐步发展成为蕴藏着巨大商机的热门领域,计算机三维技术则是这个领域中一门重要技术并逐渐成为影视特技、计算机三维动画、影视广告设计、电子游戏、虚拟现实、互联网视频信息处理等技术中的一个重要的组成部分,而且其应用领域还在不断拓宽,正在改变着电影和影视广告设计行业的整个前后期制作和传播流程。计算机三维技术由于其高效、自由的特点在国际影视制作舞台上得到了空前高速的发展。好莱坞作为世界电影制作的最前沿,同时也是展示美国计算机三维技术的舞台,其电影产品对计算机三维技术的应用能力,以及所诞生出来的影视作品中所展现的艺术成就也是走在世界前列的。正是因为计算机三维技术具有种种传统技术所不能达到的能力和优势,这种技术几乎已经成为当前影视制作的通用技术。
三、三维动画技术在影视制作中的发展
詹姆斯・卡梅隆这样说道:“视觉娱乐影像制作的艺术和技术正在发生着一场革命,这场革命给我们制作电影和其他视觉媒体节目的方式带来了如此深刻的变化,以至于我们只能用出现了一场数字化文艺复兴运动来描述它。”计算机技术在动画制作方面的应用成绩是有目共睹的,从第一部彩色影院动画片《白雪公主》征式上映以来,其中除了少数的偶动画、沙动画、针幕动画、水墨动画等特种动画以外,动画片基本上都是二维动画片的天下,但自从1995年皮克斯公司推出世界上第一部纯三维动画长片《玩具总动员》以来,动画片市场的重心就逐渐向计算机三维动画转移,几乎每部三维动画影片都是“票房炸弹”。《怪物史瑞克》中那浓密的森林、绿油油的草地,《海底总动员》中那奇幻的海底世界,《汽车总动员》中那些表情生动但又真实无比的汽车,三维动画所带来的惊人的视觉效果,是二维动画无法比拟的。三维动画依赖的计算机三维技术通过电脑强大的运算能力来模拟现实,需要完成建模、赋材质,调动作、渲染等步骤。除了视觉效果“逼真”之外,与传统的二维动画相比,三维动画还具有许多突出优势:它不受帧数的限制,在模拟动作灯光都设置妥当的前提下,渲染程序可以自动产生足量的画面,使影片看起来如同现实一般流畅自然:在着色方面,三维动画的渲染步骤是一次性的过程,不必再像二维动画那样逐帧着色,大大减少了重复劳动。
随着计算机三维技术在影视特效和动画制作方面应用的不断深入,计算机三维技术对于影视广告设计和影视栏目包装等影像作品的影响也越来越大。它能创造出完全由计算机虚拟出传统手法无法获取的镜头运动、角色动画或奇幻场景及一些令人惊叹的视觉特效。实现了科学技术和艺术的完美结合。其变幻无穷的表现力及高效的工作方式,彻底地将专业人员从大量的摄录实景、繁琐的剪辑过程和昂贵的设备中解放出来,为创意的发挥开辟了崭新的天地,节约了宝贵的时间。如何有效地将计算机三维图形技术运用到影视广告设计中去,已经成为当今广告界最关注的话题之一。
计算机三维技术在游戏制作方面也有巨大而深远的影响,由二维游戏逐步进入到三维游戏的世界,其娱乐性,交互性也由于三维计算机技术的参与而得到很大的提升,成为当今娱乐界的龙头产业。计算机三维技术除了在影视特效、动画制作、影视广告设计、栏目包装、游戏制作等方面有着巨大影响力外,在现代科学技术如虚拟现实技术等方面的应用也非常广泛。
【参考文献】
[1]钟玮.三维人体面部表情动画技术在影视制作中的应用[J].电影文学,2016(01).
计算机视觉运用范文篇10
在用常见的手势进行交流时,人们很容易就能互相理解,在经过学习之后,聋哑人或是正常人都可以运用手语进行交流。不过,想象一下,当你对计算机(或机器)做一个手势,它就能领会你的意图会是怎样的情景呢?如果计算机(或机器)看得懂手语,又意味着什么呢?姑且不管实现这样的人机交流有何深远的意义,还是先让我们来探究一下这样的可行性吧,想想看得懂手语的计算机(或机器)能有什么用途。
人机交互:从呆板到员活
人类之间的交流往往声情并茂,既采用自然语言(口语、书面语言),还广泛采用人体语言(表情、体势、手势)。与人类之间的交流相比,人机交互就显得呆板多了。以计算机的输入方式为例,人要向计算机下达指令,最常见的方式还是通过键盘输入。当然,手写输入也正为许多人所接受和喜爱,语音输入的研究也进行得热火朝天,最初单一而呆板的输入方式已经得到了扩展。然而,科学研究是永无止境的,人体语言这种简单快捷的信息交流方式得到了很多研究者的关注,他们想,能不能把这种灵活的信息交流方式也引进人机交互中呢?
于是研究人员展开了对人体语言理解的研究。人体语言的感知、人体语言与自然语言的信息融合对提高计算机的人类语言理解水平,加强人机接口的可实用性有着积极的意义。手语(手势)是人体语言的一个非常重要的组成部分,它是包含信息量最多的一种人体语言,它与语言、书面语等自然语言的表达能力相同。因而完全可以把手语作为人机交互的一种手段,它具有很强的视觉效果,生动、形象、直观。可见,将手势运用于计算机能够很好地改善人机交互的效率。
计算机怎样识别手势?
从不同的角度可以对手势进行不同的分类。分为交互性手势和操作性手势,前者手的运动表示特定的信息(如乐队指挥),靠视觉来感知,后者不表达任何信息(如弹琴);分为自主性手势和非自主性手势,后者需要与语音配合用来加强或补充某些信息(如演讲者用手势描述动作、空间结构等信息),分为离心手势和向心手势,前者直接针对说话人,有明确的交流意图,后者只是反应说话人的情绪和内心的愿望。
手势的各种组合、运动相当复杂,不过简单来看,手势主要有如下的特点:手是弹性物体,因此同一手势之间差别很大,手有大量冗余信息,由于人识别手势关键是识别手指特征,因此手掌特征是冗余的信息:手的位置是在三维空间,很难定位:手的表面是,非平滑的,容易产生阴影。
了解了手势的这些特点,就可以在手势研究中对手势做适当的分割、假设和约束。例如,可以给出如下约束:如果整个手处于运动状态,那么手指的运动和状态就不重要,如果手势主要由各手指之间的相对运动构成,那么手就应该处于静止状态。比如鼠标和笔式交互设备就是通过识别手的整体运动来完成人与计算机的交互,但它们不能识别手指的动作,其优点是仅利用软件算法就能实现,适合于一般桌面系统。只有当用鼠标或笔式交互设备的运动或方向变化来传达信息时,才可将鼠标或笔式交互设备看作手势表达工具。笔式交互设备发展很快,它提供了充分的交互信息,如压力、方向、旋转和位置信息,但现有交互主要是简单地替代鼠标。
计算机识别手势的手段主要有两种:
1.数据手套。数据手套是虚拟现实系统中广泛使用的传感设备,用户通过数据手套,能做出各种手势向系统发出命令,与虚拟世界进行各种交互操作:比如通过一只与数据手套对应的在计算机屏幕上显示的虚拟手,使用户成为虚拟世界中的一员:抓取物体,如果手套有力反馈,还能让用户感觉到物体的重量和材质等。美国在“洞穴”虚拟系统中就是利用数据手套来研制武器。数据手套的主要优点是可以测定手指的姿势和手势,但是相对而言代价较为昂贵,并且有时会给用户带来不便(如出汗)。
2.计算机视觉。即利用摄像机输人手势,其优点是不干扰用户,这是一种很有前途的技术,目前有许多研究者致力于此项工作。但在技术上存在很多困难,目前的计算机视觉技术还难以胜任手势识别和理解的任务。
目前较为实用的手势识别是基于数据手套的,因为数据手套不仅可以输入包括三维空间运动在内的较为全面的手势信息,而且比基于计算机视觉的手势在技术上要容易得多。
更好地为人服务
日本三菱电子研究实验室的研究人员已经使用低成本的视觉系统,通过手势就可以控制一台电视机。由计算机控制的美国航空航天局虚拟太空站也是采用美国Cybernet公司开发的手语识别软件,通过一部架设在顶部的摄像机来追踪指挥者的手势。当系统捕捉到挥手等手势时,就会做出相应的反应,让指挥者像航天员一样在计算机虚拟的阿尔法国际太空站上移动(确切地说是飘动)。
Cybemet公司的软件还能识别一系列的特定手势,就像工地上的工人或交通警察经常用的那种手语,通过这些手势你能够旋转在虚拟旅行中看到的三维图像,还可以向上或是向下改变你的视角。美国航空航天局正在考虑把这套系统用于真正的太空站,因为笨重的航天服和微重力环境使得鼠标和键盘都变得难以操纵。也许不久之后,航天员就能用简单的手语来控制机器人在太空中抓取物体。
手语(手势)识别系统的研究还有助于改善和提高聋哑人的生活学习和工作条件,为他们提供更好的服务。同时也可以应用于计算机辅助哑语教学、电视节目双语播放、虚拟人的研究、电影制作中的特技处理、动画的制作、医疗研究、游戏娱乐等诸多方面。另外,手语识别系统的研究涉及到教学、计算机图形学、机器人运动学、医学等多学科。因此,手语识别系统的研究非常有意义。
计算机视觉运用范文篇11
关键词:机器视觉;图像检测;航空轮胎;表面质量
中图分类号:TP23文献标识码:A
引言近年来,随着生产工艺飞速发展,人们开始关注产品的外观质量,比如印刷品、包装、工艺品等以外观质量为重要附加价值的产品,又比如航空轮胎等表面缺陷会直接影响到使用效果甚至会给使用者的生命财产安全带来无可挽回的损失的产品。众所周知,机器视觉已经发展成为重要的工业生产加工手段之一,在中国成为全球重要的制造中心之一的背景下,中国成为继美国、欧洲和日本后的全球第四大机器视觉市场,同时也是最具发展潜力的市场。一方面外国企业积极入驻中国带来了巨大的视觉系统需求,另一方面国内企业不断扩大生产规模,加大了对视觉系统的需求,以航空轮胎为例,未来十年,国家将在大飞机项目中投入500~600亿资金,大飞机项目的发展,必将会带动航空轮胎行业大规模的发展,对航空轮胎的质量要求也会更加严格。1国内外相关技术研究国外对机器视觉技术的研究,由于开展的比较早,而且具有资金、技术以及硬件方面的优势,已经走在了国内的前面。国外的机器视觉系统的应用领域涉及到了社会生产的各个方面,有原始的在线监视,也有外观检测以及动作、行为控制,许多工业加工成套生产设备都集成了机器视觉系统,成为加工生产线的标配,比如印刷生产线上的机器视觉质量控制系统,又比如汽车制造业中的移动三坐标测量系统[1]。由于经济和技术原因,国内绝大多数图像处理技术公司都以国外产品为主,没有或者很少涉足拥有自主知识产权的机器视觉在线检测设备,对视觉技术的开发应用停留在比较低端的小系统集成上,对需要进行大数据量的实时在线检测的研究很少,也很少有成功案例。但是,随着国内经济发展和技术手段不断提高,对产品质量检测要求就更高,对在线检测设备的需求也就更大,具有巨大的市场潜力。计算机、摄像机等电子技术的飞速发展大大提高了机器视觉系统的硬件水平,同时图像处理理论和算法的快速发展也给机器视觉系统提供了强大的软件支持。但是,仍然伴随着一些问题,主要有以下两点:光学仪器第35卷
第3期谢,等:机器视觉在轮胎检测领域的应用研究
(1)算法的精确性提高伴随着计算量的成倍增加,处理时间就成为了实时检测的软肋;(2)硬件的分辨率提高了,图像的分辨率、精度也随之提高了,但是数据量计算量都因此成倍增加。因此,如何保证检测的实时性和准确性,是机器视觉系统在工业应用中需要解决的核心问题。2视觉检测核心技术
2.1机器视觉图像处理技术机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。有大量的文献和著作给与介绍和讨论,其中比较著名的马颂德的《计算机视觉》介绍了计算机视觉的算法和理论,以及RichardHartley的《MultipleViewGeometryinComputerVision》介绍了在计算机视觉中的几何理论和方法[2]。机器视觉中的图像处理方法,主要包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既优化了图像的视觉效果,又便于处理器对图像进行分析、处理和识别[3]。机器视觉理论应用于现代检测领域,是上世纪末本世纪初计算机视觉的一个新的研究方向。它使用计算机视觉的理论方法来识别物体的关键点,经过分析处理以后,转换成坐标数据,然后产生检测数据。国内已有学者把机器视觉技术运用于检测领域[4]。但是在轮胎检测领域,机器视觉技术的应用还仅仅停留在理论之上,还没有可实际应用的商品化的设备,更不用说结合机器视觉和嵌入式两种技术的便携式检测仪了。
2.2嵌入式技术嵌入式系统一般指非PC系统,有计算机功能但又不称之为计算机的设备或器材。它是以应用为中心,软硬件可裁减的,适应对功能、可靠性、成本、体积、功耗等综合性严格要求的专用计算机系统。嵌入式系统几乎包括了生活中的所有电器设备,如掌上PDA、移动计算设备、电视机顶盒、手机上网、数字电视、多媒体、汽车、微波炉、数字相机、家庭自动化系统、电梯、空调、安全系统、自动售货机、蜂窝式电话、消费电子设备、工业自动化仪表与医疗仪器等。嵌入式系统有以下几大优点[56]:(1)嵌入式系统通常是面向特定应用的,它通常都具有低功耗、体积小,集成度高等特点;(2)嵌入式系统和具体应用有机地结合在一起,它的升级换代也是和具体产品同步进行的,因此嵌入式系统产品一旦进入市场,就具有较长的生命周期;(3)由于空间和各种资源相对不足,嵌入式系统的硬件和软件都必须设计,量体裁衣、去除冗余,力争在同样的硅片面积上实现更高的性能,这样才能在具体应用中对处理器的选择更具有竞争力。本研究选取嵌入式系统中的DSP(数字信号处理器)来进行开发,具体型号为TI公司的TMS320。它具有很高的编译效率和执行速度,在信号处理方面具有优势,它的特点如下:(1)程序和数据具有独立的存储空间,有着各自独立的程序总线与数据总线,可以同时对数据和程序进行寻址,大大提高了数据处理能力;(2)由于广泛采用了流水线操作,减少了指令的执行时间,可以同时运行8条指令;(3)与一般计算机不同,乘法(除法)不由加法和移位实现,它具有硬件乘法器,乘法运算可以在一个指令周期内完成;(4)指令周期降到了1.67ns。随着工作频率进一步提高,指令周期将进一步缩短;(5)拥有自己独特的专门为数字信号处理而设计的指令系统;(6)相比传统的处理芯片,它还具有体积小、功耗小、使用方便、实时处理迅速、处理数据量大、处理精度高、性能价格比高等许多优点。3轮胎检测系统构成
3.1研究目标机器视觉用于产品表面缺陷检测需要面对以下主要问题:(1)数据处理量非常庞大;(2)如何快读匹配图像;(3)如何快速实现缺陷分割并剔除伪缺陷;(4)如何选取缺陷特征,用以实现缺陷识别。以具体产品为例,相对其他轮胎产品,航空轮胎对质量检测的要求较为严格,只要航空轮胎的检测技术到位,其他轮胎产品也基本可以检测。以航空轮胎的缺陷检测为例,根据GB/T9747-2008《航空轮胎试验方法》、GB/T13652-2004《航空轮胎表面质量》和GB15323-1994《航空轮胎内胎》等标准的要求,研究表面缺陷在线检测的图像处理方案;开发一套基于机器视觉的产品表面缺陷的在线检测设备,同时根据GB/T13653-2004《航空轮胎X射线检测方法》所述,配合X射线发射仪,利用一对一的服务器/客户机构架的机器视觉对标准中所描述的航空轮胎的一系列缺陷,如断层、气泡和裂口等进行高精度、高实时性、高连续性以及非接触式的在线缺陷检测。具体技术指标:(1)能检测出最小直径0.3mm的轮胎内部缺陷(即横向纵向最小均为0.3mm)并能对缺陷进行分类识别,主要包括结构类、气泡类和夹杂物类,对缺陷的检出率要求大于90%;(2)对缺陷部位进行定量和定位分析:读出缺陷的尺寸(误差0.5mm),测出缺陷距离轮胎表面的深度,决定缺陷在轮胎内部的位置;(3)在线检测设备的检测检测速度与X射线管旋转速度同步,X射线管旋转一周即完成一个轮胎一个圆周的缺陷检测。
3.2研究内容和技术路线
3.2.1确定机器视觉检测系统的基本框架在数据量大时,采用一个处理器搭配一台摄像机的一对一方式。在产品表面检测中,由于航空轮胎的圆周面比较大,数据量也就比较大,通常采用的机器视觉单摄像机方式,很难满足圆周面检测分辨率高、数据量大的要求,而多台摄像机能满足分辨率和数据量的要求,却又相应带来实时性差的问题。若采用多台摄像机的方式,就需要配备多套成像系统,一套成像系统造价在10万元左右,基于成本和计算数据量的考虑,本研究选用一对一方式,利用分时运动克服单台摄像机采集数据量不足的缺点。具体来说,就是在经典的服务器/客户端模式架构的基础上设计一种基于机器视觉的系统结构以实现轮胎圆周面产品表面缺陷的在线检测,该结构主要由四部分组成:服务器(嵌入式系统)、客户端(图像处理子系统)、信号模块(PLC)、输出单元。系统框架如图1所示。每隔一定的时间(系统初步设定为5s),服务器通过PLC控制步进电机驱动轮胎做圆周转动,每转过一个固定角度(系统定为120°),服务器就调动客户端完成此区域内相对独立的视觉检测任务,一次间隔只检测轮胎的三分之一(120/360),经过3个时间间隔,客户端即完成了整个轮胎360°的全面检测,然后利用拼接原理把各部分拼接起来,统一到一个坐标系下。拼接测量的关键是利用重叠区计算出各次测量时基准的不同,然后消除不同,统一在一个坐标系下。拼接测量的方法可以直接计算出被测轮胎的全面信息。为了保证服务器和客户端之间图像检测数据可靠、实时的交互,本研究采用千兆以太网的方式传输数据。作为整个检测系统的管理控制单元和人机交互接口,服务器不仅要完成检测任务的调度,还要可以设定检测参数,接收和实时显示客户端上传的图像数据和处理结果(缺陷等),并将信息存入数据库中。此外,服务器还接收PLC传来的位置检测信号,用于与客户端的同步,并且根据检测结果中的位置信号,对执行机构发出动作信号,标记并剔除有缺陷的产品。在客户端处理核心中安装有图像采集卡,接收服务器设置的参数和任务调度,控制采集卡和摄像机完成图像实时采集,利用图像处理算法处理和分析图像数据,将最终得到的缺陷位置和分类信息上传给服务器,保存缺陷图像以备查。
3.2.2设计编写表面缺陷检测的图像处理方案在表面缺陷检测中,根据图像数据的特点,本研究提出以下图像处理过程:缺陷分割、特征提取及缺陷分类。首先是缺陷分割:在表面缺陷检测的时候,利用图像处理算法,处理采集到的产品表面图像,将缺陷从复杂的背景图像中分离出来。接着是特征提取:提取缺陷后,对缺陷的各种标识性属性进行提取,主要是几何特征和灰度统计特征,以保证后续的缺陷分类和识别。几何特征指的是轮廓特征,比如长度、形状、面积、重心等。灰度统计特征指的是分布位置、统计值、均方差等等。还有缺陷分类:本研究采用改进的BP算法[7]对网络进行训练,构建神经网络分类器来实现轮胎缺陷分类,为了提高检测系统对伪缺陷的适应性,本研究将部分伪缺陷也作为网络输出并对其进行训练。由于图像处理中需要运用大量的计算机内存处理算法,为避免编程中出现内存泄露进而造成计算机内存资源流失的现象,决定采用对内存进行托管的C#语言进行编程。
3.2.3服务器和客户机系统之间的同步服务器/客户端模式架构的机器视觉系统具有独立性和并行性的特点,它不得不面临的一个重要问题是如何解决服务器和图像处理子系统之间的同步问题,包括摄像机同步采集、数据同步处理和轮胎运动同步控制等。本研究利用摄像机本身的外同步特性,采用对摄像机提供统一的线扫描触发信号保证摄像机采集同步。机器视觉系统基本组成模块见图2。
4结论实际测量结果证明,应用视觉检测方法可以较好地解决传统测量方法中时间长、工作量大、测量效率低的问题。该方法能够充分利用现代计算机技术的优势,设备简单、易用,克服了传统测量仪器的许多误差来源,具有快速、准确、非接触测量的优点。在实验室中初步完成了实验系统的核心部分(如图3所示),与传统的测量方法相比,原先需要15min的测量时间,现在只需要15~30s就可完成,操作也更加简单便捷。该系统可检测出最小直径0.3mm的轮胎内部缺陷(即横向纵向最小均为0.3mm)并能对缺陷进行分类识别,主要包括结构类、气泡类和夹杂物类,对缺陷的检出率为96%。
参考文献:
[1]彭向前.产品表面缺陷在线检测方法研究及系统实现[D].武汉:华中科技大学,2008.
[2]ZHANGZ.DeterminingtheEpipolargeometryanditsuncertainty[J].AReviewIntJournalonComputerVision,1998,27(2):161-195.
[3]章毓晋.图像处理和分析[M].北京:清华大学出版社,1999.
[4]朱方文.基于LAP方法的机器人灵巧手控制[D].上海:上海大学,2006.
[5]张嘉琪.基于嵌入式系统图像处理平台的万寿菊水分状态检测系统的研究[D].重庆:西南大学,2009.
计算机视觉运用范文
计算机视觉的第一步是特征提取,即检测图像中的关键点并获取有关这些关键点的有意义信息。特征提取过程本身包含4个基本阶段:图像准备、关键点检测、描述符生成和分类。实际上,这个过程会检查每个像素,以查看是否有特征存在干该像素中。
特征提取算法将图像描述为指向图像中的关键元素的一组特征向量。本文将回顾一系列的特征检测算法,在这个过程中,看看一般目标识别和具体特征识别在这些年经历了怎样的发展。
早期特征检测器
ScaleInvariantFeatureTransform(SIFT)及GoodFeaturesToTrack(GFTT)是特征提取技术的早期实现。但这些属于计算密集型算法,涉及到大量的浮点运算,所以它们不适合实时嵌入式平台。
以SIFT为例,这种高精度的算法,在许多情况下都能产生不错的结果。它会查找具有子像素精度的特征,但只保留类似于角落的特征。而且,尽管SIFT非常准确,但要实时实现也很复杂,并且通常使用较低的输入图像分辨率。
因此,SIFT在目前并不常用,它主要是用作一个参考基准来衡量新算法的质量。因为需要降低计算复杂度,所以最终导致要开发一套更容易实现的新型特征提取算法。
二代算法
SpeededUpRobustFeatures(SURF)是最早考虑实现效率的特征检测器之一。它使用不同矩形尺寸中的一系列加法和减法取代了SIFT中浩繁的运算。而且,这些运算容易矢量化,需要的内存较少。
接下来,HOG(HistogramsofOrientedGradients)这种在汽车行业中常用的热门行人检测算法可以变动,采用不同的尺度来检测不同大小的对象,并使用块之间的重叠量来提高检测质量,而不增加计算量。它可以利用并行存储器访问,而不像传统存储系统那样每次只处理一个查找表,因此根据内存的并行程度加快了查找速度。
然后,ORB(OrientedFASTandRotatedBRIEF)这种用来替代SIFT的高效算法将使用二进制描述符来提取特征。ORB将方向的增加与FAST角点检测器相结合,并旋转BRIEF描述符,使其与角方向对齐。二进制描述符与FAST和HarrisCorner等轻量级函数相结合产生了一个计算效率非常高而且相当准确的描述图。
CNN:嵌入式平台目标识别的下一个前沿领域
配有摄像头的智能手机、平板电脑、可穿戴设备、监控系统和汽车系统采用智能视觉功能将这个行业带到了一个十字路口,需要更先进的算法来实现计算密集型应用,从而提供更能根据周边环境智能调整的用户体验。因此,需要再一次降低计算复杂度来适应这些移动和嵌入式设备中使用的强大算法的严苛要求。
不可避免地,对更高精度和更灵活算法的需求会催生出矢量加速深度学习算法,如卷积神经网络(CNN),用于分类、定位和检测图像中的目标。例如,在使用交通标志识别的情况下,基于CNN的算法在识别准确度上胜过目前所有的目标检测算法。除了质量高之外,CNN与传统目标检测算法相比的主要优点是,CNN的自适应能力非常强。它可以在不改变算法代码的情况下快速地被重新“训练(tuning)”以适应新的目标。因此,CNN和其他深度学习算法在不久的将来就会成为主流目标检测方法。
CNN对移动和嵌入式设备有非常苛刻的计算要求。卷积是CNN计算的主要部分。CNN的二维卷积层允许用户利用重叠卷积,通过对同一输入同时执行一个或多个过滤器来提高处理效率。所以,对于嵌入式平台,设计师应该能够非常高效地执行卷积,以充分利用CNN流。
事实上,CNN严格来说并不是一种算法,而是一种实现框架。它允许用户优化基本构件块,并建立一个高效的神经网络检测应用,因为CNN框架是对每个像素逐一计算,而且逐像素计算是一种要求非常苛刻的运算,所以它需要更多的计算量。
不懈改进视觉处理器
-
文化艺术课程范例(12篇)
文化艺术课程范文篇1【关键词】高校美术教育引导培养能力基础“教育”的本义是“引导”。美术是一种视觉艺术,用一定的物质材料与手段来塑造可视的形象,以表达人们的思想情感..
-
思想教育的心得范例(12篇)
思想教育的心得范文1篇1关键词:和谐教育思想政治教育对策一、和谐教育的内涵“和谐”,在《现代汉语词典》中定义为:配合得适当而匀称。英文中叫做“harmony”,意思是指内心的平..
-
乡村产业的内涵范例(12篇)
乡村产业的内涵范文篇1[关键词]乡村旅游喀斯特山区农村经济贵州省近年来,以田园风光、少数民族村寨文化为核心的乡村旅游业在贵州得到迅速发展,全省已有1000多个村寨成为旅游..
-
高危孕产妇管理方案范例(3篇)
高危孕产妇管理方案范文[关键词]全覆盖孕产妇系统保健管理;孕产妇死亡率;孕产妇系统保健管理指标[中图分类号]R173[文献标识码]C[文章编号]1673-7210(2013)04(a)-0164-03随着城市..
-
高危儿护理诊断及措施范例(12篇)
高危儿护理诊断及措施范文篇1【关键词】新生儿监护病房;医院感染;目标性监测新生儿重症监护病房(NICU)的新生儿由于先天发育不全、早产、低体重、脐/中心静脉插管及呼吸机等侵..
-
阅读教学的本质范例(12篇)
阅读教学的本质范文篇1调查:教师阅读能力不足昆明市教育科学研究院教研员熊芬等进行的《滇中农村边远地区稳定教师队伍的研究》披露,以县级培训为主的师训体系,使得近三分之一..
-
煤矿电工培训教程范例(12篇)
煤矿电工培训教程范文篇1根据我院煤矿开采专业技术专业的转型需要、结合《人工干预智能化开采的研究》项目的需求,2018年7月17日至25日专家罗**、教授杨殿海、佟凯、梁士宝..
-
企业信用管理的实质范例(12篇)
企业信用管理的实质范文篇1关键词:高质量发展国有企业财务管理优化随着高质量发展的提出,国有企业进一步推进经营管理改革,旨在提升企业综合竞争实力,建立创新优势。国有企业是..