计算机视觉的应用方向范例(12篇)
计算机视觉的应用方向范文篇1
关键词:机器人;人机界面;三维可视化;图形降噪;图像处理
中图分类号:TN830.1?34;TP391文献标识码:A文章号:1004?373X(2017)12?0105?03
Abstract:Inordertoimprovetheoperatingperformanceof3Dvisualizationofrobothuman?computerinterface,a3Dvisualizationreconstructiondesignmethodofrobothuman?computerinterfacebasedonGPUreal?timegraphtrackingrenderingisputforward.Thecomputervisionmethodisusedtosamplethevisualfeaturesofrobotman?computerinterface,andperformthesparsescatteredpointsreconstructionforthesampledvisionpixelinformation.Theimageprocessingmethodisadoptedtodenoisethegraphandcorrecttheedgeinthereconstructed3Dspace,andimprovethedetailpresentationabilityof3Dvisualizationgraphofman?computerinterface.Thesimulationresultsshowthatthemethodusedtodesignthe3Dvisualizationoftherobothuman?computerinterfacehasperfectvisualeffectoftheoutputgraph,stronghuman?computerinteractionability,andhighapplicationvalue.
Keywords:robot;human?computerinterface;3Dvisualization;graphnoisereduction;imageprocessing
0引言
机器人人机交互(Human?ComputerInteraction,HCM)是通过图像和计算机视觉处理的方法,实现机器人系统与用户之间的交互关系和沟通,在机器人人机交互过程中,人与计算机通过计算机视觉处理和动作识别的形式实现语言沟通,完成确定的任务和计算机与机器人的信息交换[1]。机器人人机交互系统广泛应用在视景模型仿真、机器手设计和远程虚拟控制等领域,在现代工业和远程控制中具有重要的应用价值。
在机器人的人机交互中,需要通过对人机界面的三维可视化设计,提高人机交互的可视性和人工智能性,研究人机交互界面的三维可视化重构方法在机器人的人工智能优化设计领域具有重要的应用意义。对此,本文提出一种基于GPU实时图形跟踪渲染的机器人人机界面的三维可视化重构设计方法。首先采用计算机视觉方法进行机器人的人机界面视觉特征采样,采用图像处理方法实现图形降噪和边缘修正处理,提高人机交互界面的三维可视化图形细节表达能力。最后进行仿真实验分析,得出有效性结论。
1视觉特征采样与像素信息重构
1.1人机界面计算机视觉特征采样
为了实现机器人人机界面的三维可视化设计,首先进行视觉信息采样,本文采用计算机视觉方法进行机器人的人机界面视觉特征采样,在视觉信息采集中,对特征空间中的突变信息进行采集,检测提取后的轮廓线信息是否符合要求,不符合的原因是由于阈值小而提取了过多的次要轮廓线,使主要轮廓线无法突出。利用多尺度特征来提取轮廓线,并将高频与低频部分的轮廓线信号进行融合,也就是在不同尺度特征下进行轮廓线提取,因此可得到光滑的轮廓线图像,提取出的人机界面外部采集轮廓线,将外部特征通过二维流形分析[2]。机器人与人体动作的交互过程可以表征为一个高维向量,收集大量人体动作完成机器人的人机动作交互,将人机交互界面场景数据库中的交互动作数据进行三维特征扫描,扫描包括激光扫描、红外扫描和CT扫描等方法[3],得到机器人人机界面交互的动作扫描的像素组成为:
1.2视觉像素信息稀疏散点重构
对采样的视觉像素信息进行稀疏散点重构,为进行人机界面的三维可视化设计提供数据基础,对机器人人机交互界面的视觉像素信息稀疏散点重构需要遵循以下原则:
(1)可描述性。对不同的人机交互动作,应该提取具有明显区别的特征参数,即特征参数具有较强的敏感性,能够高效地对技术姿态进行描述。
(2)可靠性。不同的动作识别系统做同一个技术动作时一定会存在差异,但这种差异不应该对特征参数造成影响,即同种类型的技术姿态的特征参数会比较相似,这就要求所提取的特征参数对位置和对象不敏感。
(3)数量少。一个动作识别特征值越多,系统的计算复杂程度就越大,因此要尽可能控制特征值的数量[5]。在像素点中,通过仿射变换,得到对应的不变矩坐标为,在不同朝向和不同尺度间进行机器人人机界面网格区域匹配,得到人机界面三维轮廓函数为:
3实验测试分析
对机器人的人机界面三维可视化实验建立在本主机配置为PentiumDCPU2.80GHz,2.79GHz,2.00GB内存的计算机硬件平台上。在机器人人机动作特征识别中,人体动作特征单元和模块子单元表示为Cell(col,row)。其中col表示行,row为列,人机交互中人体动作图像采集来自于分辨率为640×480,帧率为25f/s的AVI视频,参数设定为=0.5,=2,=2,得到机器人人机界面的三维可视化重构结果如图1所示。对图1给出的机器人人机界面三维重构结果进行降噪和修正处理,得到三维可视化优化结果如图2所示。
对比图2和图1结果得知,采用本文方法进行机器人人机界面的三维可视化设计,输出图形的视觉效果较好,人机交互能力较强,性能优越。
4结语
为了提高机器人人机界面的三维可视化操作性能,本文提出一种基于GPU实时图形跟踪渲染的机器人人机界面的三维可视化重构设计方法。采用计算机视觉方法进行机器人的人机界面视觉特征采样,在重构的三维空间中通过图像处理方法实现图形降噪和边缘修正处理,实现三维可视化设计。研究得知,采用该方法进行机器人人机界面的三维可视化设计,输出图形的视觉效果较好,人机交互能力较强,具有较高的应用价值。
参考文献
[1]董哲康,段书凯,胡小方.非线性忆阻器的串并联研究及在图像处理中的应用[J].西南大学学报(自然科学版),2015,37(2):153?161.
[2]袁健,高勃.基于OpenCL的三维可视化加速模型[J].小型微型计算机系统,2015,36(2):327?331.
[3]朱路,刘江锋,刘媛媛,等.基于稀疏采样与级联字典的微波辐射图像重构方法[J].微波学报,2014,30(6):41?45.
[4]HUANGY,PAISLEYJ,LINQ,etal.BayesiannonparametricdictionarylearningforcompressedsensingMRI[J].IEEEtransactionsonimageprocessing,2014,23(12):5007?5019.
计算机视觉的应用方向范文篇2
关键词:行人摔倒检测;视觉检测;视频采集模块;交通监控系统
中图分类号:TN957.52+3?34;TP233文献标识码:A文章编号:1004?373X(2016)20?0087?05
Abstract:Theautomaticdetectionforpedestrianstumblecanprovidethesafeguardforthelifesafetyofpedestrians.Thepedestriantumbleautomaticdetectionsystembasedonbehaviorvisionwasdesigned.Thesystemhardwareincludesthevideoacquisitionandoperationmodule,andvideocontouracquisitionmodule.TheTMS320F2812chipistakenasthecorecontrolunitofthesystem.TheTMS320F2812chipandSAA7111chipareusedtoconstructthevideocollectionandprocessingmodule.Thecontouroftheimageacquiredbyvideoacquisitionmoduleisdescribedtoobtainthemovingtargetcharacteristicsofpedestrians′differentposes,anddetectthepedestriantumbleautomatically.Theresultsofsimulationexperimentshowthatthedesignedsystemhasgoodadaptiveabilitytothecomplexenvironment,canimprovethedetectionaccuracyofpedestriantumbleincidents,andcanbeusedintheintelligenttrafficmonitoringsystem.
Keywords:pedestriantumbledetection;visualdetection;videoacquisitionmodule;trafficmonitoringsystem
0引言
随着中国人口的不断增加,交通事件频繁发生,行人摔倒已成为一个不容忽视的问题,严重时会给人们的生命构成严重的威胁。因此,设计一种行人摔倒自动检测系统具有重要意义[1?3]。如果能准确高效地对行人摔倒进行检测,将对交通管理和远程医疗的发展具有重要意义[4?6]。目前,研究的行人摔倒自动检测方法在取得进展的同时还存在一定的问题,如文献[7]采用几何法对行人摔倒进行自动检测,通过提取行人外界环境的几何特征,将行人位姿空间投影至加权图中,对行人摔倒进行检测;文献[8]提出一种环境分割方法,依据不同部件间的关联性绘制连通图,通过图查找方式检测行人摔倒过程,但该方法过于繁琐;文献[9]利用人工势场法把行人在自由空间的行走轨迹假想成通过受力得到的:阻碍物对行人施加排斥力,目的点作用给行人引力,行人同时吸收两种作用力后自身调整对行人摔倒进行检测,但没有考虑阻碍物的其他信息,导致出现部分最小值问题。
针对上述方法的缺陷,设计基于行为视觉的行人摔倒自动检测系统。系统硬件包括视频采集操作模块和视频轮廓采集模块。采用TMS320F2812芯片作为系统的核心控制单元,通过TMS320F2812芯片和SAA7111芯片构建视频采集处理模块;将视频采集模块采集的图像进行轮廓的描述,获取行人不同姿态运动目标的特征,实现行人摔倒自动检测。仿真实验结果说明,所设计系统对复杂环境的适应能力较强,行人发生摔倒等事件检测正确率提高,可以应用于智能交通监控系统中。
1行人摔倒自动检测系统设计
1.1系统硬件的总体结构
行人摔倒自动检测系统的硬件由视频采集操作模块以及视频轮廓采集模块构成。视频采集操作模块包括控制器和视频输入操作器两部分。
采用TMS320F2812芯片作为系统的核心控制单元,通过TMS320F2812芯片和SAA7111芯片构建视频采集处理模块。模块中包含两个事件管理器,用于调制机器人直流伺服电动机电压,对行人的运动进行PWM控制。TMS320F2812含有18KB的片内SARAM、128KB的FLASH,可用于分析并处理行人运动图像;采用可编程视频输入处理芯片SAA7111塑造前端视频处理电路,采集行、场同步信号和数字图像信号;视频轮廓采集模块以无线传输模块反馈的基于行为视觉的行人运动为基础,将视频采集模块采集的图像进行轮廓的描述,获取行人不同姿态运动目标的特征,实现行人摔倒自动检测。行人摔倒自动检测系统的整体硬件结构图如图1所示。
1.1.1视频采集操作模块
视频采集处理模块由TMS320F2812芯片和SAA7111芯片组成。TMS320F2812为依据TMS320C2xx内核的定点数字信号操作器,为了获取行、场同步信号和YUV信号,要求TMS320F2812依据芯片间的串行传递总线I2C读写SAA7111寄存器中的相关数据。SAA7111是视频输入处理芯片,通过CMOS工艺和I2C总线同其他部件相连,实现相关的调控以及信息沟通,将输入的视频图像信号转换成数字信号。如图2所示。
以DSP为基础的路线矫正视觉系统中,I2C中寄存器的相关管理部署数据实现了SAA7111的全部可编程功能。为了能有效地管理SAA7111,采用TMS320F2812的MCBSP对I2C的总线功能进行模拟。首先采用MCBSP设置SCL时钟,并将时钟相关参数写入SAA7111中的寄存器内,确保SAA7111依据行人轮廓矫正结果运行。TMS320F2812与SAA7111的I2C接口如图3所示。
1.1.2视频轮廓点和点序列处理模块
视频轮廓点和点序列采集模块包括大量的半导体部件,用于描述并记录不断波动的人物信号电荷量,然后将采集到的信号电荷量发送给模块中的移位寄存器,对其进行相应处理,确保移位寄存器输出的视频轮廓点和点序列的有效性,最后将输出结果与以无线传输模块反馈的基于栅格法和遗传算法相结合,调整行人轮廓矫正信号。如图4所示。
1.1.3无线通信模块
利用无线通信模块,将下位机与上位机进行交流。通过摄像头获取的图像资料,利用无线通信模块反馈给上位机,历经上位机的相关图像操作后,将操作成果发送到智能机器设备的操作器上。该体系择取两个VNT6656G6A40,一个与上位机相连,另一个接到视频轮廓点和点序列处理模块上,将无线传输模块反馈的基于行为视觉的行人轮廓矫正信号传递给视频轮廓点和点序列采集模块驱动模块中。
VNT6656G6A40属于一种USB接口的WiFi模块,用于深入体系的无线局域网间的交流服务。无线通信的构架如图5所示。
1.2软件设计
1.2.1软件系统的总体架构
TMS320F2812芯片是总体系统的CPU,调度系统中的任务,实现调控摄像头采集图像、同上位机进行通信、管理机器人路线矫正算法等功能。图像处理模块实现图像的预操作、图像分割、特征采集等,并采用无线网络将操作结果反馈给下位机,也就是行人轮廓矫正系统,系统的软件组成如图6所示。
1.2.2系统程序规划流程
连接电源启动系统,激发初始化模块运行,完成对入口地址和向量表的部署,以及I/O口和PWM模块的初始化。系统经DSP内的TMS320F2812发出图片收集信号,经初步处理后,传输给视频轮廓点和点序列处理模块,对图像轮廓进行描述,将摔倒识别的对象:人抽象的表示成由一些特征值构成的特征向量,这些特征向量就能代表某种动作或者某种特定的行为特征,将这些行为特征组成一个集合。在该集合中可以提取一些特征数值构成特征向量来代表摔倒模式,实现摔倒检测。系统程序流程图如图7所示。
1.2.3部分代码设计
当还未通过摄像头获取图像时,先要初始化摄像头。S3C2440通过webbingloom,连接到摄像头OV9650,因此初始化处理摄像头相当于初始化处理webbingloom。将webbingloom寄存器赋值,以便完成建立和操纵摄像头的任务。在整个操作过程的开端,需要通过pen()函数,来对webbingloom装置进行开启。倘若开启顺利,程序中会有一个文档表达符gb出现,倘若失败,会反馈开启失败信号并折返。
其中webbingloom_rule结构体中含有双个值:一个表达所在信息,另一个就是它的值。在以上的for反复运作中,把vidrule结构体数组中值授予文档表达符,此刻就完成将I2C装置赋值的任务,设置好相应的任务后,就能进行图像采集。
2基于行为视觉的行人摔倒自动检测
在硬件和软件设计完成后,进行行人摔倒自动检测。如果发生疑似摔倒现象,则提取该时段行人的特征向量,计算观测样本与数据库中的特征样本数量的距离,如果该距离没有超过设定的阈值,则判断摔倒没有发生,结束观测;如果超过设定阈值,则判定发生摔倒,采用图像采集系统进行拍照,并传送相关信息。基于行为视觉的行人摔倒自动检测算法的流程如下:
(1)建立特征向量库。通过实验对摔倒事件进行分类统计,并计算出各种行为的特征空间的距离阈值。
(2)如果发生疑似摔倒现象,系统将提取可疑信号,监测人体运动的数据变化。
(3)提取的可疑信号通过上述方法计算出各特征值作为观测特征向量。
(4)计算观测特征向量与特征库样本的距离。
(5)进行模式匹配。通过计算的特征空间距离来确定是否属于该空间范围,如果匹配成功,则判断为摔倒。
3实验结果与分析
实验以VisualC++6.0为开发工具进行行人摔倒自动检测仿真测试,模拟实现行人摔倒的自动检测,计算机配置为WindowsXP,4GHzCPU,以及行人摔倒图像,其中每一帧图像的分辨率是1248×624,利用该系统进行行人摔倒情况的检测。
3.1不同算法的人摔倒自动检测效果比对
对图8、图9进行分析可知,采用传统算法进行的行人摔倒检测时,图像处理效果模糊、难以分辨,而采用改进算法能够有效解决阴影和慢速移动带来的重影等问题,可以准确获取行人摔倒的图像,鲁棒性强。
3.2不同方法的行人摔倒自动检测精度比对
为了验证本文方法的稳定性,实验在相同的环境中对本文方法和文献[9]所述人工势场方法进行了测试,将不同方法的行人摔倒自动检测时间进行比对,结果如图10所示。
分析图10中的两条曲线变化趋势发现,相对于人工势场方法,本文方法在进行行人摔倒自动检测时耗低,证明了改进算法在精度方面的优势。
3.3不同环境中不同方法的行人摔倒自动检测时间比对
为了证明改进算法的效率和应用性,将在不同环境中利用不同方法进行行人摔倒自动检测时间比对,表1为不同环境中不同方法的行人摔倒自动检测时间。
由表1可知,在相同的环境下,改进算法进行行人摔倒自动检测所需时间远远低于传统方法,随着环境复杂程度的增加,本文方法与传统算法相比,在时间上对行人路线矫正的效率优势越显著,具有较高的鲁棒性。
4结论
设计基于行为视觉的行人摔倒自动检测系统。系统硬件包括视频采集操作模块和视频轮廓采集模块。采用TMS320F2812芯片作为系统的核心控制单元,通过TMS320F2812芯片和SAA7111芯片构建视频采集处理模块;将视频采集模块采集的图像进行轮廓的描述,获取行人不同姿态的运动目标的特征,实现行人摔倒自动检测。仿真实验结果表明,所设计系统对复杂环境的适应能力较强,行人发生摔倒等事件检测正确率较高,可以应用于智能交通监控系统中。
参考文献
[1]张弛.采用惯性测量单元的移动机器人轨迹跟踪方法研究[J].控制理论与应用,2013,30(3):398?403.
[2]谭苗,吴益飞,陈扬,等.电磁导引的两轮自平衡移动机器人设计[J].华中科技大学学报(自然科学版),2013,41(z1):249?253.
[3]瞿端阳,王维新,马本学,等.基于机器视觉技术的棉株识别定位[J].中国棉花,2013,40(2):16?19.
[4]戴金波.基于视觉信息的图像特征提取算法研究[D].长春:吉林大学,2013.
[5]黄艳.基于主动视觉的大空间测量关键技术研究[D].哈尔滨:哈尔滨工业大学,2013.
[6]孙岩,张征宇,黄诗捷,等.风洞试验中模型迎角视觉测量技术研究[J].航空学报,2013,34(1):1?7.
[7]宋慧欣.3D视觉,机器视觉新突破[J].自动化博览,2013(8):66?67.
[8]FLORAYEHYH,LAITC,LIUTM,etal.Anautomatedgrowthmeasurementsystemforleafyvegetables[J].Biosystemsengineering,2014,117:43?50.
[9]OSTERMANA,GODESAT,HODEVARM,etal.Real?timepositioningalgorithmforvariable?geometryair?assistedorchardsprayer[J].Computersandelectronicsinagriculture,2013,98(7):175?182.
计算机视觉的应用方向范文1篇3
王文汉所说的软件创新的一大背景,就是多核时代的到来。IDC的数据表明,在2008年发售的服务器、台式PC以及笔记本电脑中,超过80%的产品将内置多核处理器;而到2009年,几乎所有发售的服务器、台式PC和笔记本电脑都将内置多核处理器。
在从单线程向多线程变化的过程中,英特尔将从哪些方面的创新入手呢?
四大趋势推动创新
在多核时代,多线程工作的软件将是多核更高处理能力和性能优势得到发挥的重要因素。虚拟化、并行化、视觉化和开源是推动多核产业向前发展的四大趋势,多核的架构必然需要很多基本架构上的变化来支撑,如指令集、缓存结构等,而这些都是英特尔正在进行的工作。王文汉预计,“今后几十年可能是计算机发展的黄金时代,因为很多问题都需要重新解决一次,比如并行处理需要高效的开发工具。”
王文汉认为,视觉计算正在改变计算机用户的视觉感受,下一代技术将可以提供自然真实的游戏体验、图形效果和高清晰度音视频,从而对电脑的性能和架构提出了更高的要求。要想提供视觉计算,就需要一款包括多核CPU、芯片组、显卡、软件和相关开发工具在内的平台。为此,英特尔将继续增加有关的研发投入,Larrabee就是英特尔发展视觉计算平台的下一个架构,这个架构和指令集专为满足视觉计算、并行计算的要求而设计。
“虽然硬件给英特尔带来了很大价值,但是我们也必须通过软件的创新提高附加价值,一旦我们意识到产业的某一个环节阻碍了产品的创新力度或者速度,我们就会去帮忙。”王文汉表示,30年前,英特尔发现BIOS阻碍了整个产业的创新,因为BIOS是连接软件和硬件的固件,需要硬件和软件两方面的创新,所以英特尔就开始投资做BIOS。英特尔拥有平台软件、开发工具、架构标准和开发者资源,这些都成为创新的重要支撑力。
软件创新推进
计算产业链
无论是虚拟化、并行计算还是高性能计算,都为软件发展提出了巨大的挑战,但也带来了无限的机遇。“高性能计算在个人应用上还有非常大的空间,因为一些基本的个人需求,如医疗、理财、教育等并没有得到满足。”王文汉说。
可以说,高性能计算已不是人们印象中高高在上的专业化应用,不仅气象、石油、化学、生物医药等行业会用到它,在未来,个人应用也会纳入高性能计算的范畴。目前,中国国家网格计划已经在全国拥有8个节点、两个中心、408个用户和360个应用,中国网格计划让加入计划的高校共享了高性能计算资源。最近几年,Google、雅虎等互联网企业又将云计算的概念推到了公众面前,那么,云计算和网格计算之间到底是什么关系呢?
计算机视觉的应用方向范文篇4
关键词:盲校;计算机教学;策略
因为盲生存在着视力障碍,无法通过视觉来获取外界信息,所以,在传统的盲校教育教学过程中,老师通常错误地认为没有必要对盲生进行计算机教学。再加上动画、图像及板书等传统的教学方式也非常有限。传统的盲校教育教学主要是通过单纯的教具触摸以及老师简单的语言描述来进行的,导致盲生无法客观、全面地理解问题与外界事物,严重影响了盲生的智力开发。而计算机却可以使这一问题得到有效的解决,因此,在盲校中开展计算机教学具有极其重要的现实意义。
一、在盲校开展计算机教学的重要意义
盲人属于社会中一个弱势群体,据相关研究显示,人主要是通过视觉系统来获知外界信息的,但是由于盲人存在着视力障碍,严重阻碍了其对外部事物的认知。在盲校中开展计算机教学,可以使盲生运用现代化技术的能力得到充分的培育,为其提供一个认知外界事物的有效渠道,借助计算机技术,可以让其更好地、全面地认识到外部世界[1]。盲生在掌握了计算机技术后,可以让其自身的生活变得更加多样化,让他们的世界变得更加生机盎然,这样也可以帮助培养盲生健康、积极向上的生活心态,使盲生的生活质量得到全面的提升。应当将盲校计算机教学当作盲校教学中的一个主要内容来对待,同时,盲校计算机教学应当注重对盲生职业技能的培育,以使盲生在职业场合中能够更好地借助计算机技术来提升自身的职业水准,更好地服务于社会,从而使自身的人生价值得到更好的体现。盲校计算机教学是构成我国教育体系的主要内容之一,在盲校中开展科学规范的计算机教学是我国以人为本的科学发展观的重要表现,这也可以有效的促进盲生以及社会的健康发展。因此,在盲校中开展计算机教学具有至关重要的意义[2]。
二、在盲校开展计算机教学的相关策略
(一)调动盲生学习计算机的兴趣
兴趣可以有效的激发学习的动力,在开展计算机教学的过程中,老师应当积极调动盲生学习计算机的兴趣。因为盲生在视力上有残疾,严重阻碍了其对外界信息的获知,也极大地限制了其对外界事物的想象能力、思维能力以及感知能力等的发挥。传统的电视机、收音机等传播媒介已无法迎合盲生不断增长的信息要求。大部分盲生对于计算机的学习都是非常感兴趣的,只是还需要老师进一步的引导与激发。老师应当充分发挥盲生记忆力强,且比正常人的嗅觉、触觉及听觉都要灵敏的优势,来调动他们学习计算机的兴趣。
计算机理论知识一般都比较抽象,要想让盲生更好地理解那些知识,并对计算机学习产生兴趣,则应当遵从“感知――表象――概念”这一认知发展规律[3]。唯有感知充分,方能产生相应的表象,且感知越深刻,表象才会越精准,才能让盲生更好地掌握那些知识。例如,在学习某些软件操作的过程中,因为盲生视觉系统受损,无法与正常人一样利用鼠标进行操作,只能借助键盘输入指令,而那些指令不仅极易混淆,而且难以记忆,此时,老师应当利用盲生记忆力强且触觉敏感的特点,把各个功能分区的形状具象化,以此来帮助盲生分辨与记忆。通过实践体验教学,让盲生体会到学习计算机的乐趣,从而达到激发盲生学习兴趣的目的。
(二)创新计算机教学方式
首先,老师应当构建全新的师生关系。在盲校教学过程中,老师不仅发挥着指导、促进以及鼓励盲生学习的作用,同时还是盲生学习中必不可少的合作者与协调者。在开展教学的过程中,老师应当充分体现盲生的主体地位,同时对盲生的人格尊严予以充分的尊重,让他们在能够在生动、和谐、民主的学习环境下进行创造性学习;其次,老师还应当鼓励盲生互相协作,让他们在互动中进行创造性学习。在教学过程中,老师可以引导盲生组成小组进行讨论与学习,以实现课堂交流方式从师生单向交流到生生之间多向交流的转变。让盲生在相互协作操作、相互感染情感、相互激荡智力、相互检查评价,给予每个盲生充分展现自我的机会,以此来增强盲生的思维能力及语言表达能力,进而达到提高盲校计算机教学效果的目的。
(三)根据盲生的实际情况,编制科学合理的教学预案
计算机是一门融实践和理论于一体的学科,而盲生不同于正常人,他们存在着视力障碍,因此,在开展盲校计算机教学的过程中,老师应当根据盲生的实际情况,编制科学合理的教学预案,以此来提高盲校计算机教学的效果。如何区分键位、使用快捷键,这是盲生学习计算机的关键所在,因此,在开展计算机教学时的过程中,老师也应当将之作为教学重点。
在开展计算机基础理论教学的过程中,老师应当指导盲生认识并区分键盘格局,唯有掌握好键盘格局,方能更好地应用计算机。在盲校计算机实践教学过程中,老师首先应当对计算机键盘的分布以及每个功能分区的布局进行详细的讲述,通过具象化的语言,手把手操作帮助盲生认识、区分键盘格局。通过反复的练习与纠正来帮助盲生掌握键盘分布。在盲生熟练掌握键盘格局后,老师再重点教盲生如何应用快捷键与组合快捷键,譬如ctrl+V、ctrl+C、ctrl+A以及ctrl+X等常用组合键。在练习使用键盘时,老师应当重点引导盲生某些实用性的操作训练,例如,让每个盲生编写一份个人简介,这就是训练使用键盘的一个过程,再或者让盲生到网络上查寻某种信息,编写一个小说明,这就是训练使用快捷键的一个过程。这样便可以有效地提高盲生使用计算机的能力,从而达到提升盲校计算机教学效果的目的。
三、结语
总而言之,盲校计算机教学是我国教育体系的一个重要内容,同时也是盲校教育教学中必不可少的一个部分。在开展盲校计算机教学的过程中,老师首先应当调动盲生学习计算机的兴趣,其次,还应当对计算机教学方式进行创新,最后,还当根据盲生的实际情况,编制科学合理的教学预案,这样方能有效的提高盲校计算机教学的效果,从而促进盲校的可持续发展。
【参考文献】
[1]吴晓晖.计算机教学中互助模式研究[J].科技致富向导,2013(18).
计算机视觉的应用方向范文篇5
关键词:计算机视觉;定标方法;应用特点
中图分类号:TP319文献标识码:A文章编号:16727800(2012)007014902
作者简介:许志雄(1968-),男,浙江绍兴人,江汉石油钻头股份有限公司工程师,研究方向为计算机多媒体。
0引言
计算机技术的应用在诸多领域占据了主要位置,并得到了人们的极大重视。在此形势下,摄像机的高清晰度亦成为了人们追逐的目标,而在计算机视觉中的定标方法有各种不同的处理方式,从而为摄像机的发展提供了一个绝好的机会。由此,计算机视觉中的摄像机定标方法成为当今世界摄像机研究领域里至关重要的一个方面,以摄像机得到的图像信息作为出发点来计算三维空间中自然场景的几何信息成为计算机视觉的基本任务之一,并且它的应用特点也得到了人们的密切关注。
1摄像机视觉投影原理
透镜成像的原理利用了光的折射现象,而摄像机的视觉投影原理和透镜的成像原理相差无几,只不过在一些细节上进行了相应的改变,使成像更加清晰,以更好地满足人们的需求。摄像机视觉投影原理就是利用镜头的光学原理进行视觉成像,而其中又有许多理论支持,包含镜头与焦距和视角。焦距是指镜头的焦点之间的距离,对于摄像机而言,就是指从镜头的中心位置到摄像管,也可以说是成像的位置之间的距离就是摄像机镜头的焦距,只有调整好了这两者之间的距离,才能保证摄像机的摄像效果,这也是保证摄像机正常工作的首要任务。视角要受到镜头焦距的限制,由镜头焦距对摄像的大小情况而决定,摄影师们就是通过对焦距的不断变换来改变对任务的造型,从而改变人们的视觉效果。对于拍摄相同距离的目标而言,镜头焦距越大,摄像的水平视角就会变得越窄,这样带来的后果就是拍摄到的目标的范围就越小,使得拍摄效果大打折扣,从而给摄像机带来不利的使用效益。因此,必须在两者达到一个较好的组合效果之时,才能够充分发挥摄像机的作用,并将摄像艺术发挥到极致。由此可见,计算机视觉中的摄像机定标方法将会给摄像机的拍摄效果带来巨大的转变。
2计算机视觉中的摄像机定标方法
2.1三维定标法
在人们的平常思维中,凡是物体的影像必定是三维的,本文的理论研究也同样基于这样的想法。在讨论单幅图像的设计标定之时,我们所追求的理论基础就是需要摄像机的定标物是人们所追求的那种三维的效果,在此基础上再进行相关的理论研究,以达到相得益彰的效果。在此过程中,首先要准确定位定标物上一些比较重要的点的三维坐标,这样才能够为后来的工作提供方便;然后在与定标物相对应的成像上找到相应的点的位置,这是至关重要的一步,这也决定了后面成像的具体设计方法;最后在那些比较重要的点的图像上标出其具体的三维坐标,达到定标物的实际成像效果图,这样就可以完全解决摄像机的成像问题了。这种定标方法的基本原理就是充分分析定标物的三维信息,同时与它的具体成像位置相关联,在这两者之间形成一种具体的相对应关系。由此我们可以充分利用计算机的快速运算,实现摄像的功能,并适时进行程序功能改进,优化定标物参数的获取方法,从而达到增加摄像机清晰度的目标。
2.2平面定标法
与上面的定标方法相对立的一种方法就是多幅图像的设计标定。在这样的时代背景下,人们的要求应尽可能得到满足,因而理论研究者会在这个方面下足功夫,弄懂这里面的个中玄机,利用多幅图像对平面的定标物来进行物体的标定工作,以达到摄像机定标的目的。这样的平面定标方法就是充分利用平面物体的运动特性,在它和摄像机之间找到一个平衡点,观察两者的相对运动,这样的定标方法也给拍摄运动中的物体带来了生机。此方法在实施之余也会带给人们不一样的感受,让人们充分体会到摄像的魅力。当然这种考虑运动的平面定标法会受到特征点的增多的影响,随着点的不断增加,定标情况就会越来越好,定标物的精度也会不断提高,于是在定标物相同的前提下,平面定标法自然就可以从定标物上获得更多的数据信息,为准确对定标物进行定位测量提供了更多的依据。因此,这种方法的效果要比前面的方法好很多,得到推广的力度也会大大增加,所得到的经济效益也会增加,设备的成本在原来的基础上还有降低的趋势。所以,理论研究者的研究领域就会逐渐向这一方面进行转变。
2.3两步定标法
有了前面的研究成果作支撑,摄像机定标方法的进一步研究就会显得异常容易,人们的进一步要求也会得到满足,可谓一举两得。理论研究者们在有了丰富的理论和实践基础之后,利用直接线性的定标方法进行摄像机参数的进一步优化提高,通过透视原理来修改以前的参数,然后将修正的参数进行初始值的确认,把它们作为现在研究阶段的起点,在这样的起点之上综合考虑各种外界因素,利用最优化的计算机算法进行摄像机成像程序的改进,把原来的程序进行升级处理,使得定标物的精确度得到进一步的提高,这就是我们所提到的两步定标法。它的基本原理其实很简单,只不过是充分利用了原有的理论,并进行了一定的创新而已。但就是这样的创新步伐的迈出,给计算机视觉中的摄像机定标方法带来了新的生机,也给摄像机镜头的优化带来了很多指导方法。在图像中心到图像点的距离保持不变的前提下,参数的数量会显著减少,这样不仅节省了材料的用量,而且还进一步提高了摄像机的摄像清晰度,有效弥补了以前清晰度不高的缺点。这样一来,摄像机的成像效果大大改进,于是才有了现代摄像机的高清效果,确实让人们享受到了科技带来的福音。
3计算机视觉中的摄像机定标方法的应用特点
3.1建立于主动视觉上的自我标定
由于计算机视觉中摄像机定标方法的不断推广,一些计算机技术在摄像机的制作过程中得到了较好的应用。但是在这之中必不可少地存在一些制作人员或设计人员的主观因素,这样摄像机的标定方法中就会形成形色各异的特点,而且彼此之间可能会出现较大的不同,特别是在主动视觉上的自我标定。在主动视觉中,我们所用到的摄像机可以在一个被控制的平台上被人们固定,利用计算机的高运算能力,计算机可以把平台上所出现的参数精确地读出来,我们只需要利用控制摄像机的运转顺序,让摄像机作一定的周期运动,就可以在这个过程中得到更多的图像,然后再利用所成的图像和固定的摄像机的运动参数来确定摄像机的运动情况。这种自我标定方法比较简单,但是必须为人们提供精确控制摄像机运动的平台,这种以主观意识为主的标定特点强化了个人的主观能动性,让人们更加易于接受。
3.2进行有层次划分的逐步标定
近年来,人们对摄像技术的理论研究已经日趋成熟,并根据自己的意愿进行相关的研究工作,把自己的想法融入到摄像机的设计中,真正做到有层次的逐步标定,把所要的标定物以逐个击破的方式实现有层次的程序算法,从而让人们在逻辑上能够有所认识,并且易于接受,从而达到有层次划分的逐步标定的目的。分层逐步标定法已为标定研究领域中普遍认同的方法之一,在实际的应用中逐渐取代了直接标定的方法。因为进行有层次划分的逐步标定是符合人们的想法的,而且这种方法的特点是以射影标定作为基础,以某一幅图像作为基准图像,进行其它图像的射影对齐工作,从而将摄相机中成像未知参数的数量减少,更易于为人们所接受。可以说,进行有层次划分的逐步标定是人们在实践中得出的一套符合大势所趋的标定方法,为世人所推崇。
4结语
综上所述,计算机视觉中摄像机定标方法在人们的不断认识中得以应用和推广,在时代的不断进步中逐渐向前发展。同时,摄像机标定方法的应用特点也大相径庭,各有千秋,从而实现百家争鸣的态势,进一步推动计算机视觉中的摄像机研究工作的向前发展。
参考文献:
计算机视觉的应用方向范文
(广东农工商职业技术学院,广州510663)
(GuangdongAIBPolytechnicCollege,Guangzhou510663,China)
摘要:本文就计算机视觉的理论框架进行阐述,对计算机视觉理论框架存在的问题进行分析,提出计算机视觉理论框架的新发展,以确保通过计算机视觉获得的景物信息更加完整。
Abstract:Thispaperexpoundsthetheoryframeworkofcomputervision,analyzestheproblemsoftheoryframeworkofcomputervision,andputsforwardnewdevelopmentofthetheoryframeworkofcomputervisiontoensurethatthesceneinformationobtainedthroughcomputervisionismorecomplete.
关键词:计算机视觉;理论框架;问题;新发展
Keywords:computervision;theoryframework;problems;newdevelopment
中图分类号:TP391.4文献标识码:A
文章编号:1006-4311(2015)02-0209-02
0引言
在计算机系统中,计算机视觉是通过模拟人类视觉,从而对不同事物进行相关描述,以获得更全面的信息。随着计算机视觉在文字识别、漫步机器人和导航中的成功应用,计算机视觉的理论框架研究显得越来越重要,对于促进我国计算机应用技术水平不断提升具有重要意义。
1计算机视觉的理论框架
随着计算机视觉的不断研究和总结,从二维景物图像发展到三维景物图像,计算机视觉的理论框架主要有如下三个:
1.1计算视觉理论框架在七十年代中期,有关研究人员提出了第一个计算机视觉理论框架,即计算视觉理论,将视觉过程看作是信息处理过程,并将信息处理过程分为三个不同的层次,它们分别是计算理论层次、数据结构层次和硬件实现层次,从而对计算机视觉进行全面分析。根据相关数据和资料显示,视觉是对图像的位置、形状和特征等进行描述,因此,计算理论层成为了研究的重点,进而将视觉过程看作是从二维图像信息中对图像进行重塑,从而将三维物体的形状、位置和空间等反映出来,最终形成三维图像。由此可见,早期的视觉处理是从输入的二维图像中获得二维要素图,即图像中强度变化较强时的位置和几何分布情况、结构等;中期的视觉处理是从二维要素图中获得二点五维图,即以观察者为中心,对表面的法向、深度和不连续的轮廓等进行观测。虽然二点五维包含的深度信息比二维要多,但还不是真正意义上的三维表示,而仅仅是有多个相对独立的视觉模块组成的,在相关研究中被称作是“shapefromX”模型,将运动视觉、立体视觉等融入到其中;后期视觉处理是指从二点五维图中获取物体的三维描述,从而将场景中的物体识别处理,确定物体的确切位置和姿态。
1.2基于知识的视觉理论框架在计算机视觉理论中,基于知识的视觉理论框架,是围绕感知特征群集来进行相关研究的,从而通过人类感知的经验来描述目标,最终确定物体在场景中的真正位置、形态等。相关研究人员认为,基于知识的视觉理论可以通过知识的引导来直接完成三维重建,以将相对应观察方向保持不变动二维特征称作是非偶然性聚类,而人体中视觉识别发挥重要作用的一种感知组织,通过对非偶然性聚类的检测,可以有效辨别出目标。因此,首先是利用感知组织来提取图像中相对于观察方向大范围变化,并且保持不变的分组和结构等;然后,利用概率排队的方法来进行模型匹配,从而缩小检测空间;最后,通过对观察点的未知求解和寻找模型参数对应关系,使三维模型的投影和图像得到最合适的匹配,最终完成三维重建。
1.3主动视觉理论框架第三种计算机视觉理论框架是中东视觉理论矿坑,是根据人类视觉的主动性特征提出的。由于人类视觉会根据自己的意识选择视野范围内所看见的事物的主次,从而移动身体、转向或者改变视角,因此,人们的视觉过程是与所在环境交互感知和动作的过程。在计算机视觉理论框架的主动视觉框架中,视觉行为不需要三维物体的相关精确信息,就可以完成物体重建。主动视觉系统根据所需的物体对象特征、分析结果和当前要求等,通过控制摄像机的相关操作,如取向、位置、焦距等,就可以完成相关处理任务和信息交换。与此同时,主动视觉还可以用改变摄像机的参数和处理摄像后的数据等,使图像的时间、空间和分辨率等发生变化,从而增强图像的感知效果。
2计算机视觉理论框架存在的问题
现展中,计算机视觉理论框架的提出,是计算机视觉领域研究的重要突破,而在这个发展过程中,存在着如下一些问题,影响计算机视觉理论框架的更完善构建。由于视觉过程是成像过程的逆过程,存在着混合、投影、噪音和畸变等干扰因素,使图像三维重建存在不稳定性和不确定性,因此,从一幅景象到多幅景象的重建存在很多困难,使三维图像的准确性和通用性大大降低。并且,计算视觉理论认为输入是被动的,整个视觉过程自下而上不存在反馈,处理目的没有发生任何改变,因此,对物体的确切位置和形状有一定要求。另外,有关学者提出计算机视觉理论框架没有充分运用知识,对知识表达没有给以高度重视,从而忽略知识推理和知识库的构建,没有对空间约束和场景假设进行充分考虑,从而使场景假设受到局限。并且,没有进行多次的分析和试验,致使计算机视觉理论框架构建存在很多问题。
基于知识的理论框架忽略了计算视觉理论的重要性,认为人类视觉和重建无关,然而,在进行物体尺寸判断、物体距离估算等情况时,光靠识别是不够的,必须要依靠三维重建,才能将物体的确切位置、形状等准确地描述出来。
主动视觉理论没有排除三维重建,通过改变摄像机的参数和角度等,来改变物体空间、时间和分辨率的感知效果,从而对图像出来过程进行相关约束,使很多不稳定和不合适的问题得到有效解决,最终完成三维重建。运用主动视觉理论框架,可以大大降低问题的难度,但主动视觉理论框架仍存在缺乏高层知识指导的问题,导致主动视觉框架还不够完整,使计算机视觉理论框架构建受到一定影响。
3计算机视觉理论框架构建的新发展
在计算机视觉理论框架的构建过程中,计算视觉理论比较系统地解释了从二维图中获取三维物体形态的方法和可能性,而基于知识的实际理论和主动视觉理论则对计算视觉理论进行了补充和进一步提升。因此,计算机视觉理论框架的新发展,可以以计算视觉理论为主,将基于知识的视觉理论和主动视觉理论结合到一起,从而使计算机视觉系统框架变得更加完善。
在实际应用过程中,将早期视觉处理分为图像分割、图像预处理和二维模式识别等,以对二维图像进行滤波降噪和图像增强等,因此,不需要知识引导和控制视觉目的。在图像分割、二维图像模式识别、中期处理、后期处理和三维模式识别的过程中,没有知识引导和模型匹配,最终得出的图像效果会更好、更完整。在早期视觉处理和后期视觉处理中,二维模式和三维模式的识别,需要根据物体的实际情况来确定,由于特征、模型等各不一样,所以,二维物体和三维物体的描述方式也各不相同。由于二维信息的质量会影响三维信息的效果,因此,在计算机视觉中,二维信息应当给以高度重视。而模型库和视觉目的的应用,为计算机视觉理论框架构建提供了更多的信息。由此可见,在计算机视觉系统中,通过视觉目的来进行物体形象、位置等的输出判断,同时,运用视觉目的可以对图像分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别等进行有效控制,最终使三维重建的图像信息更加完整。
4结束语
随着高科技信息技术的不断推广,计算机视觉理论框架的研究已经成为目前重点关注对象之一,虽然取得了一定的成绩,但计算机视觉理论框架构建还不够完善。因此,计算机视觉理论框架未来的发展,需要对计算实际理论、基于知识的视觉理论和主动视觉理论进行更深层次的研究,将理论和实践应用紧密结合在一起,从而使计算机视觉理论框架研究的成果可以更加辉煌。
参考文献:
[1]尹宏鹏.基于计算机视觉的运动目标跟踪算法研究[D].重庆大学,2009.
计算机视觉的应用方向范文篇7
数字媒体不仅改变了现代人们的生活方式,也使视觉传达从根本上转变了设计思想。视觉传达受到数字媒体传播改变了人们的视觉心理与阅读方式带来的影响,设计和创作的方式发生了巨大的变革。与此同时,视觉传达也因为数字媒体的飞速进步而有了无限的可能,不断地向更加人性化与高互动的方向发展。
关键词:
数字媒体;视觉传达;设计
视觉传达的应用无处不在,大到路边的高楼大厦,小到一个生活用品,都跟视觉传达设计有关。虽然视觉传达设计理念是以人为本,从人们的喜好习惯出发,但是人们也会受到视觉传达出来的信息所影响,改变一些想法或者视觉心理。数字媒体化时代的到来无疑也加速了这种互相影响,其交互式的性质让视觉传达产品渗透入每个人的生活。基于数字媒体语境,视觉传达设计理念现在不仅发生了巨大的变革,在未来,其传播方式也会跟随数字媒体的发展而创新。下文将着重于数字媒体对视觉传达的影响进行讨论。
一、视觉传达设计概述
视觉传达其实就是把设计师想要表达的信息通过视觉符号展示给观众,比如说电影、造型、建筑物或者纹章。这种社会活动由来已久,古时候就有部落图腾来表示团队精神之说,骑士这就是视觉传达的应用。传统视觉传达的媒介一般为纸张或者物质的媒体,例如报纸或者各式各样的社会商品本身。他们的传播范围不大,视觉传达的力度也很小,而且也只是单方面进行视觉的影响。在数字技术尤其是计算机技术的发展后,视觉传达有了新的媒介,那就是数字多媒体。它使得视觉传达有了新的特性,不仅把原来的引导特性、人性化特征发扬光大,还具有了互动性和时效性。还让视觉传达的应用更加广泛,不仅在广告、平面媒体中使用,还涉及到教育以及计算机游戏中。在数字媒体的影响下,视觉传达的引导性更加强大。设计师为了表达出一个事物的特征,可以尽可能多展示与这个事物有关的信息,而观众在接受这个消息传播时会自动无意识的寻找这些信息之间的各种联系。在利用了观众的习惯时更为明显,比如在宣传一款香水时,可能不会突出香水本身怎么样,而是表现出一位常使用香水的丽人的生活细节,让有对这种生活向往的观众对这款香水有了购买的欲望。若视觉传达引发了观众的生活习惯且超出了原计划的活动,那么说明这个视觉传达的引导性是成功的。互动性是视觉传达方面因数字媒体的存在而特有的产物,它让设计与媒体的关系更加复杂。传统的视觉传达是单向的,但数字媒体时代,观众不仅可以自主选择所要接受的信息,也可以成为这个信息的传递者并与其他观众进行互动交流。其实这对设计师的要求也更高,不仅要表达出事物的特性,还要迎合观众的心理。如果一个事物的视觉传达设计不被观众接受,那么它就是不成功的。数字化生活带来了信息大爆炸时代,各种信息每天都充斥着人们的生活,每时每刻都有视觉传达的信息产生、接受、消化然后被丢弃。时效性高意味着信息有效性的降低,大部分的视觉传达设计只是昙花一现,就被新的信息覆盖了。
二、数字媒体语境概论
语境是语言学范围中的术语,指多类词交织在一起,实际概念非常复杂,简单的解释起来就是信息在传递过程中全程会受到具体语境的制约。数字媒体的出现与活跃让视觉传达的媒介增加,数字媒体语境下的视觉传达也逐渐取代了传统物质化媒介成为了最重要的社会传播信息的方式。它建立在计算机技术的蓬勃发展和互联网的迅速普及之上,既有着传统媒介的作用,还有自有的独特功能。数字媒体语境的存在是客观的,它本身也有很多特点:1.它让人民对要接受的视觉传达有了选择自。因为对传统管辖的冲击话语权被松绑,民利增强;2.信息爆炸。虽然计算机与互联网有着自己的监管制度,但是传播中的信息量巨大,传播速度与扩散速度也非常快,所以很容易被不法分子利用;3.真假并存。互联网并不是一个单纯的环境,信息的真实度很难确定,也会使用户非常迷茫。
三、数字媒体对视觉传达设计的影响
在数字媒体的影响下,视觉传达设计有了新的发展趋势:1.视觉传达脱离了传统的二维平面图文的制约,不仅可以以三维立体的形式展现,还可以在时间上进行延续,即在四维空间中传播。这样使表达更加深入,也让人们的印象更深刻;2.动态的视觉传达比静态的更加吸引人的眼球,而且使视觉空间的利用率有了大幅度的提高。研究表明,动态的视觉信息传播有效性要远远高于静态的信息;3.传统视觉传达着重于表达一个物质性的事物,但是数字媒体让非物质性信息的视觉传达设计所占比重越来越大。毕竟计算机也是虚拟工具,随着互联网的作用与地位越来越重要,信息设计也逐渐成为传播的主体;4.上文中也提到过,数字媒体改变了视觉传达的单向传播性,它使信息传播有了交互性;5.视觉传达的主要目的就是刺激人类的感官,使之产生相应的反应。数字媒体的出现使传统视觉传达不仅限于刺激人类的视觉,还可以超越视觉来刺激人类的更多感官。在信息传递越来越快的未来,单纯的视觉刺激恐怕就不能引起人们的注意了。数字媒体也让“设计师”成为了全民工作。计算机与互联网的亲民与软件的发展使所有人都可以进行信息包装然后传播,标新立异的视觉传达屡见不鲜。这也是互联网的信息真假难辨,视觉传达设计的层次参差不齐的主要原因。抄袭现象比比皆是,模仿的作品也让本来极好的创新作品失去了原来的价值。数字媒体高速的发展也要求设计师不断的学习与提高,这就难免会成为阻挡他们释放自己创作力的绊脚石。所以数字媒体语境既给视觉传达设计未来发展的带来了无限的可能,也给设计师带来了沉重的打击,它是一个“双刃剑”。
四、结束语
在计算机技术飞速发展的这些年,我们不得不感叹互联网的力量。视觉传达设计由原来的单一形式转变为现在的多元化综合性的专业,全都归功于数字媒体的成长。信息流动性的增加也带来了无限机遇,人们可以更快的吸收到自己想要的知识,也可以快速传播出自己的声音。当然,在未来视觉传达设计也许还会有更多的表现形式,数字媒体的未来之路还很漫长,与此同时也使视觉传达的发展与创新有了更多的可能。
参考文献
[1]张金.数字媒体影响下的视觉传达设计研究[D].燕山大学,2012.
[2]索理,李营伟.数字媒体影响下的视觉传达设计研究[J].艺术科技,(12):281.
[3]孙波.浅析数字技术在视觉传达设计中的应用[J].美术界,2013,(9):104-104.
计算机视觉的应用方向范文
【关键词】精密测量计算机视觉图像关键技术
在现代城市的建设中离不开测量的运用,对于测量而言需要精确的数值来表达建筑物、地形地貌等特征及高度。在以往的测量中无法精准的进行计算及在施工中无法精准的达到设计要求。本文就计算机视觉图像精密测量进行分析,并对其关键技术做以简析。
1概论
1.1什么是计算机视觉图像精密测量
计算机视觉精密测量从定义上来讲是一种新型的、非接触性测量。它是集计算机视觉技术、图像处理技术及测量技术于一体的高精度测量技术,且将光学测量的技术融入当中。这样让它具备了快速、精准、智能等方面的优势及特性。这种测量方法在现代测量中被广泛使用。
1.2计算机视觉图像精密测量的工作原理
计算机视觉图像精密测量的工作原理类似于测量仪器中的全站仪。它们具有相同的特点及特性,主要还是通过微电脑进行快速的计算处理得到使用者需要的测量数据。其原理简单分为以下几步:
(1)对被测量物体进行图像扫描,在对图像进行扫描时需注意外借环境及光线因素,特别注意光线对于仪器扫描的影响。
(2)形成比例的原始图,在对于物体进行扫描后得到与现实原状相同的图像,在个步骤与相机的拍照原理几乎相同。
(3)提取特征,通过微电子计算机对扫描形成的原始图进行特征的提取,在设置程序后,仪器会自动进行相应特征部分的关键提取。
(4)分类整理,对图像特征进行有效的分类整理,主要对于操作人员所需求的数据进行整理分类。
(5)形成数据文件,在完成以上四个步骤后微计算机会对于整理分类出的特征进行数据分析存储。对于计算机视觉图像精密测量的工作原理就进行以上分析。
1.3主要影响
从施工测量及测绘角度分析,对于计算机视觉图像精密测量的影响在于环境的影响。其主要分为地形影响和气候影响。地形影响对于计算机视觉图像精密测量是有限的,基本对于计算机视觉图像精密测量的影响不是很大,但还是存在一定的影响。主要体现在遮挡物对于扫描成像的影响,如果扫描成像质量较差,会直接影响到对于特征物的提取及数据的准确性。还存在气候影响,气候影响的因素主要在于大风及光线影响。大风对于扫描仪器的稳定性具有一定的考验,如有稍微抖动就会出现误差不能准确的进行精密测量。光线的影响在于光照的强度上,主要还是表现在基础的成像,成像结果会直接导致数据结果的准确性。
2计算机视觉图像精密测量下的关键技术
计算机视觉图像精密测量下的关键技术主要分为以下几种:
2.1自动进行数据存储
在对计算机视觉图像精密测量的原理分析,参照计算机视觉图像精密测量的工作原理,对设备的质量要求很高,计算机视觉图像精密测量仪器主要还是通过计算机来进行数据的计算处理,如果遇到计算机系统老旧或处理数据量较大,会导致计算机系统崩溃,导致计算结果无法进行正常的存储。为了避免这种情况的发生,需要对于测量成果技术进行有效的存储。将测量数据成果存储在固定、安全的存储媒介中,保证数据的安全性。如果遇到计算机系统崩溃等无法正常运行的情况时,应及时将数据进行备份存储,快速还原数据。在对于前期测量数据再次进行测量或多次测量,系统会对于这些数据进行统一对比,如果出现多次测量结果有所出入,系统会进行提示。这样就可以避免数据存在较大的误差。
2.2减小误差概率
在进行计算机视觉图像精密测量时往往会出现误差,而导致这些误差的原因主要存在于操作人员与机器系统故障,在进行操作前操作员应对于仪器进行系统性的检查,再次使用仪器中的自检系统,保证仪器的硬件与软件的正常运行,如果硬软件出现问题会导致测量精度的误差,从而影响工作的进度。人员操作也会导致误差,人员操作的误差在某些方面来说是不可避免的。这主要是对操作人员工作的熟练程度的一种考验,主要是对于仪器的架设及观测的方式。减少人员操作中的误差,就要做好人员的技术技能培训工作。让操作人员有过硬过强的操作技术,在这些基础上再建立完善的体制制度。利用多方面进行全面控制误差。
2.3方便便携
在科学技术发展的今天我们在生活当中运用到东西逐渐在形状、外观上发生巨大的变大。近年来,对于各种仪器设备的便携性提出了很高的要求,在计算机视觉图像精密测量中对设备的外形体积要求、系统要求更为重要,其主要在于人员方便携带可在大范围及野外进行测量,不受环境等特殊情况的限制。
3计算机视觉图像精密测量发展趋势
目前我国国民经济快速发展,我们对于精密测量的要求越来越来高,特别是近年我国科技技术的快速发展及需要,很多工程及工业方面已经超出我们所能测试的范围。在这样的前景下,我们对于计算机视觉图像精密测量的发展趋势进行一个预估,其主要发展趋势有以下几方面:
3.1测量精度
在我们日常生活中,我们常用的长度单位基本在毫米级别,但在现在生活中,毫米级别已经不能满足工业方面的要求,如航天航空方面。所以提高测量精度也是计算机视觉图像精密测量发展趋势的重要方向,主要在于提高测量精度,在向微米级及纳米级别发展,同时提高成像图像方面的分辨率,进而达到我们预测的目的。
3.2图像技术
计算机的普遍对于各行各业的发展都具有时代性的意义,在计算机视觉图像精密测量中运用图像技术也是非常重要的,在提高图像处理技术做以提高。同时工程方面遥感测量的技术也是对于精密测量的一种推广。
4结束语
在科技发展的现在,测量是生活中不可缺少的一部分,测量同时也影响着我们的衣食住行,在测量技术中加入计算机视觉图像技术是对测量技术的一种革新。在融入这种技术后,我相信在未来的工业及航天事业中计算机视觉图像技g能发挥出最大限度的作用,为改变人们的生活做出杰出的贡献。
参考文献
[1]汤剑.周芳芹.杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2015,14(18):33-36.
[2]马玉真.程殿彬.范文兵,计算机视觉检测技术的发展及应用研究[J].济南大学学报,2014,18(23):222-227.
[3]李华.基于计算机视觉图像精密测量的关键技术分析[J].电脑知识与技术,2013(05):1211-1212.
计算机视觉的应用方向范文篇9
关键词:物联网;RFID;视觉密码;安全协议
DOIDOI:10.11907/rjdk.151503
中图分类号:TP309.7
文献标识码:A文章编号:16727800(2015)006017303
基金项目基金项目:
作者简介作者简介:李春艳(1981-),女,云南蒙自人,硕士,红河学院工学院讲师,研究方向为数字水印、物联网安全。
0引言
射频识别技术(RadioFrequencyIdentification,RFID)是一种高效而实用的识别技术,它通过无线电波在读写器和标签之间传递信息,实现对物体的跟踪和识别。RFID系统主要由标签、读写器和后端数据库系统构成。标签可接收数据,也可将数据发送给读写器。读写器负责处理并捕捉标签的数据,并将数据传送给后端数据库系统。读写器在标签和后端系统中发挥中介作用。这种非接触性技术在带来便利的同时,也存在很多安全隐患,如物体的位置跟踪及标签信息泄露等。RFID安全保密问题日益备受关注,很多学者提出了安全认证协议,如基于密钥矩阵的RFID安全协议、Key值更新随机Hash锁对RFID安全隐私的加强、基于轻量级加密技术建立物联网感知层信息安全的解决方案等。这些算法在一定程度上可抵御攻击,有一定的安全性,但也存在同步问题及运算量大、对重放攻击不具有免疫性等缺陷。
视觉密码VCS(VisualCryptographyScheme)是一种新型的密码技术,具有解密简单、计算量小、满足无条件安全等优势。它由Naor和Shamir在1994年的欧洲密码学会议上提出[1]。其基本思想是将秘密图像编码到n个影子图像(分享图像)中,并将影子图像分别赋给n个参与者,解密时只需k(k≤n)个参与者将影子图像叠加起来,就可通过视觉辨认出秘密信息[1-3]。文献[4]提出了一个基于布尔操作的(2,n)门限视觉密码方案,加密时将秘密图像分享为n个分享图像,解密时取任意两个分享图像进行异或运算即可恢复秘密图像。文献[5]分析了物联网架构中感知层存在的安全漏洞,提出了视觉密码的身份认证方案。该方案虽采用了视觉密码运算简单的特点,但其在认证过程中只实现了单向认证,即对标签的认证,而没有实现对读写器的认证。另外,由于认证过程中认证信息始终不变,所以方案不能抵御位置跟踪、重放等攻击。文献[6]利用视觉密码实现了双向身份认证,然而在认证过程中以明文传送,算法很难抵御假冒攻击,一旦被俘获算法也不能保证前向性安全。鉴于现有认证协议的缺陷,本文利用视觉密码构造一种新的RFID认证协议,使用视觉密码实现标签与读写器间的认证,并在认证后更新标签中的影子图像,弥补现有认证协议运算量大、安全性差的不足。
1视觉密码
1.1基本原理
(k,n)的视觉密码方案将一幅秘密图像P加密成n幅影子图像,解密时只需将k(k≤n)个影子图像重叠起来就能恢复秘密信息。加密基本原理是对秘密图像P中的每个像素进行n次处理,P中每个像素在影子图像中对应m个黑白子像素(m称为像素扩展度),对P中所有像素都作此处理后就得到n幅影子图像。若为P中每个像素的加密构建一个n*m的布尔矩阵A=(Aij)n*m,则Aij=0表示对于秘密图像中某一个像素,它在第i个分享者的第j个子像素的颜色为白色;Aij=1表示它在第i个分享者的第j个子像素的颜色为黑色。矩阵A的第i行为秘密图像p中一个像素在影子图像中对应的子像素。对A中第j列的所有元素作或运算,其值W(v)称为该像素块的汉明重量。
解密时将k个影子图像重叠,计算每个像素块的汉明重量,当W(v)≥d时,图像中该像素点为黑色;W(v)
1.2二值图像的(2,2)视觉密码分解
以一幅黑白二值图像p分解为2幅影子图像为例来说明视觉密码方案的基本原理,分解时用公式(1)作加密矩阵(H0和H1分别表示秘密图像中白色像素和黑色像素的加密矩阵),像素扩展度m=2。具体步骤如下:(1)对于P中的每一个像素pxy进行扩展,扩展方法:若pxy为白色,则从集合H0中等概率挑出一个矩阵来对该像素加密;矩阵中的一行即为像素pxy在影子图像中对应的像素块。若pxy为黑色,则从集合H1中等概率挑出一个矩阵来对该像素进行加密。
(2)重复上述操作,直至P中所有像素都被加密为止。
解密步骤如下:
①选择参数d和a;叠加2个影子图像,计算叠加图像中每个像素块的汉明重量W(v);
②汉明重量W(v)≥d时,恢复图像中该像素点为黑色;W(v)
③重复上述过程即可得恢复图像。
2基于视觉密码的RFID认证协议
2.1预置信息
在基于视觉密码的RFID认证协议中,后台数据库为每个标签存储一条记录(ID、S1、Rr、Pointer),ID是标签的唯一标识符,Rr是系统生成的随机数,由Rr构造一幅黑白二值图像P;S1是对P作(2,2)视觉密码分解所得的影子图像。Pointer是数据记录关联指针,其作用是保证认证过程中的同步安全。标签中存储ID标识符和标签对应的另一个影子图像S2。读写器含有随机数发生器,并为每个标签存储一条记录(Hash(ID||R)、ID),Hash(ID||R)是标签ID与随机数的哈希值。后端系统和标签共用Hash()和Ard(),Hash()是哈希函数,Ard()为猫脸变换函数,用来对影子图像进行加密与恢复。
初始化时,为每个标签随机生成一幅二值图像P,使用视觉密码将P分解为影子图像S1和S2,将这些信息分别存入后台系统和标签中,如图1所示。
2.2协议认证过程
(1)读写器向标签发送认证请求Query和随机数R后,更新读写器中记录的Hash(ID||R)值。
(2)标签计算Hash(ID||R),对影子图像S2加密,将信息Hash(ID||R)和EN(S2)发送给读写器。
(3)读写器以Hash(ID||R)为索引搜索表中的记录,若找到则将记录中的ID和EN(S2)转发给后端系统;否则,会话结束。
(4)后台以ID为索引搜索数据库。若找到,取出记录中的S1与解密后的S2作视觉密码运算得到恢复图像P`,系统检测P`中的信息与Rr是否一致,一致则对标签通过认证。后端系统随机生成新的随机数Rrnew和对应的二值图像Pnew,对Pnew作视觉密码分解得到新的影子图像S1new、S2new,生成随机数R,并计算Hash(ID||R),将Hash(ID||R)、R和EN(S2new)发送给读写器。读写器收到后转发给标签。若P`中检测的信息与Rr的信息不一致,则会话结束。
(5)数据库检查当前记录j中的Pointer值,若Pointer=0,则再添加一条新的记录k:(ID、S1new、Rrnew、j),并将记录j中的Pointer值改为k。若Pointer!=0,则找到第Pointer所指的记录,将其内容修改为(ID、S1new、Rrnew、j)。
(6)标签收到Hash(ID||R)、R和EN(S2new)后,标签计算Hash(ID||R),并与收到的Hash(ID||R)进行比对,比对成功则读写器认证通过,标签对EN(S2new)解密后更新影子图像S2,否则会话结束。标签与读写器间的认证过程如图2所示。
3协议安全性分析
3.1双向身份验证分析
标签与读写器间的双向身份验证是设计安全协议时需考虑的首要问题,本文只有合法的标签才拥有正确的影子图像S2,S2与其对应的S1重叠后恢复的信息才与Rr的信息吻合;若标签是伪造的,则其恢复的信息与Rr的信息不一致。所以利用S2可实现读写器对标签身份的认证。协议中S2以密文的方式传送,所以即便传送的信息泄露,攻击者也无法得到S2的任何信息。此外,当后端系统通过对标签的认证时,协议会生成新的影子图像S2new、计算标签ID与随机数R的哈希值,并将Hash(ID||R)、R和EN(S2new)发送给标签,标签通过Hash(ID||R)的计算比较,实现标签对阅读器的认证。最后,在整个协议过程中,ID不在读写器和标签间传输,所以攻击者无法获得正确的ID,除非标签从物理上被攻破。认证时标签要发送Hash(ID)、EN(S2),仅持有正确的Hash(ID)是毫无用处的。总体来讲,协议能够安全可靠地实现读写器与标签间的双向认证。
3.2不可跟踪性分析
射频识别认证协议必须考虑的另一个问题是标签的位置跟踪。本协议含有反位置跟踪设计。每次认证获通过后,标签都会更新影子图像S2,且随机数R的值也在更新变化,所以标签对读写器的每次回答(Hash(ID||R)和EN(S2))是不同的,从而实现了标签的反跟踪。
3.3前向性和同步性安全分析
假设某标签被攻击者攻破并获得密钥,攻击者将得到正在使用的影子图像S2。但由于每次验证通过后,系统都会随机产生二值图像P来更新标签中的影子图像S2,这些影子图像间无任何关联,所以即使当前S2被窃取,也无法从现有的值推算出之前的S2,不可获得标签的历史活动记录。
协议对标签的认证获通过后,数据库为更新的S2new建立新记录,同时保留旧的S2对应的记录。若S2new更新不成功,标签仍能使用旧的S2实现与读写器的身份验证,这样就防止了S2更新时可能出现的异常情况。
3.4其它性能分析
标签中只存储标签ID和影子图像S2,一次认证过程需2次哈希运算和1次加密、解密运算,降低了标签的存储空间、运算复杂度。因此这在低成本的标签上较易实现。每次认证时后台数据库在2N(N为标签的个数)条记录中搜索,进行1次哈希运算,产生2个随机数,作一次视觉密码的加、解密运算,且视觉密码的加解密运算量较小,所以本方法延时短、速度快,效率高。
3.5与其它协议性能比较
表1为本协议与文献[5]、[6]协议的比较。表中VCS为视觉密码加密或解密,H表示哈希运算,R表示产生随机数操作的次数,EN为对称加密算法,DE为对称解密算法。
4结语
本协议通过对随机二值图像作视觉密码分解,把分解后的影子图像分别存储在标签和后台系统中,认证时对影子图像作视觉密码解密,然后用提取的恢复图像信息与Rr作比较,若信息一致,则标签的认证通过,否则会话结束。视觉密码的加密、解密过程简单,运算量小,标签端存储的数据少、运算量不大,复杂运算主要在运算能力和存储能力较强的后台数据库和读写器中进行。该算法具有成本低,延时短,安全性高等特点,在实现双向认证的基础上能有效抵御位置跟踪、窃听、非法读取等攻击。
参考文献:
[1]ANDREASKLEIN,MARKUSWESSLER.Extendedvisualcryptographyschemes[J].InformationandComputation,2007(205):716732.
[2]GIUSEPPEATENIESE,CARLOBLUNDO,ALFREDODESANTIS,etal.Stinson,visualcryptographyforgeneralaccessstructures[J].InformationandComputation,1996(2):86106.
[3]MNAOR,BPINKAS.Visualauthenticationandidentification[J].SpringerVerlagLNCS,1997(1294):322336.
[4]WANGDS,ZHANGL,MAN,etal.TwosecretsharingschemesbasedonBooleanoperations[J].PatternRecognition,2007(40):27762785.
[5]杜轶j,严承华,冯剑川.基于视觉密码的物联网身份认证技术研究[J].技术研究,2012(1):2628.
计算机视觉的应用方向范文1篇10
CG的由来
CG是英语ComputerGraphics的缩写,是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。
利用计算机技术进行视觉设计和生产。它既包括技术也包括艺术,几乎涵盖了利用计算机技术进行的所有的视觉艺术创作活动,如平面设计、网页设计、三维动画、影视特效、多媒体技术,以及计算机辅助设计的建筑设计等。现在CG的概念正在扩大,已经形成一个可观的经济产业,我们提到CG时,一般可以指以下四个主要领域:CG艺术与设计、游戏软件、动画、漫画。
CG动画指电脑制作动画,就是电脑原先就制作好了的动画,主机只需要播放就可以了。跟它相对应的是即时演算动画,是一段程序需要主机进行计算才能播放出的动画。一般来说,CG动画的画面要比即时演算的强上不少,占用的空间也比即时演算的要少。但是CG动画缺少变化性,无法即时更改动作。
在电影特技中的应用
计算机动画的一个重要应用就是制作电影特技可以说电影特技的发展和计算机动画的发展是相互促进的。1987年由著名的计算机动画专家塔尔曼夫妇领导的MIRA实验室制作了一部七分钟的计算机动画片《相会在蒙特利尔》再现了国际影星玛丽莲·梦露的风采。1988年,美国电影《谁陷害了兔子罗杰》(WhoFramedRogerRabbit?)中二维动画人物和真实演员的完美结合,令人瞠目结舌、叹为观止其中用了不少计算机动画处理。1991年美国电影《终结者II:世界末日》展现了奇妙的计算机技术。此外,还有《侏罗纪公园》(JurassicPark)、《狮子王》、《玩具总动员》(ToyStory)等。
行业趋势
计算机图形学狭义上是一种研究基于物理定律、经验方法以及认知原理,使用各种数学算法处理二维或三维图形数据,生成可视数据表现的科学。它是计算机科学的一个分支领域与应用方向,主要关注数字合成与操作视觉的图形内容。广义上来看,计算机图形学不仅包含了从三维图形建模、绘制到动画的过程,同时也包括了对二维矢量图形以及图像视频融合处理的研究。计算机图形学经过将近40年的发展,已进入了较为成熟的发展期。目前,其主要应用领域包括计算机辅助设计与加工,影视动漫,军事仿真,医学图像处理,气象、地质、财经和电磁等的科学可视化等。由于计算机图形学在这些领域的成功运用,特别是在迅猛发展的动漫产业中,带来了可观的经济效益。动漫产业是目前各国优先发展的绿色产业,具有高科技、高投入与高产出等特点。据统计,截至2009年3月,美国动画梦工厂所拍摄的三维动画片《怪物史莱克II》在预算为1.5亿美元的情况下,获得了超过9.2亿的全球累计票房。而我国在2008年度共制作完成的国产电视动画片249部,计131042分钟,与2007年度相比增加了近28%。另一方面,由于这些领域应用的推动,也给计算机图形学的发展提供了新的发展机遇与挑战。
图形渲染是整个图形学发展的核心。在计算机辅助设计,影视动漫以及各类可视化应用中都对图形渲染结果的高真实感提出了很高的要求。同时,由于显示设备的快速发展,人们要求能提供高清分辨率(1920x1080),进一步要能达到数字电影所能播放的4K分辨率(4096x2060);色彩的动态范围也希望从原来每个通道的8Bit提高到10bit及以上。虽然已有的图形学方法已经能较为真实地再现各类视觉效果,然而为了能提供高分辨率高动态的渲染效果,必须消耗非常可观的计算能力。一帧精美的高清分辨率图像,单机渲染往往需要耗费数小时至数十小时。为此,传统方法主要采用分布式系统,将渲染任务分配到集群渲染节点中。即使这样,也需要使用上千台计算机,耗费数月时间才能完成一部标准90分钟长度的影片渲染。
计算机图形学在追求真实感方向的研究发展已进入一个发展的平台期,基本上各种真实感特效在不计较计算代价的前提下均能较好得以重现。然而,人们创造和生成图片的终极目的不仅仅是展现真实的世界,更重要的是表达所需要传达的信息。例如,在一个所需要描绘的场景中每个对象和元素都有其相关需要传达的信息,可根据重要度不同可采用不同的绘制策略来进行分层渲染再加以融合,最终合成具有一定表意性的图像。为此,研究者已经开始研究如何与图像处理、人工智能、心理认知等领域相结合,探索合适表意性图形生成方法。而这一技术趋势的兴起,实际上延续了已有的非真实感绘制研究中的若干进展,必将在未来有更多的发展。
总结
CG技术随着计算机技术的发展,开始为影视视觉服务,从最早pixar开始运用电脑将手绘的二维动画往三维CG动画发展,影视动画就开始蓬勃发展,从1995年pixar公司的《玩具总动员》成功上映,到2011年《变形金刚3》《怪物史瑞克3》站上电影票房之巅。无不预示着电影动画的发展前景。而中国第一部全三维动画电影有环球数码制作的《魔比斯环》在2006年成功上映奠定了中国CG影视的第一步,到今中国CG不断发展,衍生出很多CG影视公司,拉动了整个产业的发展和就业。未来中国CG动画还将蓬勃发展。
(作者单位:辽宁科技大学)
作者简介:
计算机视觉的应用方向范文篇11
关键词:移动机器人;自动对接;定位
中图分类号:TP18文献标识码:A文章编号:1009-3044(2011)16-3901-03
PositioningTechnologyUsedinRobotAutomaticDockingSystem
HUANGShen-yu
(ElectronicandInformationEngineering,TongjiUniversity,Shanghai200092,China)
Abstract:Thispaperintroduceseverallocalizationtechniquesusedinrobotautomaticdockingsystem.Thearticlediscussesthetheoryandcharactersofthesetechniquesbyusingsomeexistedexamples.
Keywords:mobilerobot;automateddocking;positioning
在近几十年中,移动机器人技术不断发展,机器人在现代社会的生产生活中正扮演着越来越重要的作用。一方面,机器人的能力越来越强,能完成越来越多的复杂工作;另一方面,机器人自身的智能化越来越高,对人的依赖性越来越弱。但是为了满足这些要求,机器人就必须不断变化自身的形态,通过与各种设备,如基站,工具等,的对接和脱离,来完成各种操作,甚至不同的机器人之间也要进行对接形成新的机器人。在这一背景下,机器人的自动对接技术,就显得十分重要。在日常生活中,自动加油和自动充电等问题,都是机器人自动对接技术的应用。
机器人对接有两种,一种是内部对接,指机器人内部设备的对接松脱,涉及的位移调整基本以厘米为单位,一种是机器人外部对接,或者说是“机器人与机器人的对接”,涉及的范围一般是数米,本文讨论后者。
1机器人对接定位的基本思路和要求
机器人外部对接的基本思路是利用设备实现机器人与对接对象的相对定位,然后调整机器人的相对位置和角度,在相对较远处实现对齐,然后通过简单机械运动直接对接。这就要求使用的定位系统能够实现:
1)测距。系统必须知道机器人与对接目标的距离,用来进行下一步的行动的规划,同时距离也是计算角度的重要参数。
2)角度计算。系统必须能够知道对接部件的角度偏差才能在后续行动中通过移动对齐。为达到这一目的,系统要能够通过感应设备采集到的参数通过各种算法进行计算。
3)位置角度调整。系统要根据上述参数是机器人做出合适的机械运动。
4)即时测量,反复测量。在不同的环境下,机械系统的运动与估计值会产生误差,因此系统必须随时调整机械运动计划。
不同的环境下对对接精度,机器人工作范围的要求不同,在普通环境下机器人对接涉及的定位范围往往在数米左右,不是很大,精度要求在十毫米左右,所以至今为止,机器人一般只采用一套定位系统,少数设计位移范围特别大的机器人会采用2套系统。对接技术采用了超声导向,红外和视觉识别导向三种不同方式进行定位[1]。本文介绍这三种技术的发展现状,分析了它们的优缺点,以作为机器人设计者的参考。
普通的机器人定位方法误差往往比较大,其误差单位基本是分米,米,可以用于机器人导航,但是用于对接就相对不足,以哈尔滨工业大学的原新等人实验的定位系统为例。他们提出将推算定位算法与超声定位相结合,既可以使用推算定位算法数据作为超声波定位的判断函数,也可以进一步利用卡尔曼滤波器进行融合。采用后者比单纯使用传感器得到的精度有明显改进。但是一旦走到长程就会出现0.2m以上的较大误差,不适用于对接中的定位。[2]
2基于超声导向的机器人对接定位
超声定位技术相对来讲是一种早期技术,但是因为其应用范围比较广泛,至今仍有许多场合采用这一技术。
2.1超声定位原理
超声检测信号分析系统的原理是通过超声检测仪和信号采样装置及计算机的相互协调,实现超声检测电信号的模数转换,并完成检测数据的存储,计算机根据己量化的回波信号数据,利用有关理论及技术作相应处理。超声检测是一种物理手段,利用超声波的性质来判断目标的距离。是根据超声波在检测区域内运动时遇到界面反射所呈现的特征来判断物置状况的无损检测方法。
以平面定位为例,假设在平面上设定2个参考点A(x1,y1),B(x2,y2),通过超声探测器探得探测器(x,y)到A,B的距离为M,N。则有:
已知M,N,(x1,y1),(x2,y2),通过解方程可得(x,y)。在空间中,则再增加一个坐标点C,求解3元2次方程组。当然,这样可以得到至少2个结果,因此一般要通过引入更多测量点来辅助计算。
下面说明目标点与参考点距离的计算方法。超声波的速度为常量。通过定时发出脉冲信号,并计算接收到脉冲的时间,l=v*t,可以得到距离M,N。超声波在空气中的传播速度为340m/s,但其传播速度随介质温度的上升而加快。气温增高1℃,速度加快0.6m/s。但是一般环境下都会存在干扰,同时要考虑脉冲先后顺序的识别,因此对滤波,编码等算法的要求较高。
2.2实例
通过改良传统方法,超声定位可用于精度要求较高的机器人自重对接。以自重构机器人为例,北京航空航天大学宗光华已经采用传统超声定位技术进行了机器人对接。[3]雄峰等人提出的模型中,超声技术有了新的算法。他们提出,为控制系统得到的测量时间(Tm),是一个发射头与接收头之间距离和夹角的函数,Tm=f(t,r,d),其中,t与r分别是发射头和接收头各自的夹角,d是发射头与接收头之间的距离。此方法需要多次反复测量,因而耗时较长(3-4min)[4]
2.3特点
超声探测的特点在于可测距离范围较大,但是精度较小
3红外测距
红外线传感器是一种已经成熟的对接定位技术,红外线传感器具有光束发散小的优点,相对于超声波传感器,其测量精度有了很大的提高。
3.1红外定位原理
红外传感定位原理与超声定位原理基本相同。一般速度参数直接使用光速3*108m/s,不考虑温度因素。
3.2实例
早在1997年,MiraV.等人就采用主动红外感应技术实现了的对接,其精度为+/-0.5cm和0.1°。在该系统中,设计者采用了2对红外发射/感应装置。每次每个传感器都会读入两个信号。然后利用三角定位的方法进行定位。多余的信息用来估算机器人与基站之间的距离。传感器需要反复多次取值直到三角定位的结果与估计值相符。[5]
2006年,日本筑波大学竹内荣次郎和隆坪内在他们新设计的机器人系统中也采用了类似的技术。他们使用led作为光源,通过巧妙排列反射板来提高精度。他们实现的精度为x向+/-10mm,y向+/-25mm,+/-4°角。[6]
自重构机器人也大量使用红外线进行对接定位。北京航空航天大学在新型自组装模块化群体机器人Sambot利用该技术实现了自重构对接。其对接方式为一个机器人静止,另一个机器人移动对齐。机器人上采用短距红外发射和感应器,通讯距离为0-300mm。这样,通过检测红外感应器是否都能接受到信号来判断是否对齐。该系统可以实现多个Sambot从前、后、左、右4个方向同时进行对按,且允许一定的对接偏差。但是该系统的机器人移动范围较小,机器人距离超过600mm就不能相互找到,同时存在红外信号相互干扰的问题。[7]
新技术的发展带来新的定位技术。同济自动控制实验室的自动化机器人设计组采用URG-04LX激光探测系统进行系统定位。该探测系统可以探测探测器前方240°,半径为4m的范围。通过每0.36°取得一个探测距离来绘制地形图。经过对采到的极坐标数据进行换算,可以得到精度为25mm的地形图。然后通过识别特征地形,如直角,特定形状距离等,实现了系统的精确对齐。实验中,半米宽的机器人可以准确进入相同宽度的空隙位置。
3.3特点
红外测距对接技术的特点在于使用的设备相对便宜,精度虽然低于基于视觉的对接技术,但是在可接受范围之内。缺点在于:1)设备的灵敏度必须达到要求,同时不能有过多的干扰。2)距离较小,红外探测的范围基本不能超过70cm。
超声导向和红外导向都可以归类为传感器导向。总体而言,使用传感器进行对接定位基本能满足精度需求,成本也比较低廉,设计也相对简单,技术也已经很成熟。缺点在于耗时较长,系统功能性单一,需求外界设备支持因此不能随时变化环境。
4基于视觉识别导向的机器人对接定位
机器视觉是图像技术,模式识别技术和计算机技术发展的产物,它侧重于视觉理论,以图像分析和图像理解为核心。当需要识别颜色或物体为平面时,声纳和激光传感器没有波的反射,无法对这类特征点进行识别和确认。而视觉传感器的优点在于测量范围大,视觉采集的信息量大,价格低廉,可识别目标特征。因此视觉传感器在机器人中具有更广泛的研究领域和应用价值。基于视觉识别导向的机器人对接定位技术几乎是与红外定位技术同时起步的,但是在最近几年才逐步流行起来。复杂的图形算法要求和抗干扰问题曾经很大程度上阻碍了该技术的应用。Murphy等人在2000年实现了一个基于视觉的机器人对接,通过在不同的灯光环境下测量,最后得到的精度为+/-2cm和5°[8]。
4.1原理
机器视觉的关键技术是:
1)图像的获取:将被测物体的图像转化成计算机数据
2)图像处理:视觉信息的处理技术主要依赖于图像处理方法,它包括图像增强、数据编码和传输、平滑、边缘锐化、分割和特征抽取等内容[8]。
3)图像识别:图像的识别过程实际上可以看作是一个标记过程,即利用识别算法来辨别景物中已分割好的各个物体,给这些物体赋予特定的标记,它是机器视觉系统必须完成的一个任务[9]。
其系统结构如图2。
4.2实例
通过图像识别采用投影算法测距是应用图像识别进行定位对接的一种基本思路,其根本还是脱胎于传感器识别技术。台湾中正大学的Luo,R.C等人于设计的自动对接充电机器人就采用了这种方法。其基本思想是通过图像识别标识物,然后通过投影计算距离,角度,然后不断调整直到对齐。摄像头和参考点等高,摄像头首先对齐参考点然后开始调整,算法如下:[10]
其算法如下:
这种方法的特点是设计者不需要重新设计整个系统,只是将传感器基础的对接定位系统的几个模块用图像处理模块进行替代。缺点在于算法仍然比较复杂。
机器自重构中也开始使用视觉识别导向。Murata,S.等人利用摄像头识别成功构建了一个视觉自重构系统。在对接过程中,首先用摄像头寻找2个led灯,找到对接模块,然后利用3角定位确定相对位置,最后移动对接。基本上在3次之内机器人就能完成对接。但是该系统没有在不同的灯光环境下进行测试,其鲁棒性尚待验证。系统精度为+/-2mm和5°[11]。
利用图像识别系统信息处理量大的优点,机器人完全可以抛弃过去的进行与对接设备进行相对定位的思路,而采用构建地图进行绝对定位的方法。机器人利用其自身的传感器创建一个自己的局部地图,然后,将这个局部地图与保存在内存的全局地图进行比较.如果匹配,机器人就可以计算出自己在环境中的真实位置和方。
基于这一思路,有的设计者建议使用全景摄影机进行机器人定位。西安理工大学的刘丁等基于扩展卡尔曼滤波的理论框架进行机器人的同步定位与地图构建,在观测步通过单目视觉获得观测数据。得到机器人相对环境的观测数据后,数据关联步完成新特征点检测、已知环境特征点匹配和地图匹配。状态增广使得地图不断扩大,从而获得构建后的地图。[12]ChristianWeiss等人也进行了类似系统的室外测试,他们在阴天和晴天两种情况下进行了测试。[13]结果表明利用现行的全景系统进行定位存在鲁棒性问题,而且因为要处理的数据过多,精度不是很理想。两组实验的精度都在100cm左右,可以应用于普通的大范围定位,但是明显不符合自动对接的要求。上海交大在视觉系统的基础上结合了红外系统,虽然精度有所改善,但是仍然是大尺度上的改善,不能应用于自动对接。[14]因此该方向还是很有发展潜力。
4.3特点
基于视觉导向的机器人可以快速定位对接,基于视觉系统因此可以随时变换使用环境,技术还有很大发展空间。缺点在于受自然光干扰比较大,鲁棒性较差。
5结论
本文介绍了超声引导,红外引导和视觉引导3种应用于机器人定位的导向技术。通过简单理论分析和引用实例,我们得出结论,红外和超声导向以其成熟性和低价格仍是目前应用的主流,但是视觉导向技术发展迅速,是未来一段时间的主流研究方向,相信不久就会大范围取代以上两者。
参考文献:
[1]YANGFang-qiong,TANQing,XUHai-liang,et,al.Precisiondockingofamobilerobotusinginfraredandlaserguidance[J].Opto-ElectronicEngineering.2007,34(11).
[2]YUANXin,WANGDong-yang,YANYong-jie.Self-positioningofrobotbasedondeadreckoningandultrasonicdatafusion[J].J0URNALOFNAVALUNIVERSITYOFENGINEERING,2009,21(5).
[3]ZongGuanghua,DengZhicheng,WangWei.RealizationofaModularReconfigurableRobotforRoughTerrain[J].InternationalConferenceonMechatronicsandAutomation,2006:25-28.
[4]LIXiong-feng,FUHua-lei,LIDa-zhai,etal.UltrasonicBasedAutonomousDockingforSelf-reconfigurableRobot[J].MACHINERY&ELECTRONICS,2010(5).
[5]MiraVazP,FerreiraR,GrossmannV,et,al.Dockingofamobileplatformbasedoninfraredsensors[J].Guimaraes,Portugal:IEEE,1997.
[6]EijiroTakeuchi,TakashiTsubouchi.PortableEffectorDockingMechanismforaServiceMobileRobotandItsPositioning[J].IEEE,2006.
[7]WEIHongxing,LIUMiao,LIDezhong,et,al.ANovelSelf-assemblyModularSwarmRobot:DockingMechanismDesignandSelf-assemblyControl[J].ROBOT,2010,32(5).
[8]MurphyRR,HyamsJ,MintenB.Vision-baseddockingundervariablelightingconditions[J].SPIE,2000,4024:2-8.
[9]孔德林.基于嵌入式的机器人目标识别视觉系统设计[D].西安:西安电子科技大学,2007.
[10]LuoRC,LiaoCT,SuKL,etal.Automaticdockingandrechargingsystemforautonomoussecurityrobot[J].IntelligentRobotsandSystems,2005.(IROS2005).2005IEEE/RSJInternationalConferenceon2-6Aug.2005.
[11]MurataS,KakomuraK,KurokawaH.Towardascalablemodularroboticsystem[J].Robotics&AutomationMagazine,IEEE,2007.
[12]YiYingmin,LiuDing.Monocular-vision-basedsimultaneouslocalizationandmapbuildingofwheelrobots[J].ChineseJournalofScientificInstrument,2010,31(1).
[13]WeissC,TamimiH,MasselliA,etal.AHybridApproachforVision-basedOutdoorRobotLocalizationUsingGlobalandLocalImageFeatures[C].Proceedingsofthe2007IEEE/RSJInternationalConferenceonIntelligentRobotsandSystemsSanDiego,CA,USA,2007.
计算机视觉的应用方向范文篇12
关键词:虚拟现实技术;模拟;视传方向;真实场景
中图分类号:TP391.9
近年来,随着计算机领域的发展、PC的计算功能越发强大,模拟现实的技术应运而生――虚拟现实技术,虚拟现实技术采用计算机模拟现实场景的模式,通过创建一些虚拟的环境,包括山、树、虚拟实体等,通过逼近现实的场景,将现实世界中的场景形似地再现出来,使得观看虚拟场景的人,能够更加轻松地的获得所描述问题的背景以及分析的问题。随着计算机处理能力的增强,虚拟现实技术已经逐渐地应用于各种工况下,具体的如交通事故的再现,经常在视频上可看见虚拟场景的描述,使得事故过程清晰可见。虚拟实现技术一种体验虚拟世界的计算系统,使人的感觉彷佛看到真实的过程一样,能够从视觉、听觉、触觉上真正身临其境地感知虚拟环境,达到人机交互、虚拟再现的功能。虚拟现实技术是现代高科技、智能产品的结晶,通过计算机的模拟与建模,通过纹理特征的匹配,更加地符合人们的审美观。本文基于虚拟现实技术在视传方向的应用分析,全面而系统地分析虚拟技术的应用以及情景。
1虚拟现实技术特点
虚拟现实技术是一种采用计算机模拟的一种视觉效果技术,虚拟现实技术通过模拟已经发生的事件、正在运行的事件、预测要发生的事件等。虚拟现实技术具有很大的可调整型,可根据人的先验知识点,逐渐完成一系列虚拟场景中的事件发生经过,让观众觉得真实,具有一定的可靠性。虚拟现实技术已经广泛应用于军事上、交通部门事故回放、机车运行监控等一系列高科技应用领域,因此虚拟现实技术在未来很长一段时间将具有极大的应用前景。虚拟现实技术的三大要素主要为“沉浸”、“交互”和“构想”。对于“沉浸”而言,“沉浸”的目的是使用户尽可能的沉浸在虚拟现实技术模拟的三维场景中,让用户有着身临其境的感觉,增加虚拟现实场景的真实性,从而提高虚拟现实场景的质量。“交互”则是指的是虚拟现实技术应用于构建的虚拟场景,具有可控性,例如列车通行在高速铁路上,轨道的切换、运行的速度、运行的线路的选择等等。例如现在MATALB软件提供一种vrworld的模拟,场景的物体通过三维软件构件虚拟实体,通过编程的方式控制虚拟场景的物体的运动,因此,“交互”特点越来越引起人们的关注。“构想”这一点有时候可以用到,有时候则不需要用到,对于事故现场的再现,用户只需要了解事件发生的经过,因此也许不需要“构想”,而在军事领域则需要士兵通过对不同地形进行作战演练,构想各种障碍物等,营造更加逼真的场景,从而提高模拟演练水平。总之,虚拟现实技术就是通过先进计算机技术(现有的专业软件),利用高科技术将现实中的一些场景或者过程,制作成客观的虚拟环境,给人们以触、听、视觉上的感受。所以,用户在对虚拟现实技术尽心应用的时候,常常会产生一些跟现实世界类似的意识或幻觉,让用户真正从嗅觉、触觉等多个感官上了解虚拟世界的情境和事物,让人们沉浸在虚拟情境之中。
虚拟现实技术是高科技的结晶,它使计算机图形学的应用更加具有可操作性,用户根据需要可进行相关渲染,虚拟现实技术包括图形学、图像处理、网络技术、模式识别等一系列人工智能技术,结合气象、地质、心理学、美学的角度出发,采用一系列智能方法,使得虚拟现实场景更加地为观众所吸引。
2视景仿真中的虚拟现实技术
虚拟现实技术应用的领域极其广泛,在计算机通信领域应用在BCGcentrex、centrex的业务系统,IP网络的数据网,呼叫中心等,使得用户可以在逻辑上建立起有关业务数据的获取,采用虚拟内存和虚拟主机的通信,完成虚拟现实技术的应用。例如虚拟呼叫中心为企业和客户提供一个个性化的服务平台,能够有效提升客户和企业之间的沟通和信息交流服务,提供更加专业化的服务。
虚拟现实技术在视觉仿真过程中,能够实现建模技术和视点控制的高度化结合,通过现有的Maya、SoftimageXSI、Houdini、3DSmax、Lightware3D以及MUltigenCreator等三维建模工具,通过三维建模软件以及三维软件自带工具包中物理场景的调用,用户可实现快速的建模仿真设计,通过修饰其纹理特征,导出相应的开发模型。三维建模包括几何建模和形象建模。几何建模是整个虚拟现实场景的一个大的工作部分,对于大型的虚拟场景绘制,则采用MUltigenCreator软件可实现虚拟现实的快速刻画,得到一个非常接近于实际物理模型的所需几何模型。形象建模则是根据几何模型,进行相关的修饰,包括几何模型的纹理、材质、光照等特征,也是虚拟现实技术应用的一个重要组成部分,虚拟现实技术逼真地再现实际场景,从而在视传方向,引起观众的注意,从而达到满意的效果。对于形象建模,主要有四种纹理修饰方法:投影式贴图、立体式贴图、球体式贴图以及柱体式贴图,其中投影式贴图在虚拟现实场景中应用最广泛,投影式贴图可以满足多个角度进行渲染。
对于虚拟现实技术的视点控制,在视传方向上的控制,如果视点方向不合适,那么很难再现虚拟场景的细节,可能导致所建立的虚拟场景看不到的情况,因此虚拟现实技术中视点方向问题需要适当的调整。目前的视点方向主要有:静止视点、运动模式视点、束缚固定视点、束缚选装视点和规划路径视点等。用户可以实时地跟踪该视点,达到实时化运动检测的目的。关于视点化的效果,常采用Vega软件进行设计开发。进行视点设计时,一般需要进行视点类的创建,即分开创建运动模式和网络传来的各种参数控制等,常常电脑鼠标作为运动模式实例进行创建。对于虚拟现实技术运用,虚物实化技术常常涉及到,常见的显示设备有CRT显示器、电子投影以及立体眼镜等,帮助用户实时定位视频流以及声音所在帧。因此基于虚拟现实技术的应用,虚拟现实技术对于视传方向的应用价值以及应用前景随着计算机仿真技术的提高,逐渐变得更加可视化和简单化。
3结束语
虚拟现实技术在各行各业中广泛应用,例如汽车运行、列车运输、事故现场模拟等一系列再现和仿真领域,虚拟现实技术通过三维模型重建加之以纹理渲染使得三维模型更加适合观众的视觉感受,从而营造一种逼真的场景。虚拟现实技术借助于计算机模拟,全面直观可控地构造一种虚拟场景,真实地反映事件发生之前、正在发生、发生之后的状态,从而使得虚拟现实技术应用更加具有针对性,更加地迎合观众的视觉效应。虚拟现实技术是现代高科技的融合,结合了图形学、图像处理、模式识别等一系列人工智能技术,结合心理学、美学的角度,使得虚拟现实场景更加地为观众所吸引。本文针对虚拟现实技术在视传方向的应用,讨论其应用价值,并介绍了虚拟现实技术的广泛应用前景。
参考文献:
[1]钟玉琢.多媒体技术基础及应用[M].清华大学出版社,1999.
[2]庄成三.数据库系统原理及其应用[M].电子工业出版杜,2000.
[3](美)AlbrahamSilbersehatz,HenryF.Korth,5.sudarshan.数据库系统概念[M].机械工业出版社,2000
[4]叶叠,仲梁维,罗云.基于Vega/MultiGen的三维仿真漫游系统的研究与实现[J].计算机工程与设计,2005,26(2):362-364.
[5]杨宁.基于Simulink上的虚拟现实环境动态系统仿真[J].计算机工程与设计,2003,24(4):49-52.
-
照明工程市场研究范例(12篇)
照明工程市场研究范文1篇1一、锐意进取、深改攻坚,加快行政审批改革步伐(一)统筹推进,全面建立权责清单制度。按照职权法定、简政放权、权责一致、公开透明的原则,先后制定实施..
-
游戏在数学教学中的应用范例(3篇)
游戏在数学教学中的应用范文篇1关键词:数学课堂教学游戏应用游戏是小学生喜闻乐见的活动形式,它在数学教学活动中有十分重要的作用。对于小学生来说,游戏让他们学习的积极性更..
-
游戏作文范例(3篇)
游戏作文范文篇1【课堂片段1】师:同学们很喜欢游戏,今天老师就带着大家玩一个游戏,名字是――师板题:我来描述你来猜反思:通常情况下的公开课,教师会事先将课题投影在大屏幕上,学..
-
新课标语文教学范例(12篇)
新课标语文教学范文1篇1关键词:新课标高中语文教学新教材自高中语文新课程标准实验教科书实施以来,很多教师都尝试用不同的教学方法与教学理念来进行教学,以适应新课标、新教..
-
茶台的基本知识范例(12篇)
茶台的基本知识范文篇1Abstract:Anxiteaindustrydevelopedrapidlyinrecentyears,buttheTeaIndustryAssociationAnxiCounty,butdidnotsubsequentlybeenproperlydeveloped.Th..
-
对母亲的诉说范例(3篇)
对母亲的诉说范文总有一个人将我们支撑,这个人就是母亲,总有一种爱将我们包围,这种爱就是母爱!有人说母亲是一把伞,为儿女创造出一片美好的天地,为他们遮日避雨。有人说母亲是一..
-
医疗保障工作的重要性范例(12篇)
医疗保障工作的重要性范文篇1关键词:医疗保障,支出分配,互齐,大病一、医疗保障与养老保障的性质差异医疗保险和养老保险、失业保险是社会保险的三个最主要的组成部分,也是建立我..
-
文艺培训心得体会范例(3篇)
文艺培训心得体会范文关键词:培训机构;教育培训;营销策略;艺术培训中图分类号:C931文献标志码:A文章编号:1673-291X(2017)13-0055-02教育培训行业在近几年里的发展成果是有目共睹的,..