计算机视觉就业方向范例(12篇)
计算机视觉就业方向范文1篇1
【关键词】智能化;制造;工厂
一、智能化工厂
智能化机械工厂是以“智能化”为核心,以智能化、数字化、网络化为主要特征的生产、经营实体。智能化工厂将逐步分层次实现。智能工业机器人在智能自动化制造工厂中扮演着重要角色。
(1)智能工业机器人在智能化数控设备中,除了各种数控设备和相关数控配套设备以外,智能工业机器人在智能制造单元、智能制造系统和智能制造工厂中具有重要作用。
例如日本发那科开发的智能化工业机器人,安装了三维视觉传感器和力传感器,用于数控设备自动上下料和产品组装方面。视觉传感器能识别三维图像、能识别零件的位置和姿态,能抓取散放零件。发那科的智能工业机器人,在安装了用于生产的视觉传感器之外,还使用了力传感器用于产品组装作业。
最近几年,国内外的工业机器人专家都把注意力和精力投入到“视觉伺服”智能工业机器人的研究方面,成为国内外最热门的研究课题。工业机器人的“视觉伺服”研究,包括从视觉信号处理到机器人控制的全过程。包括机器人运动学、控制理论;包括实时图像的识别与处理,以及三维信息的获取、处理和重构技术;包括实时计算技术等领域的融合;包括机器人本体标定和摄像机标定技术等。
“视觉伺服”智能工业机器人,技术难点较多,较复杂,但是目前在数控技术领域已有较成熟的高速度、高灵敏度、高精度伺服控制技术和机器人方面的视觉传感技术作为基础和借鉴,相信是能够攻克“视觉伺服”工业机器人技术的。
(2)智能化自动化工厂在各种智能化自动化数控设备的基础上,智能化工厂将由工厂局部智能自动化、逐步分层次地发展到全工厂智能自动化和社会化智能制造。
第一层次:单机或单元智能自动化。单机或单元智能自动化,可以实现长时间无人值守。国内外都有用于生产的实例。比如日本发那科在20世纪80年代第一代智能数控加工中心上,加几个用于人工上下料托盘,可以实现24h连续运转。20世纪90年代的第二代智能加工系统,以4~6台加工中心和装有带加工夹具的立体托盘架,能摆放待加工的大量毛坯件,可实现60h连续运转。
20世纪末和21世纪初的第三代智能加工系统,称作“智能机器人化加工单元”,该单元就是用智能化机器人为智能加工数控设备的夹具自动装卸工件。与第二代加工系统相比,由机器人代替了人工上下工件,解放了工人的繁重劳力,减少了夹具,减少了设备投资,缩短了生产准备时间,加工质量更加稳定,降低了生产成本。
第二个层次:生产制造系统智能自动化。
在第三代“智能机器人化单元”的基础上,实现计算机网络控制生产车间全自动化系统。包括毛坯仓储管理,再制品仓储管理,成品零件仓储管理及其搬运、装卸、装配作业和质量检验等。
第三个层次:智能化数字化网络制造系统。在第二层次生产制造系统智能自动化的基础上,配置网络综合管理系统,来实现全工厂的智能化数字化网络制造。智能化工厂的实现主要是靠信息通信技术(ICT)和智能网络的可靠运行加以保证。具有实时资料搜集与传输功能、高效能计算机与分析预测功能、远程监控与诊断功能及模拟功能等。
智能化工厂最核心的部分是生产过程和全面经营运行的智能自动化,包括设计智能化,生产排序自动化,生产线自动化,测试检验自动化,仓储自动化,电力管理智能自动化等等,进一步发展到自动化无人化工厂(绝大多数设备可以无人值守)。除生产过程智能自动化外,还包括人力资源优化调度,物资资源(设备,工具,材料等)智能优化调配,并具有强化专案时程能力,时间弹性应用支配能力,完善调整生产周期,优化生产经营方案,达到提高生产效率和降低成本的目标。
目前,这种工业网络智能工厂基本形态在技术先进国家有实力的技术先进企业已率先实现。但是用于工业智能网络不同于一般ICT通信网络,有不少难点需要克服。工业智能化网络必须具有防水、防尘、防磁、防爆以及抗高低温和抗腐蚀的能力。在可靠性、耐用性方面都比一般通信网络要求高得多。
例如:Tata汽车有限公司在印度Gujarat投资4亿1700万美元建造一座先进的具有智能化特征的工厂,每一个生产环节都采用“智能化”制造技术,对于来自经销商的订单,可以及时对客户的偏好加以调整,满足个性化需求。采用“智能化”制造技术,可以追踪每种零件的来源,可以快速确认及解决任何可能产生的质量缺陷和安全问题。此外,智能网络还可以与智能电网相连,以便在能源最为充沛或最便宜时段大量投入设备运行以降低成本。
智能化制造工厂,应该具有掌握整体市场的需求与变化能力,适时调整生产经营的弹性灵活运行,协调生产线,推出最适合市场需求的产品。发展智能化制造工厂,绝对势在必行。这取决于三大关键要素:人性化操作接口,高功能高速度计算机运算平台连接及跨网络的云端运算与信息集成分析与统计。
第四个层次:智能化社会化生产。智能化网络化社会化制造,将由企业内部局域网经因特网向企业外部传输。这就是所谓的Internet/Intranet。网络可使企业与企业之间进行跨地区协同设计、协同制造、信息共享、远程监控、远程诊断和服务等。网络能为制造提供完整的生产数据信息,可以通过网络将加工程序传给远方的设备进行加工,也可远程诊断并发出指令调整。网络使各地分散的数控机床联系在一起,互相协调,统一优化调整,使产品加工不局限于一个工厂内而实现社会化生产。智能化社会化制造能够借助Internet网实现跨行业、跨国际智能化制造,进入Internet/Intranet时代。云计算借助Internet网整合了计算机资源,为智能化制造开了先河。智能化网络化社会化制造将引领社会和全球资源的整合与优化运用,同时将有效地提高人类的生活质量,逐步地减少人类的体力劳动而扩大脑力劳动的比重,进入知识社会,智能社会。
二、结束语
计算机视觉就业方向范文篇2
关键词:新媒体艺术三维动画艺术
中图分类号:G712文献标识码:CDOI:10.3969/j.issn.1672-8181.2014.06.030
传统艺术随着计算机科学技术的发展也发生了翻天覆地的变化,艺术不单一局限于实物为载体,现在还更多的依赖光与影产生的影像来传播。例如文艺复兴时期的绘画作品就从平面单一的图案形式美术作品开始,受到了几何与透视的影响发展到视觉上立体的美术作品;化学原料的提纯技术的进步也使美术作品的色彩更有层次感,更为丰富,从而更大地激发了艺术家的创作灵感;人类对光的分析超越对光的感知,大批色彩鲜艳的颜料普及使艺术家的作品演绎得更加传神。
那么到了现今社会,计算机科学技术高度发达,特别是图像技术对艺术的影响甚大,可以说艺术语言在当今发达的图像技术影响下已经取得空前的成就。从这里开始我所说的新媒体艺术就是指主要借助计算机来控制数字投影仪等仪器来实现虚拟影像的传播。静止的图像在计算机科学技术的影响下走向动态,庞大的市场使艺术也随之商业化,而三维动画正是这种表现方式中较容易实现,而且效果最理想的一种表现形式,大量的新媒体出现使三维动画艺术家对图像与动画的视觉表达越来越细腻,在各种创新大胆的艺术思维下,使三维动画在新媒体艺术传播,也打破了传统的思考和创作方式。
新媒体艺术是指利用电脑(计算及信息处理)及网络(传播及交换)等新科技,利用“光学”和电子作为媒介的新艺术学科门类,这就是说新媒体艺术是建立在以数字技术为核心的基础上。可以归类为数码艺术,其表现手段主要为计算机图形图象,就是ComputerGraphics简称CG。新媒体艺术的意思就有包含有“发展”、“创新”特性,当前主要是利用计算机、网络等数字技术的最新科技来作为创作媒介的数字艺术。随着计算机以硬件技术、网络的云端技术和数字通信技术的高速发展,传统的广播、电视、电影的传播媒体高速地向数字化方向发展,与日益普及的三维电脑动画形成了新一代数字传播媒体最广泛的形式之一。
三维动画艺术,是相对二维动画而言的动画手法,不同之处在于计算机内存储存了几何数据的三维表示,用于计算和绘制最终的二维图像。一般来讲,三维动画需要经过建模、生成贴图坐标、上材质、动画绑定设置,然后给动画师制作动画,最后还要进行部置灯光、渲染合成等程序生成最后的画面。
从二者的定义我们能看出,他们都是利用最新的计算机科技手段来表现艺术手法。
目前最常见的新媒体艺术的形式主要有大型数字艺术展示,虚拟空间和互动媒体这三种,其中的视觉表现部分,大多都用三维动画艺术来实现。
大型数字艺术展示,经常用在大型的舞台表演和各大型的综合节目的舞台LED背景,也有用来重现经典传统艺术,比如上海世博会展出的《清明上河图》,就是以三维动画手法制作的描绘了北宋宣和年间世界上最大的城市汴京(今河南开封)的繁盛热闹,画卷以全景式的构图,细致而真实地记录了城乡、街市、水道间的形形。这些都以三维动画的表现手法以新媒体的形式展现在观众面前。通过这种技术可以更加直观地给观众带来更炫彩的视觉享受,从平面升华到立体三维空间,可以多个角度欣赏,这也是空间上的突破。不但使画面变得五光十色,还可以让观众与画面有更加紧密的互动。加强了原有的视觉享受,还在原有的视觉享受上增加听觉,甚至味觉、触觉,这些现在都可以实现的。
虚拟空间出现在各大主题乐园中,最常见是作为第一身游戏形式给观赏者参与其中,如香港科学馆就有虚拟滑翔飞行的游戏,观众也像滑翔运动员一样坐上滑翔风筝,不同的是滑翔风筝没有动而是四周的三维环境在动,参与者眼睛看到的是三维软件制作出来的三维动画,但同样感受到像真实一样的速度感和空间感。要是换用实拍的环境视频制作,要达到相同效果其制作技术就会较难实现,但用了三维动画其制作成本就大大降低了。
新媒体艺术中的互动媒体展示里面,三维动画更是随处可见,因为三维动画能方便使得专门化的应用程序接口被创建出来用于简化互动媒体展示的各个阶段的处理。这对于计算机图形硬件也是极为重要的,因为他们提供给程序员一种使用硬件的抽象方式。如鲤鱼游泳的互动游戏,是利用参与者的手势或身体动作触发鲤鱼的预制三维动画,使鲤鱼能做出各种追食物,闲游和受惊等游泳动作,其中的主体鲤鱼、水环境、风吹植物等视觉部分完全是由三维动画来实现。
CG力量与传统技法的完美结合,向世人展现了全新的艺术形式。各种前所未有的震撼画面都是通过这种形式表现出来。是科技升华了艺术,还是艺术通过科技得到新的发展?生产离不开科技。本质上,“媒体艺术”是明确其所针对的是艺术作品创作和数字产品的艺术设计等应用领域。三维动画就能直接地和新媒体艺术结合,制作出各种大型数字艺术展示,虚拟空间和互动媒体艺术。
计算机视觉就业方向范文篇3
提倡手绘,但不摒弃现代数字技术的运用,而是利用两者的优势所在,进行手绘插画创作,同时注重原创,从而设计出更加生动的插画作品。
关键词:手绘插画;数字化时代;原创;形式;风格
中图分类号:C35文献标识码:A
作者简介:时琳怡,大连工业大学硕士研究生
一、数字化背景下的原创手绘
随着计算机技术的普及和数字媒体的应用,对插画设计领域带来了极其深远的影响,数字技术与大众生活的关系越来越密切,人们对电脑、手机等数字化产品逐渐产生了依赖心理。习惯了上网浏览新闻,用手机发短信、拍照等数字化生活方式。更重要的是人们在享用数码产品的同时,也接受了数字艺术的审美特征,并在一定程度上形成了对数字化审美的需求和期待。插画设计在这种大的时代背景下,必然形成新的发展和变革。
二、数字技术与原创手绘插画设计互动
(一)借助数字技术的手绘插画后期处理
数字技术的应用,为手绘插画的效果表现带来了无限的可能。虽然在一定程度上计算机处理图片的能力在速度和效率上远高于人类,但是它不能代替在手绘过程中笔与纸张的流动感。设计师具有艺术思维能力和创作的灵感,而这种灵感是任何先进的机器所不具备的。反之,手绘插画表现能力的增强,能更大限度地发挥计算机绘图的能力,表现手段也更为灵活多样手绘插画能力的提高,计算机操作熟练,二者的完美结台,亦可创作出动人的插画作品。一幅优美的手绘插画作品,无论是彩铅、水彩、水墨、水粉、油画等形式来表现,还是计算机、数位板等形式来表现.在创作流程上,大致相同。首先是原稿的创作,其次是后期处理。
(二)手绘插画后期处理时视觉审美因素的把握
电脑技术作为数字化时代下一个新的设计手段,深化了原创手绘插画的艺术魅力和视觉效果,二者的完美结合.已逐渐成为现代插画设计的主旋律。在原创理念、新技术的支持下.技术与艺术的碰撞,使我们对手绘插画审美方式有了全新的理解。传统的画种表现形式,给人们带来了视觉审美疲劳,纯粹的数字处理画面.同样倍感厌倦和单调。而借助于数字技术的手绘插画似乎带来了一缕清风,为手绘插画艺术打开了一个新的局面。当今是一个资讯信息更新迅速、追求形式多变的社会,手绘插画作为一种视觉表现形式,其本身在画面要求上是不断变化的。无论是后期处理的二维表现形式还是逼真的三维视觉效果,都反映出现代人们对审美追求方式的多元化。因此,在手绘插画后期数字处理,仅依靠数字技术手段是不够的,除表面特征以外,还要更多思考人的视觉审美心理。
三、数字化时代原创手绘插画在海报设计中的应用
(一)原创手绘插画与海报设计结合的优势
数字化时代原创手绘插画设计,以其灵活形式的表达、自由主题的创作、艺术视觉张力的呈现,在现代设计中被广为应用。随着现代市场经济的迅速发展,海报艺术,作为视觉传播的一种重要媒介,历经百年而不衰,在现代视觉领域中依然发挥着重要的作用。当今,设计门类在不断扩展,设计师的艺术表现手段也日益朝着多元化方向发展。其他媒体的介入(如广播、电视、报纸、杂志、多媒体等),并没有削弱海报在现代设计中的地位,反而成为众多设计师甚至艺术家表达观念、展现自我的舞台,其始终处于中轴地位。就海报的艺术表现形式而言,手绘插画这种艺术语言的表达,使海报设计更具有强烈的艺术感染力和独特的艺术风格。
(二)原创手绘插画在商业海报设计中的应用
现代商业的迅速发展,公众的消费观念、生活习性、价值导向、文化追求等方面朝多元化方向演进,现代消费者的商业意识不断增强,不再是对商品本身的关注,在新形式下,对宣传商品载体的审美也有了新的变化和追求。海报作为广告传播的重要媒体,占有重要的地位和作用。就海报的性质来说,以宣传、促销商品和服务,提升公司形象为目的的商业海报设计,在内容表现和形式上也随着环境的变化而变化。手绘插画作为一种表现形式,在现代商址海报设计中得到普遍应用。现代商业海报设计中的手绘插画应用,逐渐成为一种时尚。时尚引导消费,而现代商业海报设计在某种程度上恰恰迎合了现代大众的审美取向。手绘插画与商业海报设计的激情碰撞,正是时代的产物。手绘插画的产生、引导与传播所依靠的主要手段,就是让手绘插画成为大众所能接受的审美对象.离开了具体审美对象的海报创意与表现,在传播力度上就会受到阻碍。
商业导向实际上意味着一种消费潮流,手绘插画成为一种时尚,同时也就成为商业海报关注的切入点。对时尚的有效引导与传播,从某种意义上讲,就是承载了一部分商业价值。商业海报在现代市场环境中的视觉效应,需要理解消费者所追求的。“时尚”的概念,从而满足消费者的需求。商业海报作为一种视觉载体.注入原创手绘插画元素,所释放的视觉能量,能成功地引导消费者对时尚的追逐。在手绘插画的创作上,尽可能是大众所熟知的时尚元素,通过对这些可视性符号的解读,能够从心理和感官上寻找其中的共通点。从视觉传播来说,与文字信息传播不同,它的可读性更宽、更广,这种无阻碍的沟通、交流方式不能不归功于手绘插画的视觉魅力。
手绘插画的运用,给商业海报设计带来了一丝清爽,符合了现代的时尚气息,形象地传达主题寓意和思想内涵。与以往的图片说教,纯粹的电脑效果处理有根本的区别,手绘插画在这方面表达的更有韵味。虽然手绘插画给商业海报设计注入了新鲜的血液,但同时我们也应该注意到,一味迎合商业的需要.忽略了商业海报设计本身的视觉审美功能,那无疑会被商业同化,沦为视觉污染之行列。商业海报应符合美的标准,恰当的运用手绘插画元素,传达大众所需的生活品质、文化品味及生活态度,提高生活内涵和生活趣味,而不是滥用手绘插画,将商业海报世俗化,追求奢华和感官刺激以致失去了二者的有机结合和美的表达。
因此,手绘插画在商业海报设计应用时,我们应深刻理解商业海报的内在精髓,以“真、善、美”为根本宗旨,力求不被纯粹的物质利益所淹没,从而我们便可以设计出高品味的商业海报了。
四、未来展望
目前,中国的原创手绘插画正以蓬勃的生机向前发展,但原创手绘插画作为一项创意产业,并形成产业链,还需时日。当前,还处于模仿阶段,并未形成具有中国特色的原创手绘插画设计。虽然部分高校开设了相应的专业,但真正从事原创手绘插画的专业人士不多,大部分只是依靠电脑技术从事插画,内容与欧美、日本的风格大相径庭,设计出的插画作品没有鲜明的个性特色,如中国本土特色。从现在高校艺术类学生设计的作品来看,大多强调的是电脑技法,在原创性和手绘这方面还存在着很大的不足。电脑固然重要,但并不是唯一的艺术表现手段。一幅优秀的手绘插画作品,电脑技术起到了一定作用,但艺术的本原――原创性,才是其精髓所在。原创手绘插画与电脑结合是随着时展而自成的一个设计体系,手绘插画是表达个人的情感和个人的艺术风格;而电脑则是完善创意作品的保障。二者如何更好的融合,具有重要的现实意义。
未来高科技数码技术的介入,为原创手绘插画设计提供了技术上的支持。但原创手绘插画在现代设计中处于何种地位,如何更好地发挥手绘插画的优势,探索其他的手绘表现形式等,是未来手绘插画发展的重要领域,值得设计师去思索和研究。立足手绘插画的原创性,紧随时代脉搏,拓展原创手绘插画设计的应用领域,将是现代设计师肩负的重任。
结语
随着计算机技术的普及和数字媒体的应用,对插画设计领域带来了极其深远的影响。插画设计在这种大的时代背景下,必然形成新的发展和变革。在数字技术影响下的手绘插画逐渐改变了传统插画的复杂绘画方式,真正实现无纸作业。网络现今给大家提供了一个平等、广阔的交流平台,设计者可以突破一切束缚自由创作赢得客户的青睐和广阔的市场。在数字技术影响下手绘插画设计师的创作能力得到了更大的发挥,创作出更具视觉冲击力、更富于想象力的综合插画视觉效果的作品。但无论数字技术多么的发达,我们仍然不能抛弃传统手绘插画的创作精华,将传统手绘与数字技术相结合,取长补短,共同辅助插画设计师创作出独具原创性、个性和时代特征的优秀插画作品。
参考文献
[1]胡心怡.插图设计[M].江西美术出版社,2006.
[2]李欢.时尚插画风格分类探讨与应用研究[M].重庆大学,2007.
计算机视觉就业方向范文篇4
中科大智“人工智能与机器人教育联合实验室”主任。主要从事模式识别、图像处理、多媒体内容安全等方面的研究工作,在国际权威期刊及学术会议上发表学术论文30余篇,申请发明专利]0余项。主持和参与国家“863”计划、“973”计划,科技支撑计划、重点研发计划、国家自然科学基金等20余项国家和省部级科研项目。现为中国人工智能学会副秘书长、理事,中国图像图形学学会副秘书长,中国计算机学会计算机视觉专业委员会委员,中国电子学会通讯学分会多媒体信息安全专委会委员,中国人工智能学会模式识别专委会委员;北京图像图形学学会理事、青年委员;美国电气电子工程师学会(IEEE)高级会员、IEEEVtools委员会委员(2016-2017)、IEEE亚太区女工程师委员会主席(20172018)、IEEE北京分会女工程师委员会主席(2016-2017),JournalofInformationSecurityandApplicadon国际期刊副主编。曾担任IEEE青年计算与通讯技术大会组委会主席(2008、2009)、中国人工智能大会组委会联(2015、2016)。
如果要问当下最火的概念是什么,答案非人工智能莫属。从科研界到产业界再到资本圈,人工智能就像一团火,燃起了每个人的热情。从类脑,再到各种无人设备,人工智能已经不再是束之高阁的科研成果,而是与每个人都息息相关的话题。
然而,有一种人工智能却并不广为大众所了解。它如同其所深耕的领域一般低调而神秘,它就是视觉内容鉴别研究。通俗地说,这项技术就如同一个“火眼金睛”的侦探,从图片信息的蛛丝马迹中辨别真伪。
中国科学院自动化研究所智能感知与计算研究中心副研究员,自动化所一中科大智“人工智能与机器人教育联合实验室”主任董品,就是一位为计算机锻造“火眼金睛”的科研工作者。年纪虽轻,但她却已在这一领域拓荒许久,在基础研究的领域心无旁骛地耕耘着。勇立潮头助力科普落地生花
2016年3月10日,围棋世界冠军李世h与谷歌人工智能程序AophaGo结束了第一场黑白对决,这场人机大战引发了全世界的关注。就在第二天,中国科学院自动化所与深圳无人机教育机构中科大智共建的“人工智能与机器人教育联合实验室”揭牌成立,同时了全国首套无人机科普教程,同样引起国内的广泛关注。
作为实验室首任主任,董晶进入人们的视野。
老家在湖南的董晶,端庄温婉,性格里却带着湖南人与生俱来的爽朗、豪放基因。她先展示了实验室揭牌成立那天,正式的无人机科普技术系列教程。“这套面向8-18岁中小学生的教材,旨在培养未来的无人机接班人。”董晶兴奋地说道。种类多,图片、文字详实易懂是这套教材的特点。通过学习教材上的内容,学生可以掌握无人机的组成、飞行原理,特别是对诸如GPS、陀螺仪等应用的了解和熟悉,有助于学生今后自己组装、调试无人机甚至可以进行飞控开发。更重要的是,它能拓宽学生思维的广度,从小培养他们发现问题、分析问题、解决问题的能力。
每年在科学院开展的“公众之光”活动中,中科院自动化所都向公众开放,展出机器鱼、机器人、人脸识别、虹膜识别、类脑等新技术。中小学生在观摩了新技术的演示后,对此产生了极大的兴趣,想进一步了解新技术背后的机制和原理。自动化所为了满足中小学生的需求,特意安排研究员和博士生来进行讲解,但由于内容技术性强,专业性强,中小学生接受起来较困难。“尽管如此,可是他们求知的欲望却有增无减。”孩子们求知若渴的眼神令董晶难以忘怀。
深圳中科大智在培训过程中看到了市场对人工智能的热度,但同时也感到全国相关的科普教育工作,远跟不上人工智能蓬勃发展的趋势。自动化所作为人工智能领域的领军科研机构,在智能技术、信息处理、控制等方面具有国际一流的科学技术和科技人才储备,结合中科大智的市场推广和教育经验,双方一拍即合,“人工智能与机器人教育联合实验室”成立。
据董晶介绍,目前,相关科普课程已经在深圳中学、笋岗中学等学校开设。未来,实验室计划将把生物特征识别、计算机视觉等前沿领域的最新研究成果,研发成面向中小学生,乃至职业教育学生的科普课程和科普设备,依托中国科协、中科院、国家的科普推广项目工程以及遍布全国的科技馆、科普教育中心,为全国青少年科普人工智能知识,为国家人工智能行业培养人才。
“科学研究是一种思想的探索,而科普则是对这种思想的传播。”董晶加入实验室有她自己的愿景,她曾参加过科协和团中央组织的“科普志愿行”和“科技创新行”活动,奔赴偏远地方做科普报告。她说,人工智能一是模仿人,二是替代人,更多的功能则是延伸和拓展人类行为,理所当然也应成为拓展人类思想传播的一种手段和方式。她希望自己的科研成果联同科研思想,在未来通过这种特殊的方式得到进一步延伸。
博学笃志不忘初心潜心研究
“人有两种,通才和专才,我本希望成为前者,不是只能一条路走到黑的那种。”但对专业方向的选择上,董晶恰恰是”一条路走到黑”了。热爱科研、热爱科普的董晶于2005年本科毕业于中南大学电子信息科学与技术专业。临近毕业时,由于成绩优异,她获得了学校保送研究生名额。在众多科研机构中,董晶果断地选择了中科院自动化所。时任自动化所所长的谭铁牛,是模式识别领域的领军人物,也是董晶的湖南老乡。1997年,谭铁牛放弃了英国南部美丽城市雷丁的优渥生活,与妻子双双向雷丁大学递交o呈,带着刚满周岁的儿子,踏上回国路。这个故事对董晶的触动很大,谭铁牛也成为她心中的标杆性人物。慕名来到北京,通过面试,董晶如愿成为模式识别队伍中的一员,从此开启了令她心驰神往的人工智能科研之路。
董晶介绍,模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。人工智能领域的模式识别是通过计算机用数学技术方法来研究模式的自动处理和判读,是人工智能的核心内容。随着20世纪50年代人工智能的兴起,计算机已经开始代替并扩展人类的部分智能。大数据时代为模式识别带来了巨大的机遇,人工智能与人对弈的取胜意味着面向特定任务的模式识别已取得突破性进展。大数据的海量庞杂、异构多源、模态多样、也使得大数据时代的模式识别面临诸多挑战。
董晶说,在享受信息交换与资源共享带来的极大便利时,数字化信息能够大规模复制,并能轻易被篡改的特性同时也带来了许多负面影响。以前,人们常认为“耳听为虚,眼见为实”,然而在当前网络环境中,假图片或篡改图片正在严重误导着大众。”悬浮视察照“藏羚羊假照片事件”等都曾掀起轩然大波:明星拼接图像更是层出不穷,引发很多绯闻。更严峻的是,假图片会对司法调查、保险鉴定、网络安全等这些严肃、敏感的地带造成严重冲击。
严峻的信息网络环境,迫切需要计算机拥有像孙悟空一样的“火眼金睛”,具备识破一切伪装信息的法力。董晶就是为计算机锻造“火眼金睛”的工匠之一。以数字图像取证、隐写分析及数字水印等视觉鉴别技术为应用背景,董晶着重研究人类视觉系统的感知特性、机理与计算方法。从人类视觉系统与计算机视觉系统的认知差异性出发,借鉴两类视觉系统之间的认知和计算差异性及关联性,她提出了一系列面向实际应用需求的视觉内容鉴别研究新方法。
“刚开始做信息隐藏时,我觉得十分有趣。”董晶说“通俗地说,就是即使我用打印机打印一张白纸,也会附加上一些大家肉眼看不见的秘密信息。间谍、特务有时就是这样传递秘密信息的。”美国“911”事件中,据悉本,拉登便是通过在社区网络传播一些附带信息的照片,被一些别有用心的人提取出来,从而完成恐怖袭击任务的。
董晶研究的方法是模式识别的基础理论与方法,即模式识别的二分类法。这一研究与当时以生物特征识别、视频监控、大数据分析为主流的国家重点实验室的主流方向不太一致。然而董晶却对这一“小众”方向十分感兴趣,潜心研究,一做就是5年。取得博士学位后,董晶以优异的成绩留所工作,当仁不让地负责起了导师在这一领域的科研任务。
多年的坚持,让董晶在这个领域的研究已经有了一些成果。首先是基于成像约束条件的交互式图像真伪鉴别方法。该方法通过利用图像底层统计信息的不一致性表达及度量,反映图像高阶语义层的真实约束关系,由此鉴别图像表观内容的真伪。此外,她提出了一系列基于图像和视频底层相关特性的机器统计特征分析方法,简单并高效地辅助人类视觉系统进行视觉隐写分析。她还提出了一组基于边信息和量化抖动的鲁棒图像数字水印技术方案,较已有同类方法具有更高鲁棒性,有了这个方案,水印图像在多种水印攻击条件下,仍能被视觉系统感知与鉴别。
这些理论听起来高深,实际上在生活中的应用十分广泛。“比如把一张别人的脸PS成克林顿的脸,在自然场景拍摄图像的情况下,很难分辨出来。如果在成像原理上利用图像二次压缩之后信号改变留有痕迹的现象,通过模式分析和信号提取、放大、优化,可以准确地找到被修改的痕迹。”目前,董晶已经利用这项技术为新华社图片编辑部提供了一套解决方案。未来,这种应用还将出现在更多领域。
这些研究听起来简单有趣,在实际攻关中却不容易。董晶说:“微弱信号的识别工作有别于传统工作,隐秘信息没有统一的模型,很难被计算机识别。”因此,刚开始从事这项工作时,董晶的思路很少,而信息安全领域能够公开的文献又过于陈旧,真正有用的新技术都要很久以后才能公开。董晶的团队由于积累不多,成果一度出得很慢。遭遇科研瓶颈的董晶心里着急,甚至有些打退堂鼓。
就在这时,导师谭铁牛的一番话让董晶茅塞顿开:“这是个有价值、有影响力的科研方向,做科研不能只看眼前,不能什么火就做什么,一味跟风,而要重视长期的积累。也许你做的工作10年后才会被人认可,不能放弃。”
在导师的鼓励下,董晶重整旗鼓,再次出发。这一次她发现,越是沉下心来就越是能体会到科学研究的趣味。“科学研究万变不离其宗,找到解决问题的方法和思想最重要。”董晶说,现在自己做科研不是为了挣大钱,也不去考虑短期成果,而是真正想去做这件能让自己感到愉悦的事。“认准方向、下定决心,一步步去做,总会做出有意义的成果来。”
夯实根基冷静审慎执守钻研
现在,董晶的课题组每年持续承担着国家信息隐藏领域的科研项目。从国家自然科学基金项目、科技支撑项目到重点研发计划,她在模式识别与图像取证领域的科研积累,在一个又一个课题的打磨下日益深厚。
此外,作为多个学会专委会的委员,董晶每年都要参与和组织多个领域相关的学术大会,并在大会上积极介绍自己研究方向上的新成果。她希望所做的一切能影响到这个领域的发展,为学科发展贡献自己的一份力量。
如今,董晶研究的copy-move检测、传感器噪声取证、像素重采样检测、反射不一致性检测、光照一致性检测等技术,在现实的网络空间安全中的应用都十分具有价值,她和导师谭铁牛也已申请了多项国际专利,但在现阶段,她却不急于进行技术转化,而是认为应该将主要精力放在基础研究上。
“有些技术其实很受企业的青睐。”董晶曾有一项技术让阿里巴巴、IBM公司十分感兴趣。这项技术可以检测图片中真实人脸的脉搏反射,捕捉微弱信号,进行模式识别,从而辨别出图中人物是真实拍摄还是电脑合成。尽管多家公司希望对此项技术进行深入研究或成果转化,但现阶段董晶只考虑做技术孵化。她说:“一项技术如果真做到产品阶段,大家更多考虑的是用户友好体验和细节的优化,对技术本身反而没有那么看重了。”她希望把这些细节留给有经验的工程团队去做,而自己的课题组继续集中精力在基础研究领域深耕。
其实,对董晶来说,研转产的机会有很多,她所在的自动化所就大力度鼓励科研人员离岗创业,甚至对一些创业项目提供3年停薪留职、平台融资等机会的优惠政策,然而这些并没有打动董晶。她说,自然图像取证,特别是隐写统一特征模型的研究,目前在整个学术界还没有完整的定论,关键的科学问题还没能解决好,即便应用也只能是皮毛。“我希望在关键问题的研究上多使点劲儿,如果大家都去搞应用,而中断了研究的步伐,这就可能成为永远的难题了。”
当前,人工智能已成为技术与资本风口,其转化速度也远超其他技术。很多人在这种背景下“下了海”,而董晶却多了一分清醒与冷静。”我们现在要警惕热过头。我很认同谭老师的看法,找风口不如找关口。国家究竟需要什么技术?什么技术才是对社会最有益的?我们在这些技术上和国外的差距到底在哪里?这些都需要我们去冷静思考。”董晶认为,企业不应借人工智能炒概念、推风口。而作为这个领域的科技工作者,她的责任是站好岗、不跟风。这份踏实将让她一路前行,一路收获,在模式研究领域绽放自己的光彩。张弛有度广建平台延伸梦想
科研工作多而繁杂,董晶却十分懂得张弛之道。工作虽忙,她却从未因此放弃自己的爱好。阅读、旅游、瑜伽、摄影,只要能想出来的业余活动她都会抽空“涉猎”。虽然经常加班,但她并不是起早贪黑、埋头苦干的人。忙一段时间后,她会刻意让自己停下来,陪陪四岁半的孩子,陪陪父母、爱人,和朋友聚会。她说:“工作只是生活的一部分,如果你能热爱生活,就一定会热爱工作。”
董晶不仅懂得让自己在繁忙的工作之余放松下来,对于学生,她也鼓励他们张弛有度。“我指导学生基本上是‘放养’的。”说完,董晶大笑起来。当学生的课题进行不下去时,董晶总会让他们停下手中的课题,出去散散心,转换一下思路。她说:“读书不止是对知识的积累,攻读博士学位也不仅仅是发表几篇学术论文,更重要的是科学思维的启发和形成,我对学生能够形成正确的认知方法和学术思想看得尤橹匾。”
现在,董晶除了在自己的研究方向上努力做出成果外,还想做好“人工智能与机器人教育联合实验室”的工作,将更多的科研成果做成科普课件和设备,为国家做好人工智能方向科研人才的培养工作。
计算机视觉就业方向范文
1社会发展的需要
1.1“文化消费”与“视觉享受”
现代中国社会进入“消费时代”,“文化消费”指在现代传媒高度发展的市场经济条件下,社会公众对文化这种特殊精神产品的生产方式和接受方式。富有意味的是,消费信息的传播途径或方式,主要是官能感觉,尤以视觉为最。视觉是以图形、文字与色彩等基础元素为视觉认知语言而进行艺术化的表现。在某种意义上,消费时代也是个“一味迷恋视觉享受的时代”。其范围涉及文字、图形、图表、摄影、动画、商业广告、展示空间及视频影像等。
1.2“计算机文化”与“视觉文化”
这个时代也是计算机飞速发展的时代,计算机已然成为了一种大众消费品。计算机文化中的视觉文化占了绝对重要的比例。计算机产业的操作员或设计员也应该对视觉的消费观念和视觉艺术有一定的了解,这样才能设计出更赏心悦目的作品。只有顺应了时展的潮流,具备了全面的文化素质,我们才能在专业上走得更远,设计出更符合大众审美的计算机语言。
2学科间的交叉性
在信息产业飞速发展、信息化社会需求不断变化的背景下,产生了学科间的交叉性。这种交叉性面向未来,强调信息科技与艺术的融合。学科交叉的教学应侧重培养学生在信息技术与艺术方面的整合、策划、创意设计的能力,以数字内容、人机交互方式为研究对象,致力于创建简洁优美的信息界面、信息产品和信息环境,为观众和消费者创造和谐美观的交互方式和体验。计算机美术是跨越艺术和计算机科学的一门新兴的边缘学科。
3学科间的共通性
3.1计算机产业需要创新人才
众所周知,计算机产业从早期大型电脑演变到今天的个人电脑,从硬件配置到软件开发和应用,无一不经历一个创新的过程。如果你问盖茨:你宁可要公司全部的科技,还是要公司全部的人才?他会告诉你人才比科技更重要。在今天是最新的科技5年以后就过时了,但是人才却可以永远继续创新。
3.2美术课程是对创造力的培养最具成效的课程
计算机视觉就业方向范文
关键词:视觉伺服;分类;分析
1视觉伺服系统的分类介绍
视觉伺服系统一般可以根据反馈、摄像头位置、视觉控制方式和摄像头数量的差异进行分类:
(1)与工业控制系统一样根据有无反馈可分为两类:开环体系和闭环体系。闭环体系这种视觉伺服系统的主要优点是,摄像头对机器人的标定不必非常精确,系统就可以控制机器人按照预先的规划进行运动。
(2)根据摄像头位置的不同来分类:一般摄像头在视觉伺服系统中被称为机器人的“眼睛”,而执行体系如机械卡爪等被称为机器人的“手”。另一种是摄像头安装在执行系统之外,通常叫为“眼在手外”。
(3)当使用闭环控制体系来控制机器人的运动状态时按照视觉控制方式的差异可以分为两类:一种为基于位置的视觉伺服系统,第二种为基于图像的视觉伺服系统:在该种视觉伺服体系中偏差的主要来源为图像,它是直接利用图像的特征来进行系统反馈的。图2为这种视觉伺服体系的工作原理图。
(4)按摄像头数目分类:不同的视觉伺服体系中安放的摄像头数量不同,所以对视觉伺服体系可以按照摄像头数量进行分类,当具有一个摄像头时称为单目系统,具有两个摄像头时称为双目系统,摄像头数量在两个以上时称为多目系统。
2视觉系统的研究现状
视觉系统的研究现状主要包括摄像头标定技术的研究现状,边缘检测技术的研究现状,特征提取算法的研究现状。
2.1摄像头标定技术研究现状
一般情况下,系统需要通过建立摄像头成像的几何模型来确定空间物体表面某点的笛卡尔空间坐标与其在图像中对应点之间的几何关系,这些几何模型的参数就是摄像头参数,而这些参数大多数是通^多次实验与计算才能够得到,这个求解参数的过程就称之为摄像头标定(或摄像机标定)。摄像头标定技术一般有以下三种方法:(1)一般标定方法。(2)主动视觉标定方法(3)自标定方法。
2.2边缘检测算法研究现状
边缘检测是视觉系统中数字图像处理与分析的基础内容,在图像处理中起着非常重要的作用,边缘检测算法的好坏直接影响图像处理的结果进而影响系统的精度与稳定性。综合已有的边缘检测技术,其算法主要有分为三类,第一种为微分算子方法。第二种方法为基于局部图像的方法。第三种方法为基于全局的边缘检测方法
现在,边缘检测的主要研究重点是寻找灰度值强度的非连续性、抑制噪声和保持边缘定位精度等三个内容。因此要求不同,采取的边缘检测方法也不相同,甚至会采用几种方法相互结合的手段进行检测。
2.3特征提取算法研究现状
图像的特征检测最基本的有直线检测、圆检测和椭圆检测等。
(1)直线检测研究现状。当前在直线检测领域,使用最为广泛的为霍夫算法和Randon算法。霍夫算法是霍夫在1962年提出的一种在直角坐标系下检测直线的方法通常称为霍夫变换,随后在1972年Duda改进了霍夫变换,通过极坐标系解决了图像的90度死角问题。
(2)圆检测算法研究现状。上述的这些直线检测算法主要针对的直线为直线的变量数减少的情况,但是对直线的变量数增加的情况,其检测效果就不是很明显。因此,在对圆进行检测时,就需要对霍夫算法进行改进,使其能够对变量增多的圆进行检测。
(3)椭圆检测算法研究现状。在检测椭圆图像的算法中,有两种算法应用最为广泛,一种为霍夫变换的改进算法聚类算法,这种算法主要是根据椭圆的几何性质,使其降维,再通过霍夫算法进行检测。屈稳太提出的基于弦中点霍夫变换,就是此类算法。首先是计算出对椭圆的切点方向,然后计算出椭圆的切线方程,最后确定椭圆的方程。另一种算法为最优化算法,例如最小二乘法以及遗传算法等。这些算法都是由下向上的检测算法,都是直接对图像数据进行检查。
3结束语
本文主要论述了视觉伺服系统分类和研究现状。首先介绍了视觉伺服系统的分类包括四种不同的分类方法,详细叙述了摄像头现阶段主流的的三种标定技术,边缘检测主流的三种检测算法,最后论述了直线、圆、椭圆等三种特征的提取算法。
参考文献
[1]杨楠.PUMA560机械臂视觉伺服系统设计[D].哈尔滨工业大学,2013.
[2]王鹏飞.基于RM-501机械臂视觉伺服系统的研究[D].哈尔滨工业大学,2009.
[3]王麟琨,徐德,谭民.机器人视觉伺服研究进展[J].机器人,2004,03:277-282.
计算机视觉就业方向范文篇7
关键词:信息社会、计算机、设计、艺术设计、影响
计算机作为当今科技的产物,存在于社会的文化当中,我们不能单纯地认定它只是一种技术工具,它是人类和信息世界的媒介,是人类文化与科学技术情感交融的结晶,是人类社会文明发展的必然产物。人们通过与它的交流来把握创造世界,创造出符合发展需要的新生事物。它的成功不仅在于联通了科学与艺术,更重要的是它让人类把握设计传统,更自由地架设未来。现代设计在不摒弃传统的设计方式的同时,又包含着电子世界的语言,在现实中发展且改变着现实,真正为人类服务。
信息社会计算机对设计的影响
进入信息社会的设计,设计对象和心理环境发生了很大变化,大量与现代化科技有关的新产品层出不穷,而传统设计的产品也不断吸纳现代信息的元素,使设计出的产品在产品本身和制造方面都带有了智能化的色彩。设计的产品更具人性化,冷冰冰的产品拥有了人情味,使人们在科技包围的环境中不再感到陌生,这也成了现代设计的准则。通过人类理性和科学的研究,发展了系统设计等方法,在理论基础上为计算机辅助设计创造了条件。计算机图形用户界面及其他人机交互方法的出现,使辅助设计真正得以实现。
随着时代的发展,当今的企业在产品中注入了更多人类生活方式的因素,技术更智能化、人性化,创造出的产品更适用于不同文化背景的使用者。对设计来讲,越来越需要多面手,特别是计算机对设计的渗透,使设计师的知识结构、职业技能、工作程序、设计管理等方面都要做出调整。在平面设计行业,有许多没有经过艺术设计训练的计算机操纵者,凭借对软硬件的了解,成了行业的设计师,这也反映出设计主体的素质在改变。
从人类的设计史来看,在工业革命之后,设计与制造开始分离并由不同的人来完成各自的工作。当产品完成之后,设计者再根据产品、静态图来讨论设计的功效。而使用者与产品之间是动态的,是多种感觉的一种直接交互的使用过程,这与设计者与产品之间的关系具有很大的不同,设计者还得依靠使用者的反馈才能了解设计的成效,这造成了设计与使用的不连续性。而将计算机作为设计的辅助工具后,消除了设计与使用之间的不连续,使设计能在模拟真实使用的情景下完成,从而提高了设计的功效,在很大程度上消除了传统设计手段的局限,使构思、设计、制造和使用更具连贯和一致性,从而增加了人们对现代化设计工具的依赖。在此基础上,今天的设计直接面对人类大众,计算机的发展让我们看到人类的思想和情感开始在更多的产品中表现出来,使产品更人性化也更具人情味。借助于计算机技术,设计的产品正向着融合人的感觉,能与人交流的趋势发展。
信息社会计算机与艺术设计的联系
当前,信息技术已经逐渐渗透到人类生存环境的方方面面,以信息技术为内涵的各要素与人类活动相互作用,构成了我们赖以生存的环境空间。人类生产和创造活动中,实用与美观相结合,赋予物品物质与精神的双重作用,这是人类设计活动的一个基本特征。人类在享受物质生活的同时又产生了对精神生活的向往。高质量的精神生活带给人类的是更为愉悦的享受,它能陶冶人的情操,赋予人高尚的品质和向往美好生活的激情。
艺术为我,是一种十分个性化的自我表达行为。设计为他,立足于解决人与物之间的关系问题,它的变化反映着时代的物质生产和科学技术水平。艺术设计有相对的界限,这界限可以涵盖精神的艺术和物化的艺术领域。电子计算机的发明和运用,多媒体网络的逐渐普及,信息高速公路的建立,使计算机成为艺术设计的好帮手,使科学和艺术设计更密切地结合,为人类的生活服务。在平面设计中,通过计算机可以在作品中表达多种感觉。比如将各种材质输入到计算机当中,使之与图形或文字相结合就能将触觉肌理引入到视觉传达上,使人联想感觉到材质的效果,产生软硬、粗细、光滑等对比的触觉感受,还能产生通透性能的视觉体验。利用计算机模拟摄影的技法,改变形体和色彩,就能使图像发生改变,产生动感。
在环境设计中,计算机的三维建模及渲染技术使得设计师在设计制图时能时时观测到具有变化的微缩模型和丰富的材质灯光,因视点具有移动性,所以它能表现出物体的各个侧面及细部,同时能在空间的视点中对形体进行修改,同时还可以对材质效果、灯光的类型及分布做合理的设置,这使设计者对于问题的思考和解决能够从接近现实的三维空间入手,帮助设计师高水平地完成建筑艺术设计图纸,方便后期的施工和效果再现。由于动画软件的出现,就更方便了人类对动态物体的研究,比如物体之间的穿行、运动状态、爆炸效果等等,都可以将设计结果更直观更生动地表现出来。
在21世纪的今天,“艺术设计”的概念已经越来越多地为人们所认同和接受。“平面设计”“工业设计”“环境(室内)设计”“服装设计”“陶瓷设计”和“都市设计”的概念为人们所熟悉。因此,要想做出优秀设计就必须了解市场、了解科学、了解目的群体。单凭这些还不够,更重要的是要加上设计者的个性思维和设计提炼,将其合二为一,加以科学加工,使其成为优秀的艺术设计作品。
计算机这一新的设计工具所产生的冲击彻底改变了我们的文化和生活,设计(艺术)会因计算机的辅助设计经历深刻的变化。但其本质将会保持不变,将始终致力于为人类服务。利用最先进的科学技术,可以使设计师依靠自身的艺术修养和科学技术,保持敏锐的觉察力和艺术设计能力,在未来的世界中更好地满足人们追求时尚、追求科学的心理需求,使人类走向繁荣。
参考文献:
[1]《数字化时代的城市生活》,米切尔、W.J.伊托邦著,吴启迪、乔非、俞晓译,上海科技出版社,2001年
计算机视觉就业方向范文1篇8
最近几年,自动驾驶成为当下最为热门的科技领域之一,许多企业纷纷将目光转向该领域,诸如谷歌、百度、英特尔、Uber、丰田、本田、福特等科技和车企巨头都在该领域有相关研究。在国内,除了高举无人车大旗的百度,许多创业公司也在研究自动驾驶技术,图森互联即其中之一。
9月19日,国内计算机视觉与人工智能创业企业图森互联宣布,他们研发的计算机视觉与深度学习算法在全球最权威、最具影响力的自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上均获得世界第一。仅KITTI数据集中,图森互联获得目标检测三个单项、目标追踪两个单项、道路分割四个单项,共计九个单项的全部世界第一。
那么,在当前,自动驾驶技术究竟有哪些等级?市面上的自动驾驶技术都有哪些阵营?产品落地情况又如何?基于这些问题,《汽车观察》记者对有着十年并行和分布式运算研究经历、曾是淡马锡国家实验室研究员、现为图森互联联合创始人的南洋理工大学博士郝佳男进行了独家采访。以下为部分采访实录:
《汽车观察》:图森做自动驾驶技术项目的初衷是什么,单纯就是看到了这块的市场需求与前景吗?
郝佳男:首先,图森是做图像识别SaaS起家,在技术上有一定的积累,自动驾驶所用到的计算机视觉感知技术和图像识别SaaS在很多方面是同源的;另外,对于自动驾驶,特别是主要基于视觉传感器的自动驾驶,有很高的技术壁垒,图森能够很好地发挥自己的长处;第三,运营车辆对自动驾驶和无人驾驶存在较大的需求,因为自动驾驶和无人驾驶可以极大地减少这些运营车辆企业的人力成本和潜在的安全风险,而且无人车可以持续运营,这对企业来说是生产效率的飞跃。
《汽车观察》:目前,在国际上自动驾驶技术分为几个等级?图森的自动驾驶技术又是几级的技术?在国内外算是一个什么水平?
郝佳男:目前自动驾驶有L1-L5五个等级,L5是人们最期待的完全无人驾驶水平,众人熟知的谷歌无人驾驶在目前只能算是L4级水平。图森的主要目标是通过低成本传感器实现可靠的L3级别无人驾驶。
目前行业内的标杆是以色列的Mobileye。但目前Mobileye量产的芯片依然使用传统非深度学习算法,因此在一些特定场景中(如车侧面、非常见车型等)会出现错误。最近Tesla发生的车毁人亡事故就一个例子。图森的技术方案基于深度学习构建,能够实现更可靠的性能。
《汽车观察》:目前的自动驾驶技术有哪几类?它们的本质区别在哪里?分别有哪些优势?
郝佳男:目前,市面上共有两种解决方案:一种是计算机视觉为主、毫米波雷达为辅的低价解决方案;另一种是激光雷达为主、以摄像头为辅的高价解决方案。
以谷歌和百度为代表的是以激光雷达为主、摄像头为辅的高价解决方案,成本在50万以上。比如Google的无人驾驶车辆,在这个技术路线中,车辆完全由人工智能来驾驶,可以将车辆的方向盘、油门和刹车去掉,同时,为了增加技术的可靠性,Google无人驾驶汽车以激光雷达为核心,一个64线的激光雷达成本在7万美元左右,整体解决方案较贵。另外,激光雷达的硬件可靠性一般,也很难达到车规需求。但是这两家上市企业出于市值管理的考虑,在这方面不计成本。对他们来说,新技术所能达到的程度带来的新闻和公关效力,会大幅地抬高股价。但这种成本过高的技术,在商业化应用时会比较困难。
而选择低价解决方案更容易被车厂、受众所接受。以特斯拉、奔驰、沃尔沃等车厂为代表的渐进型自动驾驶,即先从辅助驾驶开始做起,在特定场景、或是特定的封闭结构化路段适用,做出紧急刹车、自适应巡航、车道保持、自动泊车等动作,后续涉入高度自动驾驶,即除了结构化路段外,还能在非结构化道路上自动驾驶。
图森就属于低价解决方案,即选择低成本的硬件(毫米波雷达、视觉传感器、高性能SoC),配合计算机视觉算法来降低总成本。传感器承担的精度要求降下来,那么对算法的要求就比较高了。
《汽车观察》:目前的自动驾驶技术是如何实现自动驾驶的?能实现到怎样程度的自动驾驶?
郝佳男:自动驾驶系统使用了多种传感器来感知,其中可视为广义“视觉”的有超声波雷达、毫米波雷达、激光雷达(LiDAR)和摄像头等。毫米波雷达和激光雷达承担了主要的中长距测距和环境感知,而摄像头主要用于交通信号灯、车辆、行人等物体的识别。
摄像头拍到的视频其实也是由一帧帧图像形成。拍下来是一回事,通过计算得出图像里的行人、车辆、信号灯等结构化数据则是另一回事。在过去,这被视为不可想象的任务。但深度学习的发展让基于视觉的感知技术获得了大幅度提升,基于视觉的环境感知变得可行了。
《汽车观察》:目前,市面上的自动驾驶技术在产品化的情况如何?有没有落地的产品正在运营?
郝佳男:对于整个自动驾驶行业来说,产品化需要漫长的时间,可能需要2-3年的时间。图森主要还是为主机厂和Tier1(一级零部件供应商)提供以摄像头为主、配合毫米波雷达和视觉芯片的、低成本的自动驾驶解决方案。
《汽车观察》:自长安的无人驾驶路试后,国家开始出台相关禁止自动驾驶路试的政策,这样一来,整个研发自动驾驶技术的企业又该如何测试自己的技术?如何看待国家有关自动驾驶这方面的政策?
计算机视觉就业方向范文篇9
关键词:高等教育计算机专业课程教学改革
随着“国务院关于大力发展职业教育决定”的出台,我国职业教育的发展又进入了春天。各种专业在高职院校中迅速发展壮大,曾经的老大计算机专业不仅没有发展,人数还不断下滑。“让无业者有业,让有业者乐业”。高职院校的教育就是就业教育。学生不选择计算机专业,肯定是就业出现了问题,也就是专业建设出现了问题。根据本人从教多年的经验,谈一下高职院校计算机发展建设的一些想法。
一、高职院校计算机专业学生就业难的原因
当今高职学校学生在就业过程中有这样突出的矛盾:一方面毕业生找不到对口的工作;另一方面用人单位在大量的应聘者中又找不到适用的人才。这种严重的供求矛盾表明:计算机专业人才培养产需之间严重脱节。而造成这样的现象,归纳有如下几个原因:
(一)课程设置不合理
现在高职院校计算机专业开设的课程一般有:计算机基础(Office办公软件)、VB程序设计,C语言、Flas制作、网页设计等;但是目前存在的问题是:学生们能把办公软件学好,可是计算机专业班学生是全男班,去公司做文员不大可能。因此现在感觉计算机专业的学生在就业市场上,能从事本专业工作的很少、很多人不得不改行干别的工作。
(二)教学方法落后
目前大多数高职学校仍然承袭传统的教育理念,沿用陈旧的教学方法,学生学习效果不佳,理论听不懂,操作不熟练。在这样的教育模式下,导致学生动手能力差、未具备高职学生职业技能强的特点,难于适应IT发展对人才的要求。
(三)教师实际操作能力不足
高职学校教师长期从事教育教学工作,无法进入企业体验生活,对IT行业缺乏经验,无法及时把握IT行业的脉搏。教师缺少职业培训,技术更新滞后、缺乏教育创新机制,严重影响教学质量。
二、高职院校计算机专业发展必须“四化”
(一)专业设置必须行业化
传统的计算机专业就只有计算机应用方向,开的课程多而且杂,没有针对性。学生不知道本专业究竟学什么,学习后究竟能干什么。而如今,随着计算机的普及,计算机已经进入社会的各个行业,不同的行业,计算机的作用不同。这就要求高职学校的计算机专业方向的设置必须细化,市场化,行业化。根据市场需要,高职计算机专业就应该分为自动办公方向、平面设计方向、计算机维护方向、动漫制作方向、网络搭建和维护方向等。不同的方向应该有不同的课程设置,如自动化办公方向,除了计算机基本操作维护、办公软件外,还应该加强秘书方面的培训。平面制作方向则应该加强美术方面的培养。
(二)教学手段、方法必须多样化
从信息论角度看,人的信道特性触觉信道带宽为1,听觉为100,视觉为10000,所以要交换信息,就要充分利用视觉信息。因此,计算机辅助教学以它直观、形象、生动的演示功能,给学生带来多感官、多种类型的刺激,而且能充分调动学生学习的自主性,具有与传统的教学手段无法比拟的优势,是一种适应21世纪素质教育要求的信息化教育教学模式。在计算机专业课程教学中应该多使用多媒体教学,多用课件,通过图文并茂、视频动画以直观教学的形式,提高学生的学习兴趣,使其处于一种积极主动的精神状态;利用人机交互,可以即时获得信息反馈,灵活控制教学内容,使其更加直观形象,更易于理解,提高讲课的效率和教学效果。
另外,在计算机专业课中还应该多使用“任务驱动法”:“任务驱动”是一种建立在建构主义学习理论基础上的教学法,学生的学习活动必须与任务或问题相结合,让学生带着真实的任务去学习,为每一位学生的思考、探索、发现和创新提供了开放的空间。教师把课堂教学目标分解为一个个“任务”,而且这些“任务”具有可操作性。
(三)学生技能强化必须重复化
高职院校学生的优势是操作熟练。但现在的学生学的东西多,但却熟练的少。办公自动化的打字速度只有50字每分钟,平面设计方向的photoshop操作只能用鼠标等,这样高职学生有何优势可言?同时计算机课程是操作性较强的课程,所以学校应尽最大可能补充和更新计算机设备,严格管理,提高使用效率,最大限度地增加学生使用计算机的时间,在课程安排上,相关方向的核心课程必须重复强化,课程宁愿少,也必须让学生掌握熟练。
(四)教师知识必须前沿化
作为职业学校的教师,继续教育是教育工作中不可缺少的一部分。计算机的发展日新月异,要使计算机教师跟上行业发展的趋势,必须要求其不断地自学或下企业锻炼或到高等院校深造充实自己,从而及时了解行业的情况及时掌握应有的技能能力。计算机教师要培养出符合时代需要的应用性高素质人才,自己就必先有新的教学理念并且不断更新自己的知识与技能,扩大自己的专业视野。只有这样才能在教学中具有针对性,而让学生真正掌握最新专业知识和技能,增强他们的职业适应能力,从而提高他们就业的针对性和稳定性,真正为社会培养有一技之长的应用型人才。
参考文献:
计算机视觉就业方向范文篇10
【关键词】株高HALCON双目视觉误差修正
1引言
计算机视觉技术是近几年来发展较快的信息处理技术,随着图像处理技术的专业化、计算机硬件成本的降低和速度的提高,计算机视觉的应用已变得越来越广泛,其中不乏在农业中的应用。
株高是植物生长指标的重要参数,是一个物种争夺阳光的能力的主要决定因素[1]。对于作物来讲,株高参数是作物产量预估不可或缺的参数。
然而对于具体的利用机器视觉方法直接测量株高的研究还是比较少的,本文就是利用HALCON软件,采用双目计算机视觉方法来实现株高的测量。
2双目视觉原理
双目视觉的基本原理是从两个视点观察同一景物,获取不同视角下的两幅图像,然后根据三角测量原理计算不同图像对应像素间的视差(disparity),获取景物的三维信息,从而实现场景三维重构。
根据两个摄像机位姿的不同,双目视觉有多种模式,常用的有双目横向模式,双目横向会聚模式以及双目纵向模式(也称双目轴向模式)。
为了增加测量精度,基线一般不能太小,但基线长度也不可太长,否则,由于物体各部分相互遮挡,两个摄像机可能不能同时观察到目标点。
图1是会聚双目成像中的视差原理图。图中给出两镜头连线所在平面(XZ平面),两镜头中心间的距离(即基线)是B,两光轴在XZ平面相交于(0,0,Z)点,交角为(未知)。现在来看如果已知像平面坐标点(x1,y1)和(x2,y2),如何求取世界点W的坐标(X,Y,Z)。
根据相似三角形的关系可以很明显得出:(2.1)
(2.2)
(2.3)
其中r为从(任一)镜头中心到两系统会聚点的距离(未知)。将式(2.2)和(2.3)联立,可得:
(2.4)
上式把物体和像平面的距离Z与视差d直接联系起来,若想求解式(2.4),除视差d外,还需要知道x1和x2本身。另外,由图1可以得到:
(2.5)
代入式(2.2)或(2.3)可得:
代入式(2.2)或(2.3)可得:
(2.6)
现实测量中,两相机的光轴与世界坐标Z轴的夹角不可能相等,不过即便如此,也只会引入几个待确定的三角函数,而这些三角函数在相机标定时即可确定。
3测量过程
实现该测量过程包括如下几个功能模块:图像获取、摄像机标定、特征提取、立体匹配与三维信息恢复、后处理。本实验采用是分比率为960×720的双摄像头。被测区域大小约为56cm×42cm,所以采用的标定板应为被测区域1/3大小的HALCON专用的200mm标定板。标定数为24×2张图片。利用HALCON自带的标定助手,可以轻松实现单目标定。
双目标定时,需要有15张以上左右相机相同时刻拍摄的标定板的图片。再利用for循环,find_caltab函数,find_marks_and_pose函数以及binocular_calibration函数,可以实现双目标定。将标定过程中,获得的摄像机的内参以及两个摄像机相对位置关系作参数传递给函数gen_binocular_rectification_map,可以很好地实现双目视觉校正的目的,得到两幅校正后的图像,还能得到校正后虚拟立体视觉系统中两个摄像机的内参和外参。
不同种类的植物其株高定义不同,测量方式也不尽相同。本文研究的株高只针对直立型的,是指从植株根部露出土壤部分到植株最高处的株高。
先利用gen_binocular_rectification_map函数为map_image函数提供控制参数,再通过map_image函数对采集到的图像做校正处理,利用threshold函数,fill_up_shape函数以及select等函数找出校正后图像中植株的最低和最高点,利用intersect_lines_of_sight函数,可获得植株最低点和最高点的真实三维坐标,最后通过几何运算得到双目测量结果。
我们在图像采集时就应该考虑到,摄像头应该稍微带一点俯拍的角度,保证左右两幅图像上最高处均为现实坐标中的最高处。切忌俯拍角度不可太大,否则由于拍摄角度而引起的像差会很大,对结果将会有很大的影响。
经过以上几步骤得到的三维坐标,常因各种原因而存在一定的误差,需要进行误差校正。我们对已知高度的对象进行了测量,得出结果如表1:
通过上述数据得出的修正关系如下:
y=-0.0002x2+1.0699x(3.1)
其相关系数R2=0.9993
4实验结果
我们对三种植物进行了测量得出的结果如下:
从测量结果中可以看出,修正后相对误差控制在2%之内,可以接受。误差引入的原因可能如下:
1、标定板的选择决定了标定精度。一定要选用高精度的标定板,且标定板的大小应约为测量范围1/3大小。
2、相机是图像获取的根本,高质量的图像离不开高分辨率相机,但是高分比率,高解析度的相机又会带来成本上的提升。本文中,对于390.0mm左右的对象,1个像素的误差可以带入约0.4mm的实际误差。
3、本文所采用的算法只能针对比较理想,比较直的植株,算法的不断优化,才能不断减少误差,提高精度。
5结语
本文介绍了一种基于HALCON的,利用双目视觉测量株高的方法。对于直立型植物,通过对立体匹配与三维信息恢复结果的误差修正,其株高测量相对误差不超过2%,方法具有一定的可借鉴性。
参考文献
[1]章毓晋.计算机视觉教程[M].北京:人民邮电出版社,2011.
作者简介
郝慧鹏(1988-),男,内蒙古乌兰察布人,硕士研究生,主要研究方向为计算机视觉技术在农作物检测上的应用。
指导老师
田跃(1956-),男,北京人,北京科技大学数理学院物理系教授,北京市弱磁检测及应用工程技术研究中心副主任。
作者单位
计算机视觉就业方向范文篇11
虚拟现实
简称VR(VirtualReality),也叫灵境技术,是一套由计算机仿真系统创建出来的虚拟世界。通俗讲,就是使用技术手段,让人身临其境,并可以与这个环境进行交互。这套技术主要包括模拟环境、感知、自然技能和传感器各等方面,除了计算机图形技术所生成的视觉感知外,还有听觉、触觉、力觉、运动等感知,甚至还包括嗅觉和味觉等多感知。目前,虚拟现实技术已经应用于医学、军事航天、室内设计、工业仿真、游戏、娱乐等多个行业。
认知计算
认知计算出自于IBM人工智能超级计算机“沃森”的称谓,而现在,它更多的代表着一种全新的大数据分析方式。随着信息的增加,计算机可在已有经验的基础上随着时间推移,以学习的、交互的方式,随着数据的进一步增长逐步提高认知的分析行为,就像大脑会自然而然地做事情,“认知计算”是人工智能和大数据的“联姻”。
深度学习
深度学习DeepLearning的概念源于人工神经网络的研究。机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。自2006年以来,机器学习领域,取得了突破性的进展。图灵试验(图灵,计算机和人工智能的鼻祖),至少不是那么可望而不可及了。在技术手段上不仅仅依赖于云计算对大数据的并行处理能力,而且依赖于算法。这个算法就是DeepLearning。借助于DeepLearning算法,人类终于找到了如何处理“抽象概念”这个亘古难题的方法。
DT时代
顾名思义,应该是DataTechnology,数据处理技术。这个词虽然很早就被人提出了。但是直到2015年3月的IT领袖峰会上,马云演讲中提出“从IT时代走入DT世界”之后才在中国火热起来。马云称,二者的区别在于,IT时代以“我“为中心,DT时代则以“别人”为中心,让别人更强大,开放和承担更多的责任。
量子计算
量子计算,是当前最热门的研究领域。相对于普通计算机,基于量子力学特性的量子计算机,拥有超乎想象的并行计算与存储能力,求解一个亿亿亿变量的方程组,具有亿亿次计算能力的“天河2号”需要100年,而万亿次的量子计算机理论上只需要0.01秒就可解出。当量子计算机应用之时,现在的密码破译、基因测序等科学难题,将可迎刃而解。
人脸识别
是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。人脸识别产品目前已广泛应用于金融、司法、军队、公安、边检、政
府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。形象地说,就是给计算机安装上眼睛(相机)和大脑(算法),让机器能够感知环境与对象。我们中国人的成语“眼见为实”和西方人常说的"Onepictureisworthtenthousandwords"表达了视觉对人类的重要性。不难类比,机器有了视觉以后的前途是不可估量的,例如:智能机器人、智能视频监控、新型人机界面等等。
人工智能
人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。其所使用的技术旨在根据数据和分析赋予计算机能够做出类似人类的判断。该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。
智慧城市
“智慧城市”是一个非常火热的词。但在很多人看来,这一高大上的话题显得既陌生又遥远。其实,智慧城市建设早已通过各种不同的展现方式渗入到了我们的日常生活中,并从众多方面来改变我们的生活,比如智能家居、智能可穿戴设备以及工业4.0等。智慧城市实际上就是运用信息和通信技术手段感测、分析、整合城市运行核心系统的各项关键信息,从而对包括民生、环保、公共安全、城市服务、工商业活动在内的各种需求做出智能响应。其实质是利用先进的信息技术,实现城市智慧式管理和运行,进而为城市中的人创造更美好的生活,促进城市的和谐、可持续成长。
独角兽
独角兽企业原本是美国风投界的术语。用来描述估值超过10亿美元的初创公司。这些企业最初通常是以软件为主,但现在渐渐包括了其他领域的行业。到2015年8月止,在独角兽企业名单上排行在前的企业有Uber(交通),小米(电子消费品),Airbnb(住宿),Palantir(大数据)和Snapchat(社交媒体)。
由独角兽衍生而来的词:
十角兽:指估值超过100亿美元的初创企业。
超级独角兽:super-unicorn,指估值超过1千亿的公司,例如Facebook。
独角鲸:加拿大技术独角兽一般被称为“独角鲸”。
雾计算
雾计算(FogComputing)是云计算的延伸概念,是对云计算的扩展。由思科(Cisco)首创。这个因“云”而“雾”的命名源自“雾是更贴近地面的云”这一名句。有别于云端计算,雾计算所采取的架构更分散、更接近网路边缘,将计算、通讯、控制和储存资源与服务,分配给用户或靠近用户的设备与系统。雾计算是以个人云,私有云,企业云等小型云为主,以量制胜,强调数量。
区块链
对大众而言,区块链的概念最先出现在比特币的相关论述中。区块链就是比特币的底层技术基础。比特币只是区块链的最为出名的一个应用。区块链(Blockchain)是在没有中央控制点的分布式对等网络,使用分布式集体运作的方法,实现一套不可篡改的,可信任的数据库技术方案,其特点为去中心化存储、信息高度透明、不易篡改等。通俗点说,就是利用计算机程序在全网记录所有交易信息的“公开大账本”。数据区块记录了整个数字货币网络上的交易记录数据,并且这些数据是被所有数字货币节点共享的。通过数据区块,我们可以查询到每一笔数字货币交易的历史。
区块链的核心,是一个全球性的分布式数据库,它不仅仅能够记录金融交易,它几乎可以记录所有有价值的东西:出生证明、死亡证明、结婚证、教育程度、财务帐目、医疗过程、保险理赔、投票……任何可用代码来表示的东西。
数据湖
计算机视觉就业方向范文篇12
关键词:印制电路板;图像处理;机器视觉;PCB裸板;自动光学检测;缺陷检测文献标识码:A
中图分类号:TP391文章编号:1009-2374(2016)09-0010-05DOI:10.13535/ki.11-4406/n.2016.09.005
我国是全球第一大PCB生产基地,作为电子产品承载体的电路板,其集成度和产量不断在提高。为了保证电子产品的性能,电路板缺陷检测技术已经成为电子行业中非常关键的技术。建立在图像处理算法基础上的机器视觉检测技术与传统的人工检测技术相比,提高了缺陷检测的效率和准确度。因此,设计一种高效精准的机器视觉检测电路板缺陷的系统,具有非常重要的现实意义。评估印刷电路板质量的一个重要因素就是表观检测,PCB的表观质量对产品性能及成品使用安全有着极大的重要性。而伴随着近年来在工业生产领域崛起的计算机视觉,当前表观缺陷检测和分类识别的研究方向已经转向了利用计算机视觉技术来实现。计算机图像处理识别技术这种基于计算机视觉的检测技术成功取代了传统的PCB缺陷检测方法,在自动光学检测系统众多应用中占据了相对重要的地位,一跃成为PCB生产业表观缺陷的主要检测方法。
图1系统框图
因此本文通过设计AOI自动光学检测系统,搭建较为简单的PCB缺陷自动检测系统的实验平台,对PCB中四类较为关键、常见的缺陷进行检测、分析、识别、判定,为研究推广PCB缺陷自动检测系统开拓应用前景,如能实现工业上的产业化检测,将有高额的经济收益。本文侧重对PCB中的四类较为关键、常见的缺陷进行检测、分析、识别、判定,并且仅搭建了较为简单的PCB缺陷自动检测系统的实验平台,即通过复杂算法对采集到的图像进行处理、配准、对比,从而得出PCB缺陷类型及对其进行标识。如图1所示。
1硬件设计方案
PCB缺陷检测的总体系统设计方案主要是基于自动光学检测技术来搭建PCB缺陷检测系统,硬件设计是使用CNC-T程控光源高精度影像测试系统操作台,对待测电路板进行图像采集,再通过VS2010软件所编写程序处理,得出待测电路板的缺陷种类。整个系统主要分为运动控制、光源、图像采集、图像处理四个模块,分模块简要阐述了实验过程、所需设备以及软件算法,搭建了一个相对完整的系统工作平台。
图2CNC-T程控光源影像操作台
该设备具有测量元素种类齐全、手动测量、自动对焦等多种功能,使用该设备采集图像进行二维检测,测量软体为YR-CNC,将图像储存至电脑后便由VS软件进行图像处理。实验组成如图3所示:
图3实验系统框图
1.1运动控制模块
本系统运动流程为:被检测的PCB在检测台上,通过步进电机XY轴运动到摄像机拍摄区域,CCD摄像机固定在工作台上方(Z轴),通过Z轴的运动实现聚焦。如图4所示:
图4平台运动示意图
设备工作台台面尺寸为746mm×506mm,承载玻璃面尺寸为452mm×354mm,有效测量行程为400×300×200。本装置既可通过软件驱动自动采集图像,也可以通过手动控制,移动并聚焦采集待测PCB的图像。
1.2光源模块
辅助光照――采用的是正向和背向光源这两种辅助光照。其中正光源和摄像头同侧,均位于Z轴上,正光源主要用于检测待测物体的表面特征。背光源位于检测台面下方,与正光源处于同轴反向关系,背光源能突出待测物体的轮廓特征,常用于检测物体轮廓尺寸。
图像采集:分别利用正光源突出PCB表面如走线、过孔和焊盘等主要特征,而下光源主要使PCB的轮廓尺寸和过孔产生强烈的轮廓对比。
光源:使用的是高度集中照明光源中心的LDR系列,由于该光源的伞状结构紧密排列着LED且采用了CCS独创的柔性板,使之成为LED照明系统的标准模式。照明系统如图5所示:
图5照明系统
1.3图像采集模块
图像采集模块是由图像采集卡、相机和镜头组成的,该模块是图像配准阶段的硬件基础。计算机采集图像的媒介就是相机,而相机按照不同原理又分为多种,常见的有CCD(ChargeCoupledDevice)和CMOS(ComplementaryMetalOxideSemiconductor)两类。本系统采用的是CCD1/2英寸43万像素彩色摄像头和高清晰度0.7~4.5X变焦倍率镜头,显示分辨率为0.001mm。
1.4图像处理模块
通常获得的图像将受到工业现场环境、光照等条件的干扰,计算机所获得的图像质量多数参差不齐,图像的清晰度不一致,大大增加了PCB缺陷检测的难度,所以在利用复杂算法检测、识别PCB缺陷前要先对图像进行预处理。
本图像处理模块主要通过VS软件在OpenCV计算机视觉库的基础上,通过一系列算法对图像进行处理对比。
2系统软件设计
2.1OpenCV
OpenCV(OpenSourceComputerVisionLibrary)是一个跨平台的可以运行在Linux、Windows和MacOS操作系统上的基于(开源)发行的计算机视觉库。它重量轻而高效,开放了多种接口如MATLAB、Ruby和Python等,并且在计算机视觉和图像处理中大多数通用的算法都是被允许的。OpenCV可用于开发实时图像处理、计算机视觉和模式识别方案,它提供了多种函数,实现了大量的计算机视觉算法,算法涵盖了从最基础的滤波至以高级的物体检测。OpenCV实际上是一堆C和C++语言源代码文件,许多常见的计算机视觉算法由这些源代码文件实现。如C接口函数cvCanny()实现Canny边缘检测算法。它可直接加入到我们自己的软件项目编程中,而无需去编写自己的Canny算子代码,就是没有必要重复“造轮子”。
根据OpenCV中源代码文件巨多的特点,以算法的功能为基准,将这些源文件分到多个模块中,如core、imgproc、highgui等。将每个模块中的源文件编译成一个库文件(如opencv_core.lib、opencv_imgproc.lib、opencv_highgui.lib等),用户在使用时,仅需在自己的项目中添加要用的库文件,与自己的源文件一起连接成可执行程序即可。
OpenCV计算机视觉库的出现,是为了使人们利用方便快捷的计算机视觉框架,在计算机视觉领域可以更加轻松地设计出更为复杂的应用程序。OpenCV涵盖了多种计算机视觉应用区域,如用户界面、信息安全、医学影像学、工厂产品检验、立体视觉、机器人和摄像机标定等,约有500多个函数。因为计算机视觉与机器学习是相辅相成的,所以OpenCV也开放了MLL(MachineLearningLibrary)机器学习库。MLL除了在视觉任务相关中使用,也可以很容易地应用到其他机器学习中。
2.2MicrosoftVisualStudio2010
VisualStudio是微软公司推出的开发环境,是同行业中目前最流行的Windows平台应用程序开发环境。VisualStudio2010于2010年4月12日,其集成开发环境(IDE)已被重新设计和组织,变得更简单了。
VisualStudio2010同时带来了NETFramework4.0、MicrosoftVisualStudio2010CTP(CommunityTechnologyPreview――CTP),并且支持开发面向Windows7的应用程序。除了MicrosoftSQLServer外,它还支持IBMDB2和Oracle数据库。目前有专业版、高级版、旗舰版、学习版和测试版五个版本。VisualStudio的用处十分广泛,不仅可被用来基于Windows平台创建Windows应用程序和Web应用程序,还可被用来创建智能设备、Office插件和Web服务等应用程序。微软的VisualStudio2010将成为一个版本的经典,这是相当于6.0版本。该版本可以自定义开始页,新功能还包括:(1)C#4.0中的动态类型和动态编程;(2)多显示器支持;(3)使用VisualStudio2010的特性支持TDD;(4)支持Office;(5)QuickSearch特性;(6)C++0x新特性;(7)IDE增强;(8)使用VisualC++2010创建Ribbon界面;(9)新增基于.NET平台的语言F#。本课题将基于OpenCV计算机视觉库使用MicrosoftVisualStudio2010开发环境,通过编辑算法实现PCB缺陷检测。
3图像预处理
要使用计算机对图像进行处理,所得到的连续图像就必须被转换为离散的数据集,这是因为计算机只能处理离散度数据,这一过程我们称之为图像采集。图像采集由图像采集系统实现,如图6所示。图像采集系统的三个主要模块是成像系统、采样系统和量化器。
图6
将整理出的字符图像交予识别模块来识别,被称为图像的预处理。PCB的图像预处理包括灰度化、增强、滤波、二值化、配准等,处理后的PCB输出的图像质量将得到改善,在很大程度上使得该图像特征更直观,方便计算机分析和处理。PCB的图像预处理为整个PCB缺陷检测系统的核心部件,很大程度上决定了检测的准确性。图像预处理流程如图7所示:
图7图像预处理流程图
4PCB缺陷检测
本文针对四种常见缺陷:断路、短路、毛刺(凸起)、缺损(凹陷)进行检测研究。在这四种缺陷中,最为严重的缺陷类型是断路和短路,它们将会使整块板子失去本来的功能;而凸起、凹陷也可能影响到PCB在使用过程中的稳定性能。如图8所示为几种常见的缺陷:
图8常见电路板缺陷
4.1PCB缺陷的检测方法
常用的PCB缺陷检测方法有参考法和非参考法两种。要是从概念理解和电路难易程度看,参考法明显更加具有概念直观、电路简单的优势;要是从检测所需要的条件来看,非参考法则在不需要待测PCB与标准PCB进行准确对准这一点上优于参考法。
本课题采用参考法进行PCB缺陷检测。
使用参考法对PCB缺陷进行检测的流程为:(1)确定标准的PCB图像并放入参考库;(2)通过成像设备采集待测PCB图像,进行图像预处理之后,再二值化PCB待测图像,并对其进行连通域提取;(3)然后将处理结果与标准图像进行对比,利用图像相减来判断PCB可能存在的缺陷;(4)进行分类,确定缺陷类型。
4.2图像连通域
像素是图像中最小的单位,每个像素周围有8个邻接像素,常见的邻接关系有两种:4邻接与8邻接。4邻接一共4个点,即上下左右。包括对角线位置的点,8邻接的点一共有8个,如图9所示:
图9领域示图
如果像素点A与B邻接,我们称A与B连通,即有如下的结论:
如果A与B连通、B与C连通,则A与C连通。在视觉上看来,点与点相互连通,形成一个区域,而不是连通的点形成不同的区域。这种相互立体的所有的点,我们称为连通区域。连通区域标记常用的方法有Two-Pass(两遍扫描法)和SeedFilling(种子填充法)两种方法,本课题主要介绍第二种。
SeedFilling来源于计算机图形学,通常应用在填充图形上。思路:以一个前景像素当作种子,而后在处于同一像素值且位置相邻的连通区域,把和种子相邻的前景像素融合到同一组像素中,结果将是获得一个像素集,即连通区域。接下来介绍使用种子填充法实现的连通区域分析法:
第一,重复扫描图像,当得到当前像素点B(x,y)=1时停止:(1)赋予B(x,y)一个label,并将像素位置作为种子,接着将所有位于该种子周围的前景像素都压入栈中;(2)将栈顶像素赋以相同的label值并弹出,接着将全部位于栈顶像素周边的前景像素都压入栈中;(3)重复(2)步骤,直到栈为空。此时,图像B中的一个像素值被标记为label的连通区域便被找到了。
第二,在扫描结束前,重复第一个步骤,由此可以获得图像B中所有的连通区域在扫描结束后。
扫描所得的连通域如图10所示:
图10图像连通域提取
4.3缺陷识别
缺陷识别具体特征如表1所示:
表1缺陷特征
缺陷种类二值图像面积连通区域数
断路减少增加
短路增加减少
凸起增加不变
凹陷减少不变
第一,短路和断路。在出现短路缺陷时,待测图像与标准图像相比,其所包含的连通区域数将会减少。同理可得,在出现断路缺陷时,待测图像与标准图像相比,其所包含的连通区域数将会增多。因此,断路和短路缺陷便可利用比较连通区域数来判定和识别。
第二,凸起和凹陷。凸起缺陷将导致导线和导线、导线和其他导体间的间隙变小,而凹陷缺陷将导致导线和导线、导线和其他导体间的间隙变大,二者均会导致PCB使用过程中出现不稳定状态。而观察可知,这两种缺陷的连通区域相同,差别在于各自二值化面积的大小,所以可以通过计算该待测图像的连通区域面积来识别凸起、凹陷缺陷。
识别过程:将经过图像预处理的待测PCB图像与标准图像进行对比后,通过算法找出缺陷。比较二者的连通区域数,若前者大于后者,则标定该缺陷点为断路,反之则为短路;若二者连通区域数相同,则比较二值化图像面积,若前者大于后者,则标定该缺陷点为凸起,反之则为凹陷。检测流程如图11所示:
图11PCB缺陷检测流程图
5系统实验
本文使用CNC-T程控光源高精度影像测试系统操作台,结合VS2010软件基于OpenCV计算机视觉库的算法编程来实现PCB的缺陷检测。整体实验过程为:手动控制操作台捕捉、聚焦、采集待测PCB的图像,采集到的图像与标准图像进行对比、识别,得出缺陷种类并显示结果。
本课题一共就所研究缺陷类型,做了40组实验,通过实验结果计算正确率。如表2所示:
表2实验结果统计
缺陷类型实验次数正确率
断路10100%
短路10100%
凸起10100%
凹陷10100%
针对不同电路板图中出现的同种断路类型进行检测,效果如图12a、图12b、图12c所示,可准确检测出缺陷存在。
图12
针对不同电路板图中出现的同种短路类型进行检测,效果如图13a、图13b、图13c所示,可准确检测出缺陷存在。
图13
针对不同电路板图中出现的同种凸起类型进行检测,效果如图14a、图14b、图14c所示,可准确检测出缺陷存在。
图14
针对不同电路板图中出现的同种凹陷类型进行检测,效果如图15a、图15b、图15c所示,可准确检测出缺陷存在。
图15
6结语
PCB板面向体积越来越小、密度越来越高的方向发展。在检测产品价格方面,国外AOI检测产品价格普遍偏高,而由于经济原因,在国内PCB板生产制造商多数仍采用人工目测等传统检测方法检测。随着经济的发展,数字图像处理研究的深入,自动光学检测系统也开始频繁活跃在人们视线中,但在PCB缺陷检测方面的应用却还有待完善。因此,本论文建立在深入掌握工控系统结构并从PCB板的质量标准、图像特点、缺陷特征及检测要求的分析基础上,对以图像处理为基础的PCB缺陷检测技术进行了深入研究。由于PCB缺陷自动检测系统的研究涉及多个领域的知识,其研究过程十分耗时、繁琐,由此,本论文仅仅对PCB缺陷检测中较为常见的问题进行了较深入研究,并且仅搭建了较为简单的PCB缺陷自动检测系统的实验平台,对PCB中的四类较为关键、常见的缺陷进行检测、分析、识别、判定。虽然还未实现真正实现工业上产业化检测,但是在未来几十年中,研究推广的PCB缺陷自动检测系统将有十分良好的应用前景,也将有高额的经济收益。
参考文献
[1]陈胜勇,刘盛,等.基于OpenCV的计算机视觉技术实现[M].北京:科学出版社,2008.
[2]GaryBradski,AdrianKaebler,于仕琪,等.学习OpenCV[M].北京:清华大学出版社,2009.
[3]周长发.精通VisualC++图像处理编程(第3版)
[M].北京:电子工业出版社,2006.
[4]党振.中国大陆PCB产业的现状与未来[J].印制电路信息,2006,32(1).
[5]胡跃明,谭颖.自动光学检测在中国的应用现状和发展[J].微计算机信息,2006,(4).
[6]李汉,何星,等.印刷电路板的自动光学检测系统
[J].无损检测,2004,26(6).
[7]张利,高永英,等.PCB板检测中的定位研究[J].中国图像图形学,1999,4(8).
[8]姚立新,张武学,等.AOI系统在PCB中的应用[J].电子工业专用备,2004,(5).
[9]范小涛,夏雨人.一种基于图像处理的PCB检测算法研究[J].计算机工程与应用,2004,(13).
[10]傅莉.印制电路板的发展及前景[J].电脑与电信,2010,(5).
[11]张明轩.基于视频序列的人脸检测与跟踪算法研究[D].中北大学,2011.
[12]张驰.基于机器视觉的智能控制与图像识别问题研究[D].兰州理工大学,2009.
[13]谢飞.基于计算机视觉的自动光学检测关键技术与应用研究[D].南京大学,2013.
[14]张静.PCB表观缺陷的自动光学检测理论与技术
[D].电子科技大学,2013.
[15]俞玮.AOI技术在PCB缺陷检测中的应用研究[D].电子科技大学,2007.
-
机电一体化专业论文范例(3篇)
机电一体化专业论文范文【论文摘要】机械电子工程是机械、电子、计算机和自动控制等技术有机结合的一门复合技术,常被称为机电一体化技术,它代表着机械工程技术革命的前沿..
-
机电一体化机械设计范例(12篇)
机电一体化机械设计范文关键词:机械电子教学方式教学环节中图分类号:G642.0文献标识码:A文章编号:1673-9795(2014)03(b)-0133-02机械电子工程简称机电一体化,表示机械学和电子学两门..
-
老年人生活质量评估范例(12篇)
老年人生活质量评估范文篇1一.具体措施1.管理工作任务分配年级主任:负责全面管理、教师全面评估,座班制、教案及作业批改检查、教师思想工作、巡视教师授课情况、随堂听课、体..
-
近代历史背景范例(3篇)
近代历史背景范文伴随新课程标准的实施,中学历史教学从侧重知识的掌握转向知识与能力、过程与方法及情感态度价值观并举的三维目标,重视培养学生自主学习的能力、获取历史..
-
近代会计的主要特征范例(3篇)
近代会计的主要特征范文视频关键帧体现了视频序列的主要内容。关键帧提取技术是实现基于内容的视频检索的关键技术之一。针对现有关键帧提取算法存在的计算量大、阈值选择..
-
国际服务贸易理论范例(12篇)
国际服务贸易理论范文篇1关键词:服务贸易;原产地规则;服务贸易总协定服务贸易原产地规则的国际经验(一)《服务贸易总协定》中的相关规定《服务贸易总协定》是历史上第一个关于服..
-
高等医学教育研究范例(3篇)
高等医学教育研究范文1月17日,全国第九届医药学学位与研究生教育学术年会在哈尔滨隆重召开,本次会议由中国学位与研究生教育学会医药科工作委员会、全国医学专业学位研究生教..
-
绿色低碳技术体系范例(12篇)
绿色低碳技术体系范文篇1[关键词]低碳发展;形势;绿色;经济[DOI]1013939/jcnkizgsc2017112271国际形势近年来,国际社会越来越重视碳排放对生态和经济的影响,很多国家采取有力措施..