计算机视觉研究内容范例(12篇)

daniel 0 2024-03-27

计算机视觉研究内容范文篇1

一、新型大学英语教学模式理论框架的组成

(一)多模态、多媒体、多环境理论

在研究与对比的过程中,学者界定了理论框架的相关概念。首先,多模态。简单来说,模态就是利用感官与外部环境进行交流。而此处的感官并不局限于视觉、听觉、触觉、味觉以及嗅觉,同时还包括了医学领域的距离感与平衡感。而多模态就是利用三种或三种以上的感官进行互动。在互动中能够将不同类别的信息打包捆扎。模态越多,所获得的信息与体验就会越丰富。如尝试某种物品,就满足了视觉、嗅觉、触觉甚至味觉的需要,但是如果是只看到图片,那么就只能满足视觉的需要,相比而言前者获取的信息与体验就更为丰富。如果教师在教学中,让学生将所讲述的内容复述,就是一种模态学习,但是,如果让学生在理解的基础上进行复述,那就是多模态学习。因而,学者认为多模态学习有利于学习内容的内化,提高知识储备的持久度。其次,多媒体。逻辑媒介是多媒体的载体。所谓逻辑媒介就是物理媒介上装载的内容或信息编码手段。多媒体内容就是利用三种或三种以上的逻辑媒介。因而,文字材料就是印在多媒体材料上,声音就是刻录在磁带上。而如果一张光盘上有文字、图片、视频流、音频流,其中包含的内容就是多媒体内容。可见,利用多媒体材料有利于触发多模态体验。最后,多环境。学习环境可以有很多种。除了单纯的学校,还有教室、自习室、图书馆等,同时还有教师教学模式、课程设置等。环境可向学生提供机遇与框定。学生的学习行为可在多种混合环境下进行,可以说是无处不在。不同的环境因素提供的框定和机遇千差万别,对学生学习效果的影响也不相同。因此,在大学英语教学中,教师应尽可能为学生创造能够获得丰富体验、急性模态转化的学习环境,并考虑环境中的各类影响因素。

(二)有效整合计算机技术与英语课程

在环境因素不断发生变化的过程中,计算机等现代教育技术与外语教学之间的关系显得非常重要。在当前教育教学环境中,人们普遍将计算机作为辅助学习语言的工具。事实上,这种认识存在很多的不足。计算机应用于教学中,其特点较为明显,即可充当教学活动的演示工具、教学内容与课本无差异、学生仍旧是灌输的对象、教师仍旧处于中心位置。正是这几个特点,导致计算机在教学中的作用受到限制。其实,计算机是语言教学中的必备元素。而要将计算机技术与英语课程有效整合,教师就得为学生创设数字化的学习环境。数字化的教学环境,能够发挥学生的主动性、积极性与创造性,促使以教师为中心的传统教学模式发生变化。

(三)建构主义教学理念

传统教学观来源于客观主义哲学,普遍认为知识就是客观、非情景化、抽象以及稳定存在的,是客观表象。正是这种认识,导致教学过于强调理论知识,忽视学生应有的专业实践能力与动手操作能力。受到这种教学模式的影响,教师仅仅是知识的传递者,学生仅仅被动接收。此种教学模式的弊端已经在实践中体现出来。基于此,建构主义教学理念出现,认为知识本就是不断认知、体验与构建的过程。知识并不是如传统教学认识的那样,知识是个人创造活动的结果,学习本就是知识构建的过程。建构主义教学观要求教学改变传统教学模式,最大限度丰富学生的资源、体验,提高教学效果。

二、新型大学英语教学理论模式框架

(一)创设学习环境

在多模态、多媒体、多环境的理论中,非常重视让学生获得丰富的体验与优良的学习环境。同时将计算机与英语课程进行整合,创设数字化的学习环境,并在建构主义的支持下促进沟通。事实上,这些不同的观点表面看存在较大差异,其实是相通的,甚至是依赖彼此来实现的。在当前教学活动开展的过程中,多模态的学习必须依靠多媒体学习才能实现,而数字化学习环境的创设,则必须利用多媒体。多媒体的产生必须以计算机与网络技术为基础,这样才可收集大量的音频与视频,随后进行整合、处理与存储,应用于数字化环境中,这样才能够触发多模态学习。在建构主义理论的支撑下,知识本就是个人经验的合理化与个体与他人协商后形成的社会建构。利用计算机与网络技术后,能够促使师生、生生之间的联系更为紧密,促使数字化学习环境更为优良,更有利于沟通交流。

(二)转变教学结构

在传统教学理念和模式中,教师是知识的传授者,学生被动接收知识内容。但是,在建构主义理论下,学生是学习的主体,教师应当充当引导者。在多模态、多媒体、多环境理论下,教师就是要创设环境,以便能够让学生在其中获得丰富的教学体验,展开多模态学习。无论是何种教学观,均体现出学生才是学习的主体。而在生态化整合理念、多模态、多媒体、多环境的理论下,将计算机与网络作为除教师与学生之外的教学组成要素。

三、现代教育技术下新型大学英语教学模式

新型大学英语教学模式,其建立在相关理论的基础上,最大的特点就是创设教学环境,改变教学结构。此时的教学环境应当是能够触发模态转换学习的数字化环境,这对构建意义学习具有重要意义。教学结构的改变其实就体现在学习共同体上。新型共同体下,教师、学生与计算机应当占有同样的地位,并且任意两者均是可以形成互动的。在互动中,学生可获得丰富的体验,进行模态转化学习。在过去的理论研究中,只有建构主义学习理论存在较为明显的优势,其多体现在理论框架更系统、细致方面。因而,将其作为基础建立教学模式,具有较强的可操作性与可证伪性。此种理论框架有着较为完整的理论跨度,即建立于基础层面哲学立场,有处于可证伪层面的模态转换学习假说。与其他研究中经常提到的自主、互动、计算机辅助等或模糊或复杂的变量不同,模态的多少或者转换作为一个变量更容易控制、分离与测量,因而在教学设计中更容易实现,在教学实验中更容易验证。但是在具体的实践中,还需实行具体的理论框架,这样才能够解决实际的问题。

四、结语

计算机视觉研究内容范文篇2

关键词:虚拟现实(vr);虚拟环境人机交互

一、引言

在信息技术发展的今天,人们的交流越来越多的依靠网络、广播、电视等媒体得到相关的信息资料,但是这些媒体提供的信息往往是经过抽象的,在很大程度上人们不能及时有效的进行理解吸收,解决这一问题人们只能借助于实物模型,但随着计算机技术的迅猛发展,使得人与计算机的交互成为可能,虚拟现实(vr)技术就是借助于这个基础上实现了人机交互,操作者可以通过键盘、鼠标、头盔、数据手套等工具与计算机间的交互,真正成为虚拟环境中的一员,较真实的感知和操作虚拟世界中的各种对象,达到理解和掌握知识、为生产生活服务的目的。

二、虚拟现实技术简介

虚拟现实(简称vr),又称灵境技术,是以浸没感、交互性和构想为基本特征的计算机高级人机界面,是迅速发展的一项综合性计算机、图形交互技术。它综合利用了计算机图形学、仿真技术、多媒体技术、人工智能技术、计算机网络技术、并行处理技术和多传感器技术,模拟人的视觉、听觉、触觉等感官功能,使人能够沉浸在计算机生成的虚拟境界中,并能够通过语言、手势等自然的方式与之进行实时交互,创建了一种适人化的多维信息空间。使用者不仅能够通过虚拟现实系统感受到在客观物理世界中所经历的“身临其境”的逼真性,而且能够突破空间、时间以及其他客观限制,感受到在真实世界中无法亲身经历的体验。

计算机技术的迅速发展为我们提供了许多解决问题的新方法。虚拟现实技术的产生与发展也同样如此,目前虚拟现实系统的研究现状主要涉及到三个研究领域:依靠计算机图形方式建立实时的三维视觉效果、构建对虚拟世界的观察界面和使用虚拟现实技术加强其在现实世界中的应用。

三、虚拟现实技术特征及其系统的关键技术

从本质上说,虚拟现实就是一种先进的计算机用户接口,它通过给用户同时提供诸如视、听、触等各种直观而又自然的实时感知交互手段、最大限度地方便用户的操作,从而减轻用户的负担、提高整个系统的工作效率。因此虚拟现实技术具有以下四个重要特征。

(一)多感知性

所谓多感知性就是指导包括视觉感知外,还包括听觉、力觉、触觉和运动感知、甚至包括味觉感知、嗅觉感知等。

(二)存在感

又称临场感,它是指用户感到作为主角存在于模拟环境中的真实程度。理想的模拟环境应该达到使用户难以分辨真假的程度。

(三)交互性

它是指用户对模拟环境内物体的可操作程度和从环境得到反馈的自然程度(包括实时性)。我们借助与我们8的感觉器官,在虚拟的环境中体验真实的环境。

(四)自主性

是指虚拟环境中物体依据物理定律进行动作的程度。虚拟现实系统的关键技术主要由动态环境建模技术、实时三维图形生成技术、立体显示和传感器技术、应用系统开发工具和系统集成技术等五个方面组成。其中动态环境建模技术的目的是根据应用的需要获取实际环境的三维数据,并利用获取的三维数据建立相应的虚拟环境模型。而三维图形的生成技术关键是如何实现“实时”生成。立体显示和传感器技术是虚拟现实中实施交互能力的关键。

四、当今虚拟现实技术的应用领域

虚拟现实技术的应用前景十分广阔。目前在娱乐、教育及艺术领域的应用占据主流,其次是军事与航空、医学领域,机器人和商业领域都占有一定比例,另外在可视化计算、制造业等领域也有相当的比重。下面简要介绍其部分应用。

(一)娱乐、艺术与教育领域

丰富的感觉能力与3d显示环境使得vr成为理想的视频游戏工具。如chicago(芝加哥)开放了关于3025年的一场未来战争的世界上第一台大型可供多人使用的vr娱乐系统;1992年的一台称为“legealqust”的系统由于增加了人工智能功能,使计算机具备了自学习功能,大大增强了趣味性及难度,使该系统获该年度vr产品奖。

作为传输显示信息的媒体,vr所具有的临场参与感与交互能力可以将静态的艺术转化为动态的,可以使观赏者更好地欣赏作者的思想艺术,提高了艺术表现能力。

(二)军事与航天工业领域

模拟与练一直是军事与航天工业中的一个重要课题,这为vr提供了广阔的应用前景。美国国防部高级研究计划局darpa自80年代起一直致力于研究称为simnet的虚拟战场系统,以提供坦克协同训练,该系统可联结200多台模拟器。另外利用vr技术,可模拟零重力环境,以代替现在非标准的水下训练宇航员的方法。

(三)医学领域

vr在医学方面的应用具有十分重要的现实意义。在虚拟环境中,可以建立虚拟的人体模型,借助于跟踪球、hmd、感觉手套,学员们可以很容易了解人体内部各器官结构,这比现有的采用教科书的方式要有效得多。

pieper及satara等研究者在90年代初基于两个sgi工作站建立了一个虚拟外科手术训练器,用于腿部及腹部外科手术模拟。这个虚拟的环境包括虚拟的手术台与手术灯,虚拟的外科工具(如手术刀、注射器、手术钳等),虚拟的人体模型与器官等。借助于hmd及感觉手套,使用者可以对虚拟的人体模型进行手术。

另外,在远距离遥控外科手术,复杂手术的计划安排,手术过程的信息指导,手术后果预测及改善残疾人生恬状况,乃至新型药物的研制等方面,vr技术都有十分重要的意义。

(四)管理工程领域

vr在管理工程方面也显示出了无与伦比的优越性。如设计一新型建筑物时,可以在建筑物动工之前用vr技术显示一下;当财政发生危机时,可以帮助分析大量的股票、债券等方面的数据以寻找对策等等。

以上仅列出虚拟现实的部分应用前景,可以预见,在不久的将来,虚拟现实技术将会影响甚至改变我们的观念与习惯,并将深入到人们的日常工作与生活。

五、虚拟现实技术的进一步展望

虚拟现实从其萌芽到今天的日渐成熟已经走过了相当长的一段风雨历程。目前它的研究内容涉及到多项学科领域。我们同时也认识到,这个领域的技术具有巨大的潜力和广阔的应用前景。

计算机视觉研究内容范文

【关键词】多媒体技术发展应用

多媒体技术作为20世纪80年展起来的新兴技术,大大改变了人们处理信息的方式。早期的信息传播和表达信息的方式,往往是单一和单向的,后来随着计算机技术、通信和网络技术、信息处理技术和人机交互技术的发展,拓展了信息的表示和传播方式,形成了各种媒体进行综合、交互处理的多媒体技术。多媒体技术的研究领域非常广泛,几乎遍布各行各业以及人们生活的各个角落。由于多媒体技术具有直观,信息量大,易于接受和传播等显著特点,因此该领域的拓展十分迅速。今年来多媒体技术已经成功的涉足以下几个领域:

一、教育培训

教育领域是研究多媒体技术较早的领域,也是进展最快的领域,多媒体技术的各种特点被广泛应用与即时与领域。也是进展最快的领域,多媒体技术的特点最适合教育。人们以最自然,最直观,最容易的多媒体形式接受教育,不但增加了信息丰富性,提高了知识趣味性,而且还增加了学习主动性,提高了科学准确性。

(一)计算机辅助教学。计算机辅助教学是多媒体技术在教育领域中研究典型范例。它是新型教育技术与计算机应用技术结合的产物,其核心内容是以计算机多媒体技术为教学媒介而进行的教学活动;它利用数字化的声音、文字、图像、视频及动画,展现各个学科的可视化内筒,展示形象的、逼真的自然现象,客观规律,科普知识以及各个领域里的尖端技术等,目的在于强化形象的思维模式,使性质和概念更容易接受。

(二)计算机化教学。计算机化教学是近年来发展起来的,它是多媒体技术研究的一个重要方面。它的研究使得计算机教学手段从“辅助”变成前台,成为主角,这也比较成为教育方式的主流和方向。计算机化教学的主要特点有:充分利用计算机技术将全部教学内容融入到计算机所做的工作中,为受教育者提供海量信息,这也就是常说的多媒体教学的概念。

(三)计算机化学习

(四)计算机辅助训练

(五)计算机管理教学

二、休闲旅游

多媒体技术的引入使人们的娱乐观念发生了很大变化,随着多媒体统一技术的不断发展和完善,今天人们所能享受到的由多媒体带来的娱乐和其他传统娱乐方式相比已不可同日而语了。多媒体技术为旅游业带来的变革也是显而易见的,例如,宣传方式已经从传统的印刷品到有大量逼真的图片,动听的解说,实时的录像所组成的数字化载体来实现的。使消费者如身临其境,很大程度上促进了旅游业的发展

三、商业广告

多媒体广告不同于平面广告,当多媒体技术应用于商业广告时,几乎使人们的视觉、听觉和感觉全部处于兴奋状态。多媒体技术在商业广告领域中的特点:直观,易于接受,在视觉、听觉、感觉等方面宣扬广告意图;提供交互功能,使消费者能够了解商业信息及其他相关信息;提供消费者的反馈信息;提供商业规范咨询,并设置在线咨询,问题解答等服务。

四、影视娱乐

随着多媒体技术的发展逐步趋于成熟,影视娱乐业是一个非常有前途的研究领域,使用先进的计算机技术已经成为一种趋势,大量的计算机上效果注入到影视作品中,从而增加了艺术效果和商业价值。

五、电子出版

多媒体技术为报纸,杂志及图书的出版带来了勃勃生机,各种各样的电子出版物应运而生。电子出版物以其信息容量大、易于检索、成本低等优点得到了迅速的法杖,并取代了一些传统的出版物。百科全书、电子词典、技术手册、电子书刊等采用关盘坐在提,观看、收藏都及为方便

综上所述,无论从哪个方面来看,拓宽计算机处理信息类型来看,利用多媒体是计算机技术发展的必然趋势。多媒体技术的发展方向我们可以概括为以下两个方面:

(一)智能化。多媒体的基本应用是利用多媒体传递信息,而计算机与报纸、广播、电视最大的区别应该是它的交互性。图像理解、语音识别、多媒体检索、虚拟现实等基于内容管理的技术正在蓬勃发展。未来的计算机不仅能够传递多媒体信息,而且能够识别多媒体信息、理解多媒体信息。它能够知道语言的含义,能够认识图像的含义,能够在基于计算机网络的分布式数据库中找到用户想要的多媒体信息。人们与计算机的交互方式可以通过语言、行为等人与人交往的自然方式进行。

(二)立体化。随着技术的发展,多媒体技术的应用已不限于在个人计算机上的处理和表现,许多家电设备、工业控制系统、现场监视系统也正在实现数字化,随着多媒体信息的识别技术、网络技术和通信技术的发展,它们将构成一个立体画的网络系统,而人机交互的媒体将是多媒体信息。

六、多媒体计算机的发展趋势

(一)完善计算机支持的协同环境。计算机支持的协同工作是一个非常热门的研究课题。这是一个跨学科的研究领域,它涉及计算机科学、信息科学、社会学、心理学及人类学等多种学科,研究工作目前还没有一个确切的定义,有人认为,计算机支持的协同工作致力于研究协同工作的本质和特征,探讨如何利用各种计算机技术设计出支持协同工作的信息系统。由于计算机支持的协同工作系统能够适应信息化社会中人们工作方式的群体性、交互性、分布性和协作性的特点,所以它发展的特别迅速。目前,世界上很多研究者正在从事该系统的有关研究工作。例如,群体协作理论的研究;协同工作的本质和特征的研究,也就是呀牛个人和群体的行为特点,协作的目的、意义和手段;有效的协作方式和协作模型;协作的支持技术。

(二)增强计算机的智能。可以进一步解决如文字、语音的识别和输入,汉语自然语言的理解和翻译,图形的识别和理解,解决知识工程及人工智能中的一些课题,从而使多媒体技术应用更加广泛。

计算机视觉研究内容范文

关键词:虚拟现实;研究现况;发展趋势

中图分类号:f061.3文献标识码:a文章编号:1672-3198(2009)02-0279-02

1虚拟现实

虚拟现实(virtualreality,简称vr),又译为临境,灵境等。从应用上看它是一种综合计算机图形技术、多媒体技术、人机交互技术、网络技术、立体显示技术及仿真技术等多种科学技术综合发展起来的计算机领域的最新技术,也是力学、数学、光学、机构运动学等各种学科的综合应用。这种计算机领域最新技术的特点在于以模仿的方式为用户创造一种虚拟的环境,通过视、听、触等感知行为使得用户产生一种沉浸于虚拟环境的感觉,并与虚拟环境相互作用从而引起虚拟环境的实时变化。现在与虚拟现实有关的内容已经扩大到与之相关的许多方面,如“人工现实”(artifi-cialreality)、“遥在”(telepresence)、“虚拟环境”(virtualenvironment)、“赛博空间”(cyberspace)等等。

2国外虚拟现实技术研究现状

计算机的发展提供了一种计算工具和分析工具,并因此导致了许多解决问题的新方法的产生。WWw.133229.COM虚拟现实技术的产生与发展也同样如此,概括的国内外虚拟现实技术,它主要涉及到三个研究领域:通过计算图形方式建立实时的三维视觉效果;建立对虚拟世界的观察界面;使用虚拟现实技术加强诸如科学计算技术等方面的应用。

2.1vr技术在美国的研究现状

美国是虚拟现实技术研究的发源地,虚拟现实技术可以追溯到上世纪40年代。最初的研究应用主要集中在美国军方对飞行驾驶员与宇航员的模拟训练。然而,随着冷战后美国军费的削减,这些技术逐步转为民用,目前美国在该领域的基础研究主要集中在感知、用户界面、后台软件和硬件四个方面。

上世纪80年代,美国宇航局(nasa)及美国国防部组织了一系列有关虚拟现实技术的研究,并取得了令人瞩目的研究成果,美国宇航局ames实验室致力于一个叫“虚拟行星探索”(vpe)的实验计划。现nasa已经建立了航空、卫星维护vr训练系统,空间站vr训练系统,并已经建立了可供全国使用的vr教育系统。北卡罗来纳大学的计算机系是进行vr研究最早最著名的大学。他们主要研究分子建模、航空驾驶、外科手术仿真、建筑仿真等。乔治梅森大学研制出一套在动态虚拟环境中的流体实时仿真系统。施乐公司研究中心在vr领域主要从事利用vrt建立未来办公室的研究,并努力设计一项基于vr使得数据存取更容易的窗口系统。波音公司的波音777运输机采用全无纸化设计,利用所开发的虚拟现实系统将虚拟环境叠加于真实环境之上,把虚拟的模板显示在正在加工的工件上,工人根据此模板控制待加工尺寸,从而简化加工过程。

图形图像处理技术和传感器技术是以上vr项目的主要技术。就目前看,空间的动态性和时间的实时性是这项技术的最主要焦点。

2.2vr技术在欧洲的研究现状

在欧洲,英国在vr开发的某些方面,特别是在分布并行处理、辅助设备(包括触觉反馈)设计和应用研究方面。在欧洲来说是领先的。英国bristol公司发现,vr应用的交点应集中在整体综合技术上,他们在软件和硬件的某些领域处于领先地位。英国arrl公司关于远地呈现的研究实验,主要包括vr重构问题。他们的产品还包括建筑和科学可视化计算。

欧洲其它一些较发达的国家如:荷兰、德国、瑞典等也积极进行了vr的研究与应用。

瑞典的dive分布式虚拟交互环境,是一个基于unix的,不同节点上的多个进程可以在同一世界中工作的异质分布式系统。

荷兰海牙tno研究所的物理电子实验室(tno-pel)开发的训练和模拟系统,通过改进人机界面来改善现有模拟系统,以使用户完全介入模拟环境。

德国在vr的应用方面取得了出乎意料的成果。在改造传统产业方面,一是用于产品设计、降低成本,避免新产品开发的风险;二是产品演示,吸引客户争取定单;三是用于培训,在新生产设备投入使用前用虚拟工厂来提高工人的操作水平。

2008年10月27-29日在法国举行的acmsymposi-umonvirtualrealitysoftwareandtechnoogy大会,整体上促进了虚拟现实技术的深入发展。

2.3vr技术在日本的研究现状

日本的虚拟现实技术的发展在世界相关领域的研究中同样具有举足轻重的地位,它在建立大规模vr知识库和虚拟现实的游戏方面作出了很大的成就。

在东京技术学院精密和智能实验室研究了一个用于建立三维模型的人性化界面,称为spmarnec公司开发了一种虚拟现实系统,用代用手来处理cad中的三维形体模型。通过数据手套把对模型的处理与操作者的手联系起来;日本国际工业和商业部产品科学研究院开发了一种采用x、y记录器的受力反馈装置;东京大学的高级科学研究中心的研究重点主要集中在远程控制方面,他们最近的研究项目是可以使用户控制远程摄像系统和一个模拟人手的随动机械人手臂的主从系统;东京大学广濑研究室重点研究虚拟现实的可视化问题。他们正在开发一种虚拟全息系统,用于克服当前显示和交互作用技术的局限性;日本奈良尖端技术研究生院大学教授千原国宏领导的研究小组于2004年开发出一种嗅觉模拟器,只要把虚拟空间里的水果放到鼻尖上一闻,装置就会在鼻尖处放出水果的香味,这是虚拟现实技术在嗅觉研究领域的一项突破。

3国内虚拟现实技术研究现状

在我国虚拟现实技术的研究和一些发达国家相比还有很大的一段距离,随着计算机图形学、计算机系统工程等技术的高速发展,虚拟现实技术已经得到了相当的重视,引起我国各界人士的兴趣和关注,研究与应用vr,建立虚拟环境!虚拟场景模型分布式vr系统的开发正朝着深度和广度发展。国家科委国防科工委部已将虚拟现实技术的研究列为重点攻关项目,国内许多研究机构和高校也都在进行虚拟现实的研究和应用并取得了一些不错的研究成果。

北京航空航天大学计算机系也是国内最早进行vr研究、最有权威的单位之一,其虚拟实现与可视化新技术研究室集成了分布式虚拟环境,可以提供实时三维动态数据库、虚拟现实演示环境、用于飞行员训练的虚拟现实系统、虚拟现实应用系统的开发平台等,并在以下方面取得进展:着重研究了虚拟环境中物体物理特性的表示与处理;在虚拟现实中的视觉接口方面开发出部分硬件,并提出有关算法及实现方法。

清华大学国家光盘工程研究中心所作的“布达拉宫”,采用了quicktime技术,实现大全景vr制;浙江大学cad&cg国家重点实验室开发了一套桌面型虚拟建筑环境实时漫游系统;哈尔滨工业大学计算机系已经成功地合成了人的高级行为中的特定人脸图像,解决了表情的合成和唇动合成技术问题,并正在研究人说话时手势和头势的动作、语音和语调的同步等。

4虚拟现实技术的发展趋势

随着虚拟现实技术在城市规划、军事等方面应用的不断深入,在建模与绘制方法、交互方式和系统构建方法等方面,对虚拟现实技术都提出来更高的需求。为了满足这些新的需求,近年来,虚拟现实相关技术研究遵循“低成本、高性能”原则取得了快速发展,表现出一些新的特点和发展趋势。主要表现在以下方面:

(1)动态环境建模技术。

虚拟环境的建立是vr技术的核心内容,动态环境建模技术的目的是获取实际环境的三维数据,并根据需要建立相应的虚拟环境模型。

(2)实时三维图形生成和显示技术。

三维图形的生成技术已比较成熟,而关键是如何“实时生成”,在不降低图形的质量和复杂程度的前提下,如何提高刷新频率将是今后重要的研究内容。此外,vr还依赖于立体显示和传感器技术的发展,现有的虚拟设备还不能满足系统的需要,有必要开发新的三维图形生成和显示技术。

(3)适人化、智能化人机交互设备的研制。

虽然头盔和数据手套等设备能够增强沉浸感,但在实际应用中,它们的效果并不好,并未达到沉浸交互的目的。采用人类最为自然的视觉、听觉、触觉和自然语言等作为交互的方式,会有效地提高虚拟现实的交互性效果。

(4)大型网络分布式虚拟现实的研究与应用。

网络虚拟现实是指多个用户在一个基于网络的计算机集合中,利用新型的人机交互设备介入计算机产生多维的、适用于用户(即适人化)应用的、相关的虚拟情景环境。分布式虚拟环境系统除了满足复杂虚拟环境计算的需求外,还应满足分布式仿真与协同工作等应用对共享虚拟环境的自然需求。分布式虚拟现实系统必须支持系统中多个用户、信息对象(实体)之间通过消息传递实现的交互。分布式虚拟现实可以看作是基于网络的虚拟现实系统,是可供多用户同时异地参与的分布式虚拟环境,处于不同地理位置的用户如同进入到同一个真实环境中。目前,分布式虚拟现实系统已成为国际上的研究热点,相继推出了相关标准,在国家“八六三”计划的支持下,由北京航空航天大学、杭州大学、中国科学院计算所、中国科学院软件所和装甲兵工程学院等单位共同开发了一个分布虚拟环境基础信息平台,为我国开展分布式虚拟现实的研究提供了必要额网络平台和软硬件基础环境。

5结语

计算机视觉研究内容范文1篇5

[关键词]行人检测;夜间行车安全;社会价值

[DOI]1013939/jcnkizgsc201615045

随着人们生活水平的不断提高,汽车已成为我国代步工具中的一大种类。据国家公安部通报,2013年,全国汽车增加1651万辆、驾驶人增加1790万人。方便之余,随之而来的交通安全问题,却成为威胁人们生命的不可忽视的关键。据交通部透露,交通事故在夜间行车中发生的概率较高。有数据显示,虽然40%左右的交通事故在夜间发生,但却有高达60%的事故死亡率。由此可见,夜间行车的危险指数远远高于白天行车。因此,夜间行车安全应该得到更多的重视。

1夜间行人检测研究的社会价值

产生夜间行车安全问题的因素[1]主要有两个:其一,也是夜间交通事故发生的主要原因,是由于夜间光线较暗,驾驶员视角窄,视线模糊,不能准确地对路况进行预判,对潜在危险的处理滞后;其二,根据人体生物钟规律变化,夜间驾驶员身体的各方面机能都有明显下降,加之行车过程视觉效果不好,可依赖的条件少,为了准确、快速地对速度和距离进行判断,行车过程中驾驶员必须注意力高度集中,更容易产生紧张情绪,易疲劳。而中国城市人口密集度高,行人、自行车、电动车交错穿行,机动车驾驶员稍有不慎,就容易产生碰撞冲突,造成事故伤亡。针对中国交通现状的需求,充分利用汽车安全辅助驾驶技术对路面行人情况进行全面、正确的判断和分析,缓解汽车驾驶员视觉范围有限、精力有限的缺点,是提高我国安全行车系数的重要保障。

近年来,国内外很多学者高度关注智能视觉监控领域,在理论知识和实际应用两个方面都取得了一定的进展。行人检测也因为在此领域有着广泛的应用而备受广大学者与研究人员的热衷。然而,目前的行人检测技术尚未达到人们预期的效果。运动过程中的行人检测是一项相当复杂的工程,涉及计算机视觉和模式识别,车辆定位技术,人体形态学等诸多学科,有许多技术难点有待研究人员攻克。进行行人检测研究不论在理论研究方面或者实际应用方面均具有较高的应用价值和经济潜力。

2研究现状

行人检测与识别研究开始于20世纪90年代中期,经过大量研究,目前已形成许多可行性方案,为后期的研究人员提供了一系列具有较高参考价值的理论体系和应用系统。

21国外研究现状

目前,国外学者在行人检测图像采集途径上可分为基于可见光图像和基于红外图像两种方法。可见,光图像作为人们日常生活中的常用图像采集手段,受光照程度的影响对图像中目标的识别存在很大的差别,光线不足的条件下,能见距离和能见度会明显下降,影响正常视频图像采集。而红外成像又称红外辐射,利用电磁波强大的“穿透”能力,可以通过黑暗、烟雾等外界因素,形成可见光下看不到的目标表面的温度分布图,但因为其图像层次感差、轮廓模糊等缺陷,在日常生活中使用较少。

在行人检测方法上现有两大类[2]:第一类是基于视觉传感器的行人检测方法,常用的方法有:基于小波和支持向量机的方法、基于运动特征的方法、基于立体视觉的方法、基于形状信息的方法、基于行人模型的方法等。早期的视觉传感器系统多借鉴基于静态摄像头的静态视觉监控技术,包括图像处理中的图像分割、边缘提取、图像匹配、光流、运动检测等技术及模式识别中的一些简单分类算法。随着智能化水平的不断提高,传感器也在不断更新中。目前较为前沿的行人检测方法是基于立体视觉的方法,即利用多部摄像机作为视觉传感器,在多方位同时进行图像采集,得到场景中行人的空间信息,但算法复杂、计算量大。多数使用的方法是利用多种传感器信息融合的技术。第二类是基于非视觉传感器的行人检测方法[3],常用的方法有:基于激光测距传感器的方法、基于微波雷达的方法、基于红外线成像传感器的方法等。两类方法均使用广泛,且结合适当的图像预处理技术和相关算法后均能用于夜间行人检测,为夜间行人检测的进行奠定了充足的基础。

现有的行人检测技术的两个主要侧重点分别为运动和形状。侧重于运动的检测方法是通过分析运动过程中人体行走的周期频率来进行行人检测。行走时,人体呈现出一定周期性的步态,处理过程中将先待检测图像序列的周期性与预先分析得到的行人步态的周期性进行对比,就可以判断出是不是行人。该方法的优点在于降低了光线变化和人体纹理产生的影响,但需要经过多帧对比才能得出判断结果,判断速度不及时,且只能检测运动过程中的行人。该方法的典型代表有基于光流法的行人检测。而侧重于形状的检测方法是通过对边缘、灰度、轮廓等信息的分析检测,达到对目标进行检测的目的。该方法既能检测运动的行人,亦能检测静止状态的行人,但易将不是行人的目标错认为行人而产生虚警信息。其典型方法有基于统计分类的方法、基于局部模型的方法和基于模板匹配的方法。但实际工程设计时,多采用两种方法同时使用,比如:Viola等人利用AdaBoost算法对人体的类Haar特征进行训练行人检测器[4],并融合进行人的外貌特征和肢体运动信息进行检测,取得了良好效果,在有行人、非机动车和运行汽车的环境下,能较好地检测出步行的行人。

此外,利用一些交叉学科的系统对人体进行建模,通过模型对运动物体进行识别检测也是目前较可行的方法。国际上现有的可以使用的行人检测系统[5]主要有:①2004年11月,在第38届东京车展上,三菱汽车公司(戴姆勒・克莱斯勒旗下)推出的以行人检测技术为支撑的三菱扶桑概念车,该车能在不超过150km/h车速的情况下,在多种天气条件下,对行人作出快速准确的检测,为驾驶者提供危险状况报警,并提供一定的安全应急措施;②2006年3月,在第76届日内瓦车展上,雷克萨斯LS460概念车集成了立体视觉近红线外加激光雷达的行人检测系统,能够以30~40km/h的车速,在距离车辆30~50m处检测出在人行横道上行走的行人;③2007年4月,在英国伦敦科学博物馆展出的无人驾驶汽车(德国大众汽车公司研制),能在不超过183米的范围内识别各种交通标识,并利用激光摄像机对汽车周围的行人和道路状况等障碍进行检测。

22国内研究现状

我国在行人检测技术方面,主要研究静止摄像机以及图像采集条件较好的行人检测,与此同时也在积极摸索运动摄像机情况下及夜间等受自然条件制约场景的行人检测。国内进行行人检测与跟踪研究的单位现有:浙江大学、中山大学、清华大学、哈尔滨工业大学、厦门大学、重庆大学、四川大学、长安大学、安徽大学、武汉理工大学等。浙江理工大学的徐振兴针对传统形状上下文特征在行人检测中区域划分较密的问题改进区域划分的方法,并在研究中引入随机森林分类器和点对比较特征进行行人检测。[6]苏州大学的王宝兴在单视点固定摄像头场景下提出了一种基于局部时空域模型的核密度估计行人检测算法,在单视点移动摄像头场景下提出了一种融合目标多特征的行人检测算法,并提出了基于卡尔曼滤波和显著区域检测的行人识别算法[7]用于处理由于高空视频细节模糊、背景杂乱等特点所导致的行人分割与识别困难问题。南京理工大学的陶建峰针对单特征辨识度较低和人体尺度多样性问题,提出一种多特征融合的行人检测方法。[8]

3主要存在的问题

近年来,国内外学者在夜间行人检测与运动跟踪领域的研究方面取得了一定的进展,但由于学科技术发展水平有限、实验设备性能不足、视频图像环境复杂等各方面因素的限制,至今仍然不能研究出一种方法能够在各种场景条件下都通用,其中,存在的主要技术问题有以下几点:

(1)动态视频图像采集的背景多样性问题。目前,行人检测研究多以静态背景进行,原因在于动态场景下检测目标及背景环境均在不断变化中,将出现多个不同类型复杂目标的遮挡问题。车身摄像机随车辆的抖动、偏转会发生拍摄角度及清晰度的变化,影响行人识别与检测的准确率。且对行人检测系统的鲁棒性(即应对“突然打击下”的适应能力)提出了更高的要求。

(2)夜间图像采集的复杂性问题。首先,夜间光线较弱,图像灰度值较高,色彩辨析困难,导致干扰因素多,阴影面积大;其次,现有的夜间图像采集多数使用红外线设备,红外图像分辨率低,层次感差,纹理信息少,轮廓模糊,导致夜间行人目标的检测难度更大。因此,目前进行夜间行人检测的研究项目的比重相对较低。

(3)行人外观和姿态的多样性问题。人体柔韧性强,具有多种形态,结合身材和衣着的差异,往往在行人识别检测中相差甚远。现有的行人特征有多种,但要获得较好的检测结果,既受到图像本身属性的直接影响,又取决于使用算法的选择,所以,通常不直接将特定的特征和通用的算法应用于行人识别检测。

(4)行人检测目标的快速准确判断。车载嵌入式系统随着车辆的行驶,行车速度、行车环境都在不断变化,相应采集到的图像信息复杂性高,且计算机运算速度有限,因此,如何快速地对采集到的目标进行分割、识别与检测成为实时检测系统的一大难题。

参考文献:

[1]田翠翠基于红外图像的夜间行人检测技术研究[D].重庆:重庆大学,2010.

[2]许腾,黄铁军,田永鸿车载视觉系统中的行人检测技术综述[J].中国图像图形学报,2013,18(4):359-367

[3]庄家俊,刘琼面向辅助驾驶的夜间行人检测方法[J].华南理工大学学报,2012,40(8):56-62

[4]陈志恒,姜明新基于OpenCV的人脸检测系统的设计[J].电子设计工程,2012,20(10):182-185

[5]单晓森混合交通中行人检测方法研究[D].哈尔滨:哈尔滨工程大学,2011.

[6]徐振兴基于机器视觉的行为检测和跟踪技术研究[D].杭州:浙江理工大学,2012.

计算机视觉研究内容范文篇6

如上期《思维可视化研究之目的与技术支撑》一文所述,对教学而言,“思维可视化”是指将原本不可见的思维路径、方式、规律运用图示或图示组合的方式呈现出来,以期实现增强记忆及加深理解的效果。其本质也就是隐性思维显性化的过程。为了进行思维可视化的教学研究,必须对可视化本身的类型、进展,以及可视化教学研究方面进行考量。

可视化的类型

从基本原理上讲,可视化(Visualization)是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。“可视化”一词来源于英文的visualization,原意是“可使看得见的,清楚地呈现”,也可译为形象化、成就展现等。事实上,将任何抽象的事物、过程变成图形图像等形象化的表示都可以称为可视化。[1]从另一个角度说,可视化是一个过程——它将数据、信息和知识转化为一种形象化的视觉表达形式。充分利用了人们对可视模式快速识别的自然能力,以形象化的姿态接受大众的解读。[2]“可视化”作为专业术语最早出现在1987年2月,当时美国国家自然科学基金会(NationalScienceFoundation,简称NSF)召开的一个专题研讨会,给出了科学计算可视化的定义、覆盖的领域以及近期、长期发展的方向。这标志着科学计算可视化作为一个学科在国际范围内已经成熟。[3]作为一个新的学科,目前可视化研究的类型主要是以下三个方面。

1.数据可视化

数据可视化(DataVisualization)是关于数据之视觉表现形式的研究;其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。

2.信息可视化

信息可视化(Informationvisualization)是一个跨学科领域,旨在研究大规模非数值型信息资源的视觉呈现,信息可视化侧重于抽象数据集,在科学技术研究领域,信息可视化这条术语则一般适用于大规模非数字型信息资源的可视化表达。信息可视化致力于创建那些以直观方式传达抽象信息的手段和方法。利用人类对视觉对象的快速辨别能力,使人们在这种新型高效的视觉化界面的帮助下,快速识别出数据背后事物之间的关系及其发展趋势。信息可视化的英文术语“InformationVisualization”是由斯图尔特·卡德、约克·麦金利和乔治·罗伯逊于1989年创造出来的。斯图尔特·卡德1999年的报告将其定义为:“借助于计算机支持的,交互性的视觉表示法来表现抽象数据和增强认知”。[4]

3.知识可视化

知识可视化是可视化在教育应用领域研究的一个新分支,是在科学计算可视化(ScientificComputingVisualization)、数据可视化(DataVisualization)和信息可视化(Informationvisualization)基础上发展起来的。[5]2004年,Eppler&Burkard将知识可视化定义为:“知识可视化是运用视觉表达手段来研究在两个以上人之间知识创造的提高和传播的作用,知识可视化也可被认为所有用来构成和传输复杂意识的图解手段。”[6]一般来讲,知识可视化领域研究的是视觉表征在提高两个或两个以上人之间的知识传播和创新中的作用。这样一来,知识可视化指的是所有可以用来建构和传达复杂知识的图解手段。除了传达事实信息之外,知识可视化的目标在于传输见解、经验、态度、价值观、期望、观点、意见和预测等,并以这种方式帮助他人正确地重构、记忆和应用这些知识。

可视化研究的进展

可视化的研究是伴随着科学技术的发展,经历了数据─信息─知识可视化的研究历程。但是,随着基于计算机的工业设计的兴起和脑科学的发展,可视化研究开始向思维研究的领域发展。可视化图形图像以及背后的数据来源和创造历程更是让人们为之诧异不止。它涉足制图学、图形绘制设计、计算机视觉、数据采集、统计学、图解技术、数型结合以及动画、立体渲染、用户交互等。相关领域有影像学、视知觉、空间分析、科学建模等。随着可视化技术的应用和发展,可视化研究也从计算机科学领域向与其他学科的交叉领域渗透,包括心理学、教育学、神经科学、管理学等学科。

从可视化研究方面讲,在计算机出现之前,可视化主要通过手工绘制。最具代表性的例子是英国麻醉学家、流行病学家JohnSnow绘制的关于1854年伦敦霍乱流行情况分析图,他用地理坐标方格图标绘了霍乱爆发后,死亡病例的位置以及每个病例使用水泵的情况,发现了水泵是这次霍乱爆发的来源,从而成功地验证了他的理论/假设:受污染的水是导致霍乱爆发的原因。[7]然而,直到计算机发明以后,可视化才真正成为人们分析数据,获取有用信息的手段。[8]数据可视化的概念起源于1960年的计算机图形学,人们使用计算机创建图形图表,可视化提取出来的数据,将数据的各种属性和变量呈现出来。随着计算机硬件的发展,人们创建更复杂规模更大的数字模型,发展了数据采集设备和数据保存设备。同理,也需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集。对于真正的可视化研究主要从关注科学计算和数据的可视化研究开始,1987年,由布鲁斯·麦考梅克(BruceH.McCormick)、托马斯·德房蒂(ThomasA.DeFanti)和玛克辛·布朗(MaxineD.Brown)所编写的美国国家科学基金会报告《VisualizationinScientificComputing》,拉开了科学可视化研究的序幕。[9]

几十年来,可视化一直是研究的热点,众多的大学、跨国公司以及著名的实验室均投入了大量的人力、物力开展对可视化的研究。随着数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时动态效果、用户交互使用等,数据可视化像所有新兴概念一样边界不断扩大。数据可视化在发展过程中,经历了科学可视化“利用计算机图形学来创建视觉图像,帮助人们理解科学技术概念或结果的那些错综复杂而又往往规模庞大的数字表现形式”。例如,利用经验数据,科学可视化在天体物理学(模拟宇宙爆炸等)、地理学(模拟温室效应)、气象学(龙卷风或大气平流)模拟人类肉眼无法观察或记录的自然现象;利用医学数据(核磁共振或CT)研究和诊断人体;在建筑领域、城市规划领域或高端工业产品的研发过程中发挥重大作用。又如,在汽车的研发过程中,需要输入大量结构和材料数据,模拟汽车在受到撞击时如何变形。在城市道路规划的设计过程中,需要模拟交通流量。虽然科学可视化的表现形式对于普通人比较陌生,像粒子系统、散点图、热力图等图表不接受专业训练很难看懂。但实际上科学可视化的成果已经渗透到我们生活的每个角落。数据的可视化在计算机科学的图形学领域成为研究重点,如浙江大学CAD国家实验室所关注的三维建模和虚拟现实。以微软为代表的应用软件开发商,开发了大量对数据进行可视化的软件如GRAPH图表等,应用于各个领域。随着可视化技术的发展,可视化工具包即具有可视化功能的软件包越来越丰富,它采用菜单驱动,支持有限的数据类型和可视化算法,用户通过程序调用实现数据的可视化,但不需要编程,可视化形态也从2D向3D发展。典型的可视化工具包有Ensight,MayaVi,ParaView,pV3,PV-WAVE,Vis5D等。[10]

90年代初,信息可视化进入人们的视野。用于解决对异质性数据中“抽象”部分的分析。帮助人们理解和观察抽象概念,放大了人类的认知能力。也就是信息可视化开始关注普通用户的知识表达和知识传递,使可视化技术向非专业用户和其他学科领域延伸。例如,商业及管理图形决策系统、图形化数据显示、演示图形系统、可视化信息系统、C3I(指挥、控制、通信和信息系统),金融的图形系统及商业和科学图表与图形。在电子教室的认知研究结果的基础上发展的开发视觉思维能力和创新能力的儿童和成人教育与学习的可视化工具与技巧。各种信息图形软件中的视觉呈现研究发展,在屏幕布局、窗口、图标、字体设计和动画,改善彩色图形显示和图形用户界面(GUI)的开发工具及可见语言编程工具的改进。视觉艺术和设计的计算机图形应用程序,涉及平面设计、工业设计、广告及室内设计,包括设计原则、色彩、比例及地方与视觉元素方向的有关标准等研究。

知识可视化是在科学计算可视化、数据可视化、信息可视化基础上发展起来的新兴研究方向,它应用视觉表征手段促进群体知识的传播和创新。其定义可概述为:“知识可视化是研究如何应用视觉表征改进两个或两个以上人之间复杂知识创造与传递的学科。”而美国的斯马尔蒂诺(Smaldino)在《教学技术与媒体》一书中揭示了图片、插图和文字从具体到抽象地表现了不同种类符号的真实程度,可视化内容以图片呈现已经成为体现可视化优势的重要手段。[11]如何把知识以图形图像的方式可视化呈现已经成为可视化应用领域研究的热点。由于很多学者通常将知识体系分为四个等级:数据、信息、知识和智慧。Gene、Durval和Anthony认为理解(Understanding)支撑着数据到信息和知识的转换,理解并不是一个独立的层次。[12]赵国庆等曾从可视化对象、可视化目的、可视化方式和交互类型四个方面对数据可视化等信息可视化与知识可视化进行了比较。[13]针对智慧(思维)可视化的方法、技术的相关研究也颇多,主要集中在用何种结构的图形图像显示知识更符合人们的思维方式,如启发式草图(HeuristicSketches)、视觉隐喻(VisualMetaphors)、因果图、想法鱼池(IdeaQuarium)、思维导图(MindMap)、思维地图(ThinkingMaps)等就是相关的尝试。受化学中元素周期表的使用、外观和逻辑的启发,Ralph和Martin在2005年整合了形式多样的视觉表征,依据各类视觉表征的相关性和不同点对技术进行编号、上架,从管理学的角度形成“可视化周期表方法”,[14]形象直观地揭示了不同形式的视觉表征在管理学相关领域知识的联系和区别。这些可视化方法是一种系统的、有一定规则的、外部的、持久的用来传达某种信息的图形图像表征,他们有益于人们获得知识、阐述观点或交流经验。可视化元素周期表方法提供了管理学应用领域知识可视化具可操作性的策略。

思维可视化的教学研究

数据、信息、知识的表现形式可以是美丽、优雅、生动、形象或描述性的。有多种传统的数据、信息、知识表现形式在不同的项目及可能的场合被频繁地使用,如表格、饼图、柱状图等。但为了更有效地向人们传达知识信息,有时你需要的绝不仅仅是一张饼图或直方图。还应该有更好的、深刻的、富于创造性及趣味性的方法来表达可视化数据、信息或知识。这是创造性设计美学和严谨的工程科学的卓越产物。用极美丽或形象的形式呈现可能非常沉闷繁冗的数据,其表现和创作过程完全可以称之为艺术,而教学从另一个角度说也是一种艺术,这也正是人们所期待的。这些需求和期待也正蕴含着思维可视化将成为更为丰富的教学研究对象。就目前而言,思维可视化在教学方面的研究可以归结如下。

1.教学对象的研究

在思维可视化的课堂教学中,学生被海量的视觉和图形信息轰炸,直接影响着学习者的思维变化。大量包含功能强大的图像和符号的电子媒体出现在学习和生活中,学习者需要什么样的技能和素养才能满足思维可视化学习的需求。我们的教育系统是否能够帮助学生不仅理解图形和图像,而且还使用图形和图像进行有效沟通,开展正确思维。[15]这也常被人们称之为视觉素养能力的培养。作为可视化教学的教师应该具备更全方位的视觉素养能力,这也是重要的研究。

2.教学环境的研究

为了满足思维可视化教学过程的需要,可视化的教学环境如何去构建,已经成为教育技术领域的研究热点之一,如诺丁汉大学的视觉学习实验室、北卡罗莱纳州立大学的SCALE─UP教室、华东师范大学的未来课堂以及众多的智慧教室的提出都具备多屏显示的特征,为可视化教学的实施提供尝试。可视化教学环境的研究牵扯到多个学科领域,包括技术层面和教学层面。

3.教学策略的研究

早前的可视化策略,主要集中在通过对文本链接的可视化效果,来增加对文字作品或文学作品的理解。[16]但是,新的思维可视化教学过程描述的是一个完整的把可视化融入教学的各个环节,包括教学内容的细节,能激发学习者学习兴趣的节点。在教学的每个阶段都可以使用可视化手段和可视化内容,所以会使可视化教学策略的研究内容更为丰富。技术工具的使用策略,可视化内容的设计策略,可视化教学活动设计策略等都需要研究。具体包括多学科方法和技术为基础的教学,思维导图、图形组织者、阅读障碍等。

4.教学评价的研究

杰森·理查德森,直言不讳地批评标准化测试,因为目前的评估措施主要是针对学习者对事实记忆的评价,而不是学生的技能或能力。新的可视化教学可能因为媒体技术和学习理念的变化发生改变,那么如果我们的评价方式没有改变,这些教学上的改变将无法进行,应该说可视化教学的评价是促进可视化教学发展的关键,必须得到研究者们的关注。

小结

从早期媒体的发展到新媒体技术的出现,可视化一直伴随着教学的发展,人们不需要再去质疑可视化所能带来的好处,而需要做的是如何紧跟可视化教学发展的基本脉络。按照新媒体技术发展的新趋势,融合新的学习理论研究成果,去探索如何提供更好的教学环境和教学设计使思维可视化的巨大作用能够充分地发挥出来。技术环境提供了可视化教学应用的可能,但真正的可视化教学应用还需要除硬件环境以外的教师和学生的改变,我们教育研究者所要做的是拓展研究的思路,如何提供更好的教学环境和教学设计使可视化的巨大作用能够发挥出来。随着技术的发展,信息技术和智能识别技术可以记录各种交互信息,分析技术如视频行为分析、社会网络分析法给可视化教学活动的量化评价提供了便利的方法和理念。未来科技或许将为我们的课堂带来巨大的变革,而教学研究思路的转变就是迎接课堂变革的重要部分,其中思维可视化将会成为教学理念改变的一个重要途径。

参考文献:

[1]莫永华,魏文晨,吕永峰.分层可视化方法原理与实践[M].湖南:中南大学出版社,2011(10):44.

[2]周宁.知识可视化与信息可视化比较研究[J].情报理论与实践,2007(2):178-180.

[3]潘云鹤.计算机图形学——原理、方法及应用[M].北京:高等教育出版社,2001:12.

[4]Card,S.,Mackinlay,J.andShneiderman,B..ReadingsinInformationVisualization;UsingVisiontothink[M].MorganKaufmann,LosAltos,CA.1999:254.

[5]JianPingZhang,DaZhong&JiahuaZhang.KnowledgeVisualization:AAnEffectiveWayofImprovingLearning[C].ETCS2010,IEEEComputerSociety,Wuhan,China,2010:589-589.

[6]Eppler,M.,&Burkard,R.,KnowledgeVisualization:TowardsaNewDisciplineanditsFieldsofApplication[M].ICAWorkingPaPer#2/2004,UniversityofLugano,2004:3.

[7]E.Thfte.TheVisualDisPlayofQuantitativeInformation.Graphicspress[M].Jan.1983:45-48.

[8]ColinW.InformationVisualization:PereePtionforDesign.MorganKaufmann[M].2000:198-210.

[9]Card,S.,Mackinlay,J.andShneiderman,B..ReadingsinInformationVisualization:UsingVisiontoThink[M].1999.

[10]赵国庆.知识可视化2004定义的分析与修订[J].电化教育研究,2009(3):15-18.

[11](美)斯马尔蒂诺,等.教学技术与媒体(第8版/郭译)[M].北京:高等教育出版社,2008.

[12]GeneB.,DurvalC.,AnthonyMills.Data,Information,KnowledgeandWisdom[DB/OL].http:///dikw/dikw.htm,2010-8-1.

[13]赵国庆,黄荣怀,陆志坚.知识可视化的理论与方法[J].开放教育研究,2005(1):23-27.

[14]RalphL.,MartinJ.Eppler.TowardsAPeriodicTableofVisualizationMethodsforManagement[DB/OL].http:///periodic_table/periodic_table.pdf,2010-8-1.

计算机视觉研究内容范文篇7

关键词:虚拟现实技术;vr;网上世博会;未来发展

1、虚拟现实

“虚拟现实”(virtualreality,简称vr)是1989年美国的j.lanier提出的,国内也有人译为“灵境”、“幻真”等,国外与虚拟现实同类的术语,还有虚拟环境、人工现实及电脑空间等。所谓“虚拟现实”,是在计算机技术支持下的一种人工环境,是人类与计算机和极其复杂的数据进行交互的一种技术,它综合了计算机图形技术、计算机仿真技术、传感技术、显示技术等多种学科技术。虚拟现实系统具有向用户提供视觉、听觉和触觉、味觉和嗅觉等感知功能的能力,人们能够在这个虚拟环境中观察、聆听、触摸、漫游、闻赏、并与虚拟环境中的实体进行交互,从而使用户亲身体验沉浸虚拟空间中的感受。从根本意义上来看,可以将虚拟现实技术视为交互式仿真技术的高级形式。虚拟现实是一项综合的技术,涉及计算机图形学、人机接口技术、传感技术及人工智能技术等,需要计算机、心理学、人类工程学等专家共同开发研究。

2、虚拟现实的发展现状

美国是vr技术的发源地。美国vr研究技术的水平基本上就代表国际vr发展的水平。目前美国在该领域的基础研究主要集中在感知、用户界面、后台软件和硬件四个方面。在当前实用虚拟现实技术的研究与开发中日本是居于领先位置的国家之一,主要致力于建立大规模vr知识库的研究。另外在虚拟现实游戏方面的研究也做了很多工作。但日本大部分虚拟现实硬件是从美国进口的。目前,虚拟现实技术已在军事与航天工业、医学、管理工程、城市规划设计、工业仿真、文物古迹、艺术、教育、游戏等许多领域得到广泛应用。

在我国虚拟现实技术的研究和一些发达国家相比还有很大一段距离,在20世纪90年代,虚拟现实技术发展很快,各种开发虚拟现实设备或系统的公司成立,但虚拟现实离实际应用仍很远,已有的成果大多只能称为演示。随着计算机图形学、计算机系统工程等技术的高速发展,虚拟现实技术已经得到了相当的重视,引起我国各界人士的兴趣和关注,研究与应用vr,建立虚拟环境、虚拟场景模型分布式vr系统的开发正朝着深度和广度发展。国家科委国防科工委部已将虚拟现实技术的研究列为重点攻关项目,国内许多研究机构和高校也都在进行虚拟现实的研究和应用并取得了一些不错的研究成果。

3、虚拟现实技术实现网上世博会

随着2010年的到来,人们经常议论和关注的话题就是世博会,同时网上世博会也进入了人们的眼球,网上世博会是指组委会通过互联网和多媒体技术,将展示内容以虚拟和现实相结合的方式呈现在互联网上,构筑一个能够进行网络体验和实时互动并具有其他辅助功能的世博会网络平台。它将为具有158年历史的世博会全面插上数字化的翅膀,充分利用和借助3d、虚拟现实和互联网技术使世博会得到更广泛的传播,上海世博会将会成为一届“永不落幕”的世博会。

网上世博会具备了推介、教育、导览和展示四大独特功能。通过全面体验的方式介绍世博知识并传播世博理念,提供对各种自然、人文、科技知识的学习;提供世博园区所有展馆、设计网上虚拟实现,参观者可以在网上获得世博园区地理、内部分布、相关设施以及客流导引等各类信息;采用不同技术,设计不同类型的展馆,参观者在网上可以通过第一人称视角对虚拟三维场景进行浏览、全景漫游、互动沟通等获得不同的参观感受;提供园区、展馆、表演活动等各类信息的,并在网上举行各类推广活动,和介绍各类观众服务信息。简单地讲,网上世博会是实体世博会的网络版,但不是其简单的复制。国际展览局秘书长洛塞泰斯先生曾对网上世博会做出如下评价:“网上世博会为参展者提供了绝好的机会来推广他们的国家形象,这也是世博会丰富内容的核心。三维展示让网友身临其境,网上世博会可以吸引更多的参观者前来参观实体世博会,弥补部分观众无法到现场参观世博会的缺憾。同时在实体馆外提供互动交流平台,网上世博会由基础平台和网上展馆两部分构成。网上展馆设浏览馆和体验馆两类展馆,浏览馆具备基本浏览和展示功能,由组织者为需要援助的参展方免费开发。体验馆是浏览馆的增强版,在浏览型展馆以浏览和展示为基本功能的基础上,可实现其他更加丰富的功能和特效,网上参观者可以得到更生动的互动和体验。

4、展望虚拟现实的未来发展

虚拟现实从其萌芽到今天的日渐成熟已经走过了相当长的一段风雨历程。在某种意义上说它将改变人们的思维方式,甚至会改变人们对世界、自己、空间和时间的看法。目前它的研究内容涉及到多项学科领域。我们同时也认识到,这个领域的技术具有巨大的潜力和广阔的应用前景。

说到底,虚拟现实是一种新的人机交互方式。与以前任何人机交互形式相比,它有希望彻底实现“和谐的、拟人化的”人机界面。虚拟现实系统有三个重要特点:沉浸感、交互性和构想性,这决定了它与以往人机交互技术的不同,反映了人机关系的演化过程。在复杂系统中,可能有许多参与者共同在网络虚拟环境中协同工作、学习和娱乐等一切活动,这个需要各领域专家联合起来开展研究,协同攻关。

作为长远研究目标,作为技术驱动力,作为新的人机交互方式,作为国家的一些关键应用目标,虚拟现实都是值得高度重视的。与此同时,必须十分重视虚拟现实的广泛应用。虚拟现实还有很长的路要走,机会和挑战并存,而且虚拟现实和人机交互关系密切,必须重视人机交互的研究,这点正是我国比较欠缺的部分。我们期待这有朝一日,虚拟现实系统成为一种对多维信息处理的强大系统,成为人进行思维和创造的助手和对人们已有的概念进行深化和获取新概念的有力工具。我们相信随着计算机技术和网络技术的飞速发展,计算机3d运算能力和网络带宽大大提高,虚拟现实在生产生活中的应用将日益广泛。

参考文献:

[1](美)grigorec.burdea,(法)philippecoiffet著魏迎梅,栾悉道等译.虚拟现实技术,北京-电子工业出版社,2005

计算机视觉研究内容范文篇8

在计算机教学过程中创新的思路

在计算机教学过程中,教师通过激发学生的好奇心和求知欲来体现创新教育,例如当学生根本没有对事物尤其是抽象的事物的好奇心和旺盛的求知欲时,即使他们知道创新方法和技术,也很难有实际的创新行为,这时教师要引导学生产生学习兴趣,在教授新课之前要准备一些有趣的内容给学生看。例如可以在互联网上下载与授课内容相关的、有趣的、直观的图片、视频、漫画、网页等。把抽象问题具体化,把复杂问题简单化,把困难问题容易化,把深奥问题浅显化,从而激发了学生的学习兴趣,并将兴趣转化为长期的动力,可以这样说,兴趣是创新的起源和动力,使学生充满信心,斗志昂扬,逐步引导学生主动探索新知识,积极主动地完成从探索到创新的过程。这样计算机教学不仅有效地完成了学习任务,又提高了学生的思维能力;既激发了学生的求知欲和好奇心,又能培养学生敏锐的观察力和丰富的想象力。计算机教学不是简单地向学生奉送真理,而是更好地启发学生去思维,让他们自己去发现真理,激发学生的创新激情,培养学生的创新精神,提高学生的创造能力,使学生成为一个具有创新人格的人。许多研究证明,人类可以通过视、听、触摸、肢体动作四种途径获取知识,并且通过多种途径获取知识要优于单一途径获取知识,人类以一种感官作为主要途径加上另外一种或几种感官作为辅助途径来获取知识。实际上,这个学习的过程是无意识中所有感官共同参与的过程,也就是说人类通常采用混合的学习模式。还有实验证实:人类获取的信息有83%来自视觉、有11%来自听觉、有1.5%来自触觉。人类一般能记住自己阅读过的信息的ro%、听到内容的20%及在交流过程中自己所说内容的70%。而计算机教学是可以实现等多种感官共同参与的学习模式,迎合人们自身的发展规律和发展需求。计算机教学方法可以有效刺激人的听觉、视觉、触觉、肢体动作等,从而使学习效率得到提高。在教学过程中通过计算机向学生展示图片,再加上教师语音,学生可以通过听觉和视觉两个感官来接受知识,有助于理解晦涩难懂的理论知识。比如,尽管大部分外国学生特别喜欢中国的山水画,但他们大部分不知道什么是山水画,山水画是怎么来的,山水画是怎么得名的,如果在课上播放一些山水画的图片和一些大师的山水画及山水画历史的视频,更有助于学生对山水画的了解,从而加深了对山水画的印象。还可以播放一些按步骤教授的山水画绘制过程视频,让学生参与绘画,这样能够使学生通过视觉、听觉和肢体动作三种不同的途径获取知识。这种教学方法实践性更强,有利于学生的实践创新。例如,在艺术类课程的教学过程中使用计算机,教师用和谐的色彩、逼真的画面、美妙的音乐将枯燥的说教、抽象的教学内容变成具体的视听形象,给学生展示丰富的艺术材料,创设出形象生动而又轻松愉快的教学情境,调动学生多种感官的参与、体验,以此来激发学生的学习情感,促进他们的形象思维。艺术创作的创新,需要大脑中有足够大的艺术存储量,需要具有各方面的艺术材料和生活材料,这样才能激起他们的艺术思维,才能创新出源于生活而高于生活的艺术作品。计算机教学为艺术创新提供了这一刺激源,在很大程度上体现了创新。在逻辑性和理论性强、内容抽象的文科类教学过程中,教师把西部大开发、北京奥运会、上海世博会、党的十等国家重大的焦点问题的图片资料或视频整理成教学课件,展示给学生,能够使学生的爱国热情得到极大的激发,使学生了解国家的当前局势更直观,更形象,为他们的思维和创新指明了方向。也可以把国际上的一些突发性事件,如:问题、伊拉克问题、“9.11”事件、美国出兵阿富汗、美国“哥伦比亚”航天飞机坠毁等最热点、最受关注的信息及时准确地传达给学生,让学生理智地看待国内外局势,使学生全面而准确地把握党的方针路线,坚持中国共产党的领导,坚持走中国特色社会主义道路,努力为党的目标而奋斗。培养学生思考实际问题和分析综合问题的能力,为创新能力的提高打下基础,使创新目标更加明确。在科学性比较严谨、实践性比较强的理科类教学中,教师除了用板书教学向学生传授理论外,还可以通过计算机教学给学生演示大科学家的研究过程,通过视频演示实验过程,通过一些自然学科纪录片的放映,让学生更直观地了解当前未研究的领域及研究成果,激发学生研究创造的动力,为他们的科技创新提供资源。

在计算机教学过程中培养学生创新意识和能力的方法

创新意识是指提倡创新、追求创新、以创新为荣的观念。只有加强创新意识引导,才有可能激发人们强烈的创新动机,树立创新目标,充分挖掘创新潜力,释放创新激情,进行创新活动。创新能力是反映创新主体行为技巧的动作能力,是创新活动的工作机制。创新能力的培养是创新教育的核心。笔者认为,加强创新能力的前提是要培养创新思维,创新思维是指发明或发现一种新方式.并用以处理某种事物的思维过程。创新思维具有积极的求异性、敏锐的观察力、独特的知识结构、创造性的想象和活跃的灵感等显著特点。因此在进行教学时要不断培养学生的创新思维,从而不断地提高学生的创新意识和能力。

1.在计算机教学过程中加强创新意识和能力是基于创新的在实践中不断探索完善的过程,关键是教学要在不同时代、不同社会背景下满足不同年龄、不同层次的学生的心理需要。在计算机教学过程中不断加强创新意识和能力,有效地激发学生的思维,提高他们思索探究与创新的能力。苏联教育家赞可夫说道:教学方法一旦触及学生的情绪和意志领域,触及学生的心理需要,这种教学就会变得高度有效。也就是说教学过程不仅仅只是纯粹的智力活动,还需要以创新情感为动力,创新正是产生于激情驱动下的自觉思维。因此在计算机教学过程中加强创新意识和能力,要从触及学生情绪、心理需要、激发学生思维方面人手。

2.实施计算机教学过程中创新意识和能力的培养关键在于教师的引导,这个引导体现于教师所做的课件和教师对课件的讲授过程。这个引导对学生思维的激发程度能够直接影响创新意识与创新能力的加强。教师要结合学科特点做好教学课件,适当改革教学方法,使计算机技术在教学过程中发挥优势,充分利用探索和研究计算机和网络技术,对学生做好学习模式的引导。教师尽可能把课件做成有效的适量的资源库来代替教材、教学参考书,布置相应任务让学生自主学习和复习这些资源库,拓展学生的知识范围。在学生基础文化素质普遍薄弱的情况下,可以采用任务驱动等教学方法和突出个性的学习方法,把学生当作重点对象,充分了解学生,满足学生的不同需求,组织学生按任务驱动模式就研究的课题或任务去学习。教师通过实施适合学生特点的指导学习(如项目实习等)项目,引导学生在掌握理论知识与应用工具的同时,具备良好的自学能力与职业素质。例如对于计算机这门课程,采用计算机教学是必需的,那么教师怎样去加强创新意识和能力呢?在网络规划类的教学过程中,教师首先要讲解其理论知识,举出并阐明一个实例。更为重要的是老师要安排学生上机实践,老师边演示边让学生跟着做,最后让学生独立地进行模拟配置。通过实践,学生基本能够掌握开发网站的技术以及网站管理、维护、优化的方法。在实践中学生遇到不同的问题,大家可以自由讨论,达到激发学生思维的目的。另外可以给学生适当安排自学任务,让他们自己搜集资源做出课件,然后由学生在课堂上向同学讲述,大家再一起讨论,这样能够培养学生自学的能力,也可以加强其创新意识和创新能力。在创作类的课程教学中,教师在教学过程中要充分利用计算机动画技术,可以有意安排一些需要学生点击就可以参与的板块,提供一些高质量的教学在线游戏,让学生有更多的参与感,使学生积极互动与合作。学生将听觉、视觉、触觉和肢体动作四个途径并用,在线游戏教学使重复阅读和练习不再枯燥乏味,学生在自然轻松的状态下获取知识,学生的学习效率大为提高。就形势与政策课教学而言,计算机教学的应用也非常必要,例如讲“海峡两岸关系”时,教师可以通过计算机编发几张台湾日月潭、阿里山的优美的风景图片。在呈现给学生图片的同时,不失时机地给学生播放视频短片,例如总理在答记者问时的讲话原文:“台湾是祖国的宝岛,是我一直向往的地方。我真心希望能有机会到台湾去走一走、看一看。我想到阿里山,想到日月潭,想到台湾各地去走、去接触台湾同胞。虽然我今年已经67岁了,但是如果有这种可能,走不动就是爬我也愿意去。”另外可以播放一些历史短片或纪录片,激发学生的学习兴趣,刺激学生的学习欲望,把学生的注意力集中在这门课上来。在课下,教师可以让学生通过网络收集一些这方面的内容,比如演讲稿、专家分析、新闻视频等,把学生分成小组,就他们所掌握的信息,结合课程主题进行讨论,鼓励学生利用网络进行自主学习。提高学生用各类搜索引擎,就自己所关心的问题上网搜寻资料,进行分析研究,最后解决问题,激发思维能力,强化学生的创新意识和创新能力培养。值得一提的是运用计算机教学虽然能使课堂教学更优化,但并不是课堂教学的必需方法,教师在课堂教学中不要刻意去追求使用计算机。也并不是只有计算机教学才能激发学生思维,才能加强创新意识和创新能力。摒弃历史无从谈未来,摒弃根无从谈枝繁叶茂,摒弃传统无从谈创新。教师要做到计算机教学与传统教学有机结合,做好引导学生思维的教学过程,为创新意识的加强和创新能力的培养不断去摸索和实践,积极推动创新教育的发展。

结语

计算机视觉研究内容范文篇9

关键字:摄像机标定;几何模型;传统标定;自标定

1.引言

随着图像技术和计算机系统的发展,计算机视觉技术已广泛进入人们生活的各个领域。摄像机标定技术作为计算机视觉领域的一个重要研究内容,主要用于机器人定位,工业控制,交通监管、三维重建等方面。计算机视觉中使用的摄像机一般为价格低廉的非量测CCD摄像机,这种摄像机内部参数不知或不稳定,图像分辨率不高,并且存在较大的非线性畸变。鉴于这些特点,对摄像机标定的精确度、稳定性以及实时性的研究显得尤为重要。

2.摄像机标定的基础理论

2.1摄像机标定的含义

所谓摄像机标定,就是从摄像机获得的图像信息出发,根据物体的空间三维信息和图像中二维信息的对应关系,从而确定摄像机的成像几何模型,模型的参数就是摄像机的参数。[1]即摄像机的标定过程也就是求解摄像机内外参数的一个过程,其中内参数包括焦距、光心、纵横比、畸变系数等,外参数则由空间位置和方向,即旋转矩阵和平移矩阵组成。

2.2.图像坐标系、焦平面坐标系、摄像机坐标系和世界坐标系

如图2-1所示,()为图像坐标系,以像素为单位;()为焦平面坐标系,以实际物理长度为单位,O1为摄像机光轴与图像坐标系的焦点,通常位于图像的中心。两坐标系间存在如下关系式:

(式2-1)

图2-1图像坐标系与焦平面坐标系

摄像机的成像原理图如图2-2,摄像机坐标系和世界坐标系的关系可由3*3旋转矩阵R和3*1平移矩阵t表示(见式2-2)。[2]摄像机坐标系和焦平面坐标系的关系表示为式2-3.

(图2-2摄像机坐标系、世界坐标系和焦平面坐标系

2.3.摄像机几何模型

摄像机的几何模型是光学成像的几何关系的简化,大体包括线性和非线性模型。

2.3.1线性模型

线性模型是最简单的摄像机模型,也称为针孔模型,是将空间的三维直线投影为图像上的二维直线。空间中的任一点P可表示为式2-4,再由式2-1~式2-4,可得式2-5。

其中,为u轴和v轴的夹角。为图像主点坐标,K为摄像机内参矩阵,为摄像机的外参矩阵。

2.3.2非线性模型

实际应用过程中,特别是使用广角镜头时,图像上会产生畸变,线性模型此时便不能准确的描述成像关系。通常所说的畸变包括径向畸变和切向畸变,一般情况下,径向畸变的第一项就足以描述镜头畸变。[3]

径向畸变:,其

中,,为径向畸变系数。

3.摄像机标定方法

摄像机标定技术已比较成熟,方法很多,但仍然没有一种能够普遍适用。摄像机标定技术主要可以分为三种:传统标定技术、自标定技术和基于主动视觉的标定技术。

传统的标定方法就是用一个结构形状已知的物体作为空间参照物,通过图像和空间点的对应关系确定摄像机模型,再根据优化算法获得摄像机的参数。[5]具有代表性的方法有直线线性变换法、两步法、张正友标定法等。

所谓自标定,就是不依赖于标定参照物,根据多幅图像的几何关系和摄像机内参数存在的约束实现标定。主要方法有基于Kruppa方程的自标定方法,基于二次曲面的自标定法等。

基于主动视觉的标定需借助可精确控制摄像机运动的平台,控制摄像机作特殊运动,获得多幅图像,建立摄像机模型,从而求解参数。常用方法有基于摄像机纯旋转的标定方法[8]、基于三正交平移运动的标定方法[9]、基于平面正交运动的标定方法[7]等。

3.1算法比较

传统标定法需要基于特定的实验条件(如特定的标定物),算法复杂,实时性差,但精度较高。

自标定法中常用的绝对二次曲线法受初值影响较大,虽然相对于传统标定法较灵活,但鲁棒性不足,对噪声较为敏感。该方法主要用在对精度要求不高的场合。

基于主动视觉的标定法需要提供摄像机运动平台,成本较高。目前的研究集中在如何减少对摄像机的运动限制的同时仍能线性的求解摄像机的参数。[6]

3.2改进算法

针对上述方法存在的不足之处,近年来出现了许多改进算法。例如:经典的两步法标定过程中只考虑了径向畸变,与实际情况不符,因而限制了标定精度的进一步提高;并且该法不能用平板标定块一次标定,给实际应用带来麻烦。文献[10]提出了一种改进的Tsai两步法,针对目前广泛使用的面阵CCD摄像机,采用非线性模型,运用迭代法求解内外参数。该方法操作简便,速度和精度上明显优于经典的两步法,但最终的迭代收敛条件仍需进一步研究。文献[11]中提出了一种新的基于Kruppa方程的自标定算法,该方法简化了Kruppa方程并确定目标函数,通过摄像机的三次线性无关的任意平移运动确定初值,然后用非线性优化目标函数法精化初值。该改进法大大提高了算法的鲁棒性及标定精度。

另外,孟晓桥、胡占义的圆标定方法,吴毅红等的平行圆标定方法等实用性和针对性强的方法也成为摄像机标定发展的一个方向。

4.结束语

摄像机标定技术越来越受到重视,无人机的导航,工业中工件测量、机器人辅助外科手术等很多领域都需要高精度、稳定、实时的标定结果,因此未来摄像机标定技术如何保证精确度的同时提高标定方法的鲁棒性方面,还需进一步研究。

参考文献

[1]马颂德,张正友.计算机视觉――计算理论与算法基础[M].北京:科学出版社,1998.

[2]陈西.摄像机标定与三维重建研究[D].北京:北京化工大学,2007.6

[3]高红波.基于单视图的摄像机标定及其应用[D].成都:电子科技大学,2009.5

[4]刘振中,傅莉.摄像机标定研究[J].沈阳航空工业学院学报,2010,27(1):43~47

[5]蔡宇.3D重建中的摄像机标定和点云处理[D].长春:吉林大学,2009.4

[6]胡培成,黎宁,周建江.一种改进的基于圆环点的摄像机自标定方法[J].光电工程,2007,34(12):54-60.

[7]李华,吴福朝,胡占义.一种新的线性摄像机自标定方法[J].计算机学报,2000,23(11):1121~1129

[8]R.Hartley.Self-calibrationofstationarycameras[J].InternationalJournalofComputerVision,1997,22(1):5~23

[9]S.D.Ma.Aself-calibrationtechniqueforactivevisionsystem[J].IEEETrans.Robot.Automat.,1996,12(1):114~120

计算机视觉研究内容范文篇10

【关键词】车牌识别;机器视觉;研究

0引言

机器视觉是应用本科电子信息类的一门重要选修课,该课程涉及图像处理、计算机视觉、信号处理、模式识别和人工智能等多个领域内容。机器视觉从二维信息处理的角度研究了信息的认知、表征、处理的方法和理论,涉及的理论抽象、复杂且算法众多[1]。传统的教学方法,教师只是对照教材按部就班讲解教材中的内容,学生只是被动学习,没有实践的内容,而且所学内容比较杂乱,不能灵活应用所学的方法去解决实际的一些问题,因此该种教学方法严重束缚了学生学习主动性,制约学生的各种能力的发展,与现代社会人才培养模式极不符合,为此,急需一种新的教学模式。

项目驱动教学法是一种适应新形势下教学模式,该模式与传统的教学模式相反,从教师为中心转到学生为中心,通过项目激发学生的学习兴趣,做到了“做中学”[2-4]。项目驱动教学法虽然将教转到学,但其忽略了教师的教和项目的整体。为了弥补项目驱动教学中的一些不足,本文有效结合教师的导和项目的整体,提出了一个基于项目为核心的机器视觉应用本科课程项目。在课程中,教师可以有效引导学生主动学习图像处理、图像描述和分类学习理论的基础知识和基本技能,培养学生灵活运用相关知识解决实际问题的能力。由于机器视觉这门课程设在电子信息类大四的第一学期,这学期的学生有一个很大的特点,就是面临着找工作,急需要一些实践经验,为了提高学生的就业能力,需要选择一个有效的项目提升就业能力。项目选择既要考虑项目的难度,又要考虑课程所涉及的具体内容,本文从这两方面提出了基于现实中视频序列中车牌识别来进行项目开发,这个项目难度中等,涉及到内容主要有图像处理、模式识别的内容,这些内容是解决车牌检测和识别系统的关键。

1车牌识别项目

车牌识别在智能交通中地位越来越突出,在港口,停车场、车辆监管方面得到了广泛的应用,涉及到了多门学科的内容,主要包括图像处理、模式识别、计算机视觉河应用数学等。车牌识别主要包含以下几个模块:车牌采集、车牌定位、车牌分割和车牌识别模模块,在每个模块中涉及到了许多相关的理论[5-6],如图1所示。本项目正好满足该门课程的相关内容,项目从教教学计划,每周的工作及成绩评估进行分析。

1.1教学计划

经过为期8周的项目学习,可以完整地完成一个项目的开发,学到机器视觉的相关理论知识和技能。整个项目主要包含3个2个小时理论讲座和每周的1个小时的讨论会议,完成给定的项目的开发。项目开发一般有四个阶段:理论学习阶段,数据采集和预处理阶段、数据处理阶段和完善项目阶段。理论学习阶段主要是学习项目所需的理论知识和开发所要注意的内容;数据采集和预处理阶段主要是采集所需数据,完成一些数值预处理;数据处理阶段就是按照要求处理数据,完善项目阶段就是要求学生按照要求完善项目开发。这几个阶段按照时间不同分布于不同的周次完成。

第1周到2周是理论学习阶段,对于车牌识别项目来说就是要学习车牌的采集、定位、图像的预处理(如图像校正,图象增强和边缘检测等操作),字符分割(垂直投影分割,连通区域分割和模板分割),字符识别(神经网络、模板匹配和支持向量机)的理论。

第3周是数据采集和图像预处理,这两周主要是完成数据采集和图像数据的预处理,包括图像的平滑,图像的校正和边缘检测。

第4周到7周完成车牌的定位、分割和字符识别。

第8周完成项目的开发

1.2每周工作

在项目开发阶段,每周的1个小时师生讨论会。讨论过程中,每个团队选出一名学生简短介绍自己团队一周来的工作,这些工作包括技术实现、结果,还有遇到的问题,须用PPT展示自己团队的成果,接着教师进行点评,给出每个团队的一些建议和疑难问题分析,以及一些特别复杂的算法(如梯度方向直方图、支持向量机和神经网络等)的讲解。最后,接着用10-20分钟的时间布置下周的开发内容和疑难问题解答。

1.3成绩评估

对于项目的评估,主要按照开发阶段和笔试成绩确定,开发的四个阶段占总分的30%,小组的口头报告占10%,10%小组的互评成绩,剩下的是笔试成绩。每个阶段团队都要上交一份10页以上的项目报告和部分源代码,每个阶段任务根据学生采用的方法的复杂性和创意性给分。在每周的讨论会议上,每个团队给给出相同时间口头报告,还有5分钟的讨论时间,要求每个成员都必须参与讨论,教师根据口头报告的内容和学生参与讨论的程度给出成绩。每个团队把自己项目开发的报告和结果互评,取互评的平均成绩作互评的成绩。除了项目实践成绩以外,还需要掌握了一些机器视觉的相关理论知识,这也避免学生忽略理论的学习,其中也让学生既理解开发所需的技术,也需要理解其对应的理论。

1.4学生反馈

课程结束后,学生要求填写一份匿名的项目评估表,根据表的内容填写自己的见解。评估收集后,根据重视的程度,大约70%的学生认为相关理论讲座比较重视,大约82%的学生比较重视每周的口头报告,但也有一些学生抱怨时间不够,完不成项目训练。绝大部分学生认为每周的口头报告这种交流方式很好,可以相互交流,找到自己的不足,解决自己的疑难问题,完善自己的程序开发。

2结论

本文提出了一种基于项目为核心的机器视觉应用本科课程项目,在该项目中,学生不仅可以学到了分析问题、解决实际问题的能力,而且也增大了就业的机会。课程结束后,每个团队都能开发出一套采用不同方法的车牌识别系统,虽然难易度不同,但都能识别视视频中的车牌。项目开始阶段,有些学生为了解决开发过程中面临的问题,自己主动去学习相关理论知识,这些知识不仅来自课本,而且也来自大量的相关的专业文献,也激发他们创新能力,得到了比预期好的成果。

【参考文献】

[1]史金龙,白素琴,庞林斌,钱强.研究生机器视觉课程的CDIO教学改革实践[J].计算机教育,2013(9):40-43.

[2]王洪才.论大学创新教学的三要素[J].复旦教育论坛,2012,10(4):41-45.

[3]李成学,杨大柱.任务驱动教学法在电子技术实验课中的应用[J].中外教育研究,2011,1(1):79-80.

[4]施琴,陈军,孙娣全,卢娟,许凤慧.项目驱动教学法在电子技术实验课程中的应用研究[J].工业与信息化教育,2013,8:66-69.

计算机视觉研究内容范文篇11

在用常见的手势进行交流时,人们很容易就能互相理解,在经过学习之后,聋哑人或是正常人都可以运用手语进行交流。不过,想象一下,当你对计算机(或机器)做一个手势,它就能领会你的意图会是怎样的情景呢?如果计算机(或机器)看得懂手语,又意味着什么呢?姑且不管实现这样的人机交流有何深远的意义,还是先让我们来探究一下这样的可行性吧,想想看得懂手语的计算机(或机器)能有什么用途。

人机交互:从呆板到员活

人类之间的交流往往声情并茂,既采用自然语言(口语、书面语言),还广泛采用人体语言(表情、体势、手势)。与人类之间的交流相比,人机交互就显得呆板多了。以计算机的输入方式为例,人要向计算机下达指令,最常见的方式还是通过键盘输入。当然,手写输入也正为许多人所接受和喜爱,语音输入的研究也进行得热火朝天,最初单一而呆板的输入方式已经得到了扩展。然而,科学研究是永无止境的,人体语言这种简单快捷的信息交流方式得到了很多研究者的关注,他们想,能不能把这种灵活的信息交流方式也引进人机交互中呢?

于是研究人员展开了对人体语言理解的研究。人体语言的感知、人体语言与自然语言的信息融合对提高计算机的人类语言理解水平,加强人机接口的可实用性有着积极的意义。手语(手势)是人体语言的一个非常重要的组成部分,它是包含信息量最多的一种人体语言,它与语言、书面语等自然语言的表达能力相同。因而完全可以把手语作为人机交互的一种手段,它具有很强的视觉效果,生动、形象、直观。可见,将手势运用于计算机能够很好地改善人机交互的效率。

计算机怎样识别手势?

从不同的角度可以对手势进行不同的分类。分为交互性手势和操作性手势,前者手的运动表示特定的信息(如乐队指挥),靠视觉来感知,后者不表达任何信息(如弹琴);分为自主性手势和非自主性手势,后者需要与语音配合用来加强或补充某些信息(如演讲者用手势描述动作、空间结构等信息),分为离心手势和向心手势,前者直接针对说话人,有明确的交流意图,后者只是反应说话人的情绪和内心的愿望。

手势的各种组合、运动相当复杂,不过简单来看,手势主要有如下的特点:手是弹性物体,因此同一手势之间差别很大,手有大量冗余信息,由于人识别手势关键是识别手指特征,因此手掌特征是冗余的信息:手的位置是在三维空间,很难定位:手的表面是,非平滑的,容易产生阴影。

了解了手势的这些特点,就可以在手势研究中对手势做适当的分割、假设和约束。例如,可以给出如下约束:如果整个手处于运动状态,那么手指的运动和状态就不重要,如果手势主要由各手指之间的相对运动构成,那么手就应该处于静止状态。比如鼠标和笔式交互设备就是通过识别手的整体运动来完成人与计算机的交互,但它们不能识别手指的动作,其优点是仅利用软件算法就能实现,适合于一般桌面系统。只有当用鼠标或笔式交互设备的运动或方向变化来传达信息时,才可将鼠标或笔式交互设备看作手势表达工具。笔式交互设备发展很快,它提供了充分的交互信息,如压力、方向、旋转和位置信息,但现有交互主要是简单地替代鼠标。

计算机识别手势的手段主要有两种:

1.数据手套。数据手套是虚拟现实系统中广泛使用的传感设备,用户通过数据手套,能做出各种手势向系统发出命令,与虚拟世界进行各种交互操作:比如通过一只与数据手套对应的在计算机屏幕上显示的虚拟手,使用户成为虚拟世界中的一员:抓取物体,如果手套有力反馈,还能让用户感觉到物体的重量和材质等。美国在“洞穴”虚拟系统中就是利用数据手套来研制武器。数据手套的主要优点是可以测定手指的姿势和手势,但是相对而言代价较为昂贵,并且有时会给用户带来不便(如出汗)。

2.计算机视觉。即利用摄像机输人手势,其优点是不干扰用户,这是一种很有前途的技术,目前有许多研究者致力于此项工作。但在技术上存在很多困难,目前的计算机视觉技术还难以胜任手势识别和理解的任务。

目前较为实用的手势识别是基于数据手套的,因为数据手套不仅可以输入包括三维空间运动在内的较为全面的手势信息,而且比基于计算机视觉的手势在技术上要容易得多。

更好地为人服务

日本三菱电子研究实验室的研究人员已经使用低成本的视觉系统,通过手势就可以控制一台电视机。由计算机控制的美国航空航天局虚拟太空站也是采用美国Cybernet公司开发的手语识别软件,通过一部架设在顶部的摄像机来追踪指挥者的手势。当系统捕捉到挥手等手势时,就会做出相应的反应,让指挥者像航天员一样在计算机虚拟的阿尔法国际太空站上移动(确切地说是飘动)。

Cybemet公司的软件还能识别一系列的特定手势,就像工地上的工人或交通警察经常用的那种手语,通过这些手势你能够旋转在虚拟旅行中看到的三维图像,还可以向上或是向下改变你的视角。美国航空航天局正在考虑把这套系统用于真正的太空站,因为笨重的航天服和微重力环境使得鼠标和键盘都变得难以操纵。也许不久之后,航天员就能用简单的手语来控制机器人在太空中抓取物体。

手语(手势)识别系统的研究还有助于改善和提高聋哑人的生活学习和工作条件,为他们提供更好的服务。同时也可以应用于计算机辅助哑语教学、电视节目双语播放、虚拟人的研究、电影制作中的特技处理、动画的制作、医疗研究、游戏娱乐等诸多方面。另外,手语识别系统的研究涉及到教学、计算机图形学、机器人运动学、医学等多学科。因此,手语识别系统的研究非常有意义。

计算机视觉研究内容范文1篇12

【关键词】多媒体;学习;空间能力;认知方式;先前知识

【中图分类号】G420【文献标识码】A【论文编号】1009―8097(2008)09―0035―04

多媒体技术的发展为学习提供了新的具有重要潜在优势的学习环境,多媒体技术能综合言语信息(如解说、文字)和非言语信息(如动画、表格、图表、视频和背景音乐等)于一体,生动、直观地反映教学内容,具有信息量大、能动交互、使用范围广的优点。

但遗憾的是,现实的教学中出现“为了技术而运用技术”的情况,多媒体课件往往根据多媒体工具的技术功能进行设计,而没有遵循心理学、教育学原则;往往按照设计者主观意图设计而忽视学习者的心理特点。在这种基础上设计出来的多媒体课件,其教学效果也让人值得怀疑,因此也就无法保证取得良好的教学效果。贾锋、于龙的调查[1]结果发现:多媒体课件在重点、难点方面表现不突出,教学中与学生的交流不够,互动性差,不利于学生自主学习。然而,既便设计合理,多媒体教学也不一定对所有的学习者、所有的知识都有效,学习者的认知能力、认知风格、学习偏好都会对学习者信息的加工产生重要的影响,而且学习者对不同知识类型、不同呈现方式的知识,其加工水平和加工通道也不相同,这必然也会影响学习者的学习效果。刘文昌[2]认为使用多媒体教学手段的困惑主要有:(1)多媒体的功能发挥不够,目前在实际教学中,还存在着只是用多媒体来放一段音乐、放一段录像或放投影片的现象,仅把多媒体当作单一媒体使用,难以充分发挥多媒体的巨大功能;(2)许多多媒体课件设计不尽合理,学生易对未知事物产生较强的兴趣,但自控力不强,注意力容易分散,兴趣难以持久;(3)在设计时,基本上是以“教师为中心”,考虑老师如何教,而很少考虑学生如何学的问题;(4)呈现的交互方式单一,无法根据自己的意志来选择学习内容。

一多媒体环境下学习的研究现状

一种媒体是否比另一种媒体更有效,这是媒体研究中一个非常重要、持久、尽管在一定程度上缺乏创造性的问题(Clark,1983;Clark&Salomon,1986;Salomon,1979,1994;Wetzel等,1994)。例如,最初在多媒体学习领域中,该问题是以“计算机是否比课本更有效”的形式提出的。为回答这一问题,研究者[3]对使用包括文字和插图的课本进行教学和使用计算机上图形和叙述教授同一内容的教学进行效果对比,其中学习者通过观看由计算机产生的动画和同时呈现的讲解来学习相同的材料,在这些研究中,以计算机为媒体的学生在随后的问题解决测验中平均提出了7.5个创造性答案,以课本为媒体的学生平均提出7.3个答案。与已有研究一致(Clark&Salomon,1986),该研究并没有为媒体效应提供强有力的支持,基于计算机的学习只比基于课本的学习在问题解决测验中多产生了3%的答案,这一差异是微不足道的。然而,与大多数关于媒体效应的研究相似,由于在将两种媒体进行对比时存在着严重的方法学问题,比如,学习内容和学习者本身的差异会对实验结果产生严重的影响,这一点也得到了后来研究[4]的验证,如学习材料、自主学习能力、学习风格都会影响媒体效应。

简单地说,寻找媒体效应是早期关于多媒体教学的研究,但当前的教育心理学家一致认为,各种媒体的相对有效性已不再是一个建设性的问题(Clark,1983,1994;Clark&Salomon,1986;Ross,1994;Salomon,1994)。例如在关于Clark(1994)的论断――媒体效应无法与其它方法、个人特质因素分开的争论(Ross,1994)中,各方面的研究者一致认为,关于媒体的问题应该重新界定。

后来,基于生成理论,E.Mayer将同时受到言语解释和视觉解释的学生(多表征组)在问题解决迁移测验上的表现优于只接受言语解释的学生(单表征组)的效应称为多媒体效应。很多研究(Mayer&Anderson,1991,Mayer&Anderson,1992,Mayer&Gallini,1990)表明:与单独呈现讲解相比,当讲解与动画同时呈现时,学生将在问题解决迁移测验中取得更好的成绩;与呈现文本相比,同时呈现文本和插图时学生将在问题迁移解决测验中取得更好的成绩。有研究发现[5],从时间上来说,图片和文字同时呈现比分开呈现时,其在问题解决迁移的成绩要好;从空间上来说,图片和文字相邻呈现比相继呈现时,其在问题解决迁移的成绩要好。也就是说只有当图片和文本在时间上具有同时性和在空间上具有相邻时,才能使得学习者的图像加工与言语加工两个通道建立起联系,才能提高学习者问题解决的能力,这与多媒体学习的生成理论是一致的。在Jones,LindaC.和Plass,JanL的研究[6]中也发现:图片和注释同时呈现比将二者单独呈现时在外语单词的学习上效果要好。

RicharE.MayerSherryFennellLindsayFarmer&JulieCampbel还探讨了多媒体环境下文本的风格对学习者学习效果的影响[7],研究发现非正式的谈话式的描述语言组在迁移测验上的得分明显的高于正式的非人性化的描述语言组,但是在保持测验上的得分两者之间却没有显著的不同。这个结果与MayerRichardE.&SobkoKristina等以前的研究结果[8]是一致的,多媒体环境下用人类语言比用机器合成语言在迁移测验当中的成绩要好,但是在保持的测验当中同样没有发现显著的不同。

二个人特质对多媒体环境下学习的影响

1学习者已有知识对多媒体环境下学习中的影响

学习者已有的知识主要指学习者在学习之前已经掌握了的与学习内容相关的知识经验。媒体效应对于先前知识较少的学习者而言较为明显,对于先前知识较多的学习者不明显。将语言解释呈现给先前知识较多的学习者时,他们更善于形成自己的心里表象,进而在言语和视觉表征之间建立联系。而仅呈现言语材料时,先前知识较少的学习者难以独立地形成有效的心里表象。因此先前知识较少的学习者更易于从相邻呈现的言语和视觉材料中获益。E.Mayer等人[9]使用有关闪电机制的文本和插图的实验发现,低先前知识组的学习者中,接受结合呈现的材料的学习者产生的创造性解决方案多于接受分离呈现的材料的学习者,但对于高先前知识组的学习者,结合组与分离组的成绩无显著差异。

刘儒德、陈琦、DavidReid在考查文图整合加工水平的文字测验中发现,学习能力和插图类型之间存在显著的交互作用[10];同时他们在研究计算机的插图工具对科学说明文的意义时还发现学习能力高者的测验得分显著高于学习能力低者,插图类型与学习能力之间不存在显著交互作用[11]。

2空间能力对多媒体环境下学习的影响

空间能力是智能的基本成分,指人们对客体或空间图形(任意维度)在头脑中进行识别、编码、贮存、表征、分解与组合和抽象与概括的能力[12]。它主要包括空间观察能力、空间记忆能力、空间想象能力和空间思维能力等因素。在完成空间任务的认知过程中,空间想象能力起着重要的中介桥梁作用,而空间思维能力则起着决定性的、核心作用。

有研究发现空间能力对图形或图像的知觉产生重要的影响,而且空间能力与认知风格存在着交互作用,比如李寿欣、周颖萍认为:在呈现的材料结构复杂(随机情境)的条件下,不同认知方式个体的视空间工作记忆广度存在明显差异,场独立者的视空间工作记忆广度明显高于场依存者;而在呈现的材料有结构(结构简单)的条件下,两者之间不存在显著性差异。在呈现的材料路径复杂条件下,不同认知方式个体的视空间工作记忆广度存在明显差异,场独立者的视空间工作记忆广度明显高于场依存者;而在呈现材料的路径简单的条件下,两者之间不存在显著性差异[13]。而且空间能力低的学习者在记忆中保持和操纵视觉表征时可能会感到更为困难,因为他们不易于从邻近呈现的视觉和言语材料中获益。与之相反,空间能力高的学习者更善于在记忆中灵活地保持和操纵视觉表征,因而他们更易于从邻近呈现的视觉和言语材料中获益。E.Mayer在她的实验研究(Mayer&Sims,1994)中也发现:多媒体效应对于空间能力高的学习者而言较为明显,对于空间能力低的学习者不明显。另外Plass,JanL.Chun,DorothyM.Mayer,RichardE.和Leutner,Detlev,ErfurtU.在多媒体环境下外语的学习中同样发现[14],学习者的口语能力和空间能力会对外语的学习产生重要的影响,空间能力高的学习者比能力低的学习者学习成绩好。

3认知风格对多媒体环境下学习的影响

个体的风格所描述的是一个人习惯上完成学习任务所采取的应对方法或反应。认知风格实质是个体组织和表征信息时表现出的偏好性的习惯性的方式[15]。Hamblin对教师提出建议“鼓励学生用一个长期的过程来形成一种有意义的高效率的学习风格。强加一种学习风格,在教育上等同于把一种错误的自我强加给别人――从长远来看,这无疑是一种具有破坏性的行为。[16]”多媒体教学设计也是如此,在强调设计符合人的认知规律的同时,我们还必须考虑个体的差异,尤其是认知风格的差异,因为它对个体的学习产生着潜移默化的影响,需要不同的学习策略。

研究发现,学习材料的类型与认知风格对学习者的学习效果有交互作用。Riding和Douglas[17]以59名15-16岁的中学生为被试研究了信息呈现方式对他们学习的影响,结果发现,借助计算机以文本+图片的格式来呈现的关于轿车制动系统的材料与只采用文本呈现同样的内容相比,更能够促进表象型学生的学习,提高的幅度相当明显,接近只有文本方式下的分数的两倍;对于言语型的学生来说,两种呈现方式下的学习效果相似。因为表象整体型者最倾向于将信息用心理表象的方式组织成一个整体,所以他们的成绩可能在增加了动画时提高最大;而言语分析型者倾向于用语义将信息表征为认知组块的风格可能不利于相关联系的形成,他们的成绩可能在增加了动画时变化不大。在处理信息时,与整体型的人相比,分析型个体需要一个更大的“视窗”,因为整体型的人倾向于将信息组织成结构较为松散的整体,而分析型的人则倾向于将信息组织成分割明显的认知组块,有限的视窗(如计算机)可能使他们更难获得一种整体观,但对于整体型的学生,情况正好相反。Riding和Crrimley以80名11岁小学生为样本,比较了对计算机呈现的关于科学主题的CD-ROM多媒体教学材料的学习成绩和在传统教学方法下取得的用标准评估任务测验(SAT)所测得的成绩[18],他们发现,整体一分析风格和呈现方式对回忆成绩存在显著的交互作用,分析型的学生适合传统的教法,整体型的学生适合于运用计算机学习。另外有证据表明,计算机操作者在大多数情况下属于表象整体型。

陈琦、吴洪健在多媒体环境下学习相遇问题的研究中发现,场依存性学生和场独立性学生的学习过程不同,学习结果也有差异,从总体上看,场依存性学生的成绩略低于场独立性学生;在只有学习路径支架条件下,场依存性学生在大部分指标上的成绩低于场独立性学生;在有学习路径和解题思路支架的条件下场依存性学生在练习得分、理解水平上可达到与场独立性学生同样的标准,但在远迁移水平上场依存性学生的成绩与场独立性学生有较大差距;因此在多媒体环境下学习较抽象的相遇应用题时,提供解题思路支架是必要的,对场依存性学生更有帮助[19]。

陈铮通过对信息呈现方式和认知风格的研究[20]发现,良好的信息呈现方式(增加了动画,文本和动画接近协同呈现)能帮助表象型学生的记忆和问题解决成绩得到较大的提高,而对言语型学生的帮助不大;在良好的信息呈现方式下(增加动画,文本和动画接近协同呈现),表象整体型学生的记忆成绩提高最大,言语分析型学生的记忆成绩提高最小,表象分析型和言语整体型学生居中。综合性认知风格与文本和动画是否接近协同呈现对学生的问题解决成绩有显著的交互作用,在文本和动画接近协同呈现时,表象整体型学生的问题解决成绩提高最大,其次为表象分析型、言语整体型和言语分析型,在有动画时,表象整体型学生的问题解决成绩提高最大,其次为表象分析型、言语整体型和言语分析型,体现出表象型、整体型认知风格在良好的信息呈现方式下,对多媒体教学效果的提高作用。整体一分析维度和信息的呈现方式(是否增加动画、文本和动画是否接近协同呈现)对学生的记忆和问题解决成绩没有显著的交互作用,但在良好的信息条件下(有动画、文本和动画接近协同呈现),整体型学生的记忆和问题解决成绩的提高高于分析型学生。整体一分析维度更可能与表象一言语维度相结合形成综合性认知风格来影响学习者在不同信息呈现方式下的学习效果。

三对国内外研究的简要评价

自从计算机被用于多媒体教学以来,国外学者在多媒体教学的应用方面做了大量的研究,积累了丰富的研究经验,提出了一些相关的理论,特别是佩维沃(Paivio)双重编码理论和梅耶(E.Mayer)多媒体学习理论,它们都在多媒体教学和研究当中得到了广泛的应用。纵观国外对多媒体教学效果的研究发现,主要集中在以下几个方面:

(1)多媒体效应,也即怎么样的媒体或者媒体组合对于学习者是有效的,对于这个问题研究者基本上达成了一致,用文本和动画结合起来呈现的教学信息,学习者的保持和迁移效果好。

(2)关于多媒体信息在时间和空间上呈现的连续性,时间上具有同时性和在空间上具有相邻时,学习者的保持和迁移效果好;另外,研究结果一致表明过量信息会对学习效果产生不良的影响,也即图片与文本之间的关系要联系紧密,文本应该是对图片或者动画所要表达的主要内容的准确的精练的描述,尽量避免一些冗余的信息。

(3)文本信息通过不同的感觉通道呈现的问题,比如对于文本信息通过视觉和听觉两个不同的通道呈现时,视觉通道呈现的效果要优于听觉通道呈现的效果。

(4)文本信息的风格也会对多媒体环境下的学习效果产生影响,比如非正式的谈话式的描述语言呈现文本信息,其效果要优于正式的非人性化的描述语言的呈现,口头语言的效果要优于书面语言的效果。

(5)个体特质方面,当个体的智力达到一定的程度时多媒体的刺激才能够发挥作用,而且随着个体知识的积累、认知风格的差异,他们在多媒体环境下的学习效果也不同。

然而国内关于多媒体环境下学习效果的研究还基本上处于起步阶段,这方面的研究相对较少,而且主要集中在以上(1)(2)(3)这三个方面,对与文本信息的风格和个体特质方面对学习效果的影响的研究相对较少。另外,纵观国内外对多媒体学习的研究发现,主要集中在程序性知识(主要指一些关于自然科学,也即原理性方面的知识)的学习,只有DeWestelinck,Katrien等对于陈述性知识(主要指一些关于社会科学方面的知识)的研究[21]中发现,多媒体环境下的学习并不能够提高学习者在保持和迁移方面的成绩,但同时,这种条件下的学习也不需要过大的智力负荷。对于多媒体的描述信息,用听觉通道呈现时学习者在保持和迁移方面的成绩都低于用视觉通道呈现时的成绩[22]。

四启示

通过对国内外研究的分析,特别是美国著名教育心理学家RichardE.Mayer和我国学者刘儒德、陈琦等大量实证研究的分析,我们认为以往研究至少有以下三个方面的不足。

(1)研究主要集中在利用多媒体所进行的程序性知识的学习上,而对多媒体应用于陈述性知识上的研究则相对较少。

(2)以往研究中所用的言语信息都是用文字也即视觉的加工形式来呈现的,如果将这种视觉呈现的文字信息改变为听觉呈现的文字信息时,其学习结果是否会受到影响?

(3)以往的研究没有将多媒体信息的呈现方式、认知风格、空间能力和先前知识做一个整体的研究,以便进一步考查它们之间的相互作用。

此外,由于美国计算机和网络的普及率要比中国高出很多,美国的中小学生对计算机技术和多媒体技术的了解程度相应的也要比中国的学生好,那么,在中国的研究是否会得到和RichardE.Mayer一致的结果。

总之,运用基于计算机和基于课本的媒体时都既可能产生有效的教学,也可能产生无效的教学,而且,不同认知方式、学习能力的学生的学习具有不同的特点,在运用媒体教学时应充分考虑。本文目的就是通过对多媒体学习环境中,文字信息和图像信息、听觉信息和视觉信息的呈现方式以及一些个人特质,比如:空间能力、认知方式和先前知识等因素进行分析,以便为我国的中小学多媒体教学提供理论和实践依据,更好地指导多媒体教学。

参考文献

[1]贾锋,于龙.在课堂教学中应用多媒体课程资源的研究报告[J].中国电化教育.2007,(1):64-66.

[2]刘文昌,多媒体视听要素对高中学生识记水平影响的研究[D].南昌:江西师范大学,2006.

[3]Clark.R.E.&Salomon.G.Mediainteaching.InM.C.Wittrock(Ed)Handbookofresearchonteaching[M].NewYork:Macmillan.1986:464-478.

[4]Mayer,RichardE.WhenStaticMediaPromoteActiveLearning:AnnotatedIllustrationsVersusNarratedAnimationsinMultimediaInstruction[J].JournalofExperimentalPsychologyApplied,2005,11(4):256-265.

[5]Mayer.R.E.&Anderson.R.BTheinstructiveanimation:helpingstudentsbuildconnectionsbetweenwordsandpicturesinmultimedialearning[J].JournalofEducationalPsychology.1992,(84):444-452.

[6]Jones,LindaC.&Plass,JanL.SupportinglisteningcomprehensionandvocabularyacquisitioninFrenchwithmultimediaannotations[J].ModernLanguageJournal.2002,86(4):546-561.

[7]RicharE.MayerSherryFennellLindsayFarmer&JulieCampbell.APersonalizationEffectinMultimediaLearning:StudentsLearnBetterWhenWordsAreinConversationalStyleRatherThanFormalStyle[J].JournalofEducationalPsychology.2004,96(2):389-395.

[8]MayerRichardE.SobkoKristina&MautonePatriciaD.Socialcuesinmultimedialearning:Roleofspeaker’voice[J].JournalofEducationalpsychology.2003,95(2):419-425.

[9]Mayer.R.E.Steinhoff.K.Bower.G.&Mars.R..Agenerativetheoryoftextbookdesign:Usingannotatedillustrationtofostermeaningfulleaningofsciencetext[J].EducationalTechnologyResearchandDevelopment.1995,86(4):546-561.

[10]刘儒德,陈琦,DavidReid.多媒体互动插图对科学说明文学习的影响[J].应用心理学,2002,8(2):39-44.

[11]刘儒德,陈琦,DavidReid.基于计算机的插图工具对科学说明文的意义建构的影响[J].心理与行为研究,2005,3(3):161-164.

[12]李洪玉.青少年空间认知能力发展的研究[D].北京:北京师范大学,1999.

[13]李寿欣,周颖萍.个体认知方式与材料复杂性对视空间工作记忆的影响[J].心理学报,2005,38(4):523-531.

[14]Plass,JanL.Chun,DorothyM.Mayer,RichardE.&Leutner,Detlev,ErfurtU.Cognitiveloadinreadingaforeignlanguagetextwithmultimediaaidsandtheinfluenceofverbalandspatialabilities[J].ComputersinHumanBehavior,2003,19(2):221-243.

[15][16]Riding.R.J.&Rayner.S.G.陇国维译.认知风格与学习策略[M].上海:华东师范大学出版社,2003:7-8.

[17]Riding,RJ.,Ashmore,L.Verbal-imagerlearningstyleandchildren'srecallofinformationpresentedinpictoricalversuswritten[J].EducationalPsychology,1980,6:141-145.

[18]Riding.R.L.&CrimleyM.(1999)CognitivestyleandTeamingfrommultimediaCD-ROMsin11-year-oldchildren[J].BritishJournalofEducationalTechnology,30:43-56.

[19]陈琦,吴洪健.在建构性多媒体学习环境中教学支架和认知方式对小学生应用题学习的影响[A].第九届全国心理学学术大会论文集[C],2001,94-95.

[20]陈铮.信息呈现方式和学生的认知风格对多媒体环境下科学学习效果影响的实验研究[D].重庆:西南师范大学,2004.

  • 下一篇:大学新学期开学广播稿(精选2篇)
    上一篇:了解手术室护理工作的总结(整理10篇)
    相关文章
    1. 森林防火巡查巡护方案范例(12篇)

      森林防火巡查巡护方案范文篇1【关键词】林业资源;森林;防火;管理措施1加强森林防火管理的重要性1.1加强森林防火管理有助于保护生态环境众所周知,森林资源对于我国的林业资源保..

      daniel 0 2024-03-27 04:56:13

    2. 建筑企业质量管理措施范例(12篇)

      建筑企业质量管理措施范文[关键词]:建筑工程;施工质量;管理措施[引言]:近年来,随着我国经济建设的快速发展,我国的建设事业取得了丰硕成果,人民的居住水平和生活h境有了很大程度的..

      daniel 0 2024-03-27 04:24:13

    3. 纺织行业现状及发展趋势范例(12篇)

      纺织行业现状及发展趋势范文1纺织发展新特点与检验1.1纺织的战略地位2009年,国务院的《纺织工业调整和振兴规划》给纺织工业明确定位,提出了纺织工业是国民经济传统支柱产业..

      daniel 0 2024-03-27 03:52:13

    4. 环境园林工程设计范例(12篇)

      环境园林工程设计范文篇1关键词:植物配置设计;园林工程;效果园林工程在设计的过程中,植物配置设计为主要的组成部分。植物配置设计对于园林工程的最终建设效果影响较大,当前在..

      daniel 0 2024-03-27 03:20:13

    5. 中学语文阅读教学策略范例(12篇)

      中学语文阅读教学策略范文篇1关键词:初中语文;阅读教学;轻负高质;教学策略“轻负高质”是指在素质教育背景下,通过多种教学手段的使用,将教学内容以灵活、多样的方式传递给学生,使..

      daniel 0 2024-03-27 02:48:13

    6. 道路照明验收规范范例(12篇)

      道路照明验收规范范文篇1笔者注意到这一事实:尽管存在诸多局限性,但1995年10月4日财政部印发的《国有建设单位会计制度》至今仍在实施中,这意味着《规程》应当是与《国有建设..

      daniel 0 2024-03-27 02:16:13

    7. 网络安全方面的问题及对策范例(12

      网络安全方面的问题及对策范文【关键词】网络安全;网络管理;网络技术;信息安全随着计算机网络的普及,计算机网络技术的不断发展,计算机功能的多样化与信息处理的复杂程度显著提..

      daniel 0 2024-03-27 01:44:13

    8. 黄斑性眼病如何治疗范例(3篇)

      黄斑性眼病如何治疗范文黄斑出血最常见于湿性老年黄斑变性(又称年龄相关性黄斑变性)、高度近视以及年轻患者病因不明的黄斑疾病。这类疾病造成的出血,其根本原因是黄斑部位..

      daniel 0 2024-03-27 01:12:43