数学建模如何进行数据分析范例(12篇)
数学建模如何进行数据分析范文篇1
关键词:管理统计学;教学模式;大数据;案例教学
中图分类号:G4文献标识码:Adoi:10.19311/ki.1672-3198.2016.33.147
1引言
管理统计学是一门应用统计学方法和理论研究经济管理问题的应用性学科,它通过收集、分析、表述、解释数据来探索经济管理问题的规律,并辅助企业进行管理决策和提高管理效率。传统的统计学关注小规模数据下的数据描述、推断和科学分析用。与之相应,管理统计学的课堂教学主要关注统计学原理的讲述、小数据的推断分析和经济管理问题的简单应用。
然而,自2008年Nature杂志发表“Bigdata:scienceinthepetabyteera”以恚大数据的发展方兴未艾,备受学术界,企业界等关注。大数据的理念和技术不仅在互联网、金融、机器人、人工智能等领域取得突破性进展,也将对企业的生产、经营和决策等活动带来深刻的影响,通过对企业大数据的深度挖掘,有助于实现企业的商业价值,规避企业的决策风险,提高企业的竞争力。
大数据时代的到来,对管理统计学来说既是机遇又是挑战,机遇在于:大数据的分析主要建立在统计学的基础上对数据进行处理、分析,从而使得大数据可视化;而挑战在于:当下管理统计学的教学方法和教学手段难以匹配大数据时代对数据分析从业者的要求,这就要求对管理统计学的课堂教学模式进行进一步的发展与创新,以期适应大数据背景下的新要求。
如何结合大数据时代的新要求设计合适的课堂教学模式,如何结合丰富的大数据应用案例开展课堂教学活动,如何增强大数据背景下学生的数据驱动的管理决策意识,培养适应大数据时代要求的高素质人才,这些都是大数据背景下传统的管理统计学课堂教学模式所面临的问题和挑战,这也促使管理统计学教学工作者不得不去探究、优化甚至改革现有的管理统计学课堂教育模式。
2传统管理统计学教学模式的概述
笔者所在的教学团队来自于武汉科技大学管理学院,承担全院《管理统计学》课程教学任务,在教学方法、实践教学等有较为丰富的教学经验。然而,在多年的教学过程实践和与学生的教学互动当中发现:现有的管理统计学教学模式尽管相对较为成熟,在培养学生的数据分析意识方面起到的重要作用,但是仍存在以下不足,而这些不足恰恰难以适应大数据背景下对管理统计学教学带来的挑战。
2.1注重理论讲授,忽视应用教学
受技术发展和数据规模等因素的制约,传统的管理统计学教学大都采用理论驱动的教学模式,教师依托教材,注重统计学基本原理和方法的传授,学生掌握基本原理,对统计学的实际应用等关注较少。
尽管管理统计学课堂教学会涉及到一定的应用案例,但是这些案例大都简单,陈旧,数据来源单一,难以接触实际原始数据,统计建模思路也相对固定,这些教学案例既不能反映管理统计学的最新发展和应用思想,也无法将其带入企业经营的情景,对企业决策过程缺乏了解,这些因素都使得学生对该课程的学习兴趣不高,不利于培养学生应用统计学解决实际问题的能力,进而影响课堂教学效果。
2.2注重数学推导,忽视工具应用
管理统计学要求学生掌握一定的数学基础,教材也都有较多的数学公式和理论推导,忽视了培养学生应用SPSSvSASvR等统计软件工具解决统计问题的操作能力。
根据经管类专业的培养定位,对于经管类专业的学生而言,相比于统计的数学公式,真正实用的如何借用SPSSvSASvR等统计软件工具来解决企业经营决策面临的实际问题,尤其是在大数据背景下,需要处理海量、复杂、多源、异质的高维数据。这些是单凭数学推导和简单的手动计算无法完成的。
近年来,大数据、互联网等技术的快速发展催生了一类新型且前景广阔的职业方向-数据分析师。综合数据分析师的职业要求,可以发现,这些职位大都要求从业者了解基本的统计学原理和方法,熟练掌握SPSSvSASvR等统计软件工具,并应用这些工具解决企业经营管理面临的实际问题。
2.3注重知识考核,忽视项目训练
受限于教学管理制度和考核手段等因素,目前管理统计学课堂教学考核方式大都以闭卷为主,主要考察学生对统计学基本知识点的掌握情况,以及学生应用统计学知识解决简单案例的综合能力。
然而,在大数据时代背景下,除了要求掌握统计学基本原理,更应培养学生应用统计学知识解决实际问题的综合能力,而这种综合能力往往涉及数据获取、数据预处理、数据探索、统计建模、模型检验、模型评价、模型解释、模型部署和模型修正等数据分析的全过程,这种综合能力的掌握是无法通过现有的知识考核来达到的,这些必然要求学生通过参与实际项目或模拟情景来实现。
3大数据背景下管理统计学教学模式探讨
如何结合大数据时代的新要求设计合适的课堂教学模式,如何结合丰富的大数据应用案例开展课堂教学活动,如何增强大数据背景下学生的数据驱动的管理决策意识,培养适应大数据时代要求的高素质人才,这些都是大数据背景下传统的管理统计学课堂教学模式所面临的问题和挑战。而现有的管理统计学课堂教学模式难以匹配大数据时代对其提出的要求,这就要求对管理统计学的课堂教学模式进行进一步的发展与创新,以期适应大数据背景下的新要求。
数学建模如何进行数据分析范文
关键词:探究式教学模式;数据库设计;反馈检查;探究创新
0引言
数据库系统是计算机系统的重要组成部分,是企业、机构、互联网乃至整个信息社会赖以运转的基础。数据库理论与技术教育已成为现代计算机科学和相关学科教育的核心部分。因此,数据库系统原理课程是高校计算机及相关专业的必修课程。该课程要求培养学生具有较强的数据抽象和数据建模能力,即具有较强的数据库设计和应用开发能力。
数据库设计的核心是在不同的抽象级别上通过不同的数据模型对现实世界中应用功能的数据需求进行建模,分析应用功能的数据需求,表达数据及数据之间联系语义、数据操作和数据完整性约束,实现从现实世界到信息世界、信息世界到逻辑机器世界、逻辑机器世界到物理机器世界的逐步转换。这就要求在教学过程中师生积极交流互动,共同探索、共同发展,使学生能够通过自己的知识储备,结合教师的引导,探究和解决学习过程中产生的一系列问题,从而充分发挥学生的主体作用和教师的主导作用。
1探究式教学模式
靳玉乐在《探究教学的学习与辅导》一书中将探究式教学模式定义为:在探究教学理论的指导下,在探究教学实验经验的基础上,为发展学生的探究能力,培养其科学态度及精神,按卡模式分析等方法建构起来的一种教学活动结构和策略体系。因此,我们可以认为探究式教学在实质上是一种科学模拟性的研究活动。它主要包含两个方面:一是教师作为探究式教学的主导,要为学生设置探究学习的情境,营造探究的氛围,给学生提供必要的帮助和指导,使学生在探究中明确方向;二是学生作为探究式教学的主体,要有真正独立探究的机会和愿望,能明确教师提出的探究目标,掌握探究的正确方法,开拓探究的思路,进而培养学生的创造性思维和创新能力,学会科学学习,为终身学习奠定基础。
为此,教师可以有意识、有步骤、有指导地促进学生独立自主地发现问题、分析问题与解决问题,进而促进学生知识的掌握、能力的发挥、探索与创新能力的培养。探究式学习过程前需要进行有理论指导的假设,在学习实践过程中要进行有逻辑和批判性的思考,促进多元化教育教学目标的最终实现。
2探究式教学在数据库设计中的实施方案
数据库设计是根据各种应用处理的要求、硬件环境及操作系统的特性等,将现实世界中的数据进行合理组织,并利用已有的数据库管理系统来建立数据库系统的过程。具体地说,是对于一个给定的应用环境,构造出最优的数据库逻辑模式和物理模式,并以此来建立数据库及其应用系统,使之能够有效地存储和管理数据,满足用户的信息要求和处理要求。
在数据库设计教学过程中,我们主要通过“创设情境、设疑激趣,提出问题、分析需求,设计模型、分析论证,反思评价、表达交流”4个环节进行探究式教学方法的探索与实践,并以网上书店系统的数据库设计为例,探讨探究式的教学手段和教学方法。
2.1创设情境、设疑激趣
数据库设计的第1个阶段是需求分析,教师应创设与数据库设计选题相关的业务情境、问题情境等,把要探究的问题蕴含在各种情境之中。因此,这一阶段采用创设情境、设疑激趣的探究方法,其教学目的是:结合实际业务背景,了解并分析系统功能和业务流程。
这个阶段的教学手段和教学方法具体如下:
(1)利用现实的网络资源导入案例,创设相近的业务情境。将学生分为若干小组,利用课前空余时间分别登录卓越亚马逊网、当当图书、京东商城图书、99网上书城、中国图书网等网站,每个小组实际完成一个网上购书的业务流程。
(2)在实际网上购书的业务情境中,启发各组学生在执行购物的过程中认真分析该系统的主要功能及业务流程。
(3)各小组学生对购书平台的功能进行信息收集、整理和分析,并讨论不同购书平台在系统功能、业务流程等方面的差异。
(4)分析并总结一个网上购书系统的主要业务流程和功能需求。
为了进一步激发学生对数据库设计的兴趣,教师应当结合系统功能启发学生学会巧思设疑。例如,网上购书系统中的书(商品)从哪里来的?如何存放?客户下单后如何完成配送工作?如何跟踪订单状态?订单状态如何变化?
上述探究方法能够为学生设置探究学习的情境,营造探究氛围,充分激发学生学习的兴趣,引导学生带着疑问去分析网上书店的主要业务流程并归纳出所开发系统的具体功能需求。
2.2提出问题、分析需求
数据库设计第2个阶段的探究方法是通过提出问题,进而分析系统需求。因此,该阶段的教学目的是提出问题并引导学生思考:①业务流程和系统功能的实现要依靠数据需求和业务规则来支持;②不同的业务流程和系统功能,它们的数据需求、业务规则和性能需求也是不一样的。
这个阶段的教学手段和教学方法具体如下:
(1)依托江西财经大学毕博网络教学平台(http:∥/webapps/login/),在数据库系统原理课程的教学网站中开设讨论版,教师或学生均可以自由地提出问题或就某个问题进行探讨。
(2)教师可以抛砖引玉,提出学生没有关注或不能发现的问题,以此激发学生发现问题、提出问题的探究意识,如配送单的图书从何而来,配送后如何跟踪订单状态。
(3)引导学生结合业务情境并联系实际需求,探讨更为科学合理的数据需求、业务规则和性能需求。
(4)以订单生成与订单受理业务为例,分析其主要数据需求和业务规则。
(5)当系统功能或业务流程发生变化时,数据需求、业务规则或性能需求等如何修改才能满足这些变化的要求。
上述方法可以引导学生根据系统功能需求和业务流程,分析数据管理的业务规则和约束条件,提升学生独立思考、互相研究的能力,帮助学生在认知、讨论、理解问题的过程中学习并形成自己的知识。
2.3设计模型、分析论证
数据库设计第3个阶段的探究方法是设计模型、分析论证,教学目的是在分析系统的数据需求、业务规则和约束条件的基础上,学生根据自己对问题的理解和已掌握的知识,提出解决问题的方案,设计概念模型、逻辑模型和物理模型,并通过团队讨论、理论分析、实验验证等方法进行分析论证,提高学生的分析探究能力和模型设计能力。
这个阶段的教学手段和教学方法具体如下:
(1)根据需求分析设计合理的概念模型,主要完成如下任务:
①定义实体集及属性、实体集的主码,用E-R图及数据字典描述被建模的实体集。
②定义联系集及属性、联系集的主码、联系的映射基数及参与约束、实体的角色,用E-R图描述被建模的联系集。
③分析初步E-R图中是否存在依赖约束、多值联系。
④利用扩展E-R特征对对象进行分类及聚合。
(2)设计订单生成业务的概念模型,如图l所示。
该E-R模型存在如下问题:
①当一个会员订购同一图书多次时,会员与图书之间是多值联系,导致主码值不能唯一,这违背了E-R模型关于联系集主码的确定原则。
②可能导致大量数据冗余,如订购业务中由于一次可以购买多种商品,导致订购日期、订单总金额等数据出现冗余。
为了解决这些问题,可以将上述多对多的多值依赖联系抽象为派生实体订单,并建立订单与图书之间、订单与会员之间的联系。为此,我们重新分析概念模型的设计方案,如图2所示。
(3)通过团队讨论、理论分析等不同方法,对概念模型进行进一步的分析论证。
①对照需求分析规格说明书,检查E-R模型,看其是否包含了所有数据、能否满足所有功能需求等。
②分析所建概念模型是否合理?如是否表达了正确的业务处理信息,是否需要一单多送,是否需要图书出库管理。
(4)逻辑模型设计。E-R模型是对现实世界的抽象,若要被关系数据库所接受,必须将E-R模型转化为关系数据库所支持的逻辑模式。
(5)物理模型设计。考虑数据库要支持的负载和应用需求,为逻辑数据库选取一个最适合现实应用的物理结构,主要包括数据存储结构和数据存取路径等。
上述探究方法可以帮助学生重点掌握数据库各种模型设计的一般方法,指出数据库模型设计的优点和不足,并给出改进的方法和措施,从正反两方面帮助学生加深对数据库设计理论的理解和认识,提高数据库分析和设计的能力。
2.4反思评价、表达交流
数据库设计探究式教学的第4个阶段是反思评价、表达交流,其教学目的是教师安排每个小组对已经设计好的概念模型、逻辑模型、物理模型等进行反思评价。
这个阶段的教学手段和教学方法具体如下:
(1)每一个阶段结束后,组织学生对设计的模型进行自评和互评。即使各阶段设计的模型能够基本包含网上购书系统的功能需求及数据需求、业务规则、数据约束等要求,但经过小组自评和互评,仍然可以进一步发现考虑不够深入、脱离现实需求等问题。这就需要将相关功能进行扩充或修改,以满足现实业务要求。
(2)在自评和互评过程中,教师或学生对设计的模型质疑,设计人员解答,然后进一步探讨。如当数据约束条件不能在E-R模型中完整地表达时,可以考虑用触发器来帮助实现关系的完整性定义。
(3)教师需要对每个小组的设计过程、设计结果、答辩等各个教学环节进行客观公正的评价,及时指出学生在数据库设计过程中出现的问题,并对学生的学习情况作出一个概括性的评价。
上述探究式教学方法可以引导学生对自己的模型设计、理解程度、思维过程等方面自我认识、自我评价以及对自己学习进度自我监控,达到提高学生的表达交流能力,促使学生养成批判性思维的教学效果。
3数据库设计的反馈检查
由于数据库设计不是一蹴而就的,还需要对数据库设计的各个环节进行反馈检查:一方面,对照前一阶段的要求检查在后一阶段的设计中是否全部实现了;另一方面,通过后一阶段的设计也能发现前一阶段设计工作的不足。因此,数据库设计是一个反复的过程,结合探究式教学实施的4个阶段和数据库设计的反馈检查工作,构造基于探究式教学模式的整个数据库设计教学实施流程,如图3所示。
图3中,实线部分表示探究式教学实施的各个阶段及每个阶段数据库设计的主要任务;虚线部分表示各个阶段可能出现的反馈检查任务。主要反馈检查任务包括:当系统功能或业务流程发生变化时,数据需求、业务需求和性能需求都可能发生变化;若数据需求和业务规则发生变化,则概念模型、逻辑模型、物理模型也应作相应修改;当然,概念设计的不同也同样会导致逻辑设计和物理设计的变化。总之,在数据库设计的各个阶段及其各项设计步骤中都可能根据实际应用功能和需求的变化经过不断的反思评价和反馈检查得到进一步的改进和完善。
3.1系统功能、业务流程的改变
网上书店系统的系统功能因实际应用需求的变化,可能导致业务流程也必须相应改变,从而使数据需求、业务规则和性能需求也要相应改变。
例如,业务处理中关于订单配送的流程变为:会员可以根据需要将一个订单进行拆分配送,或根据所订购图书的库存情况而选择自动拆分配送,即一个订单可以有多个配送单来完成图书配送业务。那么,主要业务流程应增加配送设置与图书配送业务,系统功能部分可以增加配送管理功能和配送公司管理功能。因此,数据需求和业务规则也应相应改变为:
①会员在生成订单后需要进一步进行配送设置,包括填写配送信息,定义配送明细,同时还需要选择如果一个配送单中的所有图书不是同时有货,是否需要自动拆送。
②每张配送单要求记录下列信息:配送单号、配送日期、是否拆送、发票编号、配送状态、配送信息(收货人、送货地址、邮政编码、联系电话等)和配送明细(ISBN、书名、配送数量等)。
③配送状态用于记录该配送单的当前配送状态:未发货、已发货、已送到等。订单中的订单状态记录了该订单的当前处理情况:未审核、退回、已审核、已部分配送、已全部配送、已处理结束等。
④订单明细的配送状态记录了该图书的当前配送情况:未配送、已部分配送、已全部配送等。
⑤当订单中的某种图书全部送到后,要更新该图书的配送状态为“已全部送到”。当订单内全部图书的配送状态为“已全部送到”时,则更新该订单的订单状态为“已处理结束”。
⑥一个配送单只能由一个配送公司进行配送(不同配送单可以由不同配送公司配送);一个配送公司可以承接多次配送业务。
3.2数据需求、业务规则的改变
南于支持系统功能和业务流程的数据需求、业务规则发生变化,其对应的概念模型也可能改变,从而逻辑模型、物理模型会相应变化:
①伴随着配送设置会生成配送单和配送明细。
②配送单是依附于订单的,可将配送单建模为订单的弱实体集,属性有配送单号、收货人、送货地址、邮政编码、联系电话、发票编号、是否拆送等,配送单号为部分码,是否拆送为新增属性。
③订单实体集与配送单弱实体集之间存在一对多的包含标识联系集。
④配送单弱实体集与图书实体集之间存在多对多的图书配送(即配送明细)联系集,联系属性有配送数量。
⑤在配送单弱实体集与职员实体集之间存在多对一的分派联系集;在配送单弱实体集与配送公司实体集之间存在多对一的配送联系集,联系属性有配送日期、配送状态。
实践表明,采用探究式教学模式的教学效果较以前有很大的改进。学生通过基于探究式教学的数据库设计学习,获得了极大的成就感和数据库应用系统设计与开发的信心。在反思评价及反馈检查过程中,很多学生感觉学习印象深刻、收获很大,尤其是教师对不同概念模型的设计与分析论证方法,让学生从不同角度深刻理解了数据库设计的基本原则和方法,从而加深了学生对抽象理论的理解和认识,提高了数据库分析和设计的能力。
4结语
在实际教学过程中,教师应利用现代信息技术设置各种情景,精心设计有助于学生开拓思维能力的导学问题,采用启发式、讨论式、参与式等多种教学方法引导学生的学习和探究,在设疑、启发、讨论和反思过程中逐步培养学生探究创新的意识和能力。
参考文献:
[1]靳玉乐探究教学的学习与辅导[M].北京:中国人事出版社,2002:24-25.
[2]贾娟.浅析探究式学习对于提升高校美术教学效果的重要意义[J].教学研究,2011(8):60.
[3]万常选,廖国琼,吴京慧,等.数据库系统原理与设计[M].2版.北京:清华大学出版社,2012:182-185.
数学建模如何进行数据分析范文篇3
非标准舾装件设计现状
船舶舾装件大多数都已经标准化,一般的专业化船舶生产设计软件都已经建立了舾装标准件的通用数据库。但大量的非标准舾装件的设计在目前仍然靠设计人员手工用AutoCAD绘图的方式,效率不高。另外非标准舾装件由于其尺寸和形状往往根据周边结构和设备进行变化,还需要与船舶实际的布置相一致,往往要进行多次修改。一旦需要修改,便需要设计人员一个个零件地进行创建、复制或移动,具体操作过程重复单调,费时费力,使得设计过程繁琐冗长,这严重影响了产品的开发效率。
船舶非标准舾装件实现参数化设计的基础
通过对非标准舾装件特点的研究,我们可以发现非标准舾装件虽然种类较多,类型各异,但绝大多数的尺寸和结构形式则基本一致,不会有太大的变化,便于进行参数化设计。参数化设计还能够使设计人员在设计的同时实现参数化建立数据库,极大的方便后续设计工作。因此,对非标准舾装件采用参数化设计技术可缩短设计周期,提高设计效率,改善绘图质量。
在船舶非标准舾装件参数化设计中,首先必须建立参数化模型。参数化模型有多种,如几何参数模型、力学参数模型等等,本方案只建立了几何参数模型。在船舶非标准舾装件参数化设计中,同类零件往往只是尺寸不同而结构相同,映射到几何模型中,就是几何信息不同而拓扑信息相同。因此,参数化模型要体现属具的拓扑结构,从而保证设计过程中几何拓扑关系的一致。
在对舾装件的形状拓扑关系进行分析的基础上,在AutoCAD中用VB语言建立了各零件的标准参数模块,然后通过修改参数,调用各模块完成尺寸修改,设计出各类不同零件,并将其插入到船舶图纸中,用程序实现自动生成布置图。
非标准舾装件参数化设计与数据库建设
1、系统模块结构图
图1
本系统是在VisualBasic集成开发环境中,对AutoCAD进行二次开发,并结合Access数据库技术,从而建立的一个与AutoCAD系统集成的非标准舾装件参数化CAD设计程序。
根据本系统的体系结构图,按功能模块划分,本系统由四大部分构成:通过VB开发的用户界面模块;实现参数化的AutoCAD应用程序模块;利用VB建立的AutoCAD部件数据库模块;设计参数数据库模块。各模块相互关联,相互调用。系统模块结构图如图。各模块的基本功能如下:
参数数据库模块:数据库主要存放的是控制零件大小等几何设计参数值,以及零件名称、编号等非几何参数。其功能是管理汇总需要使用的的船舶非标准舾装件参数数据。
AutoCAD应用程序模块:该模块是参数化系统的图形显示模块,它直接反应参数化设计的结果。
VB用户界面模块:它是用户与参数化设计系统进行人机交互的窗口,由若干菜单和对话框组成,该模块利用VB语言强有力的开发能力以及数据库访问手段,把AutoCAD应用程序、参数数据库以及属具参数化模型库有机地结合起来,支持着程序的正常、稳定运行。
舾装件实体库模块:该模块功能是提供可以参数化驱动的船舶舾装件实体块模块。按照标准对各零件建立一系列的模型块,只要用户按照标准输入零件名称及其控制参数,就可以得到相应的零件实体模型。
本程序以基于尺寸的参数化设计为基础,总体开发思路如下:采用二维模型与程序控制相结合的方式,首先在AutoCAD中用交互方式创建二维原始模型,并建立一组能控制二维模型形状和几何关系的设计参数。然后在Access数据库中建立相应的数据表。最后用VB开发工具编写程序接口程序,并利用ADO数据库接口技术使该模型样板与其设计参数数据库相关联,同时利用VB设计友好的用户交互界面。参数化程序通过对模型的设计参数编程,来实现设计参数的读取以及二维模型的再生。
2、参数数据库表的创建
非标准化舾装件设计参数数据库是整个程序的重要基础之一,它存储着部件的各种参数,部件生成时的数据、调用部件图形库所需数据以及AutoCAD中驱动设计参数的尺寸都必须从该数据库中获得。
采用Access2003搭建整个部件参数数据库,包括其中各张表的建立、各张表属性的设定、各张表之间关系的设定。
数据库是由一系列的表组成,表包含了数据库中的数据和其他的数据库对象,定义这些数据库对象的目的在于支持对数据的处理操作。存储在数据库中的数据通常与特定的客观实体或过程有关。由于本系统中主要考虑为设计部件布置时提供部件参数,根据布置绘图的需要,按照部件不同的位置分别建立对应参数表Situ1、Situ2、…、SituN,其中N为位置编号。用这些表来存储部件参数信息,以某具置表为例,其构如下表所示:
表1位置几何参数表结构
3、非标准舾装件参数化设计流程
在进行非标准舾装件设计时,一般应根据船型特点、有关规范规定和船东提出的需求等方面综合考虑。通常根据部件的位置参数xi,yi等基本参数确定各部件位置,然后根据船东的要求或设计者的意图设置各部件的基本参数(包括部件个数、尺寸等),最后对该船的每个非标准舾装件进行参数化建模,并导入模型数据库。其流程图如下:
图2系统流程图
本系统首先确定待设计的非标准舾装件进行参数化建模,并将这些参数存储在数据库文件中,最后通过VB集成开发环境来调用数据库数据,并在AutoCAD图形环境中生成舱室布置图。这个程序的开发的主要内容为:
用户交互界面的开发。利用VB的可视化编程控件,编写相应的对话框和菜单,设计系统的用户交互界面。
接口程序的设计。在VB集成开发环境下设计VB与数据库以及AutoCAD的接口程序,以实现VB程序与AutoCAD的数据交互,从而完成系统的开发。
非标准舾装件零件图形模块的构建。运用AutoCADActive技术,在VB集成开发环境下,分析各非标准舾装件图形的特征及尺寸关系,建立各类常用非标舾装件的实体绘图模块,设置合理的参数驱动关系,调试无误后,存储在VB相应的模块或过程中,作为参数化设计的通用实体模型。
零件参数数据库的建立。在Access中建立各类非标准舾装件模型对应的设计参数数据库,每一个数据库由数据表组成,以存放不同类型非标准舾装件的参数。设计参数分为几何参数和非几何参数两种。前者如属具大小与位置尺寸等数值型参数,后者是表明非标准舾装件类型以及其编号的一些非数值型参数。
数学建模如何进行数据分析范文篇4
【关键词】石油储运;信息管理;数据模型;优化设计
前言
随着石油天然气工业和油气储运学科的发展,越来越多的新技术、新设备、新理论应用于油气储运系统,油气储运学科的理论内涵和外延越越来越多的与其他相关学科进行交叉和渗透。例如随着SCADA技术、地理信息系统(GIS)、虚拟现实技术、智能管道机器人等尖端技术在油气储运工程上的应用,使得油气管道输送系统的自动化、信息化、智能化水平越来越高,这就使得从事油气管道设计和管理的专业人员必须具备自动化、计算机、智能机械等相关学科领域的相应知识;同时,随着世界各国经济发展对油气资源需求的进一步增长,国际油气营销市场的行情将会愈加变化莫测,各国都在通过建立一套完善的油气储运系统来预防国际油价、天然气价格波动给本国经济带来的不利影响。而随着我国加入WTO后油气工业国际化经营战略的实施,建成一套调度灵活的国内油气储运系统和数条与国际油气市场接轨的跨国油气输送干线的发展步伐必然加快。这一发展动向不仅会给包括油气储运业在内的相关产业带来一次很好的发展机会,同时也给油气储运学科提出了一些亟待解决的新课题,即如何规划好这样一个庞大的全国油气储运系统以及如何解决好调度管理、营销决策等方面的技术难题。这就需要我们的油气储运技术人才具有一定的技术经济、工商管理和市场营销的相关知识;此外,近年来,国家大力倡导建设节约型、环保型社会。随着油气管道完整性,可靠性管理技术的应用,对油气输送系统进行完整性管理是油气管道系统的发展趋势,将大大提高油气输送和储存系统的安全性和可靠性,这也需要油气储运技术人员具备安全工程、可靠性、节能环保的相应知识。
1.石油储运工程系统GIS数据模型的选择
空间数据是三维的数据结构,包括空间位置(由某个参考坐标系确定的位置)、相对位置(地理实体之间的拓扑关系)、属性(与几何位置无关)。任何地理实体必须包含至少一个属性,GIS的分析、检索主要是通过对属性的操作来实现。在GIS中将空间目标实体的描述数据分为三种类型:空间特征数据、时间属性数据和专题属性数据。通常在使用中,将时间和专题属性数据结合在一起共同作为属性特征数据,而空间特征数据和属性数据统称为空间数据(或地理数据)。空间目标实体的属性特征数据常以列表或表格的方式进行组织。一般将其视为二维表格(属性表),行代表空间实体,列代表属性。
空间特征数据记录的是空间实体的位置、拓扑关系和几何特征。实体的空间位置以经纬度或带有局部原点的线性坐标表示。通常,人们理解空间实体的位置并不是通过实体的坐标,而是通过这些实体与其它熟知实体的空间关系来考虑,这就需要用具体的数据模型来表现。在石油储运工程系统实际应用中,人们更关心如何根据实时采集的管网数据来进行管网拓扑分析,从而了解油田管网系统运行状况,实现对油田管网运行的有效管理。由于在管网系统中处理的大量对象都是点对象(阀门、分离器等)、线状对象(管线、公路等)和面对象(村庄、计量站等),而矢量数据模型在反应网络信息方面(如:管线、交通等)具有独特的优势,并在表示管网线路和道路等线状地物方面具有直观性,便于进行网络分析,为节省数据存储空间以及减少模型相互之间的转化时间,我们采用矢量模型来描述、管理油气管网设施。
2.石油储运工程系统数据模型的建立
2.1石油储运工程系统主要组成要素分类石油储运工程系统是一套复杂的系统,在建立其数学模型之前,首先要把系统内的各组成要素按功能进行归纳和分类。绪论中己经指出,本系统采用的是从整体到局部的构建方式,因此在对各种要素进行分类的时候,同样先从整体出发,然后再细化到每一个局部。
2.2石油储运系统信息结构模型石油储运系统的各种信息,如基本信息、实时数据信息、历史信息和相关的地理信息等,可以看作是石油储运系统这个对象的一系列属性信息,它们各不相同,但又共同围绕着石油储运系统这个对象。石油储运系统各种信息的组合可以看作是由一层一层的属性信息层组成的信息空间。我们把石油储运系统信息空间进一步具体化,即用图层的形式表示出来,就形成了油气管网的信息图层空间。进而,我们可以对石油储运系统信息进行分层管理、分层维护,并且对石油储运系统信息空间实行动态组合,根据不同的信息要求组合,形成各种各样的石油储运系统信息空间。利用这种概念可以完美地把石油储运系统的各种信息动态集成在一起,实现信息资源共享,为提高石油储运系统管理水平和效率奠定基础。
2.3石油储运系统数据模型根据上面对石油储运系统信息结构模型的分析,可以看出油气管网所联系的站井以及配套设施都具有地理分布特性,因此必须结合GIS数据模型来建立油气管网GIS数据模型,从而实现相关设施的管理和油气管网的分析计算。
石油储运系统数据一般为两种,图2.1是GIS数据模型,包括空间数据和属性数据两部分。空间数据和属性数据通过标识码(D)实现关联.空间定位数据可以表征村庄、站、管网设备(如阀门、分离器)、配套设备(如电力设备)的位置。这些石油储运系统空间数据由点、线、面等对象构成,由系统统一管理。
3.石油地面信息管理系统数据组织
在建好石油储运系统数据模型之后,就应设计具体的石油储运系统数据组织方式。下面将从图层划分、数据库设计等两方面来对本文设计的石油储运系统数据组织方法详细阐述。
3.1图层划分在石油地面信息管理系统中,为了清楚表现相关的各子系统的关系,便于查询和编辑,将石油储运系统所包含的各种对象按照类型进行分类,归入相应的图层。
3.2数据库的建立石油储运系统数据库的建立,是指用系统软件提供的数据处理和管理功能,将经过编辑的图形数据、属性数据进行入库处理,建成石油储运系统数据库运行管理系统,其主要内容包括:原始数据采集、数据处理、数据字典和数据索引的生成、软件系统和数据的融合检查。
参考文献
[1]杨祥陵.油气储运网络综合管理系统技术研究叨重庆大学校报,2004(11)
[2]胡湘.基于WEB的陆上货运交易信息系统应用研究[J].重庆大学校报,2004(7)
[3]别锋锋,刘扬,魏立新.油田注水管网的优化设计方法[J].大庆石油学院学报,2004,(01).
数学建模如何进行数据分析范文1篇5
随着数据库技术的不断发展,数据库和数据仓库已经被广泛地应用于企业管理、产品销售、科学计算和信息服务等领域,数据量的不断增长对数据的存储、管理和分析提出了更高的要求,急需新一代的技术,能够智能化的从大量的数据中提取出有用的信息和知识,于是数据挖掘技术应运而生,且在各行业得到了广泛的应用。如何从海量的数据中找到内在的规律,如何更快更方便地传递、交流、获取有用的信息,挖掘这些激增数据背后隐藏的重要信息并及时进行信息的重组已成为当前我们所探究的热点。
一、数据挖掘概述及分类
数据挖掘是近年来随着数据库技术和人工智能技术的发展而出现的一种多学科交叉的全新信息技术,是指从海量的数据中出潜在的、有价值的知识(模型或规则)的过程,反复使用多种数据挖掘算法从观测数据中确定模式或合理模型。也就是根据预定义的目标,对大量的数据进行探索和分析,揭示其中隐含的规律,并进一步将其模型化的先进有效的技术过程。随着计算机网络的发展和普遍使用,数据挖掘成为迫切需要探究的重要课题。
数据挖掘涉及多个学科方向,主要包括摘要:数据库、统计学和人工智能等。数据挖掘可按数据库类型、挖掘对象、挖掘任务、挖掘方法和技术以及应用等几方面进行分类。按数据库类型分类摘要:关系数据挖掘、模糊数据挖掘、历史数据挖掘、空间数据挖掘等多种不同数据库的数据挖掘类型。按数据挖掘对象分类摘要:文本数据挖掘、多媒体数据挖掘、Web数据挖掘。按数据挖掘的任务有摘要:关联分析、时序模式、聚类、分类、偏差检测、猜测等。按数据挖掘方法和技术分类摘要:归纳学习类、仿生物技术类、公式发现类、统计分析类、模糊数学类、可视化技术类。
二、数据挖掘的基本过程
(1)定义新问题。对目标有一个可行、清楚和明确的定义,同时还包含对一个结果进行衡量的标准。(2)建立数据挖掘库。它主要是指收集数据、维护数据等工作。(3)分析数据。找到对新问题解决影响大的数据字段集和决定是否需要定义导出字段。(4)预备建摸数据。根据新问题的定义,对数据库中的字段变量、记录进行筛选,并根据现有的变量进行转换,生成新的变量和字段。它主要是指为建立模型预备部分数据的过程。(5)建立模型。选择一定的挖掘算法来处理数据,它需考察不同的模型用以判定和选择解决新问题最有效、精确度较好的一种数据挖掘模式。(6)模型的评价和解释。模型建立后,必须有一个对它的结果进行评价、对它的价值进行解释的过程。(7)实施。模型建立并验证之后通常有两种使用方法。一种是提供给分析人员作参考和分析这个模型之后的行动方案及建议。另一种是在应用了模型之后,还需不断地监控其效果,因为事物在不断地发展变化,有可能一段时间后,模型就不再起功能川。在以上数据挖掘的基本过程中,其中数据预备、数据选择、预处理、数据缩减的阶段主要以完成数据仓库为主;目标确定、算法确定、数据挖掘、模式识别和知识评价这几个阶段,主要以挖掘有用的知识为主,为知识发现做预备。
三、数据挖据的应用
数据挖掘技术源于商业的直接需求,因此它在各种商业领域都存在广泛的使用价值。现在已经应用数据挖掘技术的领域都是信息量大、环境复杂、需要知识帮助进行管理和决策的领域。下面介绍一些目前比较活跃的应用方向摘要:
(一)在金融数据分析中的应用。多数银行和金融机构都提供了丰富多样的储蓄,信用,投资,保险等服务。他们产生的金融数据通常比较完整、可靠,这对系统化的数据分析和数据挖掘相当有利。在具体的应用中,采用多维数据分析来分析这些数据的一般特性,观察金融市场的变化趋向;通过特征选择和属性相关性计算,识别关键因素,进行贷款偿付猜测和客户信用分析;利用分类和聚集的方法对用户群体进行识别和目标市场分析;使用数据可视化、链接分析、分类、聚类分析、孤立点分析、序列模式分析等工具侦破洗黑钱和其他金融犯罪行为。
(二)在电力业的应用。在电力行业中,数据挖掘技术主要用于指导设备更新、业绩评估、指导电力企业的建设规划、指导电力的生产和购买、指导电力的调度等。数据挖掘在电力企业的其它方面也有巨大的用处,比如说指导项目管理、平安管理、资源管理、投资组合管理、活动分析、销售猜测、收入猜测、需求猜测、理赔分析等。而且当使用数据挖掘系统时,用户会对模型进行调优和定制。这将会逐步积累符合企业自身需要的模型库,成为企业知识库的重要组成部分。
(三)在零售业中的应用。零售业是数据挖掘的主要应用领域,这是因为零售业积累了大量的销售数据,如顾客购买史记录、货物进出、消费和服务记录以及流行的电子商务等等都为数据挖掘提供了丰富的数据资源。零售数据挖掘有助于划分顾客群体,使用交互式询问技术、分类技术和猜测技术,更精确地挑选潜在的顾客;识别顾客购买行为,发现顾客购买模式和趋向,进行关联分析,以便更好地进行货架摆设;改进服务质量,获得更好的顾客忠诚度和满足程度;提高货品的销量比率,设计更好的货品运输和分销策略,减少商业成本;寻找描述性的模式,以便更好地进行市场分析等等。
(四)在医学上的应用。近年来,生物医学探究有了迅猛地发展,从新药的开发到癌症治疗的突破,到通过大规模序列模式和基因功能的发现,进行人类基因的识别和探究。在人类基因探究领域具有挑战性的新问题是从中找出导致各种疾病的特定基因序列模式。由于数据挖掘中已经有许多有意义的序列模式分析和相似检索技术,因此数据挖掘成为DNA分析中的强有力工具。利用数据挖掘技术在DNA数据的分析探究中可以进行DNA序列间的相似搜索和比较,对同时出现的基因序列的相关分析,遗传探究中的路径分析等。近期DNA分析的探究成果已经促成了对许多疾病和残疾基因成因的发现,以及对疾病诊断、预防和治疗的新药物、新方法的发现。
(五)在高校和科研单位以及其他领域的应用。主要是用于海量信息数据的抽取,提供给教研和科研人员有价值的数据。比如在数字图书馆方面可以引入数据挖掘技术。同时还可以应用的电子商务等等众多领域。
数学建模如何进行数据分析范文篇6
关键词:道路交通;大数据;本体
中图分类号:TP391文献标识码:A文章编号:1009-3044(2016)01-0025-03
AKindofTrafficDataAnalysisFrameworkBasedonOntology
YANJun-wei,LINGQing-wei,WANGJian
(CIMS,ResearchCenter,TongjiUniversity,Shanghai201804,China)
Abstract:Withtheincreasingofurbantrafficdatainformation,theanalysisoftrafficdatabecomesmoredifficult.Existingtrafficdataanalysisfacesproblemsoffiltering,screeningandintegrationofalargenumberofdispersedandheterogeneousdatainformation.Therefore,thispaperproposesatrafficdataanalysisframeworkbasedonontologybybuildingontologymodelfortrafficdataofurbanroadtraffic.Theontologymodeldescribetherelationshipbetweendatathroughnetworktopology,theobjectofroadtrafficandroadtrafficinformationandrelatedstorageinformationoftransportlargedata.Theframeworkusesurbanroadtrafficontologyasmappingfileforsemanticspecification,andusesJenadevelopmenttoolsmakeanontologyconstructionofurbanroadtraffic,forbigdataanalysisofmulti-sourcemulti-dimensiondatacorrelationanalysisandknowledgediscoverywithsemanticquerysupport.Theschemecanfindthetargetdatabasedontheanalysisoftrafficdemandquicklyandefficiently,andhaveplayedanimportantroleinlogicbetweenbigdataanalysisanddatastorage.Itisofgreatsignificancetotheexistingtrafficdataanalysis.
Keywords:roadtraffic;Bigdata;ontology
1概述
随着城市规模的不断扩大以及城市聚集效应的加强,一方面城市交通数据日益增长,数据种类和数量高速增长;另一方面市民的密集出行以及物流压力使城市交通面临着严峻的挑战。针对上述现象,如何快速有效地对交通数据进行分析是目前亟待解决的重要问题。
由于交通信息源的多样性和交通信息量的不断增加等原因,信息交互共享的实现以及如何对有价值地信息的进行检索变得日趋复杂,传统的基于关键字的搜索几乎不能实现语义[1],很难满足大数据分析多源多维数据关联分析及知识挖掘的查询要求。而本体作为一种可以在语义以及知识层次上描述信息系统的概念模型,提供了资源描述和查询所必需的元语、可以为信息源提供必要的语义标注。同时由于交通数据具有多维多量的特性,通过构建本体模型对交通数据进行关联描述,可以为原有的交通信息数据建立统一的数据模型,为实现智能交通领域信息的语义交互和知识共享提供了关键技术[2],从而支撑有效快速的交通大数据分析。
本体自提出就在交通领域得到了广泛的研究和应用。得克萨斯大学的Peterclark建立了Boeing交通本体[3],对本体进行分层同时引入一个基本交通本体,使用图节点代表交通地点,使用图弧线代表交通路线;欧洲Mnasser等针对出行者的信息服务,使用Protege工具构建了一套公共交通领域本体[4],同时根据应用案例对本体推理的相关性以及一致性进行了分析。在国内,黄坷萍等针对公交系统领域知识进行分析,提取并定义了类和类内公理以及实例的基本规则,从而构建了城市交通本体[5]。郭军杰等针对中国高速公路网内交通地理信息系统(GIS―T)提出了基于本体的GIs―T信息共享方案,以层次结构的交通信息组织模式构建高速公路网本体模型[6]。李文雄等开发了一套交通本体作为交通系统共享数据的标准化定义,利用数据集成技术实现针对性、具体化的智能交通系统信息服务组件,从而实现交通数据的交互与共享[7]。
然而,随着交通领域信息资源的快速增长与更新,大数据处理面临着如何对这些信息进行过滤、筛选以及如何对大量分散且异构的数据信息进行数据整合等难题[8]。但是,现有交通本体基本上是从语义化的层次对交通领域知识进行本体建模,并没有具体考虑交通本体与大数据分析等应用的关联;国内外对本体的研究仍主要集中于描述本体的构建、推理与查询、信息集成解决方案等一些本体关键技术,缺乏对实际本体应用的研究;现有交通本体基本上从路网拓扑、GIS信息等相关数据组织进行本体建模,但缺乏对交通信息数据的层次划分,不利于本体的扩展。
为此,本文通过在路网拓扑、道路交通对象和道路交通信息三个层次对交通数据相互关系进行描述,并关联交通大数据存储信息,构建面向交通大数据的城市道路交通本体模型,提出了一种基于本体的交通大数据分析框架。该框架中以城市道路交通本体为语义规范制定映射文件,利用Jena开发工具构建城市道路交通本体库,为大数据分析的多源多维数据关联分析及知识挖掘提供语义查询支持。该框架能够根据交通分析需求快速有效地找到目标数据,在大数据分析与大数据存储之间起到了逻辑关联的作用,对现有交通数据分析具有重要意义。
2城市道路交通本体建模
2.1城市道路交通数据分析
通过分析中国城市道路交通信息分类、道路交通信息服务信息分类和智能交通系统组成以及交通数据采集、传输和信息过程中的数据元素及其组织模式,将道路交通数据划分为三个层次,分别为路网拓扑数据、道路交通对象数据、道路交通信息数据三类,层次结构如图1所示。其中,路网拓扑描述主要描述城市道路的宏观拓扑特征,道路交通对象从属于道路,道路交通信息主要来自路网和道路交通对象。
图1道路交通数据层次结构图
路网拓扑数据主要包括道路、路段、节点、断面等拓扑构件信息;道路交通对象主要分为固定交通类和移动交通类两大类,固定交通类主要指地理位置一般不会变更的交通对象,比如道路设施,移动交通体主要指地理位置经常改变的交通体,主要指车辆和行人;道路交通信息主要有两类,一类为静态信息,包括交通网络基础信息、车辆信息、交通管制信息、地理信息等;一类为动态信息,包括交通流状态特征信息、交通紧急事故信息、环境状况信息、交通动态管理信息。
2.2城市道路交通本体模型
根据道路交通数据的分析,本文在路网拓扑、道路交通对象和道路交通信息三个层次对交通数据相互关系进行描述。根据语义完备性的描述,道路交通数据可以分为静态交通数据和动态交通数据两大类。静态交通数据主要包括路网拓扑数据、道路交通对象数据和静态交通信息数据,动态交通数据主要为动态交通信息数据,其中大数据主要是动态交通信息数据。考虑到大数据的存储问题,如图2所示,城市道路交通本体库主要包括静态交通数据和动态交通信息数据的存储信息,同时根据交通信息采集的方式将依据道路设备进行存储信息关联,构建面向交通大数据的城市道路交通本体模型。
图2城市道路交通本体模型构建示意图
城市道路交通本体模型主要有四大类:路网拓扑、道路交通对象、道路交通信息和存储信息。道路交通对象从属于路网拓扑,交通信息描述路网和道路交通对象的相关信息,存储信息描述道路设备采集的交通大数据(动态交通数据)的存储信息。
其中,存储信息描述交通信息的采集信息及存储信息,根据道路设备进行存储信息描述。例如,针对某一线圈采集交通数据的存储情况,关联特定的配置文件。配置文件中可将交通数据表存储的名称和采集数据种类等进行描述,通过制定配置文件将交通大数据与道路本体关联,对其进行语义标识,为后续查询及大数据分析提供语义支持。
具体城市道路交通本体模型如图3所示。
图3城市道路交通本体模型示意图
3基于本体的交通大数据分析框架
随着城市交通数据的种类和数量迅速增长,如何快速有效地对交通数据进行分析是目前亟待解决的重要问题。
如何对大量分散且异构的交通数据信息进行数据整合并搜索是交通大数据处理面临的重要问题。为解决这一问题,本文通过构建本体模型对交通数据进行关联描述并关联交通大数据存储信息,为大数据分析的数据整合和数据搜索提供语义支持。基于上述城市道路交通本体模型,本文提出一种基于本体的交通大数据分析框架,如图4所示。
首先,分析交通数据,构建城市道路交通本体模型实现交通语义共享;针对动态交通信息数据存储信息制定配置文件,包括交通数据表存储的位置、名称和采集数据种类等存储信息。其次,根据本体模型和静态交通数据进行关联分析,以城市道路交通本体为语义规范制定映射文件;通过D2RQ[9]引擎实现关系型数据到本体数据的语义映射,采用JenaAPI工具构建城市道路交通本体库;最后,通过语义网对本体库进行语义搜索,根据搜索结果对大数据进行快速检索,同时返回数据和语义关系检索结果,实现大数据对多源多维数据的关联分析及知识挖掘。
图4基于本体的交通大数据分析框架
4基于本体的交通大数据分析框架的实现
根据上述的基于本体的交通大数据分析框架,以上海市南北高架道路交通数据为数据源,通过D2RQ引擎以城市道路交通本体为语义规范对多源数据进行信息融合,利用Jena开发工具构建上海市南北高架道路交通本体库,形成道路交通语义网,实现对南北高架道路交通大数据的语义查询。
图5南北高架本体模型实例
针对南北高架道路数据的本体建模如图5所示。其中,路段NBBJX-DO是地理对象实例,路段NBBJX-DO在地图上的位置描述是几何对象实例,路段NBBJX-DO上的线圈NBBJX-DO-1-1是道路设备实例,线圈NBBJX-DO-1-1采集的数据类型FINT_LV是道路交通信息实例,线圈NBBJX-DO-1-1采集的数据类型FINT_LV描述的大型车是道路交通对象实例,线圈NBBJX-DO-1-1具有的存储信息coil2是存储信息实例,coil2描述线圈NBBJX-DO-1-1采集的数据类型FINT_LV在大数据平台的存储地址。
根据上述以南北高架数据为源数据的道路交通语义网,针对线圈信息进行语义搜索,结果如图6所示。图中对线圈NBBJX-DO-1-1进行语义搜索,可以得到线圈位置、拥有信息、采集信息、ID、车道类型、类型等数值属性信息。根据线圈拥有信息即5min的存储名称coil2,可以查找到对应的交通大数据表名,将此信息作为搜索条件,即可快速对大数据进行查找,同时也获得了线圈的路网位置。为交通大数据分析提供了有力的语义查询支撑。
图6线圈NBBJX-DO-1-1语义搜索结果示例
5结束语
本文从面向大数据分析的本体建模的角度出发,对道路交通数据进行层次分析并关联大数据存储信息,构建了较为完善的面向大数据分析的城市道路交通本体模型。同时,提出了一种基于本体的交通大数据分析框架。最后,采用Jena开发工具和D2RQ映射引擎构建城市道路交通本体库,并实现了交通大数据的语义搜索,从而解决了对大量分散且异构的交通数据信息进行数据整合并搜索的难题。考虑到道路交通是种类众多、关系复杂且更新迅速的知识领域,下一步我们将对城市道路交通本体的更新和维护进行研究,并创建公理库以支持对知识的推理与知识的完备性和一致性。同时,我们将进一步深入研究语义网在大数据分析中的应用,重点研究语义查询解析和模型定义方面,使城市道路交通本体在交通服务系统中发挥更好的作用。
参考文献:
[1]CAOYan,CHENYan.ResearchonITSKnowledgeIntegrationTechnologyBasedonOntology,ProceedingsoftheEighthInternationalConferenceofChineseLogisticsandTransportationProfessionals,2008:p2066-2075.
[2]曹妍.本体理论在城市智能交通系统语义集成中的应用研究[D].大连:大连海事大学,2010.
[3]Clark,P.http://5.utexas.edu/users/pelark/kr-web/other/passenger-vehiele/transportation.km,Transportationontology,1998.
[4]MnasserH,MahaK,KathiaO,etal.Apublictransportationontologytosupportusertravelplanning[C]//IEEE.Proceedingsofthe4thInternationalConferenceonResearchChallengesinInformationScience(RCIS-2010).Nice:IEEEPress,2010:127-136.(下转第34页)
(上接第27页)
[5]黄坷萍,蒋昌俊.基于本体的城市交通的知识分析和推理[J].计算机科学,2007,34(3):192-196.
[6]郭军杰,闫茂德,陈荫三.高速公路网异构GIS-T信息共享的本体模型[J].交通运输工程学报,2011,11(1):24-29.
[7]李文雄,闫茂德,王建伟.智能交通系统本体数据集成[J].中南大学学报:自然科学版,2013,44(7):3038-3045.
数学建模如何进行数据分析范文篇7
关键词:数据仓库;联机分析处理;ETL;OLAP技术;图书借阅分析系统
中图分类号:TP311文献标识码:A文章编号:1009-2374(2009)21-0063-02
图书管理系统每天都会产生大量的统计数据,这些海量信息中蕴涵了对图书管理(如采购、馆藏、咨询等)有指导性的潜在信息。但传统的图书管理系统只有简单的借阅查询功能,难以从多维的角度对数据进行提取,进而为图书管理提供决策支持。
数据仓库、OLAP和数据挖掘技术是建立决策支持系统的有效手段。数据仓库集成了当前的业务数据、历史数据和外部数据,基于不同的主题,使用OLAP技术可以为图书管理情况提供有价值的信息,采用数据挖掘算法还可以对图书各业务趋势做出预测。因此,本文以数据仓库、OLAP为核心技术,并以时间为基准,通过ETL技术对数据进行增量式迁移,实现了对现有数据库的动态建模,以达到辅助支持图书管理的目的。
一、ETL技术
ETL(Extract,Transform,Load)即数据抽取、转换、清洗、装载的过程,是构建数据仓库最重要的步骤之一。用户从数据源抽取出所需的数据,经过数据处理,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。ETL总共分为数据抽取、数据转换、数据清洗、数据加载四个步骤。
二、数据仓库和OLAP概述
(一)数据仓库
数据仓库中的数据是面向主题的、集成的、不可更新的(稳定的)并随时间不断变化的,建立数据仓库的目的是为了更好地支持行业高层主管们的决策分析。数据仓库被看作是一种支持结构化和专门的查询、分析报告和决策制定的体系结构。由于数据库和数据仓库应用的出发点不同,数据仓库将独立于业务数据库系统。但是数据仓库又同业务数据库系统息息相关。事实上,数据仓库系统=ETL十数据存储+0LAP+客户端。
(二)OLAP多维模型
OLAP(联机分析处理)是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的,并真实反映企业多维特性的信息进行快速、一致、交互的存取,从而获得对数据的更深入了解的一类软件技术。其基本思想是企业决策者能够灵活地操作企业的数据,以多维的形式从多方面和多角度来观察企业的状态并了解企业的变化。OLAP的目标是满足决策支持或多维环境特定的查询和报表需求。OLAP提供了对数据的多维分析方法,包括切片、切块、旋转、上钻、下钻等分析动作。
三、系统设计
通过综合考虑事务处理系统的数据环境和本系统的需求,设计基于数据仓库技术的图书借阅分析系统体系结构。该系统的体系结构图及数据流程如图1所示:
(一)数据仓库模型设计
数据仓库和OLAP工具是基于多维数据模型的,该模型将数据看成数据立方体(DataCube)的形式。图书借阅分析系统原始数据库主要信息有借还交易记录、客户信息、部门、地点、时间。因此,本文基于以上信息对数据仓库进行了建模型,所用多维数据集采用雪花型模式。考虑图书统计数据很大,为了提高分析效率,本文采取了两个策略:
1.将交易记录分为了两个事实表:借记录表和还记录表,并将两个表合并生成新的视图。这样分析可以根据需求而选择不同表。
2.采用“基于Apriori算法和OLAP的关联规则挖掘模型设计”所提方法对数据仓库数据进行处理以提高效率,并为以后的数据挖掘处理做好准备。在SQLServer2005数据转化服务(DTS)中通过VBscript语句完成此项转化,语句如下:
FunctionMain()
DTSDestination(“次数”)=1
Main=DTSTransformStat_OK
EndFunction
所设计数据仓库如图2所示:
(二)ETL实现策略
ETL策略是关于工作的总计划,处理诸如如何提取数据以及如何处理数据中的错误之类的问题。主要考虑的问题包括不同的数据格式、坏数据、不兼容的源系统、源系统的改变和提取与加载的窗口等,ETL策略需要定义这类问题的标准来为ETL过程提供依据。
考虑数据仓库设计需求,本系统ETL主要策略有两条(对于数据清洗、存储本文不作过多阐述):
1.根据交易记录的统计字段,在数据迁移过程中,将数据分为借图书事物数据和还图书事物数据,并分别存储。
2.以时间为基准,实现系统定时、增量式迁移数据。这将大大提高系统数据处理效率。本系统中选用Microsoft的DTS作为ETL工具,流程图如图3所示:
四、系统实施
(一)系统实现
Microsoft提供了一系列提取、分析、总结数据的工具,从而使联机分析成为可能,并将OLAP(联机分析处理)功能集成到MicrosoftSQLServer中,提供可扩展的基于COM的OLAP接口。本系统采用MicrosoftSQLServer2005建立数据仓库、定义数据迁移的定时处理、OLAP模块的定时更新,利用MicrosoftVisualStudio2005开发数据迁移模块及OLAP联机分析处理模块。
(二)分析结果展示
本系统在某高校图书管运行,效果理想。图4为图书馆2007、2008年(学生类型―学院)借阅情况分析图。该图蕴涵信息有:
1.“计算机”和“经贸”学院的学生借书次数明显多于其他系,说明可以考虑分不同区域存放和这两个学院有关的图书,以增加安全性,避免借阅人员拥挤。
2.研究生借阅图书次数低于本科生,但考虑研究生总人数,说明研究生学习更为积极。
3.全校所有专科生借阅次数几乎没有,而专科生总人数巨大,说明该校专科生学习情况极为不好。学校应加强补救措施。
五、结语
本文给出了一种基于数据仓库、OLAP、ETL技术的实现图书借阅数据再次管理的解决方案。本系统运用数据仓库、OLAP技术,在原由图书管数据库的基础上进行了二次开发,且利用ETL技术使整个系统实现了智能增量更新,有效的达到了对图书借阅情况分析、学生学习情况分析及对图书管理工作支持的目的。当然,该方案缺乏和数据挖掘技术的结合,而在分析系统中,正是需要更为科学和强大的决策支持技术,如数据挖掘、专家系统等来满足特定的需求,数据仓库才能充分发挥其作用,这也是下阶段研究的重点。
参考文献
[1]JiaweiHan,MichelineKamber.DataMining:ConceptsandTechniques,SecondEdition[M].ChinaMachinePress,2007.
数学建模如何进行数据分析范文
【摘要】当代西方经济认为,经济学的基本方法是分析经济变量之间的函数关系,建立经济模型,从中引申出经济原则和理论进行决策和预测。
【关键词】经济学数学模型应用
在经济决策科学化、定量化呼声日渐高涨的今天,数学经济建模更是无处不在。如生产厂家可根据客户提出的产品数量、质量、交货期、交货方式、交货地点等要求,根据快速报价系统(根据厂家各种资源、产品工艺流程、生产成本及客户需求等数据进行数学经济建模)与客户进行商业谈判。
一、数学经济模型及其重要性
数学经济模型可以按变量的性质分成两类,即概率型和确定型。概率型的模型处理具有随机性情况的模型,确定型的模型则能基于一定的假设和法则,精确地对一种特定情况的结果做出判断。由于数学分支很多,加之相互交叉渗透,又派生出许多分支,所以一个给定的经济问题有时能用一种以上的数学方法去对它进行描述和解释。具体建立什么类型的模型,既要视问题而定,又要因人而异。要看自己比较熟悉精通哪门学科,充分发挥自己的特长。
数学并不能直接处理经济领域的客观情况。为了能用数学解决经济领域中的问题,就必须建立数学模型。数学建模是为了解决经济领域中的问题而作的一个抽象的、简化的结构的数学刻划。或者说,数学经济建模就是为了经济目的,用字母、数字及其他数学符号建立起来的等式或不等式以及图表、图象、框图等描述客观事物的特征及其内在联系的数学结构的刻划。而现代世界发展史证实其经济发展速度与数学经济建模的密切关系。数学经济建模促进经济学的发展;带来了现实的生产效率。在经济决策科学化、定量化呼声日渐高涨的今天,数学经济建模更是无处不在。如生产厂家可根据客户提出的产品数量、质量、交货期、交货方式、交货地点等要求,根据快速报价系统与客户进行商业谈判。
二、构建经济数学模型的一般步骤
1.了解熟悉实际问题,以及与问题有关的背景知识。2.通过假设把所要研究的实际问题简化、抽象,明确模型中诸多的影响因素,用数量和参数来表示这些因素。运用数学知识和技巧来描述问题中变量参数之问的关系。一般情况下用数学表达式来表示,构架出一个初步的数学模型。然后,再通过不断地调整假设使建立的模型尽可能地接近实际,从而得到比较满意的结论。3.使用已知数据,观测数据或者实际问题的有关背景知识对所建模型中的参数给出估计值。4.运行所得到的模型。把模型的结果与实际观测进行分析比较。如果模型结果与实际情况基本一致,表明模型是符合实际问题的。我们可以将它用于对实际问题进一步的分析或者预测;如果模型的结果与实际观测不一致,不能将所得的模型应用于所研究的实际问题。此时需要回头检查模型的组建是否有问题。问题的假使是否恰当,是否忽略了不应该忽略的因素或者还保留着不应该保留的因素。并对模型进行必要的调整修正。重复前面的建模过程,直到建立出一个经检验符合实际问题的模型为止。一个较好的数学模型是从实际中得来,又能够应用到实际问题中去的。
三、应用实例
商品提价问题的数学模型:
1.问题
商场经营者即要考虑商品的销售额、销售量。同时也要考虑如何在短期内获得最大利润。这个问题与商场经营的商品的定价有直接关系。定价低、销售量大、但利润小;定价高、利润大但销售量减少。下面研究在销售总收入有限制的情况下.商品的最高定价问题。
2.实例分析
某商场销售某种商品单价25元。每年可销售3万件。设该商品每件提价1元。销售量减少0.1万件。要使总销售收入不少于75万元。求该商品的最高提价。
解:设最高提价为X元。提价后的商品单价为(25+x)元
提价后的销售量为(30000-1000X/1)件
则(25+x)(30000-1000X/1)≥750000
(25+x)(30-x)≥750[摘要]本文从数学与经济学的关系出发,介绍了数学经济模型及其重要性,讨论了经济数学模型建立的一般步骤,分析了数学在经济学中应用的局限性,这对在研充经济学时有很好的借鉴作用。即提价最高不能超过5元。
四、数学在经济学中应用的局限性
经济学不是数学,重要的是经济思想。数学只是一种分析工具数学作为工具和方法必须在经济理论的合理框架中才能真正发挥其应有作用,而不能将之替代经济学,在经济思想和理论的研究过程中,如果本末倒置,过度地依靠数学,不加限制地“数学化很可能经济学的本质,以至损害经济思想,甚至会导致我们走入幻想,误入歧途。因为:
1.经济学不是数学概念和模型的简单汇集。不是去开拓数学前沿而是借助它来分析、解析经济现象,数学只是一种应用工具。经济学作为社会科学的分支学科,它是人类活动中有关经济现象和经济行为的理论。而人类活动受道德的、历史的、社会的、文化的、制度诸因素的影响,不可能像自然界一样是完全可以通过数学公式推导出来。把经济学变为系列抽象假定、复杂公式的科学。实际上忽视了经济学作为一门社会科学的特性,失去经济学作为社会科学的人文性和真正的科学性。
2.经济理论的发展要从自身独有的研究视角出发,去研究、分析现实经济活动内在的本质和规律。经济学中运用的任何数学方法,离不开一定的假设条件,它不是无条件地适用于任何场所,而是有条件适用于特定的领域在实际生活中社会的历史的心理的等非制度因素很可能被忽视而漏掉。这将会导致理论指导现实的失败。
3.数学计量分析方法只是执行经济理论方法的工具之一,而不是惟一的工具。经济学过分对数学的依赖会导致经济研究的资源误置和经济研究向度的单一化,从而不利于经济学的发展。
4.数学经济建模应用非常广泛,为决策者提供参考依据并对许多部门的具体工作进行指导,如节省开支,降低成本,提高利润等。尤其是对未来可以预测和估计,对促进科学技术和经济的蓬勃发展起了很大的推动作用。但目前尚没有一个具有普遍意义的建模方法和技巧。这既是我们今后应该努力发展的方向,又是我们不可推卸的责任。因此,我们要以自己的辛勤劳动,多实践、多体会,使数学经济建模为我国经济腾飞作出应有的贡献。
数学建模如何进行数据分析范文1篇9
[关键词]系统生物学;基因组学;蛋白质组学;计算生物学
[中图分类号]R34[文献标识码]A[文章编号]1673-7210(2008)09(b)-020-03
近代生物学研究主要是以分子生物学和细胞生物学研究为主。研究方法皆采用典型的还原论方法。目前为止,还原论的研究已经取得了大量的成就,在细胞甚至在分子层次对生物体都有了很具体的了解,但对生物体整体的行为却很难给出系统、圆满的解释。生物科学还停留在实验科学的阶段,没有形成一套完整的理论来描述生物体如何在整体上实现其功能行为,这实际上是还停留在牛顿力学思想体系的简单系统的研究阶段。但是生物体系统具有纷繁的复杂性[1,2]。尽管对一个复杂的生物系统来说,研究基因和蛋白质是非常重要的,而且它将是我们系统生物学的基础,但是仅仅这些尚不能充分揭示一个生物系统的全部信息。这种研究结果只限于解释生物系统的微观或局部现象,并不能解释系统整体整合功能的来源,不能充分揭示一个生物系统的信息,且忽略了系统中各个层面的交互、支持、整合等作用,限制了生物学研究的发展。在这种现状下,20世纪末人类基因组计划完成后,生物学领域的科学家都在考虑一个问题:未来生物学研究的方向在哪里?为此学术界也不乏辩论。得出的共识是:生物学的发展未来主要面对如下问题:(1)如何弄清楚单一生物反应网络,包括反应分子之间的关系、反应方式等;(2)如何研究生物反应网络之间的关系,包括量化生物学反应及生物反应网络;(3)如何利用计算机信息及生物工程技术进行生物反应,生物反应网络,乃至器官及生物体的重建。
早在1969年,BertalanfyLV就提出了一般系统理论(generalsystemstheory),他在文章中指出生物体是一个开放系统,对其组成及生物学功能的深入研究最终需要借助于计算机和工程学等其他分支学科才能完成[3]。1999年,由LeroyHood创立的系统生物学(systemsbiology)则是在以还原论为主流的现代生物学中反其道而行之,把这种以整体为研究对象的概念重新提出。他给系统生物学赋予了这样的定义,系统生物学(systemsbiology)是研究一个生物系统中所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件下这些组分间的相互关系的学科。换言之,以往的实验生物学仅关心基因和蛋白质的个案,而系统生物学则要研究所有的基因、所有的蛋白质、组分间的所有相互关系。显然,系统生物学是以整体性研究为特征的一种大科学,是生物学领域革命性的方法论。以胡德的观点,基因、蛋白质以及环境之间不同层次的交互作用共同架构了整个系统的完整功能。因此,用系统的方法来理解一个生物系统应当成为并正在成为生物学研究方法的主流。利用系统的方法对其进行解析,综合分析观察实验的数据来进行系统分析。具体通过建立一定的数学模型,并利用其对真实生物系统进行预测来验证模型的有效性,从而揭示出生物体系所蕴涵的奥秘,这正是生物学研究方法的关键所在。
1系统生物学的主要研究内容
系统生物学主要研究实体系统(如生物个体、器官、组织和细胞)的建模与仿真、生化代谢途径的动态分析、各种信号转导途径的相互作用、基因调控网络以及疾病机制等[4,5]。
系统生物学的首要任务是对系统状态和结构进行描述,即致力于对系统的分析与模式识别,包括对系统的元素与系统所处环境的定义,以及对系统元素之间的相互作用关系和环境与系统之间的相互作用的深入分析。具体如生物反应中反应成分之间的量的关系,空间位置,时间次序,反应成分之间的因果关系,特别是反馈调节和变量控制等有关整个反应体系的问题等。其次要对系统的演化进行动态分析,包括对系统的稳态特征、分岔行为、相图等的分析。掌握了系统的基本演化机制,使系统具有目标性和可操作性,使之按照我们所期望的方向演化,也有助于我们重新构建或修复系统,为组织工程学的组织设计提供指导。另外,系统科学对生物系统状态的描述是分层次的,对不同层次进行的描述可能是完全不同的;系统科学对系统演化机制的分析更强调整体与局部的关系,要分析子系统之间的作用如何形成系统整体的表现、功能,而且对系统整体的每一行为都要找出其与微观层次的联系。
系统生物学的研究包括两方面的内容。首先是实验数据的取得,这主要包括提供生物数据的各种组学技术平台,其次是利用计算生物学建立生物模型。因此科学家把系统生物学分为“湿”的实验部分(实验室内的研究)和“干”的实验部分(计算机模拟和理论分析)。“湿”、“干”实验的完美整合才是真正的系统生物学。
系统生物学的技术平台主要为各种组学研究。这些高通量的组学实验构成了系统生物学的技术平台。提供建立模型所需的数据,并辨识出系统的结构。其中包括基因组学、转录组学、蛋白质组学、代谢组学、相互作用组学和表型组学计算生物学通过建模和理论探索。可以为生物系统的阐明和定量预测提供强有力的基础。计算生物学包括数据开采和模拟分析。数据开采是从各实验平台产生的大量数据和信息中抽取隐含其内的规律并形成假说。模拟分析是用计算机验证所形成的假说,并对拟进行的体内、体外生物学实验进行预测,最终形成可用于各种生物学研究和预测的虚拟系统。计算生物学涉及一些新的数学原理和运算规则,需要物理和数学来研究生物学的最基本的原理,也需要计算科学、信息学、工程学等进行生物工程重建和生物信息传递的研究。
2系统生物学的研究思路及特点
系统生物学识别目标生物系统中的各种因素,然后构架一个系统模型,在其中赋予这个生物系统能动性。在此模型中研究细胞、组织、器官和生物体整体水平,研究结构和功能各异的各种分子及其相互作用,并通过计算生物学来定量描述和预测生物功能、表型和行为。系统生物学最大的特点即整合。这里的整合主要包括三重含义。首先,把系统内不同性质的构成要素(DNA、mRNA、蛋白质、生物小分子等)整合在一起进行研究;其次,对于多细胞生物,系统生物学要实现从基因到细胞、到器官、到组织甚至是个体的各个层次的整合。第三,研究思路和方法的整合。经典的分子生物学研究是一种垂直型的研究,即采用多种手段研究个别的基因和蛋白质。而基因组学、蛋白质组学和其他各种“组学”则是水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种“三维”的研究[6]。
3系统生物学的研究方法
系统生物学最重要的研究手段是干涉(perturbation)。系统生物学的发展正是由于对生物系统的干扰手段不断进步促成的。干涉主要分为从上到下(top-down)或从下到上(bottom-up)两种。从上到下,即由外至里,主要指在系统内添加新的元素,观察系统变化。例如,在系统中增加一个新的分子以阻断某一反应通路。而从下到上,即由内到外,主要是改变系统内部结构的某些特征,从而改变整个系统,如利用基因敲除,改变在信号传导通路中起重要作用的蛋白质的转录和翻译水平[7]。
目前国际上系统生物学的研究方法根据所使用研究工具的不同可分为两类:一类是实验性方法,一类是数学建模方法。实验性方法主要是通过进行控制性的反复实验来理解系统[8,9]。首先明确要研究的系统以及所关注的系统现象或功能,鉴别系统中的所有主要元素,如DNA、mRNA、蛋白质等,并收集所有可用的实验数据,建立一个描述性的初级模型(比如图形的),用以解释系统是如何通过这些元素及其之间的相互作用实现自身功能的。其次在控制其他条件不变的情况下,干扰系统中的某个元素,由此得到这种干扰情况下系统各种层次水平的一些数据,同时收集系统状态随时变化的数据,整合这些数据并与初级模型进行比较,对模型与实际之间的不符之处通过提出各种假设来进行解释,同时修正模型。再设计不同的干扰,重复上面的步骤,直到实验数据与模型相一致为止。
数学建模[10,11]方法在根据系统内在机制对系统建立动力学模型,来定量描述系统各元素之间的相互作用,进而预测系统的动态演化结果。首先选定要研究的系统,确定描述系统状态的主要变量,以及系统内部和外部环境中所有影响这些变量的重要因素。然后深入分析这些因素与状态变量之间的因果关系,以及变量之间的相互作用方式,建立状态变量的动态演化模型。再利用数学工具对模型进行求解或者定性定量分析,充分挖掘数学模型所反映系统的动态演化性质,给出可能的演化结果,从而对系统行为进行预测。
4当代系统生物学研究热点
基因表达、基因转换开关、信号转导途径,以及系统出现疾病的机制分析等四个方面是目前系统生物学研究的主要阵地。
基因组医学(genomicmedicine)是以人类基因组为基础的生命科学和临床医学的革命。生命科学和临床医学结合,将人类基因组研究成果转化应用到临床实践中,是后基因组时代最重要的研究方向之一。人类基因组计划从完成和多种疾病相关的基因研究发现,迅速进入到蛋白质组学、染色体组和人类疾病基因的研究,通过单基因或复杂多基因疾病的相关基因研究和疾病易感因素分析,达到揭示基因与疾病的关系之目的;遗传背景与环境因素综合作用对疾病发生发展的影响;为疾病的诊断、预防和治疗、预后和风险预测提供依据。基因组医学将大大提高我们对健康和疾病状态的分子基础的认识,增强研制有效干预方法的能力。
后基因组(post-genome)的交叉学科研究是目前生命科学研究的前沿。交叉学科是一个新的研究领域,范围非常广阔,如基因组、蛋白质组、转录组等等,从而出现许多新的交叉学科。
细胞信号转导(signaltransduction)的研究是当前细胞生命活动研究的重要课题。细胞信号转导蛋白质组学是功能蛋白质组学的重要组成部分。系统地研究多条信号转导通路中蛋白质及蛋白质间相互关系及其作用规律,细胞信号转导通路网络化,其作用模式、通路、功能机制、调控多样化,细胞信号转导结构、功能、途径的异常在癌症、心血管疾病、糖尿病和大多数疾病中起重要作用。对细胞信号转导机制的了解,已成为创新药物、防病治病的关键。细胞信号转导不是一门单一学科,而是多种学科,如细胞学、生物化学、生物物理学和药理学等多学科的交叉学科。
5现阶段系统生物学存在的问题
目前的系统生物学研究还只是初步使用动力学建模方法来定量描述系统的动态演化行为,这种方法对简单巨系统是适用的,但是在运用到复杂适应性系统时就会表现出很多的局限性,有很多问题就不能解决。生物体系统的复杂程度超乎我们的想象,现阶段不宜研究整个生物体系统,可以从研究“小系统”(生物体中具有一定功能、相对独立的部分,将其看成一个“系统”)开始,当然如何正确地分析这个小系统本身也不是件易事。
5.1现有技术水平的限制
着眼于整体的系统生物学对技术、仪器的依赖性大大超过传统的分子生物学。高通量、大规模的基因组及蛋白质组等的发展都是建立于新技术、新仪器出现基础之上。就目前的技术水平来讲,距系统生物学所要求达到的理想水平还相差很远。由于技术发展的不均衡造成了系统中各个水平上的研究不均衡。基因组和基因表达方面的研究已经比较成熟,而在其他水平如蛋白质、小分子代谢物等的研究仍处于起步阶段。各种蛋白质在数量上的巨大差异是全面分析低丰度蛋白质的一大障碍。而低丰度蛋白往往是最重要的生物调节分子,如何加强对低丰度蛋白的高通量研究,将是对蛋白质组应用前景的重要保障。同样,如何研究系统内存在的非遗传性分子即细胞中存在的成百上千的独立的代谢底物及其他各种类型的大小分子,它们在基因表达、酶的构象形成等方面有着重要作用。建立适当的方法来系统检测这些分子的变化是系统生物学能否发展的关键。
5.2分析水平的限制
系统的复杂性决定了全面分析的复杂性。人类基因组计划的实施提供了庞大的信息资源,已让人眼花缭乱,而对于较核苷酸复杂得多的蛋白质及代谢物等的分析将是更大的挑战。如何系统而详尽地为公共数据库中的信息加上注解,对这些复杂数据进行储存和分析将成为系统生物学发展的瓶颈。
[参考文献]
[1]WangKunren,XueShaobai,uuHuitu.CellBiology[M].Beijing:BeijingNormalUniversityPress,1998.
[2]朱玉贤,李毅.现代分子生物学[M].北京:高等教育出版社,2001.
[3]DicksonBJ,MoserEI.Neurobiologyofbehaviour[J].CurrOpinNeurobiol,2007,17(6):672-674.
[4]NottaleL,AuffrayC.Scalerelativitytheoryandintegrativesystemsbiology:2Macroscopicquantum-typemechanics[J].ProgBiophysMolBiol,2008,97(1):115-157.
[5]RhoS,YouS,KimY,etal.Fromproteomicstowardsystemsbiology:integrationofdifferenttypesofproteomicsdataintonetworkmodels[J].BMBRep,2008,41(3):184-193.
[6]吴家睿.系统生物学面面观[J].科学杂志,2002,54(6):26-28.
[7]SreenivasuluN,GranerA,WobusU.Barleygenomics:anoverview[J].IntJPlantGenomics,2008,486258.
[8]PriceND,FoltzG,MadanA,etal.Systemsbiologyandcancerstemcells[J].JCellMolMed,2008,12(1):97-110.
[9]BonneauR,ReissDJ,ShannonP,etal.TheInferelator:analgorithmforlearningparsimoniousregulatorynetworksfromsystems-biologydatasetsdenovo[J].GenomeBiol,2006,7(5):R36.
[10]UllahM,WolkenhauerO.FamilytreeofMarkovmodelsinsystemsbiology[J].IETSystBiol,2007,1(4):247-254.
数学建模如何进行数据分析范文篇10
[关键词]数学建模;商务数据分析与应用专业;实施路径
前言
数学模型是连接实际问题与数学问题的桥梁,是对某一实际问题,根据其内在规律,作一些必要的简化与假设,运用适当数学工具转化为数学结构,从而用数学语言描述问题、解释性质、预测未来,提供解决处理的最优决策和控制方案。数学建模是架设桥梁的整个过程,是从实际问题中获得数学模型,对其求解,得到结论并验证结论是否正确的全过程。数学建模是用数学语言和方法,借助数学公式、计算机程序等工具对现实事物的客观规律进行抽象并概化后,在一定假设下建立起近似的数学模型,并对建立的数学模型进行求解,然后再根据求解的结果去解决实际问题。在这个过程中要从问题出发,充分发掘问题内涵,按照问题中蕴含的内生动力,寻求合适的模型,经过实践检验后多次修改模型使之渐趋完善,同时还要进行因素灵敏度分析,找出对问题影响较大、更大或最大的因素。随着社会的发展,大数据时代的来临,数学建模越来越引起人们的重视,很多高校将数学建模纳入课程体系之中,以提高学生运用专业知识、数学理论与方法及计算机编程技术综合分析解决问题的能力,特别是数学建模竞赛能有效提升学生的计算机技术与运算能力、团队协作能力、写作表达和创新实际能力。近年来,随着互联网技术的迅速发展,形形色色的数据环绕着我们,数据分析方面的人才需求陡增,造就了商务数据分析与应用专业的问世。商务数据分析与应用专业虽是2016年才增补的新专业,但它是一个跨数学、电子商务、计算机应用等学科的边缘专业。培养主要面向互联网和相关服务、批发、零售、金融等行业,掌握一定的数理统计、电子商务及互联网金融相关知识,具有商务数据采集、数据处理与分析、数据可视化、数据化运营管理等专业技能,能够从事商务数据分析、网店运营、网络营销等工作的高素质技能型人才。商务数据分析与应用专业的学生毕业后主要从事电商数据化运营过程中的数据采集与整理、调整与优化、网店运营与推广等工作。从2019年开始1+X证书制度试点工作拉开了序幕,职业教育迈入考证新时代,商务数据分析与应用专业作为第二批试点专业正在如火如荼地进行着,这将拓宽学生就业创业渠道,提高学生就业创业本领。但作为一名优秀的数据分析师要对数据敏感,熟知业务背景,认知数据需求,具有超强的数据分析与展示能力。若将数学建模融入商务数据分析与应用专业的人才培养体系中去,不仅使学生运用数学思维解决问题的能力得到提升,更使学生思路变得富有条理性,让学生养成敏锐观察事物的习惯,对学生的未来发展产生深远的影响。
1将数学建模融入商务数据分析与应用专业的可行性分析
将数学建模融入商务数据分析与应用专业不是牵强附会的关联,具有一定的可行性。
1.1在课程体系上具有可行性
数学建模是源于实际生活的需求,借助于数学的思维及知识去解决问题,需要学生具备一定的数学基础和计算机编程相关知识。商务数据分析与应用专业的课程体系中含有统计基础、数理统计与应用、C++、数据分析与处理等课程为学生学习数学建模奠定了基础。
1.2在教学团队上具有可行性
数学建模相关课程需要一支专业基础扎实、年轻、富有创造力的教学团队。教学团队中的教师不仅要有较为宽广的数学知识,也要具备较强的计算机编程和操作能力,这样才能培养学生从实际问题中刻画问题的本质并抽象出数学模型的能力。我校商务数据分析与应用专业的数学建模相关教师共9人,由来自于统计专业、计算机专业、电子商务专业等专业背景的教师组成,完全可以胜任数学建模相关课程的教学与指导。
1.3在教学环境上具有可行性
本专业校内教学条件比较完善,校内实训室基本上能够满足所有专业课程及专业实操课程的教学需要,学生可以在仿真的环境中进行练习。鉴于现有校外实训基地的实习内容与学生所学专业并不对口或融合度较低的现状,学校还要积极拓展校外实训衔接度高的校外实训基地,让学生真正参与到企业活动中去,着实提升学生的商务实践技能。校内教学条件完全可以胜任数学建模相关课程的教学。
2将数学建模融入商务数据分析与应用专业的实施路径
任何的教学改革都不是一蹴而就的,是时间沉淀出来的产物,从无到有、从有到优需要一个漫长的过程。要将数学建模融入商务数据分析与应用专业,需要从课程体系、教学团队、管理制度等方面着手。
2.1构建数学建模的课程体系
将数学建模融入商务数据分析与应用专业,首先要制定融合数学建模的人才培养方案,明确数学建模在培养方案中的知识、素质、能力等培养目标和要求,设置数学建模在教学计划中的相关理论、实践等教学环节的课时与学分分配。对大一学生增设数学建模课程,将数学建模与统计学、经济应用数学并行教学,其中涉及数学建模思想、基本数学模型、Matlab软件入门等内容,使学生了解几类基础的数学模型、常规的数学建模步骤及方法。在教学中加入商务数据分析案例,根据问题需求先建立数学模型,然后通过Matlab编程求解出结果,并运用软件进行计算、仿真和模拟,这样将数学建模、数学实验和商务数据分析三者有机衔接起来,不仅可以激发学生的学习兴趣,提高学生运用数学建模进行商务数据分析及预测的能力,也为之后的数学建模竞赛铺路。
2.2组建数学建模的教学团队
数学建模的教师不仅要熟悉初等几何、微分方程、优化、图与网络、概率等机理分析性建模,还要熟悉统计、预测、检测等测试分析性建模;不仅要掌握差分方程、插值与拟合、回归分析、线性规划等数学建模方法,还要熟练掌握Matlab、LINGO等各类建模语言的使用。作为数学建模的教师,面对商务数据方面的实际问题,要全面深入细致地了解问题的背景,准确无误地明确问题的条件,在查阅、收集、阅读掌握相关的数据、信息和资料的基础上,清晰准确地形成问题的主要特征,初步确定模型类型。然后根据特征和目的,找到问题的本质,忽略一些次要因素,给出必要的、合理的简化与假设。在分析与假设的基础上,利用数学工具和方法,描述对象内在规律,建立变量间关系,确定数学结构,建立商务数据的问题模型。数学建模的一系列过程需要教学团队的合理分工与协作,在日常教学过程中既要重视数学理论,又要重视实践案例教学。使学生了解基本的数学模型和编程思想,把教学重心放在案例的分析、模型的选择、程序的实现、灵敏度的分析等过程之中。通过对大量问题的数学模型的建立及计算机编程的求解,让学生触类旁通地处理一些实际问题,使学生体会到数学的魅力所在及学以致用的道理,从而提高学生商务数据分析与应用能力,为学生今后的创新创业奠定基础。教学团队不仅要完成数学建模相关课程的教学,还要加强数学建模教学的研究和应用,加强与外界的交流,推动教学改革,以提高数学建模的水平和质量。
2.3成立数学建模的学生社团
除了数学建模融入商务数据分析与应用专业教学之外,还可以在学校成立数学建模社团,吸纳学校中对数学建模感兴趣的学生,特别是商务数据与分析专业的学生进入社团。由数学建模老师定期对社团学生进行指导,将数学建模相关的数学公式、数学方法,数学建模的流程,竞赛论文的撰写要领,编程技巧等以讲座的形式传授给学生。同时,社团学生之间成立互助小组,互助小组中选择商务数据分析与应用专业的学生为组长,由组长带领其他组员共同探讨数学建模的学习方法与技巧,分享数学建模的编程技术与相关资料,交流数学建模的解决问题的思路。这样由一个专业带动多个专业,一个社团辐射到整个学校,在提高学生的数学建模能力的同时,也为数学建模竞赛选拔人才做好准备。数学建模社团的建立在丰富学生业余生活的同时,也给那些对数学有兴趣的学生提供了一个相互交流的平台,不仅可以开阔学生数学发现和研究的思维,还可以加强数学理论与实际问题之间的联系,提高学生运用数学思维方式解决实际问题的能力。
2.4参加数学建模的相关竞赛
为了更好地发挥数学建模在培养大学生创新创业能力过程中的引领作用,学校组织学生参加数学建模的相关竞赛,并将其发挥到极致。大学生数学建模竞赛是提高学生数学建模能力最好的平台,美国在1985年开始创办数学建模竞赛,我国大学生于1989年开始参赛并逐步成为参赛主体,到2019年共有15个国家25370队注册参赛,其中中国大陆地区代表队约占98%。我国第一届大学生数学建模竞赛(CUMCM)于1992年创办,2019年1490校区42992队报名参赛,现已呈现出一派繁荣景象,其他数学建模竞赛,如:深圳杯、电工杯等也如火如荼地开展起来。想在竞赛中取得优异的成绩是一个系统的工程。数学建模参赛团队通常由3名学生组成。在学生选拔时,就要综合考虑学生的知识、能力、性格等因素,这3名学生不仅要有较好的计算机技术与运算能力,更要有吃苦耐劳的精神和较好的团队合作意识。在教学指导时,不仅为学生讲解一些基础的数学建模方法和技巧,更要注重综合分析解决问题、逻辑思维、语言文字理解与表达、科研创新等能力的培养。在模拟训练时,指导教师严格把关,让学生合理安排三天时间在网上查阅资料,分析问题之后建模与解答,检验与分析,再完成竞赛的论文的写作。通过多次有针对性的模拟训练,学生摄取新知识、新技能的能力得到提升,定量与定性分析的思维能力得到锻炼,责任意识得到加强,自主学习的习惯逐渐养成,不畏艰难的品质得到磨练,团队创新能力得到提高。指导教师通过对数学建模的研究和学生的指导,教学相长,自身的建模能力也将得到大幅提升。面对一些实际的商务数据问题,能够通过建立一些相关的数学模型,探索出解决实际问题的方案,并从这些方案中选择出最合理、最科学、最恰当的方案。
2.5搭建数学建模的管理体系
将数学建模课程融入商务数据分析与应用专业难度不大,但是要让学生组队参加数学建模竞赛并出彩,就需要学校领导重视及相关职能部门支持,在校内建立健全数学建模管理制度,如将数学建模竞赛作为二级学院考核指标、数学建模指导教师的工作量计算办法、学生在奖学金与评先评优等方面优先考虑等。只有建立健全校内管理体系,才能激励更多的教师主动承担数学建模相关课程的教学,参与数学建模社团的指导,同时激发学生学习数学建模的兴趣与参加数学建模竞赛的积极性。
数学建模如何进行数据分析范文篇11
1.高中数学建模定义及过程
所谓数学建模就是指通过建立数学模型来解决各种实际问题的方法,也就是通过对实际问题进行抽象、简化,转化为数学问题,并应用某些规律建立数学模型,求解该数学问题,解释验证所得到的解,从而确定能否用于解决实际问题的多次循环,不断深化的过程.
由以上建模过程可知,在高中数学课堂中开展数学建模教学,可以把学生所学数学知识与实际适当联系起来,使学生在了解数学妙用的同时,更能进一步激起学生学习数学的热情,提高学生学习数学的主动性,也是深入理解数学概念领悟数学应用思想的有效途径.
2.建立数学模型的方法和步骤
①模型准备
了解问题的实际背景,明确其实际意义、建模目的,搜集掌握对象的各种信息.弄清对象的特征,用数学语言来描述问题.
②模型假设
根据实际对象的特征和建模的目的,对问题进行必要的、合理的简化,使问题的主要特征凸现出来并用精确的语言提出一些恰当的假设.
③模型建立
在假设的基础上,利用对象的内在规律和适当的数学知识来描述各变量之间的数学关系,构造各个量间的等式关系或其它数学结构.
④模型分析
利用获取的数据信息,采用解方程、画图形、证明定理、逻辑运算、数值运算等各种数学方法,特别是计算机技术,对模型的所有参数进行数据分析.
⑤模型检验
对所建立数学模型进行准确性和稳定性分析,将模型分析结果与实际情形进行比较.若模型与实际较吻合,则要对计算结果给出其实际含义,并进行解释.再次修改假设,重复建模过程,不断完善,以更好的为实际所应用.
3.高中数学建模教学的三个案例及分析
①方程或不等式模型
对于实际应用问题,可以通过建立目标函数,然后运用解(证)不等式的方法求出函数的最大值或最小值,其中要特别注意蕴涵的制约关系,一旦忽视,将出现解答不完整.此种应用问题属于不等式模型.
例1:甲、乙两地相距S千米,汽车从甲地匀速行驶到乙地,速度不得超过c千米/时,已知汽车每小时的运输成本(以元为单位)由可变部分和固定部分组成:可变部分与速度v(千米/时)的平方成正比,比例系数为b;固定部分为a元.
(Ⅰ)把全程运输成本y(元)表示为速度v(千米/时)的函数,并指出函数的定义域;
(Ⅱ)为了使全程运输成本最小,汽车应以多大速度行驶?
分析:几个变量(运输成本、速度、固定部分)有相互的关联,抽象出其中的函数关系,并求函数的最小值.
解:(读题)由主要关系:运输总成本=每小时运输成本×时间,
②三角模型
作为工具学科的三角,跨学科的应用是它的特点,不少物理学、工程测量、航海航空等问题都可以转化为三角函数来解决,此种题型属于应用问题中的三角模型.
例2(射门问题)国际足联规定世界杯决赛阶段,比赛场地长105米,宽68米,足球门宽7.32米,高2.44米,试确定边锋最佳射门位置(精确到1米).
面对这样一个问题情境,大多数学生都束手无策,教师可以设计以下几个探究方向:
(1)到球场实地去观察一下,边锋在球场上如何运动,一般在何处起脚射门?
(2)向踢球经验丰富的同学请教足球的有关知识;
(3)到图书馆查阅有关材料;
(4)认真思考本题所谓的最佳射门位置在数学上的具体含义;
(5)在此基础上考虑如何利用数学方法来解决这一问题.
分析求解:设边锋所在位置为M,最佳射门位置为M对球门AB水平视角最大,确定M点位置,即OM的长度,与足球场长度和球门高度无关.
③几何模型
数学建模如何进行数据分析范文篇12
【关键词】经济学数学模型应用
在经济决策科学化、定量化呼声日渐高涨的今天,数学经济建模更是无处不在。如生产厂家可根据客户提出的产品数量、质量、交货期、交货方式、交货地点等要求,根据快速报价系统(根据厂家各种资源、产品工艺流程、生产成本及客户需求等数据进行数学经济建模)与客户进行商业谈判。
一、数学经济模型及其重要性
数学经济模型可以按变量的性质分成两类,即概率型和确定型。概率型的模型处理具有随机性情况的模型,确定型的模型则能基于一定的假设和法则,精确地对一种特定情况的结果做出判断。由于数学分支很多,加之相互交叉渗透,又派生出许多分支,所以一个给定的经济问题有时能用一种以上的数学方法去对它进行描述和解释。具体建立什么类型的模型,既要视问题而定,又要因人而异。要看自己比较熟悉精通哪门学科,充分发挥自己的特长。
数学并不能直接处理经济领域的客观情况。为了能用数学解决经济领域中的问题,就必须建立数学模型。数学建模是为了解决经济领域中的问题而作的一个抽象的、简化的结构的数学刻划。或者说,数学经济建模就是为了经济目的,用字母、数字及其他数学符号建立起来的等式或不等式以及图表、图象、框图等描述客观事物的特征及其内在联系的数学结构的刻划。而现代世界发展史证实其经济发展速度与数学经济建模的密切关系。数学经济建模促进经济学的发展;带来了现实的生产效率。在经济决策科学化、定量化呼声日渐高涨的今天,数学经济建模更是无处不在。如生产厂家可根据客户提出的产品数量、质量、交货期、交货方式、交货地点等要求,根据快速报价系统与客户进行商业谈判。
二、构建经济数学模型的一般步骤
1.了解熟悉实际问题,以及与问题有关的背景知识。2.通过假设把所要研究的实际问题简化、抽象,明确模型中诸多的影响因素,用数量和参数来表示这些因素。运用数学知识和技巧来描述问题中变量参数之问的关系。一般情况下用数学表达式来表示,构架出一个初步的数学模型。然后,再通过不断地调整假设使建立的模型尽可能地接近实际,从而得到比较满意的结论。3.使用已知数据,观测数据或者实际问题的有关背景知识对所建模型中的参数给出估计值。4.运行所得到的模型。把模型的结果与实际观测进行分析比较。如果模型结果与实际情况基本一致,表明模型是符合实际问题的。我们可以将它用于对实际问题进一步的分析或者预测;如果模型的结果与实际观测不一致,不能将所得的模型应用于所研究的实际问题。此时需要回头检查模型的组建是否有问题。问题的假使是否恰当,是否忽略了不应该忽略的因素或者还保留着不应该保留的因素。并对模型进行必要的调整修正。重复前面的建模过程,直到建立出一个经检验符合实际问题的模型为止。一个较好的数学模型是从实际中得来,又能够应用到实际问题中去的。
三、应用实例
商品提价问题的数学模型:
1.问题
商场经营者即要考虑商品的销售额、销售量。同时也要考虑如何在短期内获得最大利润。这个问题与商场经营的商品的定价有直接关系。定价低、销售量大、但利润小;定价高、利润大但销售量减少。下面研究在销售总收入有限制的情况下.商品的最高定价问题。
2.实例分析
某商场销售某种商品单价25元。每年可销售3万件。设该商品每件提价1元。销售量减少0.1万件。要使总销售收入不少于75万元。求该商品的最高提价。
解:设最高提价为x元。提价后的商品单价为(25+x)元
提价后的销售量为(30000-1000x/1)件
则(25+x)(30000-1000x/1)≥750000
(25+x)(30-x)≥750[摘要]本文从数学与经济学的关系出发,介绍了数学经济模型及其重要性,讨论了经济数学模型建立的一般步骤,分析了数学在经济学中应用的局限性,这对在研充经济学时有很好的借鉴作用。即提价最高不能超过5元。
四、数学在经济学中应用的局限性
经济学不是数学,重要的是经济思想。数学只是一种分析工具数学作为工具和方法必须在经济理论的合理框架中才能真正发挥其应有作用,而不能将之替代经济学,在经济思想和理论的研究过程中,如果本末倒置,过度地依靠数学,不加限制地“数学化很可能经济学的本质,以至损害经济思想,甚至会导致我们走入幻想,误入歧途。因为:
1.经济学不是数学概念和模型的简单汇集。不是去开拓数学前沿而是借助它来分析、解析经济现象,数学只是一种应用工具。经济学作为社会科学的分支学科,它是人类活动中有关经济现象和经济行为的理论。而人类活动受道德的、历史的、社会的、文化的、制度诸因素的影响,不可能像自然界一样是完全可以通过数学公式推导出来。把经济学变为系列抽象假定、复杂公式的科学。实际上忽视了经济学作为一门社会科学的特性,失去经济学作为社会科学的人文性和真正的科学性。
2.经济理论的发展要从自身独有的研究视角出发,去研究、分析现实经济活动内在的本质和规律。经济学中运用的任何数学方法,离不开一定的假设条件,它不是无条件地适用于任何场所,而是有条件适用于特定的领域在实际生活中社会的历史的心理的等非制度因素很可能被忽视而漏掉。这将会导致理论指导现实的失败。
3.数学计量分析方法只是执行经济理论方法的工具之一,而不是惟一的工具。经济学过分对数学的依赖会导致经济研究的资源误置和经济研究向度的单一化,从而不利于经济学的发展。
4.数学经济建模应用非常广泛,为决策者提供参考依据并对许多部门的具体工作进行指导,如节省开支,降低成本,提高利润等。尤其是对未来可以预测和估计,对促进科学技术和经济的蓬勃发展起了很大的推动作用。但目前尚没有一个具有普遍意义的建模方法和技巧。这既是我们今后应该努力发展的方向,又是我们不可推卸的责任。因此,我们要以自己的辛勤劳动,多实践、多体会,使数学经济建模为我国经济腾飞作出应有的贡献。
-
移动互联网营销方式范例(12篇)
移动互联网营销方式范文1篇11.移动互联网应用概述1.1移动互联网的基本概念移动互联网(MobileInternet,简称MI)就是将移动通信和互联网二者结合起来,成为一体。它通过智能移动..
-
初中数学建模思想的培养范例(12篇)
初中数学建模思想的培养范文1篇1关键词:新课程改革;初中数学;课堂教学;模式虽然初中数学经历了漫长的历史,但是在传统的课堂教学的背景下初中数学的发展并不明显。进入21世纪以..
-
八年级上学生期末评语范例(整理10
八年级上学生期末评语范例篇1是班主任对八年级学生一学期的思想品德、学习劳动、健康状况等作出的全面总结和评价。下面是有八年级上期。欢迎参阅。1.文静的你总是面带微笑..
-
线上教育和线下教育结合范例(12篇)
线上教育和线下教育结合范文篇1关键词:在线交互;翻转课堂;教学实践中图分类号:G434文献标志码:B文章编号:1673-8454(2015)22-0040-04一、引言2012年,大规模开放在线课程(MOOCs)横空出..
-
计算机的专业方向范例(12篇)
计算机的专业方向范文篇11大数据技术对高校计算机专业的影响大数据技术的快速发展,使国内面临着大数据专业人才短缺的困境,各领域的人才缺口很大。目前,各高校已经注意到了这..
-
如何做到绿色生活范例(12篇)
如何做到绿色生活范文篇1森林是绿的,大地是绿的,天空是绿的,小草是绿的,荷叶是绿的……世界万物都散发出绿”的气息,而低碳生活就是我们要建立的绿生活,只要我..
-
对生态学的认识范例(12篇)
对生态学的认识范文1篇1意识形态作为信仰与信念,当政治认同的其他因素如经济绩效等失去时,可能仍然延续,甚至重新发展。比如中国的传统意识形态儒家学说,在绵延两千多年的古代..
-
信息资源管理的基本概念范例(12篇)
信息资源管理的基本概念范文篇1论文摘要:本文主要针对数字图书馆的特点。指出数字图书馆管理应确立新的管理理念,并在此基础上从四个方面论述了数字图书馆的管理:知识管理、人..