动态分析基本方法范例(3篇)
动态分析基本方法范文
关键词:目标运动分析;纯方位;扩展卡尔曼滤波
中图分类号:TN911文献标识码:A文章编号:1007-9416(2017)03-0234-01
TMA的基本问题即是利用带噪的阵元域数据估计出目标的运动要素[1]。在现代战争实际环境中,测得的目标特征数据通常极其有限,而目标的方位几乎成了唯一可靠的参数,因此BO-TMA具有十分重要的意义[2-4]。
水下运动目标的运动要素估计有其特殊性,其一是本舰不允许机动,其二是TMA算法的快速收敛性,因此单阵BO-TMA并不适用,文中采用双阵方位测量值进行TMA,基于扩展卡尔曼滤波算法(EKF)处理该非线性系统,通过计算机仿真分析了不同条件下算法性能,仿真结果表明:与单阵BO-TMA相比,该算法无需本舰机动即可实现对水下目标的运动分析。
1双阵纯方位TMA原理
考]如图1所示的基阵与目标间的几何关系,假定二维平面情形,两基阵均随本舰匀速直线运动,阵间距离D可预先测量并能实时修正,目标于平面内匀速直线运动。
表示目标的绝对运动状态(即相对坐标原点的运动状态,下同),其中分别为目标相对坐标原点的方向与方向的距离,分别为目标相对坐标原点的方向与方向的速度;表示阵1的绝对运动状态,表示阵2的绝对运动状态。
表示目标相对于基阵1的运动状态,其中分别为目标相对基阵1的方向与方向的距离,分别为目标相对基阵1的方向与方向的速度,表示目标相对于基阵2的运动状态,其中分别为目标相对基阵2的方向与方向的距离,分别为目标相对基阵2的方向与方向的速度。、如上图所示,分别为基阵1、基阵2所测得的目标方位角。以基阵1为参考基阵,则有状态方程如下:
(1)
式中:为状态转移矩阵,为过程噪声,其自相关矩阵为Q,G为过程噪声转换矩阵。
简记为,测量方程如下:
(2)
其中:为量测噪声,其自相关矩阵为R,且有:
(3)
由式(3)可知,系统为非线性,经典的EKF算法非常适合处理此类问题[5]。对于非线性系统,EKF算法基于泰勒展开对其线性近似,然后利用卡尔曼滤波算法完成对目标状态的估计。
2仿真计算
基于上述方法进行仿真计算。仿真条件:双阵间距D分别为600m和1200m;双阵方位测量误差均为正态随机变量,标准差分别为1.5°和0.5°,方位测量间隔T为1秒;本舰绝对航速6m/s,航向正东,基阵1的初始位置为(-D,0),目标初始位置为(-6000m,6000m),目标绝对航速20m/s,绝对航向120°。
图2给出了不同D情形下算法仿真结果。其中,方位测量误差标准差取0.5°。由图可知,D越大,收敛速度越快,估计性能愈好。
图3给出了不同方位测量误差下仿真结果。其中,D取600m;方位测量误差均值取0。由图可知,方位测量误差方差越小,收敛速度越快,估计性能越好。
仿真结果表明:基于EKF算法能实现双阵纯方位目标运动分析,且无需本舰执行机动。双阵间距、观测噪声影响算法性能,间距越大,噪声越小,算法性能越好。
3结语
本文将EKF算法拓展到双阵TMA领域中,文章通过计算机仿真分析不同条件下算法性能,仿真结果表明算法的可行性,且双阵间距越大、观测噪声越小,算法性能越好。该算法是实时处理方法,不需存储大批量数据,非常适合工程实现。
参考文献
[1]O.Tremois,J.P.LeCadre.TargetMotionAnalysiswithmultiplearrays:PerformanceAnalysis[J].IEEETransactionsonAerospaceandElectronicSystems.1996,32(3):1030-1046.
[2]YunJunZhang,GuoZhongXu.Bearings-OnlyTargetMotionAnalysisviaInstrumentalVariableEstimation[J].IEEETransactionsOnSignalProcessing.2010,58(11):5523-5533.
[3]ClaudeJauffret,DenisPillon.Bearings-onlymaneuveringtargetmotionanalysisfromanonmaneuveringplatform[J].IEEETransactionsonAerospaceandElectronicSystems,2010,46(4):1934-1949.
动态分析基本方法范文
关键词:动态能力价值性困境环境
引言
动态能力类似流程的概念,高管们通过创造动态能力以执行高水平的内部惯例(Winter,2003),获取暂时的竞争优势。动态能力理论体现了Nelson等(1981)的演化经济学,变革的来源是子系统的互动,而非高层管理者;其研究方法建立在Schumpeter(1934)的竞争理论,Cyert和March的企业行为特征,Williamson(1975;1985)的市场、层级与资产专用性等研究文献基础上(Véronique等,2009)。
动态能力理论学派的研究基于简单的理论,看起来能很好地解释复杂的现象:企业的差异之源,可能比社会学中那些复杂的技术更有用(Zahra等,2006)。但是动态能力理论经过20多年的发展,在动态能力的含义、动态能力的分析单位、动态能力的框架、动态能力之源方面仍然模糊不清。本文通过梳理动态能力相关文献,总结出动态能力理论和实践应用的价值性困境,在此基础上从动态能力的理论基础切入分析困境的原因,最后对未来的研究提出展望。
动态能力理论的价值性困境
(一)动态能力含义的模糊性
Teece等(1997)指出动态是指更新竞争能力以与变化的竞争环境保持一致的能力;能力是战略管理中整合、重构组织内外的资源、技术和能力以符合环境变化的要求的重要角色。随后的研究者们一直未达成一致的观点。有的研究者认为动态能力是资源整合、重置、更新能力(Griffith等,2001);有的研究者认为动态能力就是组织高阶流程(Winter,2003),是组织惯例(Eisenhart等,2000);有的研究者认为动态能力是无形的根植于资源可以转换为流程,动态能力是比普通能力高级的能力(Wang等2007);有的研究者认为动态能力可以转换成普通能力(Paull等,2011)。动态能力的定义含糊,存在同义反复问题(Eisenhart和Martin,2000)。动态能力的定义有待澄清(Wang等2007)。含义的模糊性影响了分析单位(维度)。
(二)缺乏统一的分析单位
理论界试图界定动态能力的维度以方便测量和研究。自Teece(1997)提出动态能力的三维度说后,其后的研究者们受研究样本和研究者主观认知的影响,对于动态能力维度提出各种学说。Winter(2003)提出低阶能力和高阶能力的关系;Danneels(2008)认为动态能力是组织构建一阶能力的二阶能力,二阶能力是动态能力,具体包括市场能力和研发能力。国内的一些学者曾提出三维度说:即适应、吸收、创新(Wang等,2007),四维度说即环境洞察力、技术柔性、组织柔性、变革更新(焦豪,2008),五维度说即组织价值观、个人动态和静态能力、组织的静态能力和动态能力(王文超,2005)或动态资源获取能力、动态内部组织能力、动态外部协调能力、动态资源释放能力、动态信息利用能力(曹红军等,2007),六维度说(贺小刚,2006)等。动态能力分析单位模糊,缺乏客观统一性,导致动态能力分析框架的缺失。
(三)系统分析框架缺失
由于全球竞争环境和商业模式的变化引起产业边界的模糊,定位学派(Porter,1980)的产业选择和产业内定位的分析范式变得越来越无力。演化经济学的动态分析框架将企业视为知识的存储库,从个体和组织的学习过程入手,主要研究企业内部知识生产、传播和利用,通过企业内部子系统层次的遗传、变异和选择,使企业之间相互区别,产生竞争优势和多样化(贺小刚,2006)。动态能力理论的开启者Teece(1994;1997;2007)基于演化经济学的分析范式,建立起路径、位势、流程的分析模式,认为组织发展的先前路径决定组织位势,组织位势决定组织流程,组织流程决定组织的动态能力,从而组织形成新位势,动态能力对组织绩效和竞争优势产生影响。Teece等(2007)改进了1997年研究的逻辑,认为组织动态能力包括组织对机会的感知、抓住机会的能力以及重新组合和重构的能力,他的研究说明了动态能力的性质和微观基础。这些阶层研究方法为定量研究奠定了基础。
在Teece之后很多研究者借鉴演化理论的子系统分析方法,在分析组织的具体动态能力时关注组织的流程,尤其是创新和变革的相关流程(Minzgerg,2012)。一些学者从人力资源管理(Rosenbioom,2000)、公司治理(Mayer,2006;Argyers,2007)、关系管理(Gulati,1999;Lorenzoni,1999)、管理决策(Oliver,2008;纪春礼,2010)、产品研发(Smith,2005;Lavie,2006)等组织内部各个流程创新和变革入手,研究动态能力对企业管理和绩效的影响(曹红军,2008),并且这些分析扩展了规范性的分析方法,使实证研究纳入动态能力的研究,但是这种流程的分析方法与Porter创造的企业价值链分析方法差别不大,并且战略的核心方向会逐渐分散成机动的战术策略。一系列的理想行动会使整体活动失去理性(Mintzberg,2012)。由于动态能力涉及诸多不同的研究单元,如资源、能力、知识、管理、要素等,所以还没有出现一个比较系统的框架(贺小刚,2006)。
(四)动态能力之源的相关争论
动态能力之源的研究关系到动态能力如何培育实现的问题。Teece(1997)认为动态能力是重要的,企业必须通过学习来获得。动态能力的本质是集体学习(Minzberg,2002)。Winter(2000)指出组织对学习达到了满足,能力的进化也同时停止了。Zollo等(2002)从组织学习机制出发,提出学习机制影响动态能力,直接和间接影响运作管理演化模型。但是对于学习的过分强调可能会破坏一个连贯的、完美的可行战略。学习不应该是某种圣杯一样的实务,应该是建立方向感的一种方法。一个企业的战略应该在合适的时候改变,学习可能促使那些没想到或不希望的战略出现,这样组织会失去战略,组织因此被一步步引入困境。另外学习的成本可能是昂贵的(Minzberg,2012)。
借助资源观理论分析范式,Teece(1997)认为学习形成的知识和技能不容易被模仿和复制,是形成独特竞争优势的源泉。企业是知识的集合体,企业的独特资源、能力源于企业所拥有的难以交易和模仿的知识。企业知识高度情境化,必须通过特定的实践获得。企业知识通过不断学习积累的特征决定了它的难以转移性和不可模仿性,并通过惯例反映到企业行为上(Grant,1996)。但是学习是能力之源意味着动态能力差异会因组织学习缩小甚至消失,这成为学者质疑动态能力带来持续竞争优势的有力证据(曹红军,2008),动态能力理论需要寻求其它理论来解释动态能力之源。
价值性困境之源的分析
动态能力学派试图用组织理论中的认知学派和学习学派的观点,在市场动态因素的影响下分析构建组织产生竞争优势的源泉,弥补资源学派忽视环境、核心能力理论的静态分析的缺点,采用进化学派的分析框架解释组织差异。动态能力理论是组织理论框架中继理论、产权理论、交易成本理论之后一个重要的分支理论(Mahoney等,1993)。通过上面的分析,如果说设计学派对于环境分析是静态并且过于简单,定位学派对战略是什么的解释未必正确,那么学习学派的动态能力理论在认知和学习中迷失。动态能力的价值性困境之源源于其分析对象、理论基础和研究过程。
能力本身是一个抽象的概念,能力理论缺乏统一的理论框架结构,其中有两因素说、群因素说、智慧结构说,能力倾向的测量也不胜枚举(孙喜林,1998)。能力理论被应用于组织战略领域,能力理论对能力的研究只是探索阶段,导致动态能力的含义、动态能力之源模糊不清。
认知理论作为动态能力的理论基础,本身是一个缺乏严密系统的思想学派,是一些零散的研究集合;动态能力理论基础之一的演化理论,研究者分析演化过程借鉴学习理论,通过学习培养战略涌现的能力,支持学习学派的学者会发现,当战略进行重新定位时,很少通过正规计划,而是通过一些小决策和行动,经过长期积累达到重大改变。人们的学习认知过程一直没有被清楚地表达出来。如果学习认知能力被清晰的表达出来,它将极大地改变我们今天所熟悉的战略教学和实践过程(Mintzberg,2012)。
动态能力理论除了理论存在模糊性之外,系统分析框架的缺失使其在实践应用性方面对组织绩效存在的差异解释不清,动态能力的过程研究很宽泛,存在用结果解释企业差异而非用过程来解释的问题。如果从能力提升过程研究动态能力对组织绩效的贡献,可能研究对象本身也说不清自己的能力是何时以及如何提升的,从而使研究无法进行。
研究展望
本文通过对动态能力理论、应用的价值性困境以及困境之源的剖析,对动态能力理论有了进一步的认识。动态能力理论的模糊性以及与实践的背离让人觉得不满意。研究者首先应该弄清楚理论适用的环境,包括组织情境和组织文化。当组织处于高度复杂的环境,制定战略所需的知识非常广泛,如医院这种组织。与Quinn(1980)描述的组织异曲同工:核心管理者可以制定战略,但是政治现实要求战略的实施过程要么是一个集体学习过程,要么是一个取得集体认同的过程。有些组织不断面临新情况,无法形成清晰的战略,这种情况下学习是唯一灵活处理问题的方法(Mintzberg,2012)。在高权利距离组织文化中,讲究等级、领导权威、下属的服从,在这种组织文化影响下动态能力强调的任何有识之士推动战略进程的思想很难实现,因为战略形成的逻辑渐进主义需要政治上的支持和管理中的放权,而高权利组织文化对于权利和等级的观念很难改变。
超越组织边界进行学习。动态能力理论试图将复杂的环境问题和组织内部的学习过程,分解成简单的要素维度进行科学研究和预测,这种研究方法不能满足理论对实践的指导。动态的环境使组织的无序和混沌增强,为了增强组织的敏捷性和对环境的快速适应性,用简化的战略指导决策,以减少流程,所以不论在学术研究或实践应用中应该跳出流程的规范,发起一些实验行为,以吸纳更多的切实可行的意见和建议。如宝洁公司的创新团队独立于公司的任何部门,采用维基的思想,使企业将创新边界由内部向外部拓展,在对需求的认知过程中将顾客和供应商纳入组织创新(vonHippel,2005),使组织对环境的动态感知能力增强,使组织战略不但在组织中的每个角落实现,是组织内部的集体学习过程,而且超越组织的边界,开启了组织战略的另一扇大门。
重新定位领导的角色。战略通常被看做管理活动的高端任务,而动态能力理论假设前提是领导不再事先勾画出深思熟虑的过程,而是对涌现战略的思考、学习,最终推动行动和变革。领导者需要创立一套创新和变革流程,发现可提供动态能力的资源,做造钟者而非报时人。
研究者在实践中催生新的分析工具和分析方法。在具体的实践情境中,研究者研究如何有效解决更具体和现实的问题,促进多种理论融合共生。如在研究创新能力的过程中,研究者将心理学的创造力理论、社会学的社会交换等相关理论应用于组织的动态能力构建中,用新的理论解决组织动态能力问题。
在全球竞争环境中,竞争越来越激烈,变革越来越快而不可预测,企业需要运用多种战略获取竞争优势。动态能力理论撼动了战略管理理论界和实践界主流地位的思想(Mintzberg,2012)。希望动态能力理论在不断的应用中发展,成为更有震撼性的理论。
参考文献:
1.亨利・明茨伯格著.魏江译.战略历程[M].机械工业出版社,2012
2.焦豪,魏江,崔瑜.企业动态能力构成路径分析:基于创业导向和组织学习导向[J].管理世界,2008(4)
3.纪春礼.营销动态能力的构成:中国国际化企业视角[M].经济科学出版社,2011
动态分析基本方法范文篇3
关键词:聚类分析;判别分析;动态聚类
0引言
经典聚类分析算法是基于距离计算的。然而除马氏距离定义外,其他距离定义都存在样本指标的量纲处理问题;除马氏距离和斜交空间距离定义外,其他距离定义都存在样本指标的相关性处理问题;另外,包括马氏距离在内的所有距离定义都存在将用于聚类的指标同等对待的缺点,不能反映不同指标对聚类结果的贡献程度。
一般情况下,在确定样本间距离计算方法的基础上,用不同的聚类分析方法得到聚类的结果是不会完全一致的。这是因为在实际应用中,许多对象在不同类之间本身并无清晰的划分。这导致了在既定用于聚类的指标组合的情况下,用不同的聚类方法对同一组样本进行分析会得到不同的聚类结果。如上所述,即使使用同一种聚类方法,有时由于样本的排列顺序不同,也可能导致不同的分类结果。这就提出了对不同的聚类方法进行评价的问题。关于所用方法好坏的评价,现在还没有一个合适的标准。edwards和cavalli?sforza(1965)曾建议把样本分成两类,使得两类间的离差平方和最大[1]。d.fisherwalter也指出,应该寻找使类内差异最小的聚类方法[2]。因此,评价不同聚类方法的一个重要方面,就是看这些方法得到的聚类结果在类内的接近程度和在类间的相隔程度。一个较好的分类方法应该得到类内差异较小、类间差异较大的聚类结果。在实际应用中,一般采用以下两种处理方法:a)根据分类问题本身的专业知识,结合实际需要来选择分类的方法,并确定分类的个数;b)用多种方法对数据进行分析处理,把结果的共性取出来。如果用几种方法的某些结果都一样,则说明这样的聚类确实反映了事物的本质。将有争议的样本暂放一边,或者用其他方法如判别分析进行处理归类。另外,在聚类分析方法既定的情况下,同一组样本采用不同的指标组合进行聚类分析,通常也会得到不同的分类结果。产生不同结果的原因主要是由于不同的指标组合测度是样本间的不同侧面的相似程度,在进行聚类分析时存在指标组合选择的问题。一般是根据聚类的实际需要进行指标的选择,这是一个比较复杂并且带有主观性的问题。实践中,在开始进行聚类分析时,通常是先选择多种指标组合分别进行聚类,然后对聚类分析的结果进行对比分析,以确定出合适的测度指标。
判别分析产生于20世纪30年代,是利用已知类别的样本建立判别模型,为未知类别的样本判别的一种统计方法。近年来,判别分析在自然科学、社会学及经济管理学科中都有广泛的应用。判别分析的特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则。当遇到新的样本点时,只要根据总结出来的判别公式和判别准则,就能判别该样本点所属的类别。判别分析按照判别的组数来区分,可以分为两组判别分析和多组判别分析。本文仅研究两组判别分析。在众多的判别分析方法中,最直观的是距离判别法。
距离判别的思想是计算待判样本到第?i?类总体的平均数的距离。哪个距离最小就将它判归到哪个总体。所以,距离判别法的任务就是构造一个恰当的距离函数,通过样本与某类别之间距离的大小判别其所属类别。这里仅讨论两个总体的距离判别法。距离判别只要求知道总体的数字特征,不涉及总体的分布函数。当参数未知和协方差时,就用样本的均值和协方差矩阵来估计。
从距离判别法可以看到判别规则是一个线性函数。由于线性判别函数使用简便,希望能在更一般的情况下建立一种线性判别函数。fisher判别法由fisher在1936年提出,是根据方差分析的思想建立起来的一种能较好区分各个总体的线性判别法。该判别方法对总体的分布不作任何要求。
从两个总体中抽取具有?p?个指标的样本观测数据,借助于方差分析的思想构造一个线性判别函数:
距离判别法是基于距离计算的,用构造线性判别函数方法进行样本判别的fisher判别法也存在着类似基于距离计算的聚类分析方法当中的不足:
a)将总体和样本的多个指标赋予了同等的判别能力,而这与现实是不相符合的,即不同的指标在判别样本的归属时具有不同的判别能力。
b)没有对用于建立判别分析模型的总体指标进行筛选。这在两总体的某指标没有显著差异时进行判别分析的意义不大,误判的概率很大[3,4]。
c)距离的计算不可避免地会带来量纲上的问题[5]。
d)距离判别方法简单实用,但没有考虑到每个总体出现的机会大小,即先验概率,没有考虑到错判的损失。bayes判别法正是为了解决这两个问题提出的判别分析方法,其判别效果更加理想,应用也更广泛。本文将在实证研究部分用bayes判别方法对涉及的问题进行分析,作为与新算法计算效果的一个对比。
在回归分析中,变量的好坏直接影响回归的效果。在判别分析中也有类似的问题。用于建立判别准则的指标的选择是判别分析中的一个重要问题。如果在某个判别问题中,将最重要的指标忽略了,相应的判别函数的效果一定不好;另一方面,如果引入了一些判别能力不强的指标,不仅会增加计算量,还会严重地影响判别的效果。但是在许多问题中,事先并不知道哪些是主要指标。因此筛选变量的问题就非常重要,从而产生了逐步判别法。逐步判别法与逐步回归法的基本思想类似,都是采用有进有出的算法,即逐步引入变量,每引入一个重要的变量进入判别式,同时也考虑较早引入判别式的某些变量。如果其判别能力随新引入的变量而变为不显著了(如其作用被后引入的某几个变量的组合所代替),应及时从判别式中把它剔除,直到判别式中没有不重要的变量需要剔除,而剩下的变量也没有重要的变量可以引入的判别式时,逐步筛选结束。这个筛选过程实质就是作假设检验。通过检验找出显著性变量,剔除不显著的变量,得到用于建立判别式的变量组合后,可用各种方法建立判别函数和判别准则。
实际上,以上提到的不论是距离判别法、fisher判别法,还是bayes判别法、逐步判别法,其出发点都是把给定的分组作为构造判别函数的依据和出发点,其最终结果都是构造一个线性判别函数。它们仅仅是判别函数构造思想上的差异。距离判别法基于距离判别思想;fisher判别法基于方差分析思想,判别式的形式为距离判别式的一般形式;bayes判别法基于条件概率思想;逐步判别法基于假设检验思想确定用于判别的指标,但其判别式的确定仍由其他判别分析方法确定。
以上各种判别分析方法中,仅有逐步判别法的基本思想中考虑到了不同指标具有不同的判定能力,但是其思想的具体体现仅在于确定用于构建判别式的指标,并没有给出各个指标具体的判别能力大小的差异。实际上不仅不同指标的判别能力存在差异,而且在筛选掉部分指标的同时也会丢失该部分指标所包含的判别信息。
对于一组给定的样本,对其进行聚类分析时,可以应用不同的聚类方法对不同的指标组合进行聚类分析,同时也将得到多组不同的聚类结果。对于某些指标组合下的聚类结果,结合实际可能会得到比较符合实际意义的解释,对此类聚类结果可以为其构造特定的判别模型,用于新样本类别的判别。因此,聚类分析的实质是对不同的指标组合下的样本分类组合的可能性进行搜索,找出符合特定聚类定义的组合。其作用是寻找满足特定需求的,或者说可以给出较好解释的聚类结果。判别分析的实质是根据历史信息或者聚类的结果建立判别标准,用于对参加聚类的样本和新的样本的判别。聚类分析和判别分析之间存在着紧密的联系。聚类分析的结果作为进行判别分析的基础;而判别分析不仅可以用于对新样本进行判别,而且另一个重要的作用在于校验聚类分析结果的正确性,即回判。
基于以上的分析结论,传统的对数据的聚类判别分析流程一般是先有聚类分析,然后在其之上的判别分析。本文将借鉴经典聚类分析和判别分析中的部分思想,从聚类分析和判别分析的实质出发,逐步构建出一类有异于传统分析思路的样本聚类判别分析算法,并尝试在新算法中解决经典聚类判别分析方法中存在的部分问题。
1动态聚类判别分析算法的设计和实现
1.1新的聚类判别分析框架
对于一组给定的需要进行聚类分析和判别分析的样本集合,新的聚类判别分析框架基于以下基本事实:
a)对于给定的样本序列,有有限种分组方案。
b)用传统聚类分析方法得出的结果并不总能遍历以上所有的分组可能。不仅因为其中部分分组在任何指标组合下都不合理,还因为传统聚类分析方法得出的结果本身就有限。在指定指标组合、指定样本排列顺序的情况下一种聚类方法仅能给出一个聚类结果。
c)对于用聚类方法得不出的分组方案,存在部分用判别分析进行判别回判率为百分之百的分组方案。
d)对于既定的分组,不同指标在区分该分组的能力上存在差异。不同组的某些指标差异明显,有些并没有明显差异。
新的聚类判别分析框架的设计基于以下基本假设:对于任意一种分组方案,如果判别分析的回判正确率足够高,那分组就是合理的和可以接受的。因此,新的聚类判别分析框架设计的基本思想是聚类分析建立在判别分析的基础之上。据此设计的新算法中并不包括具体的聚类分析算法,仅仅包括判别分析算法。
本文中应用的判别分析算法基于文献[6]提出的基于样本指标值频度计算的判别分析算法。该两总体判别分析算法的思想与逐步判别法的思想有一定的相似之处。不同之处在于其核心思想不是筛选变量,而是筛选指标值,是逐步筛选出具有显著判别能力的指标值;不是根据用具有显著判别能力的变量建立判别式,而是用筛选出的具有显著判别能力的指标值建立判别模型;其判别模型不是线性判别式,而是一个复杂的判定模型系统;得出的结果不是某样本的判定结果,而是某样本属于某总体的概率。该算法筛选指标值的基本思想为:对于同一指标而言,假设两组中所有样本的该指标值为一维空间上的点。如果两组内距离最近的两点距离小于或者等于这两点中任意一点到该点所在组的其他任意一点的距离,则这两点根本就不具有判别能力,应该剔除。为提高该算法的计算速度,进行了如下两点优化,在程序实际运行中取得了良好效果:
a)对某指标进行计算时应用冒泡算法对所有指标值进行排序。该数据预处理大大提高了指标值的筛选速度。
b)因为对样本的判别问题是通过计算该样本的各个指标值上的判别概率得到的,从对数据库表的访问效率出发,进行判别分析时不是依次对每一个样本进行判别,而是按照指标的顺序依次计算所有样本的某指标值在该指标下的判别概率,并且若某指标的权重为零时不需要计算任何样本在该指标下的判别概率,最后对每一个样本进行判别。
本文依据以上提出的聚类判别分析框架,以改进的两总体判别分析算法为基础,提出了一种动态的聚类判别分析算法的设计,并在实现算法的基础上进行了相应的实证研究。
1.2两总体动态聚类分析算法的设计和实现
两总体动态聚类分析算法的设计基于两总体判别分析算法。其基本思想在于从某初始判别状态出发,不断修正判别分析中错判的样本分组,直到所有样本已经判别,并且回判率为100%或出现错判循环为止。
根据样本初始判别状态的情况,这里把动态聚类分为有指导的动态聚类过程和无指导的动态聚类过程。有指导的动态聚类过程是指在进行聚类分析之前根据实际经验对所有或者部分样本进行组别的指派,这有助于加快动态聚类的过程,并产生期望的聚类结果;无指导的动态聚类过程是指在进行聚类分析之前不进行任何初始判别状态的设置。其中有指导的动态聚类与无指导的动态聚类的区别在于,无指导的动态聚类可能导致聚类过程中判别次数的增加,这在进行大样本聚类时,时间开销将成倍增加;另一个可能产生的结果是无指导的聚类过程会产生与预期不同的分类结果,即聚类的可能结果更多,可用于试探性分析。一般有指导的聚类分析过程可以很快得出与预期相符合的聚类结果。
从另一个角度对动态聚类过程可以作如下分类:可以在初始聚类之前一次全部指定所有样本的判别状态,之后不断修正样本的判别状态直到判别结束,也可以逐步添加参加判别分析的样本个数。实证分析的结果表明,第一种动态聚类方法的聚类过程不稳定,有时会产生抖动现象,即某次的很多错判样本在修改组别后进行下一次判别后仍然为错判样本,如此不断反复,甚至出现循环。出现这种现象的原因可以解释为当错判样本较大时,即使改变了错判样本的组别,因为错判样本个数相对较大,错判的样本对新的判别模型仍然会产生很大的影响。另外因为分组本身存在的模糊性,某些样本本身属于两总体的概率就比较接近,也有可能导致该类现象的发生。
一个解决方案是为所有错判的样本,选择错判概率最大的样本改变组别,但这不能从根本上解决抖动现象的发生。用第二种动态聚类算法可以很好地解决此类问题,因为第二类逐步聚类分析方法中,每次判别分析都将错判样本的个数控制在相对较小的范围内,每次增加一个新的样本进入判别模型。图1给出第二种动态聚类过程的算法流程。
在动态聚类的算法流程设计中,所有样本没有判别之前,某次判别过程后,需要平衡不同组别的样本个数,使不同组别的样本个数差不大于1;在所有样本组别判别之后实行不平衡样本个数的判别过程。实际上也可以进行不平衡样本个数的动态聚类。这样得到的结果有可能与经典的聚类分析算法有很大的差异,但聚类结果仍然可以得到很好的解释。
两总体的判别分析算法以及相应的动态聚类分析算法已经应用在基于odbc和ado标准的数据库访问技术、sqlserver2000数据库、visualbasic6.0编程工具,参考相关技术资料?[1,2,7]实现。以下分别给出不平衡样本个数的无指导动态聚类、平衡样本个数的无指导动态聚类以及平衡样本个数的有指导动态聚类的算例及其分析。
2关于该算法的实证研究
以下实证分析所用的原始数据以及用经典判别分析方法得到的结果均来自文献[3]。
2.1不平衡样本个数的无指导动态聚类
不平衡样本个数的无指导动态聚类更符合实际,但数据量少时,可能得到的结果不具有统计学意义。
对人文发展指数案例中14个样本的原始数据进行不平衡样本个数的无指导动态聚类过程得到的结果,与经典判别分析结果的分组完全相同。聚类结果如表1、2所示。在该聚类结果中,指标成人识字率(%)的权重仅为0.142857。这与用逐步判别法进行判别分析时得出的判别式的结论比较一致。
另外还给出两种可能的聚类结果,分别如表3、4和表5、6所示。其中第二种聚类结果中出生时的预期寿命成为最重要的指标,分组的结果使得出生时的预期寿命相似的样本成为一组;同时使同组内样本在成人识字率以及调整后的人均gdp这两个指标上没有明显的差异。第三种聚类结果中调整后的人均gdp成为最重要的指标,分组的结果使得调整后的人均gdp相似的样本成为一组;同时使同组内样本在出生时的预期寿命以及成人识字率这两个指标上没有明显的差异。实际上已经有不少学者对联合国开发计划署人文发展指数的确定方法表示了怀疑。因为该指数本身的确定方法,包括所选的指标以及指标值的调整等都不存在令人信服的理由[8,9]。本文给出的这两种聚类分析的结果可以从其他角度给出人文发展指数的可能更合理的确定方法,即把所有参加评价的国家纳入聚类分析的范围进行探索性的分析,并选择可以接受的聚类?结果。
不平衡样本个数的无指导动态聚类算法当然可以作为一个数据挖掘算法用于挖掘离群点。但是有时候这并不符合聚类的初衷。因为聚类的结果并不能通过显著性检验,无统计学意义。
2.2平衡样本个数的无指导动态聚类
平衡样本个数的无指导动态聚类是指在所有样本没有全部被判别完之前,在每次判别之前对组别的样本个数进行判别。与不平衡样本个数的无指导动态聚类相比,不容易出现分组个数严重不平衡的情况,但并不能避免这种情况的发生。下面以人文发展指数案例的聚类分析中给出的第二种聚类结果说明这种情况。
第二种聚类结果如表7、8所示。在第二种聚类结果中,成人识字率成为判别能力最显著的指标。其中,阿联酋、南非和中国三个成人识字率最低的国家成为一组;其他11个国家成为另一组。各组内其他两个指标的差异不显著。因此该分组方案中识别的是所有样本在识字率指标上的差异。
2.3平衡样本个数的有指导动态聚类
将人文发展指数案例中的待判样本加入聚类样本中,并且把待判样本以外的其他样本的组别作为动态聚类的起点,得到的聚类结果如表9、10所示。聚类结果与经典判别分析结果一致,并且指标权重的计算结果表明实际人均gdp指标具有显著的判别能力,成人识字率判别能力不显著。
3结束语
本文在分析经典聚类分析和判别分析方法实质的基础上,给出了一种新的聚类判别分析框架,并利用改进的两总体判别分析算法依据此分析框架构造并实现了一种动态聚类判别分析算法。实证结果表明逐步动态聚类算法具有相对较好的稳定性;无指导动态聚类算法很适合寻找样本中的奇异点,适合作为一种数据挖掘算法使用;有指导的动态聚类更适合于经典聚类算法的聚类问题。
参考文献:
[1]沈毅,陈峰.六种常见的条件系统聚类法比较[j].中国卫生统计,2004,21(6):338-340.
[2]walterdf.ongroupingformaximumhomogeneity[j].americanstatisticalassociationjournal,1959,53(12):789-798.
[3]于秀林,任雪松.多元统计分析[m].北京:中国统计出版社,1999:61-153.
[4]何晓群.现代统计分析方法与应用[m].北京:中国人民大学出版社,1998:255.
[5]朱孔来.评价指标的非线性无量纲模糊处理方法[j].系统工程,1996,14(11):58-62.
[6]魏世振,杨磊,陈传明.上市公司财务状况判别分析算法的实证研究[j].系统工程,2005,23(1):108-110.
[7]张尧庭,方开泰.多元统计分析引论[m].北京:科学出版社,1982.
[8]保罗·斯特里滕.关于人文发展指数的争论[j].国际社会科学杂志:中文版,1996(1):31-44.
[9]金玉国.新hdi评介[j].山西统计,1995(5):44-45.
[10]陈峰.带约束的聚类分析[j].数理医药学杂志,1999,12(20):112-113.
[11]蔡红艳,韩立岩.上市公司财务状况判定模型研究[j].审计研究,2003(1):62-64.
[12]徐成志,陈少军.odbc配置数据库应用程序[j].山东农业大学学报:自然科学版,2003,34(2):238-241.
[13]贺智明,李雯.采用动态数据库连接技术开发多课程通用考试信息系统[j].计算机应用与软件,2003,20(4):16-17,77.
[14]赵宇峰,张烨,黑新宏,等.vb6访问数据库技术的应用[j].计算机应用研究,2004,21(8):223-224.
[15]谷震离.ado访问sqlserver数据库技术分析及其应用[j].计算机应用与软件,2004,21(12):32-33,77.
[16]bradleyjc,millspaughac.visualbasic6.0高级编程[m].常晓波,刘颖,等译.北京:清华大学出版社,2003.
[17]altmane.financialratios,discriminantanalysisandthepredictionofcorporatebankruptcy[j].journaloffinance,1968,23(9):589-609.
[18]吴德胜,梁?牛?笠??煌?P驮诓莆裨ぞ?抵ぶ械谋冉涎芯?j].管理工程学报,2004,18(2):105-108.
[19]刘洪,何光军.基于人工神经网络方法的上市公司经营失败预警研究[j].会计研究,2004(2):42-46.
[20]乔?韦华?韦华,牛芳.上市公司财务困境预测的fisher判别分析模型[j].统计与信息论坛,2003,18(2):69-71.
[21]zmijewskime.methodologicalissuesrelatedtotheestimationoffinancialdistresspredictionmodels[j].studiesoncurrenteconometricissuesinaccountingresearch,1984,22(9):59?82.
[22]gricejs,ingramrw.testsofthegeneralizabilityofaltman’sbankruptcymodel[j].journalofbusinessresearch,2001,54(1):53-61.
[23]郭亚军.综合评价理论与方法[m].北京:科学出版社,2002.
[24]杨淑娥,徐伟刚.上市公司财务预警模型——y分数模型的实证研究[j].中国软科学,2003(1):56-60.
[25]mutapif,mduluzat,roddamaw.clusteranalysisofschistosome?specificantibodyresponsesartitionsthepopulationintodistinctepidemiologicalgroups[j].immunologyletters,2005,96(2):231-240.
[26]yuanh,parrilla.clusteranalysisandthree?dimensionalqsarstudiesofhiv?1integraseinhibitors[j].journalofmoleculargraphicsandmodelling,2005,23(4):317-328.
[27]terbraakcjf,herberth,wiesa,?etal?.bayesianmodel?basedclusteranalysisforpredictingmacrofaunalcommunities[j].?ecologicalmodelling,2003,160(3):235-248.
[28]lianggs,choutu,hantc.clusteranalysisbasedonfuzzyequivalencerelation[j].europeanjournalofoperationalresearch,2005,166(1):160-171.
[29]alexyu,verenasp,wolfgangsh,?etal?.clusteranalysisofindividualswithsimilartrendsoffatintakeduringchildhoodandadolescence:anewapproachtoanalyzingdietarydata[j].nutritionresearch,2005,25(3):251-260.
-
动态心电图范例(3篇)
动态心电图范文[摘要]患者男,48岁,因心前区疼痛伴紧缩感3d每于凌晨发作,持续3~4min后自行缓解,常规心电图检查无异常,既往高血压病史8年,于2011年5月10日就诊。24h12导联同步动态..
-
国际商务管理知识范例(3篇)
国际商务管理知识范文篇1招生对象:高中毕业生。学制:三年二、培养目标适应生产、建设、管理、服务第一线需要的德、智、体、美等方面全面发展的高等技术应用性专门人才,本专业..
-
动态环境设计范例(3篇)
动态环境设计范文篇1现代环境设计随着社会不断进步,经济飞速发展,社会大众的生活水平大幅度提高,更加注重精神方面的追求,对现代环境设计已提出了新的更高要求。在现代艺术领域..
-
合同中的法律条款范例(3篇)
合同中的法律条款范文一、格式条款的一般特征判断合同条款为一般条款、即通过自由磋商形成的合同条款还是格式条款是对格式条款进行法律控制的前提,因此必须严格区分二者。..
-
老年护理综述范例(3篇)
老年护理综述范文篇1【摘要】目的探讨护理干预对老年心力衰竭患者治疗效果影响。方法选择我院2009年11月至2011年11月慢性充血性心力衰竭老年患者共100例,上述患者均符合充..
-
思维导图心得体会范例(3篇)
思维导图心得体会范文篇1关键词:思维导图;初中数学复习;意义一、初中数学复习教学存在的主要问题复习是初中数学教学的重要环节。笔者对所在学校数学复习课的现状进行调查分析..
-
绩效管理的目的范例(3篇)
绩效管理的目的范文关键词:绩效管理岗位工作流程项目导向《绩效管理》是人力资源管理专业的一门专业主干课,技术性与实践性较强,其课程性质决定了该课程在教学模式、教学内容..
-
如何提升自己的逻辑思维范例(3篇)
如何提升自己的逻辑思维范文篇1关键词:德育;德育过程;逻辑力量中图分类号:G641文献标志码:A文章编号:1002-0845(2006)07-0109-03当前,我国德育缺乏吸引力、感染力,实效性差,原因固然有..