地理信息系统基本概念(6篇)

daniel 0 2024-11-23

地理信息系统基本概念篇1

关键词:管理会计信息系统;PEA模型;平衡记分卡;全面概念数据库设计框架

中图分类号:F234.3文献标识码:A文章编号:1005-0892(2007)08-0116-05

信息技术的迅猛发展,推动人类社会从工业经济时代跨入知识经济时代。在这种背景下,会计作为“商业语言”,面临着前所未有的巨大冲击和挑战。众所周知,管理会计作为公司的信息系统,在开发业绩评价框架方面始终发挥着主导作用。然而,陈旧的会计信息系统设计方式,制约了管理会计对信息技术发展的充分利用。运用会计领域的创新工具REA模型和平衡记分卡进行管理会计信息系统重构,可以实现管理会计与公司数据库设计的融合,密切公司业绩评价、战略决策和信息系统设计功能之间的联系,促使管理会计人员更加有效地参与公司战略管理和控制。

一、管理会计信息系统重构的背景:管理会计人员面临职责转变挑战

信息技术的发展和推广应用,持续不断地改变着会计工作的作用和内容。PeterDrucker(1992)指出,信息技术的发展已经使得会计成为最具挑战性和不确定性的管理领域之一,日益带来会计与管理信息系统的交叉。管理信息系统工作人员通常比较关注与计算机软硬件相关的技术问题,但信息系统面临的未来挑战将不在于技术方面,而在于把数据转化为对决策有用信息的能力。MichaelAllies等预测,在未来10年中,管理会计将有可能提供一系列广泛的战略和运营指标,从而使财务会计成为其子集。随着公司战略从成本竞争转向质量、时间和客户服务竞争,将有更多参与者(诸如工程师、IT界人士和咨询公司等)作为信息提供者与管理会计人员展开竞争,他们甚至可能在提供特定类型信息方面比管理会计人员更具优势。在这种变革的环境下,“随着对大量信息实时解释需要的增加…会计人员面临的挑战将是证明他们的内在竞争优势”。

会计领域的发展能否应对这种挑战?传统会计系统受到基于经济业务的财务会计需求驱动,难以反映公司经济活动的全貌。因此,公司内部不同职责部门持有平行的信息系统用于满足各自的需求,不仅导致数据储存的低效率,而且难以实现跨部门信息整合。问题的关键在于,传统会计系统的设计和开发已经陈旧过时。首先,传统会计系统中的唯一设计是设置账户表,它是会计循环的第一步,最终旨在生成统一财务报表,因此仅关注经济业务的财务方面,而将更广泛的信息如生产率等排除在外。其次,传统会计系统的构建基础是具有700年历史,可以追溯到卢卡.帕乔利时代的借贷模型。虽然借贷模型在手工记账系统中十分有效,实现了会计业务活动的具体化,但随着公司性质和规模的变化以及数据库和联机处理的出现,以其为基础的传统会计系统已经难以满足管理层的决策需要。

在这种情形下,公司的信息系统开发任务在很大程度上归属到管理信息系统(MIS)部门。MIS已经确立了“系统开发生命周期”(SDLC),包括系统规划、分析、设计和执行。使用MichaelPorter的价值链概念对其加以描述,有助于我们获得对影响公司信息系统开发问题的深入理解,如图1所示。SDLC的设计阶段增加了该信息系统的价值,因为它有助于确定决策所用信息的充分性和相关性。如前所述,信息系统面临的未来挑战将不在于技术方面,而在于把数据转换为对决策有用信息的能力。因此,信息价值链的主要优势在于能够收集和提供相关信息,带来控制和决策流程的增值。MIS开发人员因接受过技术培训而在当前的系统设计和执行中发挥着重要作用,但最了解信息价值链和价值增值手段的是管理会计人员。正如MichaelPorter所指出的,“任何其他信息系统都不具备将公司所有职能部门的业绩整合为一套指标体系的能力,正是这种能力,使得会计被称作‘商业语言’”。但是,传统会计系统仅反映公司流程的有限方面,不利于管理会计人员在整个公司管理信息系统设计中发挥重要作用。全面采纳REA模型和平衡记分卡重构会计信息系统,实现管理会计与公司数据库设计的融合,有助于管理会计人员成功完成职责转变。

二、管理会计信息系统重构的基础:平衡记分卡和REA模型

REA模型(资源-事件-参与者模型)是一种数据库设计概念模型,可以为管理会计人员提供数据库系统设计工具。平衡记分卡(BalancedScorecard)作为信息价值链中的下游作业,可以提供业绩评价框架,用于传递和计量战略,并为系统设计提供依据。这两种工具在信息系统开发设计阶段的结合使用,可以促使管理会计人员在信息系统领域发挥新作用。

(一)平衡记分卡

平衡记分卡被称作“战略计量系统”和“全面业绩评价系统”,由卡普兰和诺顿在1992年提出,其后得到不断丰富和完善。从概念设计的角度看,平衡记分卡作为业绩评价框架可以发挥最大效用。AndyNeelY等指出,“毫无疑问,平衡记分卡是目前得到最广泛认可的业绩评价框架之一。”

从本质上看,平衡记分卡是旨在反映公司战略的一系列领先型和落后型业绩评价指标的结合。其基本原理在于,一个“平衡”的业绩评价系统不仅应该包括传递有关公司过去业务活动信息的落后型指标(财务指标),还应该包括反映财务业绩动因的领先型指标(非财务指标)。因此,平衡记分卡是财务指标与非财务指标的结合,非财务指标表明公司战略的执行过程,财务指标反映公司战略的执行结果。

平衡记分卡的业绩评价系统包括四个方面:财务业绩、客户关系、内部业务流程、学习和成长。客户关系视角侧重于战略对客户满意度的影响,包括质量、时间、绩效、服务和成本等各个方面。客户满意度是公司内部业务流程运作的结果。内部业务流程视角反映公司核心竞争力和核心流程(诸如生产、设计和新产品开发等领域)的业绩,公司在这些领域必须非常出色,才能实现整体目标。全球竞争的日益激烈要求公司持续对其产品和流程加以改善,并且具有开发新产品的能力。学习和成长视角考虑持续学习和创新的重要性,侧重于衡量公司对流程和产品加以改良以实现其目标的能力。财务视角是表明公司战略恰当与否的最终指标,反映战略执行情况的改善是否已经转化为更高的盈利能力,通常使用现金流量、销售增长率和收益等传统指标计量公司财务业绩。

从总体上看,平衡记分卡相关研究主要从两个视

角展开。一个视角是考察基本理论的相关性,尤其是领先型指标对财务业绩的影响。ChristopherIttner等发现,客户满意度是财务业绩的领先型指标。RAJivBanker等也发现,反映客户满意度的非财务指标与未来财务业绩非常相关,而且包含财务指标所未能反映的额外信息。VenkyNagar等则发现,与质量相关的非财务指标(例如缺陷率和及时运达率等)是未来销售收入的领先型指标。叫另一个视角是考察成功执行平衡记分卡的各个方面。MaryMalina等检验了卡普兰等在1996年提出的观点,即认为平衡记分卡主要不是一种评估方法,而是一种战略规划和传递工具。研究结果表明,经过良好设计并且具有良好信息传递功能的平衡记分卡,能够激发低层经理人员按照公司战略行事的积极性。ChristopherIttner等考察平衡记分卡在激励计划中的应用,发现非财务指标权重设计的主观性导致了激励计划的执行混乱。MarlysLipe等对各业务部门的专用指标和共用指标进行研究,发现共用指标被应用于业务部门评价,而专用指标未能在这种评价中受到重视。

这些研究表明,平衡记分卡赋予了参与财务会计报告过程的管理会计人员一个新角色,即在信息价值链中发挥作用。平衡记分卡所提供的平衡指标系统意味着,信息系统的各项功能需要彼此结合。卡普兰等把“功能鸿沟”(“functionalsilos)视作战略开发和执行过程中的障碍。他们指出,“按照传统,公司总是围绕财务、生产、销售、工程和采购等功能设计,各种功能具有自身的知识、语言和文化,从而导致功能鸿沟产生并成为战略执行的主要障碍,因为大多数公司很难进行跨功能战略传递和协调。”平衡记分卡是一个将各种功能结合起来的计量系统,管理会计人员可以在利用其潜能方面发挥重要作用。

相关研究还指出,信息系统价值链的系统设计对计量指标的有效性具有重要影响,从而进一步证实管理会计人员应该更多参与系统设计和执行,因为各种计量指标正是在设计阶段被融入系统中。在各个功能领域,各种指标被赋予的含义与所收集数据之间的关系必须保持一致,而且必须反映公司的经营活动。有研究证实,各业务部门的共用指标更有助于决策,从而表明指标应该更具一致性和可比性。此外,为实现一战略在整个公司内部的传递和协调,还需要将各种计量指标无偏地应用于公司内部各个不同层次。卡普兰等指出了平衡记分卡实施流程与信息系统之间的联系,“一个新组建的团队提出了一个记分卡执行计划,包括把数据库计量指标与信息系统联系起来,在公司内部传递平衡记分卡理念,以及鼓励和促进分权经营公司次级指标的开发。作为这一流程的结果,一个全新的管理信息系统将被建立起来,从而把高层业务部门的计量指标与最低层车间班组的特定运营指标联系起来”。因此,信息系统设计是执行与公司战略相符的平衡记分卡的重要环节。

(二)KEA模型

REA模型是一种支持信息系统设计的概念建模工具。所谓概念模型,是指用高度抽象的方式反映现实世界状况的数据模型。这种模型独立于机器,对现实状况的描述易于理解和解释。REA模型具有很多有助于其成为有效管理会计工具的特征。首先,它能够反映经济业务的两重性,即资源的流人和流出,与传统会计中的“借项和贷项”一样有效。此外,它还可以为管理会计人员提供一个概念框架,帮助其概括公司特征、详述业务活动和站在公司全面视角设计数据库,从而满足内外信息使用者的需求。

REA模型的基本构架由三种实体组成,分别称为资源、经营事件和参与者。经营事件是公司流程的一部分。例如,收现是一个经营事件,它是销售流程的一个组成部分。与该经营事件相关的资源是现金,相关参与者则为内部参与者(出纳人员)和外部参与者(客户)。实体的最基本性质称为属性,即为实体的具体化。例如,对于客户实体而言,属性可以包括客户状况、客户数量、客户满意度反馈等项目。资源、经营事件和参与者作为REA模型的基本构架,有助于把公司战略指标系统与信息系统数据库联系起来。

REA模型通过提供两种组织观――局部观和全局观,支持公司的计划、控制和决策流程。局部观又称为外部纲要,是指对公司不同业务流程的经营事件以及与这些经营事件相关的资源和参与者加以具体描述,如图2所示。全局观又称为概念纲要,是局部观、业务活动和流程在公司范围内的整合,如图3所示。

三、管理会计信息系统重构的方法:开发全面概念数据库设计框架

REA模型和平衡记分卡作为会计领域的创新工具,为管理会计信息系统的重构奠定了基础。我们试图在两者之间建立起逻辑联系,通过开发全面概念数据库设计框架,重构管理会计信息系统,以充分发挥管理会计在公司战略规划开发和评估中的作用。

(一)开发概念设计框架的依托:概念模型和设计战略

开发概念设计框架,首先需要依托概念模型。REA作为一种概念模型设计工具,能够满足开发数据库系统支持战略决策的需要。概念设计旨在描述数据库的信息内容,通常从需求说明开始,结束于数据库全局观的形成。概念设计模型在SDLC的各个流程与信息价值链的价值创造之间建立起重要联系。.用户输入对确定数据库的内容至关重要,尤其便于计量指标和其他信息的含义与数据相符。CarloBatini等指出,“最终用户影响设计决策能够带来很多积极后果:概念纲要的质量会提高,项目更有可能趋向预期结果,开发成本也会下降。更重要的是,如果用户拥有更多机会参与决策流程,将促使其更愿意接受和使用该信息系统。REA概念模型的最基本构成要素“属性”,可以将其与平衡记分卡的业绩评价指标联系起来,从而促使用户直接参与支持决策的信息系统设计过程。

开发概念设计框架,还需要依托战略,以便确定数据来源以及将数据在概念模型内部加以整合的方式。Batini等描述了三种概念设计开发战略:自上而下型战略、自下而上型战略和混合战略。自上而下型战略重视概念设计各个阶段的改进,以最宽泛和抽象的理想系统纲要作为起点,引入与模型相关的具体信息,诸如各个层次不同功能领域之间的关系等。自下而上型战略则以各功能领域的需求等基本概念作为起点,在此基础上建立更复杂的概念,最终融合为一个全局纲要。混合战略使用前两种战略的要素,是前两种战略的综合。混合战略的重要特征是:系统设计师使用应用域的细分子集引导全面系统,子集使用自下而上型战略开发,包括应用域的详细信息;与此同时,设计师使用骨架纲要整合设计的各个方面,骨架纲要发挥框架作用,包括应用域的最重要概念,更便于子集所产生的不同纲要进行自下而上的整合。

(二)全面概念数据库设计框架的构建:平衡记分卡战略模型与KEA模型的结合

本文使用混合战略开发概念数据库设计框架,同

时应用REA模型和平衡记分卡实现概念设计,称为全面概念数据库设计框架,如图4所示。图4表明,全面概念数据库设计框架的执行,涉及到两个重要阶段:首先需要把公司战略转化为平衡记分卡模型,即阐明公司战略并将其与平衡记分卡相结合;其次需要把平衡记分卡模型转化为REA概念模型。

全面概念数据库设计框架以平衡记分卡战略模型的开发作为起点,使公司战略与信息系统相联系。在这一阶段,公司首先确定战略目标,随后将战略目标映射到平衡记分卡中,转换为四个视角的目标以及各个目标的相应计量指标。例如,如果一家公司实施产品差异化战略,它可能将开发研究技能作为学习和成长视角的目标,而相应的计量指标可能是所雇用研究科学家的数量。与此相联系,内部业务流程视角的目标可能是提高公司内部的创新能力,而相应的计量指标可能是所开发专利的数量;客户关系视角的目标可能是提高市场份额,而相应的计量指标可能是新客户的数量。通过这一阶段,平衡记分卡可以提供基于公司战略的一个全面计量系统。

在第二个阶段,公司需要把平衡记分卡模型转化为REA概念模型。为实现这一目的,公司首先需要使用平衡记分卡,建立作为混合战略概念设计基础的骨架纲要。骨架纲要能够为理想的信息系统模型提供框架,平衡记分卡在这方面尤其有用,因为它能够确定与战略相关的主要目标,对这些目标加以计量,并且提供有关计量指标之间的逻辑关系,形成一个计量系统。这种基于平衡记分卡的骨架纲要是自上而下型战略的基础,可以用于确定与战略相关的业务流程,受到影响的实体,以及与实体相关的特定属性,确保最终模型与平衡记分卡战略模型相呼应。公司也可以采纳自下而上型战略实现概念没计,首先将平衡记分卡的计量指标分解为REA模型的基本计量单位“属性”,然后确定与属性相关的实体,最后确定流程。有些计量指标不需要进一步分解,可以直接成为与实体相联系的恰当属性,例如产品创新带来的新客户等;有些指标则需要进一步分解为不同要素,以便形成与REA相对应的属性,例如投资回报率等。同时使用上述两种战略。既可以确保最初战略中确定的所有计量指标都通过自下而上型战略包括在内,也可以确保可能与战略相关的其他指标都通过自上而下型战略找到。最后,使用骨架纲要对根据两种战略形成的概念设计加以比较,可以形成公司的全局纲要,从而确保公司战略总目标得到保持。

四、管理会计信息系统重构的意义:实现管理会计与公司数据库设计的融合

开发全面概念数据库设计框架重构管理会计系统,有助于实现公司内部的会计与信息系统集成,完成会计与信息系统数据的语义统一。在全面概念数据库设计框架下,系统所有数据按照“资源”、“经营事件”和“参与者”集成在一个逻辑数据库中,消除了数据分散重复存储在多个系统中所造成的数据不完整、冗余和不一致问题,有助于支持跨部门信息传递。由于系统记录所有经营事件的细节数据,任何信息使用者都可以通过查询功能从信息系统中直接获得自身所需信息,并且相应生成各类报告,突破了传统会计信息系统以单一会计信息使用者为用户的局限性,有助于满足公司所有利益相关者的信息需求。

开发全面概念数据库设计框架重构管理会计系统,有助于管理会计人员对平衡记分卡在公司内部的执行。有研究表明,平衡记分卡能否成功,关键在于执行问题。卡普兰等指出,平衡记分卡的成功执行者是有能力将战略转化为行动的“战略型公司”。公司战略的成功转化涉及到通过平衡记分卡与信息系统的有效结合,把平衡记分卡理念在公司内部传播。全面概念设计框架能够为管理会计人员提供将战略映射到概念设计中的工具――平衡记分卡的计量指标,并最终将其与信息系统数据库相结合。正如卡普兰等所指出的,平衡记分卡的执行涉及到创造“一个全新的管理信息系统,把从高层业务部门直至车间班组的计量指标联系起来。”它作为一个持续的过程,支持公司内部各个层次的战略传递和整合。因此,管理会计人员可以通过参与设计阶段,在平衡记分卡执行问题上对公司形成支持,例如在公司内部传递平衡记分卡理念、将薪酬计划与平衡记分卡联系起来等。

开发全面概念数据库设计框架重构管理会计系统,有助于促使管理会计人员深入参与公司战略和信息价值链设计,并在执行战略过程中获得更多与行政管理人员合作的机会。随着管理会计人员对全面概念数据库设计框架功能的深入了解,将有助于其在为公司实现价值增值方面发挥更大作用。

地理信息系统基本概念篇2

关键词语义检索语义网本体信息检索

分类号TP391

1网络信息检索的局限与语义检索

目前网络检索的实现技术主要有两种:一种是依赖于编码处理,通过分类模式来描述信息资源,从而实现检索;另一种是通过全文检索,查找文本中含有用户指定词语的信息源。其应用的体现分别为基于分类目录的搜索引擎和全文搜索引擎。前者虽然基于人工处理,准确性较高,但它更适合用于网络信息资源的浏览和导航;后者实现较为方便,适应了对迅速增长的海量网络信息资源进行自动处理的需要,成为网络信息检索的主要途径。但是用户在检索中始终面临不少困难,如:检索结果的过载和低查准率,用户负担重;检索结果及其排序不一致,且与用户使用的查询词汇形式及其组合形式高度相关等。究其原因,统计意义上的词型匹配难以支持对网络信息资源的有效检索利用。因此研究者们将目光投向了对词形背后的意义的挖掘上,探索实现基于概念匹配的检索技术和方法。

早在上世纪80年代对语义检索的讨论就出现在SIGIR会议论文中,但语义检索研究始终受制于语义信息处理发展水平的局限。随着自然语言处理、人工智能的发展,尤其是语义网技术的兴起与发展,语义检索研究自上世纪末以来得以迅速发展。尽管到目前为止对语义检索在概念上仍没有统一的界定,但不同的研究却有着共同之处,就是基于对信息资源的语义处理实现效率更高的检索。语义信息的提取和处理可以是基于语义网方法与技术的,也可以是基于自然语言处理技术的。目前,前者在语义检索研究中相对更为普遍。事实上,正是由于语义网的出现与发展,才使语义检索的研究更加得以明确并发展如此迅速。

2基于本体的信息资源检索

本体是语义网技术的核心部分,承担着语义表达的关键任务。本体在传统信息检索中的应用可促进从词型匹配到概念匹配的转变。从处理环节来看,它体现在两个方面:查询处理与文档标注及索引。

2.1基于本体的查询处理

基于本体的查询处理包括查询消歧与查询扩展。通过消歧,明确查询的确切所指,准确反映用户的信息意图,继而通过加入与其语义相关的其他概念来实施扩展。许多研究中利用了语言本体(如WordNet),通过其所提供的词的不同义项来实现查询消歧,通过其所蕴含的同义、整分、上下位等词汇关系来实现查询扩展。支持两种处理模式:查询消歧和扩展、检索结果后分类控制。前者是系统在查询消歧的基础上将某义项的上位词或下位词加入以扩展查询;后者则是系统先以常规方式处理用户查询,再对检索结果基于用户指定的查询义项进行分析和加权。则在词义消歧的基础上,利用WordNet根据查询词义抽取子概念图来实现查询扩展。子概念图作为查询的上下文信息用于支持对由普通搜索引擎返回的初次结果的过滤,以选出相关文档。提出的查询消歧方法包括三步:首先用WordNet中的义项及同义词簇,对查询用词进行两两配对,即在固定其中一词的情况下,与另一词的所有义项进行组合,得到若干种不同的组合情况,反之亦然其次将这些组合作为提问通过AltaVista进行搜索,并根据命中数对它们进行排序;最后,以WordNet中对相关义项的注释为上下文,计算排序在前的配对词间不同义项组合的语义密度,从而决定查询用词所指的确切概念。国内基于WordNet汉化而建设的中文概念词典(CCD)也在信息检索研究中得到了应用。

此外,各种自建的领域本体也被应用于查询处理。以一个有关人、地、事件、组织等的本体为基础来实现查询消歧,为每一个初始查询结果提供一个特别链接,用户通过点击这些链接来向系统确认该结果代表的概念符合其查询意图。构建了一个三层本体模型,分别为概念层(即按等级层次组织起来的概念)、语言层(即与概念对应的表达形式)、出现层(即对应于表达形式的具体字串)。在其可视化本体浏览提问接口中,用户可在本体层级体系中点击选择合适的概念。系统会自动执行查询扩展,将用户指定层级范围内的下位概念以及相关关联概念增加进来。扩展后的查询通过上述三层本体模型从抽象到具体被依次转换,最终变为由文档中实际出现的具体词汇构成的查询式。

2.2语义标注文档的检索

语义标注文档检索的一种普遍思路是在对文档进行语义标注与索引的基础上,先进行实例检索,再据此返回所有以检出实例标注的文档信息。此外,也有其他不同方案。引入了向量空间模型,采用了基于概念级的向量空间文档表达,还设计了文档排序算法。在进行标注时以文档为单位,将其作为一个概念类的实例来进行处理。它设计了一种独特的索引和检索方法,以从文档全文和其语义标注数据中抽出的内容描述符(词)来代表文档,并建立索引记录。这样的索引可支持基于关键词或语义标注信息的检索。根据自建的历史领域本体对文档进行实例标注以构成其语义上下文信息(含概念与时间信息),并认为用户浏览的当前资源的上下文信息可代表其真实查询意图。检索时,用户首先通过传统的全文检索获得一个初始资源或自行提供一个初始资源。然后系统据此反馈该资源的上下文信息,并以嵌入文档中的链接供用户选择。当用户点击链接时,系统即将当前上下文信息作为新的查询,对其进行基于本体和规则的查询扩展,在对系统全部文档先进行过滤之后,再进行最终的检索匹配。

3语义网资源检索

语义网是一个基于某种知识表达语言(如RFD(S)、OWL等)的、机器可处理的语义网文档集合。从逻辑上看,它不再仅是一个普通文档的网络,而是一个资源(可以是各种媒介资源和现实世界中的其实对象,如人、地方、组织、事件等)及其语义关系的网络,表现为本体文档,实例数据和各种语义关系。

3.1本体文档检索

本体文档检索旨在找到含有特定类或属性的本体文档。普通搜索引擎,如Google,可以通过指定文档类型为RDF等方法来搜索本体文档,但其根本问题是不能识别本体文档中的结构化语义标注信息,因而也无法将它们与普通文本信息区别对待。所以在检索的过程中无法将真正符合需要的本体文档与那些只是含有检索词的本体文档区分开来。这正是对本体文档进行检索需要解决的问题。

解决问题的一种思路就是对本体文档进行适用于普通搜索引擎的改造处理。就是基于这种思路,通过对RDF文档进行一定处理使其可被普通搜索引擎索引和检索,而同时又能在某种意义上发挥其语义信息的作用。它的关键技术Swangling能将语义信息编码成普通文本,并将其作为新的陈

述加入到原RDF文档中(对于以三元组表示的查询,也以相同编码方法处理,将其变为普通文本)。这样提问与文档的匹配就可以按传统的方式进行。

另一种思路则是探索新的本体搜索方法和技术。使用了本体注册的方法。注册服务器并不实际存储任何本体文档,只保存由本体服务器提供的元数据信息。同时,系统通过将本体中的元素与WordNet中的词进行匹配来构建本体摘要,并将其也放入元数据信息。这样,用户就可以从WordNet中选词来对注册服务器进行检索。采用基于GoogleWebService构建的Googlecrawler来进行本体搜索。在此基础上,基于向量空间模型,采用一种概念一权重向量匹配方法来进行本体索引与匹配。也进行基于Googlecrawler的本体搜索,不同的是,系统没有独立的索引和匹配过程,而是将Google搜索与本地仓库结合起来,后者专门用于存储已搜索到的本体文档,并保存检索历史。对于已经执行过的同类查询,系统直接从本地仓库中提供查询结果,只有当一定时间内无相同查询被执行过时,才启动新的一次Google搜索。还另开发了针对某个特定网站的搜索器以及基于JENA2的搜索器。系统将从搜集到的语义网文档中抽取的元数据与原结构信息一起存入数据库。它们支持对含有某一特定类或属性的本体的查询。同时还通过定制的索引与检索引擎Sire对语义文档进行基于传统检索技术的处理。提出了另一种匹配方法,它通过Google搜索获取一批与用户查询域相关的文档,然后从这些文档中抽取一批词,并用这个词集合取代原始查询与本体文档进行检索匹配。在结果排序方面,主要有两种方法:一种是跨本体链接分析方法(cross-ontologylink-analysis);另一种则是图分析方法(graph-analysismethod)。从效果上看,前者是让更流行的本体文档排序在前,而后者则是让更相关的本体文档排序在前。

3.2实例检索

除了本体文档外,语义网资源还有表征各类对象的实例数据。对于大多数一般用户来说,对实例数据检索的需求更为普遍。实例检索的目的是在基于本体的知识库中发现和搜集关于某一指定类的所有实例信息。尽管传统检索技术在其中也有不同应用,但实例检索主要是基于结构化查询与推理的。基于RDF(S)、OWL等底层知识模型的图遍历(graph-traversal)与图模式(graphpatterns)得到了广泛的应用。用语义网数据来补充传统检索结果的这一部分就属于实例检索。其“语义网”资源包括正式的语义网文档和语义标注信息。在执行传统检索的同时,系统会针对查询概念在RDF知识库中通过图遍历搜索所有相关的数据信息。相对复杂的是将一种认知模型加入到搜索过程中,它支持用户用自然语言输入一段文字,从中抽出概念并将其作为关键词概念的上下文信息以用于检索过程。在传统关键词检索的基础上,结合了扩展激活算法,通过图遍历进一步扩展搜索与初始结果相关的更多实例信息(即使其不含查询中的关键词甚至与初始结果不是直接相关联)。在此基础上还提出了一个特别的实例相似性计算方法,并将其用于扩展激活过程中。提出了一种面向RDF(S)仓库的可视的语义检索途径。系统为用户提供可视的语义检索与语义浏览服务,其基础是底层的本体及基于本体映射得到的概念分面。在多分面视图中,用户可对系统资源有一个概括的了解,并通过点击各分面中的不同范畴概念来提交查询。语义搜索引擎通过图遍历等方法来进行查询构建与查询扩展。系统接受用户的自然语言提问,并将其解析为一组元素(包括类、属性、实例等),构建基于这些元素的图模式以作为复杂提问。隐式查询扩展也是基于类层次关系与规则而实现的。为了更好地结合传统信息检索技术与结构化查询及推理,充分利用普通文本信息与语义标注信息,一种增强的语义检索模型,基于自由文本的关键词搜索与基于语义信息的结构化查询与推理被紧密地融合在一起来实现检索目标,这种检索有利于解决集中了模糊关键词概念与结构化查询要素的混合查询问题,如“请查找由研究语义网检索的教授撰写的论文”。

3.3语义关系检索

尽管在上述本体文档检索与实例检索中运用了各种语义关系,但毕竟没有直接以这些语义关系为检索处理对象。而概念、文档等之间的语义关系也应是语义网资源检索的重要内容之一。目前,一些研究已开始关注针对语义关系的检索问题,进行的有关语义关联检索(Semanticassociationsearch)的研究。它所关注的不仅是简单的属性链关系,更是概念间的各种复杂关联关系。研究的主要贡献是分析了语义关系检索所面临的三大主要挑战(即对关系的理解不够通用和全面、缺少以关系而非概念为对象的查询语言和系统、检索结果排序问题),并提出了相应的解决方法(将关系分为语义关联和语义相似性两类并形式化、设计了p-query以支持关系查询、基于用户指定的上下文来进行结果排序)。为检验这些解决思路,在相关研究的基础上,还在国家安全领域实现了一个名为SemDIS的检索系统。

4结语

地理信息系统基本概念篇3

遍布全世界的主机和服务器,错综相联的超媒体资源,这是互联网为我们所构建的一个巨大而丰富的电子信息空间。它无疑是现代社会最重要的信息获取手段,但是它的开放性、分布性、无序性以及惊人的发展速度也为人们对信息资源的利用带来了困难。正如在大海中行驶的船只需要导航系统确定方位一样,要想在茫茫的信息海洋中有效获取有用信息,也必须拥有便捷有效的信息导航技术。一般来说,www网络中常用的信息导航方式有三种:一是利用门户网站的分类索引;二是利用网络搜索引擎;三是利用网站的相关链接。但是目前这三种信息导航方式的效果都不尽如人意。分类索引所覆盖的网络站点范围太小,更新较慢,难以适应网络的快速增长,而且分类标准的不统一和不规范常常影响到用户对站点所属的判断,造成导航失败。搜索引擎虽然是目前主要的网络信息检索工具,但是通过简单的逻辑运算检索到的结果往往是数量庞大且鱼目龙杂,充斥着大量的无用和重复信息。网站的相关链接是指符合当前网站内容主题的内部和外部信息资源的超链接,这种导航方式虽然简单直接,但是信息量非常有限,而且对外部信息的链接常常出现错链和假链,即使是内部信息,也常常因为组织和描述方式的影响,造成用户的“资源迷向”。

用户在信息空间中的“迷航”会使他们感到厌倦而丧失获取信息的信心,分析其原因,主要包括以下几个方面[1,2]:

(1)网络的巨大信息量使人们必须依赖于自动化的处理技术。但是目前因特网的各个网端的技术支持环境比较复杂,信息资源的内容范围、组织结构和存储方式各不相同,呈现出分散、无序、变幻多端的特点,这使自动信息处理技术的应用困难重重。因此要提高信息导航的效率和质量,必须先解决资源异构的问题。

(2)网络信息空间中的数据大多以半结构化和非结构化的形式存在,对信息资源的内容缺乏形式化的语义描述,而且大部分资源间的链接也没有反映语义关系,这使得机器很难对网络信息空间进行深层次的理解和处理,对信息的自动导航也无法像人工操作那样准确有效。

(3)目前的网络导航系统缺乏个性化的信息服务。由于知识背景的差异和一词多义等方面的原因,不同的网络用户之间、用户与系统设计者之间对于问题和信息内容可能会具有不同的理解与认识,当用户按照自己的思路查找信息时,他所选择的导航路径可能是错误的或者低效的。因此信息导航必须考虑具体用户的特殊性,有针对性地提供导航服务。

(4)网络导航系统的设计缺乏规范。门户网站各自依据不同的标准建立自身的分类导航系统,网站的划分随意性较大,常常引起用户的困惑。一些著名的信息搜索引擎也各自采用不同的检索规则,有些系统不能利用历史信息或者不提供二次检索,给用户的使用带来不便。另外,在网站内部的导航系统设计上,也存在着导航结构不合理,导航要素不完整,导航界面不统一等问题。这些都可能造成用户的导航障碍。

由此可见,造成信息“迷航”问题的主要原因在于缺乏信息空间的合理组织和有效的导航机制,这也是第二代web网络技术难以克服的困难。为此,人们正在研制第二代web网络——SemanticWeb,它以结构化信息表示为主,为网络导航研究开辟了新天地。

2SemanticWeb技术

TimBernersLee在1998年提出了SemanticWeb的概念。2001年2月,W3C组织正式推出SemanticWebActivity,使网络环境下的语义处理技术研究渐入佳境。SemanticWeb研究活动的目标是开发一系列可由计算机理解和处理的语义表示语言和技术,通过显式的语义表示和领域本体将网络信息空间编织成为一个巨大的机器可读的知识网络,以支持自动化的信息访问和知识管理,实现高质量的网络信息服务。目前关于SemanticWeb的研究主要集中在网络信息资源及其内容的语义和语义关系表征,基于语义的数据自动分析、理解和处理,不同应用领域和系统间的数据自动交换、转换和复用[3]。SemanticWeb虽然是现有web网络的延续,但在信息导航方面具有许多普通web没有的优势。SemanticWeb中的节点既可以代表物理页面,也可以代表知识实体;SemanticWeb中网页的内容不但可以被人理解,而且可以被机器理解;SemafiticWeb中的链接不再是任意的,而是遵循一定的语义关系。通过SemanticWeb技术,可以改变现有网络松散的数据结构,将信息资源结构化并赋予含义,使网络信息的整合和自动处理都变得更加容易[4]。

2.1本体

所谓本体(Ontology),实质上是描述特定应用领域知识的公认的术语集。关于奉体的定义,比较著名的观点是“本体是概念模型的一个显式的规格说明”和“本体是共享概念的一个形式化的规格说明”,其中,“概念模型(Conceptualization)”是指通过对某个客观现象的相关概念进行辨析和提取而获得的关于该现象的抽象摸型;“显式(Explicit)”是指对所使用的概念的类型,以及这些概念在应用上的约束都给予明确的说明;“形式化(Formal)”表示本体以计算机可读的形式存在;“共享(Share)”表示本体中反映的是共同认可的知识”[5]。

本体通常表达为一组对象(概念)、关系、函数、定理和实例。本体中的对象类按照等级关系组织成基本的结构体系。等级关系包括例化(is-a)关系、类属(kind-of)关系和整部关系(part-of)。上层的对象类为父类,下层的对象类为子类。对象类具有各自的属性,并可依据父子关系继承。对属性的取值对象、取值范围、取值基数等都可以加以限制,还可以对属性的交换性、对称性、传递性、唯一性等进行定义。除了等级关系,本体中的对象类间还可以具有其他语义关系,形成语义网络形式的概念模型。本体是机器自动推理和智能化高级信息服务的基础,对网络而言,一个简单的本体的典型例子就是网络的分类索引(如Yahoo!的分类目录)。本体的应用对于提高网络导航的精度和效率具有重要的意义[1,4)。

2.2RDF和RDFS

RDF是由W3C开发的元数据描述机制,其目的主要是为元数据在网络上的编码、交换和重用提供一个基础。它允许在XML的基础上以一种标准化的、互操作的方式对数据语义进行定义[4],提供了一个描述web资源的数据模型。RDF包含描述资源的属性和关系的声明。资源是任何用URl(UniformResourceIdentifier)唯一标识的实体对象。资源具有属性,属性则具有一定的值,该值可能是简单的字符串或数字,也可能是自身也具有属性的其他资源。这样,资源、资源属性和属性值构成了RDF声明中的三元关系模式,任何本体或描述性元数据都是这种三元关系模式的具体体现”[1,7]。

为了描述元数据元素间的复杂语义关系,W3C进一步定义了RDFS(RDFSchema)。它可以看成是一个本体定义语言,用来建立概念类体系结构、属性层次和类关系。

3基于SemanticWeb的智能导航机制

SemanticWeb的出现为网络信息导航提供了新的研究思路,SemanticWeb技术是解决无序网络空间中“迷航”问题的关键技术。基于SemanticWeb的智能导航是一种以结构化、语义化的概念知识网络为基础,自动形成个性化导航结构的方法。它分为两个方面,一是基于SemanticWeb的信息组织,即利用参考本体对各信息源进行语义描述和整合;二是基于SemanticWeb的个性化导航结构模型的构建,即在有序语义组织的基础上,构造用户语义模型,并据此建立导航结构。图1显示了基于SemanticWeb的智能导航机制的概念结构[8]。

3.1基于SemanticWeb的信息组织

基于SemanticWeb的信息组织的基本思想是,将来自于多个异构信息源中的数据整合到一个语义统一的参考本体中。参考本体是通过分析领域中的各个信息资源集合,提取公共概念、属性和关系而构建的本体,它为所有信息资源提供统一的概念集合和通用语义。

信息整合的方法是先分别将各个信息源中的数据转换为通用的数据模型,然后建立各个数据模型和参考本体之间的映射关系。网络中的信息源具有各种各样的数据格式,其中大部分是HTML页面,有的包含表格和列表。另外还有XML文档、RDF文档以及关系数据库文档等。为了解决分布式异构信息源的语法相异问题,需要将数据转换为公用的数据模型格式,例如RDF。对于非RDF格式的信息数据,可以利用外覆包(wrapper)技术将其自动地转换为基于RDF的数据模型。外覆包对特定格式的数据文档进行解析,并采用RDF声明对其内容进行标注。下面是三种常用的外覆包:

(1)HTML外覆包。由于HTML页面属于半结构化的信息数据,因此HTML外覆包采用的是半指导性的标注方法。即预先手工标注一组HTML页面,然后对新的HTML页面进行结构分析,将新页面与标注页面进行比较,从中提取相关信息。HTML外覆包还可以处理异构的XML文件[1]。

(2)XML外覆包。根据DTD和Schema所定义的XML文档的内容结构和内容元素,建立概念集与DTDSchema之间的映射关系,从而自动地将XML文献中的DTD内容元素标记转换为对应的概念集元数据标记。

(3)关系数据库外覆包。将关系数据库中的数据元素和二维数据关系映射到概念集中,形成语义基础,以便从关系数据库中自动创建RDF声明。

由于不同的信息提供者可能会使用不同的词表来标注数据,因此在建立通用数据模型后,还必须在信息数据源和参考本体之间建立概念和关系的映射,以消除语义差别。根据RDF声明,在参考本体中注册相关内容的来源,使参考本体成为一个知识内容的集成文件。另外,采用基于本体的元数据发现和漫游技术,探测相关的RDF声明,可以自动地添加新的信息资源[8]。

3.2基于SemanticWeb的个性化导航

通过建立参考本体以及进行信息整合,无序异构的网络信息数据通过语义概念及语义关系被组织到一起,形成一个有序的公共语义知识模型。但是对于具体网络用户的信息导航,并不直接在全部公共语义模型上进行,而是依据用户语义模型有针对性地进行。

3.2.1用户语义模型

用户语义模型是反映用户观点的概念集合和概念关系。概念集合的确定可以由用户直接提交或者根据用户的注册信息(用户的兴趣、爱好和知识背景等)按照一定的规则计算选择。而构建用户语义模型的关键步骤在于建立用户概念集合与参考本体间的语义映射,寻找参考本体中与用户相匹配的概念和关系。

为了将参考本体映射到用户语义模型,需要预先对参考奉体和用户概念集合进行数据训练,方法是为每个本体概念和用户概念各标注一定的相关资源作为训练数据,然后利用向量空间模型为每个概念生成向量,并计算其标准权重。

建立语义映射的过程通过计算用户概念集合中的概念向量uc与参考奉体中的每个概念向量间的匹配度来完成。假设在n维向量空间中,用户概念向量uc中第i项的权重为的匹配度为[9]:

首先将计算结果中匹配度高于阀值的若干概念向量与uc建立映射,形成从用户概念集合到参考本体的一对多的对应关系。如果参考本体的一些概念被重复映射,则需要选择其中匹配度最高的映射,以保证从参考本体到用户概念集合的一对一关系,即一个本体概念只能和一个用户概念相关,但一个用户概念可以和多个参考概念相关。在建立用户概念集合与参考奉体对应关系的同时,用户概念也继承了本体中的概念层次结构和其他语义关系,成为一个独立的语义模型。

原则上应该将参考本体中的所有概念都映射到用户语义模型中,但是由于用户语义模型是范围相对较小的概念集合,因此参考奉体中的概念实际上不可能被完全映射。为了保持映射的完整性,可以在用户语义模型中设立一个“其他”概念类,参考本体中的所有没有被映射的概念将成为它的子概念[9]。

举例来说,假设用户提供的信息表明其在体育领域感兴趣的概念为“足球”、“足球世界杯”、“足球亚洲杯”、“NBA”、“围棋”、“奥运会”,图2显示了这些用户相关概念经过映射后形成用户语义模型的过程。

用户概念集合中的每一个概念都在参考本体中找到了与之相对应的一个或多个概念,将这些概念从参考本体中提取出来,并根据其语义关系重新组合,就形成了用户语义模型的结构。例如:用户概念“NBA”的对应概念为“篮球”、“篮球赛事”和“美国篮球职业联赛(NBA)”,因此这三个概念都被包含在用户语义模型中,且它们之间的父子关系(即等级关系)保持不变。又如,虽然参考本体中的“其他赛事”概念和用户概念集合没有直接对应关系,但由于该概念和“足球赛事”与“篮球赛事”两个概念间有语义关系,且这两个概念均与用户相关,因此该概念也被包含在用户语义模型中。另外,“世界杯足球赛”概念实际上与“足球”和“足球世界杯”两个概念间都具有对应关系。但由于它与后者的匹配度比前者高,因此将它映射到后者。

3.2.2个性化导航结构模型

导航结构模型显示了导航系统组织、关联和显示信息内容的方式。站点地图就是一种最简单直接的导航结构模型。个性化导航结构模型是基于用户语义模型创建的针对特定用户的导航结构,是个性化导航服务的实现。

导航结构的设计需要考虑三个基本要素:卡片、页面和链接。一张卡片只包含一种类型的信息内容,是导航结构模型中的最小组成单元。页面与物理的web页面相对应,一个页面上可以包含若干个卡片。链接则用于连接各个页面中的卡片以形成整体结构[8]。通常,导航结构模型总是从一个缺省的根页面开始,每一级页面都包含了到下一级页面的链接,信息内容通过卡片和页面进行分类和聚合,导航通过链接来进行。在个性化的导航结构建模中,导航结构是根据用户语义模型来确定内容和链接关系的。图3显示了一个导航结构的部分示例,它是在图2中的用户语义模型的基础上建立的。

导航结构的建模过程就是对各级贞面中的卡片的内容、类型和表示样式的确定过程。卡片的内容根据触发点和用户语义模型来选择,不同的用户将获得不同的信息内容。

导航结构中的卡片被分为两种类型:静态卡片和动态卡片。静态卡片的内容独立于数据源,主要包含静态文本、图片等。导航结构中的根页面通常都包含静态卡片,具有预先定义的锚点,指向下一级的页面。动态卡片的内容视数据源而定,如果数据源改变,则卡片的内容必须重新计算生成。动态卡片还可以细分为四种类型,每一种都代表了对信息进行结构化的一种典型方法:

(1)列表型(List)卡片:显示实体的实例列表,每一条实例都可具有指向该实例具体内容的链接入口。列表中的实例可以按照某种属性排序或索引。图3中的页面P2、P3、P4、P5都包含了列表型卡片。

(2)事实型(Fact)卡片:详细地显示一个实例的具体内容,如图3中的页面P4包含的“新闻内容”卡片和页面P5包含的“赛事内容”卡片。

(3)幻灯片型(Slide)卡片:顺序显示一组实例的具体内容,每次一个实例,且具有浏览附近实例的超链接,待显示的实例可以按照某种属性排序或索引。图3中的页面P6包含该类型的卡片,其中每个足球俱乐部的相关信息将被依次显示。

(4)查询型(Query)卡片:要求用户先填写一组实体属性的值,然后查询符合该值的实例并显示,通常该类型的卡片用于导航系统中的信息检索,如图3中的页面P7包含的卡片[8]。

另外,不同的卡片具有不同的表示样式,表示样式描述各种表示元素的属性,例如字体、颜色、布局等。表示样式可以根据用户喜好确定。

个性化导航机制的导航方法采用用户语义模型的查找与语义链的触发相结合的方式。当导航结构中的一个链接被触发时,该链接将被赋予一个查询式Q(C,T,S),式中三个变量的含义分别代表卡片的内容、类型和表示样式,在用适当的值填充变量后,即可利用查询式计算生成链接末端的卡片。例如在图3中,当链接L1被触发后,L1的查询式为:Q(“体育”,List,Stylel),其计算结果为页面P2中的卡片。Q中的变量C的值为L1的触发端点的概念“体育”,Q在计算时将检索用户语义模型,获取此概念的相关概念或相关资源作为卡片的内容。Q中变量T的值为List,因此Q生成的卡片将具有列表型的信息结构。同时,由于Q中变量S的值为Stylel,因此Q还要读取样式表中名称为Stylel的表示样式,并据此决定卡片的外观。同理,链接L2的查询式为Q(“足球俱乐部”,Slide,Stylel),其结果是生成一个信息结构为幻灯片类型,表示样式为Stylel,内容与足球俱乐部相关的卡片”[11,12]。

导航机制采用SemanticWeb技术,揭示和整合网络信息资源的深层语义知识模型,能有效解决无序、异构网络信息空间中的“迷航”问题。它利用映射方法建立用户语义模型,可以充分表达用户需求的语义知识,以提高个性化导航的效率。

4结束语

网络信息的利用状况不容乐观,迫使人们努力探索更为先进更为成熟的导航理论、方法和技术。第二代web技术——SemanticWeb在信息服务中的应用,促进了网络导航新技术的发展。它作为导航系统的信息组织框架,能够使复杂的信息空间变得有序、清晰和直观,它采用机器可读的形式化的知识表示方式,有利于知识内容的自动获取。目前,SemanticWeb技术正获得越来越多的应用,相信经过不断地研究和优化,以SemanticWeb为基础的高级网络信息服务将逐步成熟,智能、高效、个性化的导航系统将成为开发网络信息资源的主流工具。

参考文献

1丛敬军,阎辉.数字图书馆的知识信息导航技术研究.中国图书馆学报,2003,29(145):51~53

2马瑞民,衣治安.Web上超文本数据导航方法的研究.情报学报,2001,20(5):538~544

3张晓林.SemanticWeb与基于语义的网络信息检索.情报学报,2002,21(4):413~420

4刘柏嵩.基于知识的语义网:概念、技术及挑战.中国图书馆学报,2003,29(144):18~21

5MikeUschold,MichaelGruninger.Ontologies:Principles,MethodsandApplications.KnowledgeEngineeringReview,1996,11(2):93~155

6JeffHeflinetal.Requirementsforawebontologylanguage.w3.org/TR/webont-req/

7张平,郭金庚.语义网描述语言分析.电脑开发与应用,2003,16(4):31~33

8OntoWebberModel-DrivenOntology-BasedWebSiteManagement.www-db.stanford.edu/pub/gio/2001/Ontowebber01.pdf

9Ontology-BasedPersonalizedSearchandBrowsing.ittc.ku.edu/~sgauch/selectedpapera/WLAS2003.pdf

10毕强,刘早学.QUIC——一个智能超文本导航系统.情报学报,2002,20(12):1277~1281

地理信息系统基本概念篇4

企业价值是公司现有基础上的获利能力价值与潜在的获利机会价值之和。以价值为核心的绩效评价突破了传统的以财务指标为主的企业绩效评价体系的局限,强调绩效评价应能更好地体现企业未来业绩的预测与评价。

一、成本信息成为制约企业绩效评价的瓶颈

在以价值为基础的企业绩效评价体系中,无论是高层次的战略定位,还是低层次的企业经营,成本信息的运用一直贯穿其中。但是,目前国内许多企业的成本管理处于一种成本概念歪曲、成本信息滞后、成本系统无效的状态,在一定程度上成为制约企业价值的瓶颈因素。

(一)对成本概念的理解过于片面

当前,企业对成本的理解仍过多地强调成本的财务信息属性,而忽略了它的非财务信息属性。实质上,成本是一个内容十分宽泛的概念。它既包括管理者有效管理企业时所需的成本收益方面的财务信息,也包括生产率、质量等非财务信息。如果企业一味地注重财务信息,则有可能产生误导作用。因为财务信息倾向于关注短期因素。然而,随着经济的全球化发展和竞争的日益加剧,获得可持续性的竞争优势成为企业成功的关键因素。为了取得竞争胜利,企业必须首先关注一些长期的非财务性因素,如,产品与生产领先、产品质量和顾客忠诚度等。有时,过分强调财务信息去削减成本(一项财务指标)而忽略甚至降低质量标准(一项非财务指标),这样的决策可能会给企业带来重大灾难,导致长期内顾客和市场份额的丧失。反之,企业为了获得竞争优势可能会有意地抬高成本,只要所取得的溢价收入大于成本的增加额。因此,在研究成本概念时,有必要将战略思想引入其中,从战略角度考虑它的非财务性和长期性。

(二)会计收益的计算只考虑了债务资本的成本,忽略了对权益资本成本的补偿

众所周知,现行财务会计只确认债务资本成本(利息费用),股东的权益资本成本被当作是“免费的午餐”不予核算。在金融市场不发达和企业组织形式为独资和合伙时,债权人被认为是唯一的外来者,重要的是确认和计量债务资本成本,相反,单独确认和计量权益资本成本是没有多大意义的。然而,在企业组织形式为公司制时,无论是债权人还是股东,相对于公司这个独立的人格化主体而言,都是“外来者”。公司通过两个渠道筹集其所需要的资本,无论是哪种资本,公司使用它们都是有代价的,都应作为成本处理。而且,在公司制企业中,股东并不直接参与企业的经营,不了解企业信息的股东可以随时用“脚”投票,出售其原来持有的股票而不再成为公司的股东。因此,从这个角度来讲,他们已经成为企业的“外部人”,股东权益资本成本必须单独计量。

(三)强调物质资本成本,忽略了对人力资本成本的计量

1960年,美国经济学家西奥多・舒尔茨(TheodoreW.Schultz)在其“向人力资本投资”的演说中正式提出了“人力资本”的概念。他指出,人力资本是相对于物质资本而言的,是指体现于劳动者身上,通过投资形成并能使价值迅速增值的包括健康、体力、经验、知识和能力的存量。西方人力资本理论认为,在经济增长的要素中人力资本的作用大于物质资本的作用。我国著名经济学家肖灼基也认为,人力资本比物质资本具有更大的增值空间,特别是在后工业时期和知识经济初期,人力资本将具有更大的增值潜力。周其仁(1996)在“企业契约性质”的基础上进一步分析,认为“企业是一个人力资本与非人力资本的特别合约”。这里的非人力资本,通常是指除人力资本之外的所有物质资本的总和。人力资本与非人力资本的合作契约关系,是双方长期博弈的结果,体现了一种博弈均衡。

(四)固守陈旧、落后的成本系统

一个有效的成本系统提供的信息应具有以下一些特点:首先,成本信息应具有可靠性,成本信息应能够尽量客观地反映现实,接近实际,管理人员使用该成本信息应能够做出恰当的决策,不会导致错误判断。其次,成本信息应具有相关性,成本信息的提供应与管理者将要做出的决策相关。当决策需使用历史成本时,成本系统应提供历史成本信息;当决策需利用未来现金流量时,成本系统应提供未来的相关成本信息。再次,成本信息必须支持各种类型的管理决策。如,为管理层指出正确的经营方向、产品投资组合与定价、材料(零件)自制/外购、新产品开发、长期投资决策等。此外,有效的成本系统还应有助于企业的激励与控制、学习与反馈等。企业管理人员可以直接或间接地对成本系统进行深入的分析和研究,如果发现成本系统对于一些现象无法解释时,表明企业的成本系统可能无效了。

二、改革现行成本信息系统势在必行

(一)建立以管理职能为基础的成本概念框架

企业的日常管理工作是由一系列相互关联、连续进行的活动构成的,这些活动可被归类为一些基本的管理职能,包括计划与决策、组织与领导、绩效与控制。

1.基于战略职能的成本概念。近年来,随着经济的全球化发展,企业间的竞争日益剧烈,企业要获得竞争优势,就必须重视战略。因此,管理的战略职能已经一跃成为管理的首要职能。把战略管理思想同成本管理结合起来便形成了战略成本管理,战略成本的实质要以企业的战略为核心,与一系列具有源流性质的成本动因相对应。战略成本的内容一般包括时间成本、信息化成本、创新成本、学习成本和市场成本。

2.基于计划与决策职能的成本概念。企业管理人员为了做出各种计划和决策,必须获得足够的信息,其中,成本是一项非常重要的指标。但是,企业管理人员所运用的成本信息并不是简单的成本数据,而是一些经过处理的具有及时性、相关性和精确性的成本信息。于是产生了常见的用于计划和决策职能的成本概念。这些概念主要包括相关成本、差别成本、机会成本和沉没成本。

3.基于绩效与控制职能的成本概念。成本管理的一个重要作用就是为控制企业的日常管理活动和生产经营活动、考核和激励雇员及经理提供信息。用于此项管理职能的重要成本概念是可控成本与不可控成本、标准成本、定额成本和责任成本。

4.基于报告职能的成本概念。企业管理当局需要定期编制各种财务报表,以满足广大外部信息使用者和内部成本管理的信息需求。在这一管理职能中所使用的重要成本概念为生产成本和期间成本。这些成本通常是根据国家统一的财务和会计法规、制度核算出来的,又称为财务成本或制度成本。

5.基于组织与领导职能的成本概念。企业在进行组织设计之后,为确保各项任务的顺利完成并使系统能够正常运行,组织还必须按照设计的要求为系统配置合适的人力资源,并对之进行有效的管理,称为人力资源管理。与人力资源管理职能相对应的成本概念为人力资源成本。广义的人力资源成本包括劳动者被企业雇佣之前为了培养自身的劳动能力所花费的代价和企业在员工的招聘与培训、人力资源开发等方面所花费的代价;狭义的人力资源成本仅指劳动者受雇后的成本,是企业组织为了取得或重置人力资源而发生的成本。

可见,成本信息正扮演着多种角色,为管理的各项职能服务。因此,我们必须改变传统的成本观念,冲破单纯的产品成本概念的束缚,多层次、多方位地理解成本的概念。而且,随着经济的发展,新的管理手段、方法和目标的出现,成本的涵义也必然随之拓展和延伸,成本概念的内容将更加丰富多彩。

(二)将权益资本、人力资本纳入会计核算系统

会计学家安东尼(1973)认为,利息费用不仅包括债务资本成本,而且包括权益资本成本,它应和债务资本一样计量成本并和直接材料、直接人工、制造费用一起计入存货成本和商品销售成本。现行资产负债表的股东权益部分并不代表股东在企业中的权益数额。尽管实收资本项目反映了股东原始资本的投入,但是,留存收益却不代表股东的贡献,盈余是会计主体本身赚取的,而不是股东赚取的。因此,有必要改变以股东为导向的资产负债表右边结构,将原来的股东权益分成股东权益和主体权益两个部分。新的股东权益包括:一是原来资产负债表上列示的实收资本数额;二是权益资本成本(权益利息)部分。新的主体权益与现行财务会计程序下的留存收益也并不是一回事。因为在资本成本会计理论下,净收益应该是各种收入与各种费用(包括权益利息)之间的差额。每个会计期间的净收益应该加到主体权益上去,只不过这个净收益要比现行会计程序计算出来的净收益小一些。

地理信息系统基本概念篇5

[关键词]概念模型信息系统用户理解沟通实验室研究

[分类号]N945.12

概念模型通过一套正规化的符号语言描述现实世界,是信息系统开发中记录系统需求的重要工具,如E-R图、数据流程图、UML等。记录的系统需求成为项目中各方沟通的媒介:系统分析员与用户沟通以确认系统需求;系统开发人员间沟通开发细节。显然,两方面沟通均有效才能保证开发出符合用户需求的应用系统。而以往研究多关注系统开发人员间的沟通,忽视了与用户的沟通。

当前,用户参与需求分析愈加被重视,有效的用户参与被认为是系统成功和用户满意的有力保障。Davies等人的调查表明,与用户的沟通有效性超出其他技术和管理因素,成为概念模型使用中最重要的问题。然而还缺乏直接的研究和证据解释概念模型在与用户沟通中的作用机理。

鉴于此,本文将以概念模型与用户沟通过程中的认知特点为基础,分析和解释概念模型影响沟通效果的作用机理,并通过实验室研究方法获得数据支持。

1文献回顾

1.1概念模型的沟通有效性

基于概念模型的沟通效果本质是阅读者正确理解模型中信息的程度,可以定义为阅读者正确掌握的信息量与模型全部信息量的比率。但信息本身具有不同的类别,近年来研究中多依信息类别将理解效果划分为不同的维度,以深入分析模型对沟通有效性的影响。如Agarwal等根据信息组成分为简单信息(仅包含基于结构的或基于过程的信息)与复杂信息(包含两类型信息),研究发现开发人员使用面向过程的概念模型理解复杂信息显著优于面向对象的概念模型。而在简单信息理解方面无显著差异。

理解效果的维度,即信息类别的划分不存在统一的标准,主要依研究目的而定,如上述研究中的信息分类是为了寻求信息结构与模型结构的匹配。

1.2概念模型理解效果研究

阅读者理解模型中信息的过程是概念模型与阅读者个人交互的过程,因此分别受到模型特点及个人特点两方面因素的影响,如图1所示:

对于模型因素,以往研究发现了一些好的品质,如信息完整性、清晰性等。满足好品质的模型能够提升理解效果,如Gemino等通过实证研究验证了本体论语义更清晰的模型更利于理解。

个人特点中的因素关注较多的如个人经验、知识。经验越丰富,知识储备越充足,个人理解效果必然越好。如Khatri等的实验室研究验证了开发人员所具有的模型技术知识以及应用领域知识对阅读效果的影响作用。

然而,这些研究能够回答的现实问题很有限。首先,用户具有高的应用领域知识水平及低专业技术知识和实践经验,现有研究对这样的复合因素组合的情况难以解释。此外,除了模型特点中的“好品质”,不同的模型仍然存在其他差异影响阅读者理解过程,但作用效果可能因人而异。如有研究发现相对于面向对象的建模方法,面向过程的模型更利于开发专家全面识别信息,而对开发新手不存在这样的差异。因此,本文将根据用户整体的认知特点分析其与概念模型特征的交互关系。

2理论与假设

2.1用户阅读的认知过程

概念模型主要的呈现形式是图形,为了更深入认识用户阅读概念模型时的认知特点,可以借鉴图形理解的相关理论:感知理论与认知理论。

感知理论解释了阅读者将所看到的图形信息放入短期记忆的感知过程,包括三步:辨识图形中各符号对象;根据模型中符号的空间布局对符号进行分组及确定层次关系;对符号初步组织并放入短期记忆。专业的训练和实践能够使开发人员具备组织图形信息的技巧;而用户未接受过培训,只是按照阅读文本时的习惯策略从左向右、自上而下地组织模型信息,因此放入短期记忆中的信息基本是按照模型的信息组织方式。

认知理论解释了信息放入短期记忆后的认知过程,包括两个活动:搜索长期记忆中的相关知识;对图形信息进行解释并与长期记忆整合。影响认知效果的根本因素是认知计算量。对用户来说,主要依靠搜索长期记忆中关于业务环境等的知识来解释图形所传达的含义。根据认知匹配理论,当放人短期记忆的信息结构与用户长期记忆中的知识组织方式一致时。搜索相关知识的效率将提高,整合新知识时也减少了结构关系的转换计算,使得总的计算量降低,因此认知正确性将提高。

综上所述,概念模型的信息组织方式与用户长期记忆中知识结构的匹配程度是影响认知过程正确性的重要因素。

本文将以面向对象与面向过程的概念模型为例,验证上述分析。两类模型对信息的组织方式显著不同:面向对象的模型将信息分类、抽象为对象,以对象为中心组织与对象相关的属性、行为、通讯等信息,如用例图中围绕各角色的行为活动(即用例);而面向过程的模型将信息抽象为信息流,通过信息处理流程中的前后衔接组织信息,如数据流程图中“处理模块”的输入和输出“信息流”。

认知心理学中众多研究结论显示出人们的自然思考方式首先是分类,这正是面向对象思想的基础。因此可以说,面向对象模型的信息组织方式与未接受过专业学习的用户脑中的知识组织更加匹配。由此判断,与面向过程的概念模型相比,采用面向对象的概念模型更利于用户理解。

假设1:描述同一系统信息时,用户使用面向对象模型的理解效果显著高于面向过程模型。

2.2基于语义网络理论的理解效果

语义网络理论对人脑中的知识组织方式作了很好的解释:人的长期记忆中,知识是通过节点互联的网络来组织的。节点代表任何实体、抽象类、属性等概念;节点间的连接表示概念间的某种关系。一条信息可能包含一个、两个或多个节点,而多个节点之间的关系可能是直接关联,或是通过某些节点间接关联。

显然,当信息包含的节点数较少、节点间的连接较少时,认知过程的搜索和整合计算量都更小。因此,为了进一步分析用户认知特点与概念模型的交互作用,本文根据信息中所包含的节点数及连接关系的复杂程度,将理解效果分为简单理解与复杂理解。

有研究曾发现,不熟悉概念模型的阅读者在使用用例图和使用数据流程图识别单个信息点的完整性上没有差别。这是因为,理解简单信息时的认知计算量很少,面向对象模型信息组织的优势不显著;但随着信息复杂度增加,两类模型认知计算量的差异将显现出来。

假设2:描述同一系统的简单信息时,面向对象与面向过程概念模型的用户沟通效果无显著差异;

假设3:描述同一系统的复杂信息时,面向对象概念模型的用户沟通效果显著高于面向过程模型。

3研究方法

3.1实验对象及实验过程

本文采用实验室研究方法收取数据。实验在大学课堂道行,选修同一课程的管理学院各专业学生自愿参加,最终参加学生41人。实验中学生被随机分为两组,依次完成三项任务:阅读描述同一系统的系统需求说明,两组的阅读材料不同;回答关于系统理解效果的测试问题,包括简单信息及复杂信息;填写个人经历以及实验感受的问卷。

3.2实验设计

3.2.1实验情境待开发的系统是一个校友录系统。大学生对这样的系统较为熟悉,符合学生作为系统用户的角色。实验人员在实验开始时将以系统开发者的角色进入,并说明实验参与者将作为该系统的用户,实验目的是使用户理解系统的构建内容。

3.2.2需求说明两组阅读的需求说明分另0由用例图(UseCaseDiagram)与数据流程图(DataFlowDia-gram)来描述,两者是当前使用最广泛的概念模型,分别代表面向对象与面向过程的概念模型。两组模型描述了相同的系统内容,所传达的信息量一致,只是表达形式不同。由于实验时间的限制,所描述的系统只具备简单的功能。

3.2.3理解效果用户的理解效果通过回答问题的正确率来反映。所有问题均为判断题,共14题:关于简单理解的问题共7题,只涉及需求中两个概念及直接连接关系;关于复杂理解的问题共7题,涉及三个以上概念及其关系。所有14道问题的正确率反映用户的整体理解。

3.2.4实验后调查问卷问卷主要通过五点量表测量实验中的假定条件以及控制变量。包括三个问题:阅读者对概念模型的学习程度、阅读者对校友录系统背景的熟悉程度(这两者用来保证学生作为用户角色的有效性)以及阅读者感知的模型阅读难度。感知的阅读难度也是影响模型使用的重要因素,因此在本研究中作为控制变量。

4实验结果与讨论

4.1实验数据剔除

实验收集到数据41份,首先剔除回答不完整的数据1份,然后对实验的前提假定进行检验。统计阅读者的模型知识表明所有参与者都没有学习过概念模型知识,同时95%的参与者较熟悉或非常熟悉校友录系统。为进一步保证实验的有效性,根据参与者对系统背景的熟悉情况剔除了解很少或完全不了解的参与者数据3份。最终获得有效数据37份,其中用例图组19份,数据流程图组18份。接下来将使用SPSS统计软件对数据进行分析、验证假设。

4.2模型对用户理解的影响

采用多元方差分析方法验证两概念模型组阅读效果的差异,并将用户感知的模型阅读难度作为协变量以控制其对因变量的影响。两组用户的简单理解效果没有显著影响(显著性=0.617),支持了似设2;复杂理解效果方面,用例组(均值=0.722)显著高于数据流程图组(均值=0.579),显著性=0.007,支持了假设3;总体理解效果方面,用例图组(均值=0.726)也显著(显著性=0.043)高于数据流程图组(均值=0.643),支持了假设1。如表1所示:

4.3用户不同层次的理解效果

通过对同一用户简单理解效果与复杂理解效果的配对均值检验来反映前文中关于理解划分的认知基础。用户对简单问题的理解效果显著高于对复杂问题的理解(显著性=0.045),如表2所示:

4.4讨论

4.4.1用例图组用户的总体理解效果显著高于数据流程图组(假设1)基于前面的分析,该结论在理论上验证了影响用户理解效果的一个重要的概念模型因素――模型信息组织结构特征,该因素与用户知识组织结构交互影响用户理解效果,即使用与用户知识组织结构更相近的概念模型得到的用户理解效果更好。这为概念棋型的选择和评价提供了一个较可靠的一般性的依据。该结论为实践中而向对象的概念模型在用户沟通方面的意义提供了证据支持,为开发项目选择概念模型提供了直接的参考。

本文基于认知特点的分析认为用户与开发人员在理解概念模型时(无论是感知过程还是认知过程)具有显著差异,对比以往研究中面向过程的慨念模型更有利于开发人员理解的结论,本实验室研究的结论间接证明了用户与开发人员认知特点上的差异。

4.4.2用户对不同复杂度信息的理解效果差异显著

用户对简单问题的理解效果显著高于复杂问题;且用例图/数据流程图在简单和复杂信息理解效果方面的表现显著不同(假设2,假设3)。这些结论验证了认知复杂度是用户理解效果的本质影响因素,进一步解释了具有不同信息组织特征的概念模型是通过影响用户认知计算量影响用户理解效果的。

同时,该结论具有更高的可靠性。可以对以往一些研究结论进行解释:即由于所设置的信息过于简单或没有选择对用户认知计算量有影响差别的概念模型,以往研究可能获得概念模型对用户沟通效果无影响作用的结论。这再次肯定了该领域研究中以用户认知特点为基础的重要意义。

5结语

地理信息系统基本概念篇6

【关键词】中医药;文本信息抽取;本体

【Abstract】TextinformationextractionbecameanovelmechanismforknowledgeminingfromtextsinTraditionalChineseMedicine(TCM)domaininrecentyears.Weconstructedanontology-basedtextinformationextractionsystemforTCMdomain.ItcanextractsemanticrelationsfromTCMtexts,andsupportuserstobrowse,analyze,andannotatetheserelations.ThissystemcanfacilitateTCMexpertstoacquireknowledgefromTCMdocuments,andfurtherrefineTCMdomainontologies.

【Keywords】TraditionalChineseMedicine;Textinformationextraction;Ontology

First-author’saddress:InformationInstituteofTraditionalChineseMedicine,ChinaAcademyofChineseMedicalSciences,Beijing100700,China

doi:10.3969/j.issn.1674-4985.2015.21.040

中医药文献是中医药文化的重要载体之一,记载着历代医家的智慧和经验。如何对浩如烟海的中医药文献进行系统梳理和深度挖掘,是中医药知识管理中的一个重要问题[1-2]。文本信息抽取(TextInformationExtraction)是指从一段文本中自动抽取特定信息的计算机技术,它能显著提升人类处理海量文献并从中获取知识的效率[3-4]。文本信息抽取的任务包括命名实体识别[5]、语义关系发现[6]、事件抽取[7]、情感分析[8]等。笔者构建了基于本体的文本信息抽取系统,用于辅助中医专家从中医文献中挖掘知识,并进一步完善中医领域本体系统。本文介绍该系统所使用的文本信息抽取方法,以及该系统的主要功能和使用情况。

1文本信息抽取方法

该系统使用一种本体驱动的文本信息抽取方法。本体(Ontology)是一种用于表示领域知识的计算机模型,它能帮助计算机更好地理解领域术语并处理文本内容[9]。它定义了一个领域中的语义类型和语义关系,并构建了领域的概念层次结构和语义网络[10]。中医界从本世纪开始在中医药领域中引入了本体技术,对该领域的概念和术语体系进行系统性的表达[11]。其中的代表性系统包括中医药学语言系统和中医古籍语言系统等[12-13]。本体为文本信息抽取提供了领域背景知识,可将领域本体与文法分析技术相结合,从而改进文本信息抽取的效果[9,14]。本系统基于中医药本体,从文献中提取关键性词汇,识别领域概念,进而发现领域实体之间的语义关系。信息提取有2种途径:(1)关系提取,即理解作者在文本中直接提出的显性关系;(2)假设生成,即根据显性关系推理出文本中并未直接提出的隐性关系。该方法包括如下4步。

第一步、提取关键性词汇。文本中仅有部分词汇有助于机器理解文本中蕴含的语义关系,这部分词汇被称为关键性词汇。首先,根据应用需求,从本体中导出关键性词汇,创建领域词库。例如,在药物发现应用中,“药物组成”“感冒”“甘草”“主治”等词汇往往用于表示领域专家关切的医药学关系,而“”等地理名称一般不可能构成有意义的医药学关联。又如,中医古籍文献中的某些关键动词(如“主”)往往对应概念之间的语义关系(如“管理”),因此需要找出这些关键动词,并建立关键动词与语义关系之间的对照表。在建立关键性词汇的词库后,利用一种词库驱动的最大匹配算法,从文献中提取关键性词汇,从而将原始的中文文本转化为词汇序列。

第二步、识别关键性概念。为消除领域知识表达中的歧义性,领域本体中定义了概念和词汇之间的语义关系,包括概念的正名和异名等。机器根据领域本体从词汇序列中识别对应的概念,并判断概念的语义类型。例如,根据本体中定义的异名关系〈甘草,藏名,‘相额尔’〉(即甘草在藏医药学中称为‘相额尔’),将藏医药学文本中出现的词汇‘相额尔’理解为概念甘草;并根据本体中定义的类型关系〈甘草,rdf:type,草药〉,将概念甘草归属于草药这个类。此后,将概念及其类别加入词汇序列中的对应位置,生成文本对应的概念序列。

第三步、抽取语义关系。通过一系列预先定义的语义模板与概念序列进行匹配,若匹配成功则生成对应的陈述。该过程分为3步:(1)基于领域本体生成一个语义模板库,其中的每个语义模板为由领域概念和词汇构成的三元组;(2)根据资源序列中出现的概念在模板库中检索对应的一系列语义模板;(3)将每个模板与资源序列匹配,如果匹配成功,则生成对应的陈述。例如,针对文本“[七十味珍珠丸]的[药物组成]为:……[相额尔]……”,首先提取出其中的3个关键词,并识别对应的概念;其次根据本体中定义的概念类型〈七十味珍珠丸,类型,方剂〉和〈甘草(相额尔),类型,药物〉,获取相应的模板〈方剂,‘药物组成’,药物〉;最后,将模板与资源序列匹配,从而推出陈述:〈七十味珍珠丸,包含,甘草〉。将所获得的陈述融合为一个图,并将其加入索引结构中。

第四步、推导假设性语义关系。根据文本中的语义信息,使用领域规则进一步推导出假设性的语义关系。领域规则形如BodyHead,在Body和Head中均可出现变量。例如,规则R1:〈?x,包含,?y〉〈?y,属于,?x〉表示对于任意x和y,如果x包含y,那么y属于x;根据规则R1和陈述〈七十味珍珠丸,包含,甘草〉,可以推出〈甘草,属于,七十味珍珠丸〉。又如,规则R2:〈?x,包含,?y〉〈?y,具有功效,?z〉〈?x,具有功效,?z〉表示如果某种药物x的成分y具有功效z,则x具有功效z;根据规则R2和〈七十味珍珠丸,包含,当归〉、〈当归,具有功效,补血〉可推出〈七十味珍珠丸,具有功效,补血〉。

下面通过一个关于方剂生化汤的案例来解释上述过程。下面是《中华药典》中描述传统方剂生化汤的组成和功效的部分文本:“……[生化汤]中重用[当归],补血活血,祛瘀生新为[君];[川芎]行血中之气,[桃仁]活血祛瘀为[臣];[黑姜]入血散寒,温里定痛为[佐];[炙甘草]调和诸药为[使]。[功效]为[活血化瘀]……”。首先,根据中医领域本体,从词汇序列中提取对应的概念,并对概念归类。据本体可知,生化汤为方剂的实例,当归、川芎、桃仁、黑姜和炙甘草为中药的实例,活血化瘀为功效的实例。进而,提取文中的语义关系。例如,根据模板〈方剂,药物,‘君’〉,和序列(生化汤,当归,‘君’),推出:〈生化汤,君,当归〉。最后,根据已知的语义关系生成假设。例如,根据陈述〈生化汤,具有功效,活血化瘀〉和规则〈?x,具有功效,活血化瘀〉〈?x,治疗,血瘀证〉,推出假设:〈生化汤,治疗,血瘀证〉。提取出的语义信息构成了如图1所示的语义图。

2文本信息抽取系统

笔者采用上面的方法,构建了中医文本信息抽取系统。该系统基于本体对中医文献进行处理,自动识别其中出现的中医概念,生成文本内容的索引。该系统还能从文本中自动发现语义关系,再将所发现的语义关系交由领域专家进行检验。笔者以综合性医学著作《医学纲目》等中医古籍作为试验文本对该系统进行了测试。该系统基于“中医古籍语言系统”对中医古籍进行处理,从中提取出中医药领域概念及其语义关系,取得了良好的效果。

该系统还实现了文本语义关系管理与检阅的功能,对从文本中发现的语义关系进行集中管理,支持用户查看语义关系在中医文本中的用法,并完成语义关系的检阅、分析和标注工作。如图2所示,该系统以网页的形式展示《医学纲目》古籍全文,以不同的颜色标出文本中出现的中医名词和谓词。该系统在左侧建立书籍目录导航,在页面主体部分显示全文,自动识别文中出现的中医概念并在文本右侧列出,用户可点击查看概念定义。该系统还找出文中出现的谓词,据此识别文中出现的语义关系。用户也可以点击查看原文中蕴含的语义关系。该系统还实现了中医本体加工辅助工具,将文本语义关系正式插入某个本体系统,为中医本体的修订和完善提供可行的技术路径。

3小结

中医药文献是中医药知识共享的主要手段。近年来,随着文字识别等信息技术的广泛应用,大量的中医药文献被转换为数字文件、数据库等数字资源[15]。中医药文献的数字化,为将文本信息抽取等各种文献处理技术应用于中医药领域奠定了基础。本文介绍了中医文本信息抽取系统,它能从中医文献中提取领域实体及语义关系,并支持用户完成文本语义关系的检阅、分析和标注工作。这套系统能辅助中医专家开展文献知识挖掘工作,为梳理中医药知识体系,实现中医文献和知识的共享和重用提供技术支持。

参考文献

[1]刘毅.中医古籍数字化与知识挖掘[J].图书馆工作与研究,2010,14(12):92-94.

[2]周雪忠,崔蒙,吴朝晖,等.基于文本挖掘的中医学文献主题自动标引[J].中国中医药信息杂志,2003,10(1):71-74.

[3]顾铮,顾平.信息抽取技术在中医研究中的应用[J].医学信息,2007,20(1):27-30.

[4]杨博,蔡东风,杨华,等.开放式信息抽取研究进展[J].中文信息学报,2014,28(4):1-11,36.

[5]赵军.命名实体识别、排歧和跨语言关联[J].中文信息学报,2009,23(2):3-17.

[6]陶金火,陈华钧,胡雪琴,等.中医药文献语义关系图发现[J].计算机科学,2011,38(3):213-217,251.

[7]吴家皋,周凡坤,张雪英,等.HMM模型和句法分析相结合的事件属性信息抽取[J].南京师大学报(自然科学版),2014,14(1):30-34.

[8]赵妍妍,秦兵,刘挺,等.文本情感分析[J].软件学报,2010,21(8):1834-1848.

[9]丁晟春,刘逶迤,熊霞,等.基于领域本体和语块分析的信息抽取的研究与实现[J].情报学报,2010,29(1):53-58.

[10]GruberTR.Ontology.EntryintheEncyclopediaofDatabaseSystems,LingLiuandM[M].Tamer?zsu(Eds.),Springer-Verlag,2008.

[11]于彤,崔蒙,李敬华,等.中医药本体工程研究现状[J].中国中医药信息杂志,2013,20(7):110-112.

[12]贾李蓉,杨硕,董燕,等.中医药学语言系统评价体系的研究与建立[J].中国数字医学,2012,7(10):13-16.

[13]朱玲,尹爱宁,崔蒙,等.中医古籍语言系统构建的关键问题与对策[J].中国中医药信息杂志,2010,17(4):98-99.

[14]方纯洁,王波,罗杰,等.基于信息抽取的中医药文献知识发现[J].浙江中医药大学学报,2012,36(1):88-90,96.

  • 下一篇:心理学的主要功能(6篇)
    上一篇:医学检验的好处(6篇)
    相关文章
    1. 年教师个人工作总结范文(整理6篇)

      教师个人工作总结范文我来到幼儿园工作已经有一年时间了,作为一名新教师,我学到了很多。能够来到幼儿园工作,我感到很幸运。这段时间,其他老师给了我很多的帮助,让我能够迅速的..

      daniel 0 2024-11-22 22:35:00

    2. 中秋节作文范文(整理6篇)

      中秋节作文范文今天,就是一年一度的中秋节。我刚走到商场入口时,只见人山人海,热闹非凡。我好不容易挤了进去,我左碰碰右撞撞,才好不容易地跟着人群挤了超市。果然不出我所料,商..

      daniel 0 2024-11-22 08:53:00

    3. 五年级读后感字范文(整理6篇)

      五年级读后感500字范文“读书破万卷,下笔如有神”。读书可以让我们增长知识,读书会开阔我们的眼界,丰富我们的内涵,变得更有素养,也能让我们更有情趣,还能提高我们的沟通交流和写..

      daniel 0 2024-11-22 02:02:00

    4. 一年级小学生日记范文(整理16篇)

      19.一年级小学生日记范文九今天是周五,老师带我们去了光明农场春游。我玩了手摇船,抓鱼,喂奶牛,还做了泥陶。看到一群群红的黄的花的小金鱼在水池里游来游去,我就急忙挽起裤脚,跳..

      daniel 0 2024-11-21 15:44:00

    5. 信息技术教学个人计划范文(整理6篇

      信息技术教学个人计划范文2024一、指导思想:1、让学生初步掌握计算机的基础知识,掌握基本的WINDOWS操作技能。2、让学生进一步了解电脑的广泛用途,并从小树立学科学、爱科学、..

      daniel 0 2024-11-17 15:44:00

    6. 部门经理个人工作计划范文(整理6篇

      2024部门经理个人工作计划范文一、行政人事制度、流程、手续、表格类:在日常工作中行政人事类的制度、流程、手续、表格没有统一规整,些许制度、表格只是遇到时在临时制作,通..

      daniel 0 2024-11-17 02:02:00

    7. 年财务经理个人工作总结范文(整理2

      财务经理个人工作总结范文作为xx集团子公司的xx公司,财务部是xx公司的关键部门之一,对内财务管理水平的要求应不断提升,对外要应对税务、审计及财政等机关的各项检查、掌握税..

      daniel 0 2024-11-16 02:02:00

    8. 小学生英语作文范文十(整理6篇)

      小学生英语作文范文通用Ihaveahappyfamily.Therearethreepeopleinmyfamily:mymom,mydad,andme.Mymomisateacher.Sheisverykind.Shecooksdeliciousfoodforuseveryday.Mydadi..

      daniel 0 2024-11-15 11:10:00

    9. 幼儿园大班幼儿毕业评语(整理10

      12.2023幼儿园大班幼儿毕业评语二 你是个聪明大方又可爱的小女孩。这学期你的表现很能干,能主动和老师说一些自己发生的事。你上课

      栏目名称:办公范文 0 2024-11-23

    10. 部队班级年终工作总结(收集6篇)

      部队班级年终工作总结篇1今年来,在支队党委的正确领导和业务部门的有力指导下,我们班始终以“”重要思想为指针,以政治合格、军事过

      栏目名称:办公范文 0 2024-11-23