生物的基本特征(6篇)
生物的基本特征篇1
第二条在特区范围内设立*经济特区主要副食品价格调节基金(以下简称调节基金)。
*经济特区主要副食品价格调节基金领导小组,代表市人民政府统一领导调节基金的征收、管理和使用工作。领导小组办公室(设在市物价局)负责调节基金的日常使用和管理。
第三条调节基金来源:
(一)市财政部门在本规定实施的第一个年度预算内安排300万元作为补贴资金,以后由市人民政府每年视财政状况和实际需要适当增加;
(二)特区旅馆业向旅客按税前客房营业收入的规定数额价外加收。征收标准为:
1、普通旅馆,每套客房每日2元;
2、一星级(含收费等级准一星级),每套客房每日3元;
3、二星级(含收费等级准二星级),每套客房每日5元;
4、三星级(含收费等级准三星级),每套客房每日7元;
5、四星级(含收费等级准四星级),每套客房每日9元;
6、五星级(含收费等级准五星级),每套客房每日10元。
旅客住宿半日或不足半日的,定额标准按全日标准折半计征;
(三)根据《*经济特区特种消费行业税费征管若干规定》,对特区范围内特种消费行业按其营业收入5%征收的特种消费行业附加费,纳入调节基金使用管理;
(四)对实行政府定价、政府指导价的部分商品和服务项目,按一定价格或收费标准比例征收;
(五)经市人民政府批准的其他项目。
第四条财政预算内安排的调节基金,由财政部门纳入预算,在每年第一季度末划入*经济特区主要副食品价格调节基金专户(以下简称基金专户)。
第五条除本规定第三条第(一)项以外的其他调节基金,由各职能部门按照下列规定征收后,并于次月10日前统一上缴市财政部门在银行开设的调节基金专户:
(一)本规定第三条第(二)项的调节基金,由旅馆业经营单位负责;
(二)本规定第三条第(三)项的调节基金,由市地方税务局负责征收;
(三)本规定第三条第(四)项的调节基金,由市物价局负责征收。
第六条调节基金的征收应使用市财政、地方税务部门印制或监制的票据。
第七条调节基金征收及单位应于每月10日前向调节基金领导小组办公室报送上月调节基金收缴情况统计表;市财政局应每季向调节基金办公室报送基金专户收缴和支出情况统计表。
第八条调节基金实行专项管理,专款专用,任何单位和个人均不得截留、挪用。其主要用途是:
(一)扶持特区“菜篮子”工程建设;
(二)在遭受灾害或其他特殊情况下,对重要农副产品实行保护价的补贴及对经营部门必要的政策性亏损补贴;
(三)主要节日或淡季,市政府下达经营部门组织、储备主要副食品货源所必需的费用补贴;
(四)为平衡市场供求,委托经营部门参与市场吞吐,组织副食品期货,平抑市场价格,提供必需的经营风险基金。
第九条调节基金实行滚动使用,必要时,经调节基金领导小组批准,可实行有偿使用。遇紧急需要,资金不足时,可向开户银行申请低息货款。
第十条调节基金的使用,根据有关部门和生产经营单位的申请以及市场的情况,由申请使用基金的单位填写《价格调节基金使用申请表》,经其主管部门审核后,由调节基金领导小组办公室会同市财政、市贸易等部门提出使用方案,报市调节基金领导小组批准后执行。
第十一条使用基金的单位,应自觉接受调节基金领导小组的检查、监督,于每年年终写出书面使用情况报告,向基金专户办理结算,并接受物价、财政、审计等部门的监督。
第十二条市财政、审计、物价、地税等部门应加强对调节基金收缴、使用的监督、管理和检查。物价等部门在实施监督、检查时,可以行使下列职权:
(一)查询、复制与调节基金有关的帐薄、单据、凭证、文件及其他资料,核对与调节基金有关的银行资料;
(二)检查与调节基金有关的财物,必要时,可以责令当事人停止相关营业;
(三)在证据可能灭失或者以后难以取得的情况下,可以依法先行登记保存。
第十三条对逾期不缴纳调节基金者,由征收部门从逾期之日起按日加收5‰的滞纳金;属列管商品或收费,物价部门不予办理调、定价手续。拒不缴交的,可以申请人民法院强制执行。
对瞒报少交调节基金者,由物价部门处以少交款额三倍以下的罚款。
第十四条单位不按规定调节基金,或擅自截留调节基金的,应依法予以全额追缴,并追究其单位负责人和当事人的责任。
擅自挪用调节基金的,由审计部门处理;对情节严重,触犯刑律的,由司法机关依法追究刑事责任。
生物的基本特征篇2
“物业”一词源于香港和东南亚,含义是已建成并投入使用的各类房屋以及与其配套的设备、设施和场地等,物业是房地产(不动产)的别称,物业税即房地产税。’房地产税是一个历史悠久的税种。早在古希腊时期,就开始了对房屋征税,以后各国都对房屋开征了名称各异的财产税。[1]美国称之为“propertytax”,香港则称为“差晌”、“地租”。物业税是财产税的一种,是以对不动产为课税对象,在不动产保有环节课征的一种税,主要针对土地、房屋等不动产,要求其所有者或承租人每年交纳一定的税款,税款随房产的升值而提高。财产税有着悠久的历史,虽然在现代各国税收结构中并不占主导地位,但由于它能起到所得税、流转税等其他税种难以实现的独特的调节作用,因而被大多数国家所采用,特别是被许多国家的地方政府所掌握,并成为地方财政收入的重要来源。
二、物业税的特征
物业税作为财产税的一种,与其他税种相比,具有自身的特性:
(一)物业税税基具有地域性和普遍性,对物业征税最符合税收的付出与受益对等原则。房产具有固定的坐落地点,不能随意移动,地域性强,而且房产与每个家庭、每个人都息息相关。因此,以房产作为税基征税相当于对辖区每一居民征税,而且,物业税税基的非流动性与地域性特点又使得物业税税基具有相对独立性。同时,房产、土地等财产的增值及收益的高低与当地的基础设施、地方政府公共服务的优劣密切相关,不论是企业财产还是个人财产,都享受着来自地方财政支付的公共服务,因此,对辖区内的房产课税,明显地体现了付税与受益对等原则,企业和居民理应承担相应的纳税义务。
(二)物业税税收收入具有可*性,不易发生周期性波动。由于房屋等不动产不能随意移动,隐匿比较困难,故物业税税源比较可*。随着人口的增加和经济的发展,房屋等不动产在不断增加,其价值则因时代变迁与纳税人有效需求的增加而不断提升,其纳税面宽,主要涉及当地居民,容易控管,税源可*而充裕。而且,对于企业和居民个人而言,固定资产代表了一种长远的资本投资形式,税基稳定,不会发生税基的大量地区转移。因此,对物业的课税可以成为地方政府的一个相当丰富的税收来源,其收入不易发生周期性波动。
(三)物业税便于征管性。由于物业课税具有税源分布广泛的区域性特征,因此,适宜地方政府对这一税源实施严格监控。同时,由于房产等不动产具有不可隐匿的特点,征收相对方便,从而可以降低管理成本。
三、物业税的税制设计
(一)物业税的纳税义务人、课税对象
1.物业税的纳税义务人
纳税义务人即纳税主体,是指税法规定的一切履行纳税义务的单位和个人。物业税的纳税义务人是拥有房地产权利的单位和个人。房地产权利包括土地使用权和屋产权。单位包括各类国有企业、集体企业、私有企业、股份制企业、外商投资企业外国企业、行政单位、事业单位、社会团体,以及其他类型的组织和企业。个人是所有中国公民和来华投资或居住的外国公民。
2.物业税的征税对象
征税对象即纳税客体,是指税收法律关系中征纳双方权利义务所指向的对象或为。物业税的征税对象是我国境内的房产和地产。房产是指可供人们在其中生产学习、工作、娱乐、居住或储藏物资的场所。地产是指拥有土地使用权的土地,包建筑物坐落地、尚待开发用地和农村土地等。境内是指我国税收管辖权范围内的城市县城,镇和区以及农村。
关于农村是否应该被包括在物业税的征税范围之中,学术界还未形成统一观点本文认为应将农村划入到征税范围之中。如果农村不被包括在课税范围内,就会给逃物业税的行为留有一定的空间(如富人在农村利用耕地修建别墅等),这样物业税税源不仅得不到保证,物业税的调节社会公平的目标无法充分实现,还会使物业税征管成本增加。在将农村划入征税范围的同时应根据农村房地产存在的用途决定征免对于农民用于农业生产的土地和维持农民生活的自建房应该暂免征收,对于农民进出租、转卖、开发旅游资源搞旅馆住宿等获取额外收入的房地产应该征收物业税。
(二)物业税的计税依据1.计税依据的设计
计税依据是指计算税额的基础或依据。如果说课税对象是对征税客体的质的规定那么计税依据是对征税客体的量的规定。要对计税依据进行合理确定,就需要对物税征税客体的量进行分析。
(1)从价计征和从量计征的选择
在税收理论中,房地产税类按税种的计量标准划分,可以被分为从量计税和从计税。从量计税是以课税对象的数量、重量、容积、体积、面积等为标准按预先确的单位税额确定的税。从价计税是根据课税对象价值的大小按一定比例征收的税,国现行的房地产税类中既有从价征收的税种(如我国现行的房产税),也有从量征收税种(如我国现行的城镇土地使用税)。从量计税和从价计税各有优劣。从量计税征税依据的数据比较容易获得,如房产的面积具有易测度、不变动的特点,只要通过科学的测量和完整的记录就能得出确的计税依据,实际操作过程中,征管成本相对较低。但对物业税而言,相同面积房地产可能会因为其区位、质量、朝向、楼层、外部环境、交通情况、物业管理的同而存在价值上的差异。如果按面积征税就会带来不公,很可能出现穷人要为低价的房地产支付与富人高价值的房地产同样数额的物业税。有人提出可将地块按等级行划分,每个等级内仍然按面积为单位计税。这样虽然能缓解物业税从量计征带来不公,但不能从根本解决问题。因为即使是在统一等级土地区域内部,单位面积的地产价值仍然存在差异。从价计税能够很好的克服从量计税的不公。但从价计税中何合理的确定房地产保有环节的计税价值一直是一个难点。现实生活中,城市中绝多数的房地产是缺乏其现值市场价值资料的,这就需要对房地产的现值进行评估。本文认为,由于从量计征的方式在物业税实际征收过程中会存在不公,不符合业税开征的公平原则。因此我国物业税的征收方式应采用从价计税,而对于计税依的确定,可借鉴国外房地产税的做法,以房地产的课税评估价值为计税依据。
(2)计税依据的定价
物业税的计税依据要通过房地产的价值评估确定。获得房地产评估价值的方式两种,分别是一般性房地产评估和房地产课税评估。两种评估方式在对相同的房地评估时既存在共性也有区别。共性在于都是通过科学方法对评估对象进行评估,并房地产课税评估需借用一般性房地产评估的方法,如成本法,收益法、市场比较法等两种评估方式也有区别。从房地产价评估的实践看,房地产升值因素的部分主要是土地,房地产减值素的部分主要是建筑物。从长期看,土地作为稀缺资源,市场价格将会不断上涨。土地上的建筑物会因为使用而产生累计折旧,同时还会因为建筑物本身的质量、户型年代、周遍交通情况等因素的变化发生减值,所以房屋的净值呈不断下降的趋势。此在借鉴各国经验的基础上,本文提出以下计税依据的表达公式:计税依据=土地评估价+建筑物评估价(1-减值毁损率)上式中,土地评估价是土地课税评估后的土地价格,可按地段或小区划分。建物评估价是建筑物课税评估后的价格,不包括土地的价格。减值毁损率是指综合考建筑物修善和折旧因素的情况下所制定的一个比率,这个比率应根据实际情况进行整。
(三)物业税的减免规定
我国目前房地产保有环节税种主要是针对营利性单位或个人课征,所以减免税优惠主要适用于一些非营利性质的单位或特殊用途的房产,本文认为,物业税征免规定的设计在延续这个原则前提下,应广泛考虑普通居民利益。由于具体的减免税优惠设计牵涉到的因素较多,需做专题研究才能确定,本文在此不做深入探讨,只在参考当前房产税等相关税种的税收优惠的基础上,列举几条有代表性的减免税税收优惠规定。
1.减税方面
(1)对于家庭所拥有的第一套住房并且是唯一生活住房,可参考家庭人口数和住房面积大小等因素给予规定免征额或起征点。
(2)对于孤老、残疾、低收入特殊人群等家庭拥有的生活唯一住房给予免征。
(3)损坏房、危房,经有关部门鉴定,在停止使用后,可给予免征。
(4)对于经济适用房实行一定程度的减免优惠。
(5)由于不可抗力造成房地产毁损的,主管税务机关核准可酌情给予适当减免。
(6)对农村生产用地和农民生活用房,在一定期间内给予减免。
2.免税政策
(1)国家机关、人民团体、军队、外国使领馆及各种社会团体自用的房地产免征。
(2)教堂、寺庙、公园、国家纪念馆以及其他名胜古迹自用的房地产免征。
(3)市政街道、广场、绿化地带等公共物业免征。
(4)非营利性科研机构、医疗单位、疾控机构、妇幼保健单位、老年人服务机构等自用的不动产免征。
参考文献
1.阎祖兴主编:《物业管理法律实务》,中国建筑工业出版社,2003年版
2.高富平、黄武双著:《物业权属与物业管理》,中国法制出版社,2002年9月版
3.肖海军、李华著:《物业管理侵权的法律救助》,湖南人民出版社,2005年版
4.杨秀琴钱晟编著:《中国税制教程》,中国人民大学出版社,1999年版
5.胡怡建主编:《税收学》,上海财经大学出版社,1999年版
6.王乔席卫群主编:《比较税制》,复旦大学出版社,2004年9月版
7.蒋晓蕙主编:《比较税收教程》,中国财政经济出版社,2002年9月版
8.戎生灵著:《中外地方税收比较》,中国经济出版社,2005年版...
生物的基本特征篇3
[关键词]生物特征识别数字签名电子商务身份安全认证
一、引言
在电子商务应用日益广泛的今天,从某种角度看,身份认证技术可能比信息加密本身更加重要。它是网络安全和信息系统安全的第一道屏障,是在信息安全时代备受关注的一个研究领域。
目前的应用主要是以“用户ID+口令+数字证书”来进行用户的身份认证。从根本上说这种身份认证不能解决访问者的物理身份和电子身份的一致性问题,即无法确认通过身份认证的访问者即获授权者。
启发于人的身体特征具有不可复制的特点,人们开始把目光转向了生物识别技术。人的指纹、虹膜、视网膜等都具有惟一性和稳定性的特征,为实现更安全、方便的用户身份认证提供了有利的物理条件。
用户最关注的问题是因特网的网络安全性和保密性。保障网络中数据传输的安全性通常需要借助信息安全功能来实现。在开放系统中对具有重要价值的信息或私密信息进行通信时,可使用数字签名等密码技术进行加密。
生物识别技术代表着用户身份认证技术的未来,有着广阔的应用前景。如果将生物特征识别技术和数字签名技术有机地结合在一起,可以提供一种更加安全、便捷的用户身份认证技术。
二、生物特征识别技术
生物特征识别技术是通过计算机与光学、声学传感器和生物统计学原理等高科技手段结合,利用人体固有的生理特性来进行个人身份的鉴定。其核心在于如何获取这些生物特征,并将之转换为数字信息,存储于计算机中,利用可靠的匹配算法来完成验证与识别个人身份的过程。
1.指纹识别――成熟的身份认证技术
在网络环境下的身份认证系统中,应用指纹作为身份确认依据是理想的。
第一,理论上,每个人的指纹是独一无二的。
第二,指纹样本便于获取,易于开发识别系统,实用性强。
第三,指纹识别中使用的模板而是由指纹图中提取的关键特征,使系统对模板库的存储量较小。也可以大大减少网络传输的负担,便于支持网络功能。
第四,指纹识别是生物特征识别中研究最早、技术最成熟、应用最广泛的技术,有着坚实的市场后盾。
指纹识别具有很高的实用性、可行性。随着固体传感器技术的发展。指纹传感器的价格正逐渐下降,在许多应用中基于指纹的生物认证系统的成本是可以承受的。
指纹识别原理和过程如下:首先,通过指纹读取设备读取到人体指纹图像,并对原始图像进行初步的处理,使之更清晰。然后,指纹辨识算法建立指纹的数字表示――特征数据。特征文件存储从指纹上找到被称为“细节点”(minutiae)的数据点,也就是那些指纹纹路的分叉点或末梢点。这些数据称为模板(至今仍然没有一种模板的标准,也没有一种标准的抽象算法,各厂商自行其是)。最后,通过计算机把两个指纹的模板进行比较,计算出它们的相似程度,得到两个指纹的匹配结果。
2.虹膜和视网膜――更准确、更可靠的身份认证技术
虹膜是一种在眼睛中瞳孔内的织物状各色环状物,每一个虹膜都包含一个独一无二的基于像冠、水晶体、细丝、斑点、结构、凹点、射线、皱纹和条纹等特征的结构。世界上两个指纹相同的几率为1/109,而两个虹膜图像相同的几率是1/1011,虹膜在人的一生中均保持稳定不变。因此,利用虹膜来识别身份能够成为独一无二的标识,其可靠性超过了指纹识别。
从直径11mm的虹膜上,Dr.Daugman的算法用3.4个字节的数据来代表每平方毫米的虹膜信息,一个虹膜约有266个量化特征点,而指纹识别技术只有40多个特征点。266个量化特征点的虹膜识别算法在众多虹膜识别技术资料中都有讲述,在算法和人类眼部特征允许的情况下,Dr.Daugman指出,通过他的算法可获得173个二进制自由度的独立特征点。这在生物识别技术中,所获得特征点的数量是相当大的。
关于虹膜的特征提取方面较有成效的主要有Daugman的利用多分辨率Gabor滤波器提取虹膜纹理的相位信息;Wildes的基于4种不同决策标准的拉普拉斯金字塔提取虹膜纹理特征;Boles和Boashash的基于小波变换过零检测虹膜识别算法以及中科院采用Gabor滤波和aubechies-4小波变换相结合的纹理分析方法。
虹膜技术上有一些地方有待完善;当前的虹膜识别系统只是用统计学原理进行小规模的试验,而没有进行过现实世界的惟一性认证的试验;目前图像获取设备相当昂贵。
视网膜是一些位于眼球后部十分细小的神经(一英寸的1/50),它是人眼感受光线并将信息通过视神经传给大脑的重要器官,用于生物识别的血管分布在神经视网膜周围,即视网膜四层细胞的最远处。
在20世纪30年代,通过研究就得出了人类眼球后部血管分布惟一性的理论,进一步的研究的表明,即使是孪生子,这种血管分布也是具有唯一性的,视网膜的结构形式在人的一生当中都相当稳定。所以,同虹膜识别技术一样,视网膜扫描可能是最可靠、最值得信赖的生物特征识别技术。视网膜扫描设备可以从使用者的视网膜上可以获得400个特征点,创建模板和完成确认。由此可见,视网膜扫描技术的录入设备的认假率低于0.0001%。但拒假率(FAR,指系统不正确地拒绝一个已经获得权限的用户)比较高,相信在进一步的研究中可以大大降低。
因为对视网膜难于采样,也无标准的视网膜样本库供系统软件开发使用,这就导致视网膜识别系统目前阶段难以开发,可行性较低。
与指纹识别技术的主要步骤以及原理相似,虹膜识别与视网膜识别一般包括图像采集、图像处理、特征提取、保存数据、特征值的比对和匹配等过程。
图生物识别系统原理
综上所述,指纹识别是最容易实现的;而虹膜识别与视网膜识别受到某些限制,目前除了一些高端应用外很难普及应用,但其有着巨大的技术优势和潜在的商业价值,必将是下一代生物特征识别技术的发展方向。
三、基于生物特征识别和数字签名技术的电子商务身份认证系统解决方案
1.方案设计要求
要确保基于指纹特征的用户身份认证系统的整体安全性,必须对基于指纹特征的网络身份认证方案设计一个安全的身份认证协议。良好的身份认证协议应该满足以下几个要求:
(1)能够准确识别被认证对象的身份;
(2)能够明确重要事件的责任人,并实现签名,避免事后抵赖;
(3)能够保障数据在存储和传送时的安全。
2.基于生物特征和数字签名技术的电子商务身份安全认证系统结构
基于秘密信息的身份认证协议:保证通信认证可以防止第三方的重放攻击,但由于客户端密钥存储和管理存在问题。基于生物特征的身份认证:能解决口令窥视和密钥管理难等问题,但很难阻止第三方的重放攻击。因而,笔者提出了综合前述的生物特征识别技术和数字签名后得到的电子商务身份认证系统的解决方案。
在网络环境下(B/S结构),用户(客户端)如果要访问远程服务器所管理的信息资源,在获得相关资源访问权限之前,必须通过生物特征身份认证,所有的信息资源访问权限都在身份认证系统(服务器端)管理之下,未通过身份认证的用户不能访问信息资源。当模板内置于服务器时,通过客户端的生物特征获取仪器获得用户的生物特征信息,该信息被加上数字签名后传送到服务器,在服务器首先校验签名是否有效,再与预先注册的模板进行比较,并完成身份认证。
3.身份认证步骤与协议
在生物认证系统中,为了保证生物特征值这不被非法用户所获得,采用数字签名技术。我们在此对协议中采用的符号做如下定义:A为用户,AS为认证服务器,KUAS为认证服务器公钥,TAS为认证服务器的时限,NA为A的现时数据,FA为A的生物特征值,IDA为A的标识。还需说明的是这里采用的是单向认证协议。基本协议如下:
(1)A用自己标识的签名向认证服务器AS请求认证。使用签名技术能有效地阻止一个虚假认证服务器对用户A的欺骗性连接。因为只有合法的认证服务器才保存有用户的公钥,从而能验证这个签名来获得IDA来为下面的认证过程来使用。
(2)认证服务器产生时限TAS,现时数据NA,并将自己的公钥KUAS、NA和时限TAS用用户A的公钥KUA加密后返回给客户端的A用户。
(3)客户端A接受到认证服务器公钥、时限和现时数据NA,同时在客户端的生物特征传感器读取用户的生物特征图像,并获得特征FA,把元组{TAS,NA,FA}用认证服务器的公钥KUAS加密后发送给认证服务器。
(4)认证服务器AS通过生物特征信息数据库进行比对,若匹配则A的身份通过认证。
这个方案与现时使用的认证体制基本类似,所以电子商务交易系统不必作重大改变。但因为引入了生物特征识别,安全性可以获得有效的加强。
四、结束语
在信息化日趋成为主流的今天,电子商务的业务已随着互联网的普及而飞速发展,与此同时,电子商务的安全性也成为业界的一个热点研究方向。本方案设计将基于生物特征的身份认证技术和数字签名相结合应用于电子商务,加强系统安全性,具有一定的研究和实用意义。
参考文献:
[1]DAUGMANJG.Highconfidencevisualrecognitionofpersonsbyatestofstatisticalindependence[J].TranPatternAnalysisandMachineIntelligence.1915(11):1148-116
[2]MALi,TANTieniu,WANGYunhong.Efficientirisrecognitionbycharacterizingkeylocalvariations[J].IEEETransactionsonImageProcessing,2004,13(6)739-750
[3]BOLESWW,BOASHASHB.Ahumanidentificationtechniqueusingimagesoftheirisandwavelettransform[J].IEEETransonSignalProcessing.1998,46(4):1185-1188
[4]WILDSRP.Irisrecognition:anemergingbiometrictechnology[A].ProceedingsoftheIEEE[C].SanjuanPuertorico,1997
[5]孟浩徐翠平:虹膜识别算法的研究[J].哈尔滨工程大学学报,2006,27(3):400-403
[6]祝连庆穆婕马龙:虹膜识别技术的研究[J].仪器仪表学报,2006,26(6):753-755
[7]叶炜李恒华田捷:生物识别技术在网上银行认证安全体系的应用[J].计算机工程,2003,29(11):192-194
生物的基本特征篇4
关键词:仿生设计;游艇设计;生物原型
中图分类号:U674.91文献标识码:A文章编号:1005-5312(2015)23-0272-02
一、仿生学概念
仿生学一词最早是在1960年由美国人斯蒂尔(JackEllwoodSteele)取自拉丁文“bios”(生命方式)和词尾“nic”(具有……性质的)合成。斯蒂尔认为:仿生学是研究模仿生物系统方式,或是以具有生物系统特征的方式,或是以类似于生物系统方式的系统科学。因此,我们可以这样定义仿生学:它是研究生物系统的行为、结构、原理、性质以及相互作用,为工程技术提供新的思想观念、系统构成以及工作原理的科学。
二、基于生物原型的仿生学概念
产品形态仿生设计是运用模仿的手法,将生物的某些原型特征赋予产品形态之中,使产品形态与生物特征形态具有某种程度的相似性,而仿生设计成功与否的关键因素就是形态结构特征之间相似程度的大小。
产品仿生设计过程中,非常重要的一个环节是如何准确地提取生物原型的主要特征。阿恩海姆曾说过:意象越具体,它展示出的特征越多,观者也就越不容易明确究竟它的哪一种特征是主要的,事物所具有的最突出、最本质的结构特征就越难以突出和强调。
那么生物形态特征指的是什么呢?它包括生物体本身各个组成部分的形状、大小、相对位置、相互关系等一些构成要素,各要素之间的相对位置形成的一些关联(包含、相离、相交、相切等)、大小比例、距离、角度等关系。基于生物原型的仿生设计以蕴含于生物和自然中的特征或结构、形态为蓝本(如植物的茎、叶以及动物形体、肌肉、骨骼等方面),借助于现代技术手段,对其进行“形”或“神”的模仿,实现特定的技术功能或目标。
三、基于生物原型的仿生学在游艇设计中的研究
古代劳动人民通过对生活在水中的鱼类的模仿,伐木凿船,用木材做成了鱼形的船体,仿照鱼的鱼鳍和尾鳍制成双桨和单橹,从此开始了水上活动。随着模仿水平层次的提高,受更多类型动物(各种鱼类、鸟类等飞行动物)外形的影响,尤其是在空气动力学的发展形成以后,对流线型的动物形态的研究,使得水上交通工具,由之前的独木船发展成为各式各样的“船”,包括帆船、油轮、游艇、各种军用舰艇的外形,甚至是航母的形态,我们都能在他们的外形上发现某些动物形态的蛛丝马迹。在游艇设计的方法中,仿生设计是一种最常见的设计方法。无论在游艇的整体形态造型上还是在局部形态设计中,比如船头船尾、上层建筑等的一些细节设计,都采用了仿生设计的手法。
游艇是用于海上航行的工具,它一旦运行,其造型便是动态的形态,所以游艇的造型艺术不仅是单纯的用来美化和修饰它的轮廓,更多的时候我们关注的是它航行时候的富于流动感的形态意象,使它尽可能最大的与自然环境融合。因此要使游艇能最大程度的融于自然,使游艇的形态更具感染力和动态美,那么我们需要在游艇的造型中看到更多的自然界中这种流线型的柔和的形态特征,选取适合游艇设计的生物原型,并对生物原型的形态进行分析。这也是近期各大游艇品牌在设计船型的时候均采用更加贴近自然的仿生设计方法的原因。根据不同的产品,不同的设计师,进行形态仿生设计造型方法也不同,在此介绍两种比较常用于游艇设计的仿生设计造型手法。
(一)仿态设计
仿态设计又进一步分为局部法和整体法。局部法是选用生物形态特征中的某一部分、最具有特色的、能通过该部分的特点识别整个生物的特征,通过对该特征进行抽象、提炼、加工,使其特征更加突出简练、主次分明、具有代表性。在此基础上将局部形态特征运用于产品形态仿生。比如人造大鲸鱼电动仿生潜艇的仿生设计,潜艇的尾部与两翼的设计采用的是鲸鱼尾部与鳍部特征:突出其肥大的尾部,夸张的表现鳍部特征,表现出鲸鱼在游动时尾部与鳍的作用,使整个潜艇看上去有种灵动的生命感。局部法就是通过抓住局部特征的表现来强调整个生物的主要特点。
整体法与局部法不同的是,它是从全局出发,整体来考虑自然形态特征,对整个的形态做全面的观察,并进行分析。在此基础上对整个形态进行提炼与加工整合,从其外观整体形态中提炼出形态的本质特征,使整个形态特点更加突出、简练、准确。
如果说局部法一般用于动物局部静态的特征,那么整体法常用于模仿动物的运动时,整体特征所表现出的动态美、速度感和力量感。例如海里的各种鱼类,游泳的姿态是它们典型的特征,所以游艇设计时常提取其游泳时的动感特征线并加以提炼加工。
(二)隐喻抽象设计
隐喻抽象设计主要分为三类:由形到意的抽象方法、由意到形的隐喻方法、综合隐喻抽象方法。
自然形态具有丰富复杂的特征,其中一些特征不能很直观的发现、并且能被简单的表达。这种时候我们需要一些形象的表现手法来表达,这就是我们常用的隐喻的抽象法。隐喻抽象法要求形态不仅要准确、贴切,而且还要完整、明确、力求用最简洁的手法来予以表现。比如:象征、隐喻等。例如:通过一组形态线条粗细长短的改变来表示声音音量的变化、重复的图形表现节奏与韵律等,通过线条起伏、疏密、粗细的改变来表示生物形态变化的神韵。在使用该方法的时候一定要表现完整并且准确。
1.由形到意的抽象方法
在产品的仿生设计上,想要做到使用者与产品形态达成共鸣,需要使产品的形与仿生对象的意达到相互融合的程度,通过形的组成要素来表现出意的神韵。如圆形、圆弧形表现出一种规则、柔和的韵味,不规则的多边形则表现一种锐利、刚毅的意境。比如“海斧”游艇,在产品中,通过斧型的船头,设计师表达出的一种力量于速度的感觉,通过对这种形象的细致刻画来表达这种意境。
2.由意到形的隐喻方法
在进行产品仿生设计的时候,设计师以意境为出发点,借助形态来表达,创造出一个神似的仿生形来抽象隐喻。这就是由意到形的隐喻方法。比如Beluga超级游艇,Beluga这艘船的设计灵感是Puresang(来自安特卫普的设计师)从童话人物Pinnochio(匹诺曹)和MobyDick(莫比迪克)身上获得的,其天窗打开时形状就像鲸鱼的嘴。设计师以童话人物的意境为背景,通过游艇形态的仿生设计传达出对这两个人物的神韵,达到一个由意象到形态的升华。
3.综合隐喻抽象方法
综合隐喻抽象方法是仿生设计常用的方法,设计师在做设计的时候会根据需求的差异而是用不同的设计手法,单一的方法往往满足不了设计的需求。将设计师对产品的理解与仿生对象具有的寓意相结合来创造产品形态,即把生物本身寓意延伸扩展开来,同时也使设计师的理解创新提升到一个与自然和谐统一的高度,使两者相得益彰。
四、结语
生物的基本特征篇5
一、田间种植鉴定的合法性。
(一)、新品种的选育和审定及新品种的特征特性的鉴定,依法应在田间种植的条件下进行。
《种子法》规定:主要农作物或林木品种在推广前应当通过部级或者省级审定;应当审定的农作物或林木品种未经审定通过的,不得广告,不得经营、推广。《主要农作物品种审定办法》规定:申请审定的品种应当具备特异性、稳定性、一致性等条件;品种试验包括区域试验和生产试验,区域试验应当对品种的丰产性、适应性、抗逆性和品质等农艺性状进行鉴定;生产试验是在接近大田生产的条件下,对品种的丰产性、适应性、抗逆性等进一步验证,同时总结配套栽培技术。上述法规证明,主要农作物或林木的新品种必须在田间接近大田生产的条件下种植,进行区域试验、生产试验。新品种是在接近大田生产的条件下进行品种实验,是在田间对品种的丰产性、适应性、抗逆性、品质以及其特异性、稳定性、一致性等特征特性进行一系列的鉴定才选育出来的,而不是在实验室内用按电钮的方法电泳出来的。新品种的选育和审定必须在田间种植条件下进行,品种的鉴定也应在田间种植条件下进行。法规没有规定可用物理、化学的方法对植物新品种进行选育和鉴定。采用化学的方法提取植物蛋白质和氨基酸,采用物理的方法电解分离蛋白质,对比蛋白质分离图谱以鉴定植物新品种的特征特性的所谓电泳测定法,是没有法律依据的。
(二)、将植物在田间种植生长出的特征特性即表现型与审定公告公布的及品种权申请公告的新品种的特征特性相对照,鉴定两个品种是否具备同一性,符合法律规定。
《种子法》规定:通过审定的主要农作物或林木品种由审定部门公告。如“鲁白16号”大白菜杂交种是由山东省品审委审定公告的。山东省农作物品种审定委员会(97)鲁农审字第2号文件即关于公布第十九批审定认定品种的通知(即山东省品种审定公告),公告的内容是“鲁白16号”大白菜等作物品种的选育经过和特征特性,其选育经过是在田间进行的,其特征特性是在田间种植的情况下与对照品种进行比较表现出来的。将“鲁白16号”的被控侵权品种“丰抗78”进行田间种植,根据其种植后表现出的特征特性与相邻种植的和通知公告的“鲁白16号”的特征特性相对照,进行差异性遗传学分析,即可鉴定他们是否同一品种。
由于审定公告仅公告了“鲁白16号”的特征特性,没有公告“鲁白16号”的电泳分离图谱,所以,无法将“丰抗78”的电泳图谱与山东省品审委公告的“鲁白16号”的电泳图谱相对照。没有对照就没法鉴定。其它机构(包括鉴定机构)不是法定的品种审定机构,依其制作的电泳图谱作对照,没有法律依据。
(三)、新品种在田间种植条件下表现出的特征特性是品种权保护的范围,其电泳图谱不属品种权保护的范围。
《农业植物新品种保护公报》公告的申请品种权的说明书,其内容是育种过程和申请品种的育种方法及其主要特征特性等。其中的特征特性,特别是该品种的特异性主要是在田间种植条件下与对照品种相比较表现出来的,是经公告被公众知悉和认可的。《保护公报》没公告新品种的电泳图谱,其电泳图谱不为公众所知和认可,不是品种权保护的范围。
(四)、田间种植鉴定是法定的鉴定程序。
对被控侵权品种是否授权品种进行的鉴定,属于种子真实性鉴定。农作物种子真实性鉴定,应依据GB/T3543.5-1995进行。GB/T3543.5-1995规定,“种子真实性是指供检品种与文件记录是否相符。”田间小区种植鉴定是GB/T3543.5-1995规定的鉴定程序,而其开章明义地指出:“田间小区种植是鉴定品种真实性和测定品种纯度的最为可靠、准确的方法。”该标准未规定电泳法是测定植物品种真实性的程序,所以,应当采用国家标准GB/T3543.5-1995进行植物品种真实性鉴定。在有国家标准的情况下,不应采用不属国家标准的电泳法进行蛋白质测定。
二、田间种植鉴定的科学性。
(一)、依据遗传学理论,根据表现型判断的结果比较可靠。
一个植物品种的特征特性,是其内部基因(称为基因型)和外部环境条件共同作用下表现于外部的性状(称为表现型),即植物品种的特征特性是内因(基因)和外因(环境条件)共同作用的结果。一个植物品种有什么样的表现型必有什么样的基因型,但有什么样的基因型不一定就有什么的表现型。高产品种虽有高产基因,在肥水充足的良田虽表现高产,但在旱薄地不能高产;而低产品种无论在良田或旱薄地均不能高产,即是这个道理。
田间种植鉴定在鉴定外部性状的同时测定了其内在基因;而电泳法测定只能测定内部基因,不能测定作为品种权保护的特征特性等外部性状。田间种植鉴定依据的是植物品种表现出的特征特性,而电泳法测定依据的是种子籽粒分离出的蛋白质、氨基酸等生物大分子在电场影响下的移动。植物品种经种植表现出什么样的特征特性必有什么样的基因;而电泳分离出植物品种含有某种基因,在没有适宜的条件下,该种基因不会发生作用,表现不出性状。男人有长胡须的基因,但如认定没长胡须的小男孩是女人,将是幼稚可笑的。田间鉴定既鉴定了内因又鉴定了外因,能鉴定植物的特征特性;电泳测定仅能考查内因,不可能测定植物的特征特性;所以田间鉴定较电泳测定科学。
(二)、依据概率论理论,田间种植鉴定具有代表性。
1、样本的代表性。依据GB/T3543.2-1995(农作
物种子检验规程。扦样),大白菜种子田间种植鉴定送检样品最小重量是100克。由于没有电泳法测定大白菜种子真实性和纯度的法定标准,参照电泳法测定大麦、小麦种子纯度(注意:不是真实性)的国家标准,包括各种药剂、溶剂在内,样品吸取量也仅为10-20微升(UL)。不足20UL的液体与100克籽粒的代表性相比,谁大谁小不言自明。
由于电泳法测定取样太小,代表性太差,出现错将相同品种误定为不同品种或错将不同品种误定为相同品种的概率太大,所以,电泳法不如田间种植法科学。
2、差异性分析的准确性。田间种植鉴定种子的真实性,其鉴定结论是通过对调查数据进行统计分析后,根据其差异性大小判定是否具有同一性的。如果被控侵权品种与授权品种差异的概率小于或等于1%,证明其极可能是同一品种(概率论称为差异极不显著);如果概率小于或等于5%,证明其可能是同一品种(概率论称为差异不显著)。法院据此下判,判定其是同一品种的正确率就达95-99%以上,能达到高度盖然性的证明标准。
因为同一种作物不同的品种之间差异性很小,一个新品种能比对照品种增产5%或增加一个优良性状或淘汰一个不良性状就很好了;如果能增产10%或改进一个质量性状将是极好的品种。如“鲁白16号”比其对照品种“鲁白10号”在1995年增产仅为1.6%,其仍被审定为新品种。一个质量性状对应的往往是一个基因或几个基因,品种间一两个质量性状的差异或百分之一点多的数量性状的差异,靠几微升的溶液测定,并用其测定结果判决是非,风险性太大。所以,国家没有将电泳测定法列为品种真实性鉴定的方法,未制定其标准。
三、田间种植鉴定的可行性。
田间种植鉴定是小区鉴定,一般小区面积只有几平方米,用种量较少,国家保藏中心有足够数量的种子供鉴定所用。即使国家保藏中心保藏的授权品种的种子量不能满足田间种植鉴定用种,依据《植物新品种保护条例》实施细则的规定,品种权人也应提供鉴定所用的种子。作为品种权人,不可能提供不出供鉴定所用的种子。所以,田间种植鉴定是可行的。
四、对杂交种进行田间种植鉴定的特殊性。
对杂交种,品种权保护的范围是杂交种本身和其父、母本特定的杂交组合。这就是说,品种权既不保护杂交种的种子,也不保护其父本与母本反交产生的杂交种;还不保护其亲本本身;更不保护其亲本与其它繁殖材料杂交产生的杂交种即授权杂交种的同父异母兄弟、同母异父兄弟以及表兄弟、堂兄弟等。但是,授权杂交种的双亲均与授权杂交种有50%的核基因或性状一样;两亲本的反交杂交种,与授权杂交种的核基因100%一样,只有少量的细胞质基因不同,其性状相同处在98%以上;授权杂交种的亲本与其它繁殖材料杂交产生的杂交种,均是授权杂交种的同父异母或同母异父兄弟,应有50%以上的基因一样;授权杂交种的种子即F2,虽为分离世代,但仍有绝大多数与授权杂交种的基因和性状相同。总之,授权杂交种与其父、母以及同父异母兄弟或异父同母兄弟基因型和表现型差异很小,不进行田间种植鉴定,很难区分其差异性即特异性。
杂交种本身不具有稳定性。它不像常规品种能够“种瓜得瓜,种豆得豆”,其自身具有稳定性。杂交种的亲本是常规品系,其上下代之间性状遗传具有稳定性,这是杂交种稳定性的真正含义。杂交种的真实性鉴定要比常规种真实性鉴定复杂得多。
五、应用电泳法测定受限制。
目前,科学已测定清楚玉米、水稻、小麦的全部基因及其排序,并绘制了其基因图谱,所以,对玉米、水稻、小麦等已绘制基因图谱的作物,采用电泳法或其它方法测定其基因,用其基因图谱与标准基因图谱对照,可以测定其品种纯度。对于基因的排序未测定清楚,未绘制出基因图谱的农作物,无法采用电泳或DNA分析方法对其差异性进行测定。这也是我国法定检测机构承办用电泳法测定玉米种子纯度,而不承办用电泳法测定大白菜等杂交种的种子纯度的缘由所在。
六、关于鉴定机构、鉴定人员的资质问题。
生物的基本特征篇6
针对中国地鼠基因表达谱数据维数高和样本小的特点,提出一种基于支持向量机(SVM)的分类特征基因选取方法。该方法利用改进的Fisher判别(FDR)基因特征计分准则剔除分类无关基因,提出由空间距离和功能距离组成的新距离作为相似性度量的标准进行冗余基因的剔除,采用SVM作为分类器检验特征基因的分类性能。实验结果表明,该方法有效地剔除了分类无关基因和冗余基因,选取的特征基因满足对中国地鼠正确分类的最小基因数。
ス丶词:
特征选取;支持向量机;分类器;基因表达谱;中国地鼠
ブ型挤掷嗪牛TP391.4
文献标志码:A
英文标题
FeaturegeneselectionforChinesehamsterclassificationbasedonsupportvectormachine
び⑽淖髡呙
YANGJunli1,LIUTianfu2
び⑽牡刂(
1.DepartmentofComputerTeaching,ShanxiMedicalUniversity,TaiyuanShanxi030001,China;
2.LaboratoryAnimalCenter,ShanxiMedicalUniversity,TaiyuanShanxi030001,China
英文摘要
)
Abstract:
ConcerningthegeneexpressionprofileofChinesehamsterfeature,suchashighdimensionandsmallsample,amethodoffeatureselectionforChinesehamsterclassificationbasedonSupportVectorMachine(SVM)wasproposedinthispaper.ThemethodusedimprovedFDRgenefeaturescorecriteriontoremovethegenesirrelevanttotheclassification.Anewdistancecomposedbyspacedistanceandfunctiondistancewasproposedasthecriterionofcomparabilitytoremoveredundantgenes.ASVMwasusedasclassifiertovalidatetheclassificationperformanceofthefeaturegenesselected.Theexperimentalresultsshowthatthismethodeffectivelyremovestheirrelevantandredundantgenes,andselectedthefeaturegenesthatmeettheneedsofleastfeaturegeneswhichclassifyaccuratelyonChinesehamster.
英文关键词
Keywords:
featureselection;SupportVectorMachine(SVM);classifier;geneexpressionprofile;Chinesehamster
0引言
中国地鼠因其染色体大、条数少、易于识别等特点[1],广泛应用于细胞遗传学、辐射遗传学、实验肿瘤和分子生物学等众多领域,在医学和生物学实验研究中占有重要的地位。但由于中国地鼠的生物性状、基因组等基础资料报道甚少,国内对于中国地鼠的分类学研究尚处在形态学分类阶段[1]。随着基因表达谱技术的出现与不断发展,利用基因序列中的基因表达谱数据建立分类模型,已成为生物分类学研究的一种重要的分类方法。而分类特征基因的提取和选择方法又是建立分类模型的一个重要环节,直接影响着分类器的设计和性能。因此,如何选取生物序列中的特征基因,成为特征基因提取与生物分类器研究的核心内容。目前,常用的特征基因选取方法主要有因子分量分析、启发式搜索、支持向量机(SupportVectorMachine,SVM)、线性判别分析等,在实际应用中,也常将多种方法结合起来使用[2-6]。
中国地鼠的基因表达谱数据集具有高维数和小样本的特点,而高维数及其所包含的高噪声和信息冗余等因素会降低分类器的分类性能。本文针对中国地鼠基因表达谱数据的特点,设计了基于支持向量机的中国地鼠分类特征基因的选取方法。实验表明,该方法有效地剔除了分类无关基因和冗余基因,选取的特征基因对中国地鼠的分类结果与传统的形态分类结果一致,同时保证了对中国地鼠正确分类的最小基因数。
1特征基因的预选
1.1极端基因的过滤
极端基因是指偏离群体分布,具有过大的变异性表达异常的基因[2]。极端基因可以通过设置判别阈值进行识别,判别阈值根据整个基因表达数据的分布百分位点或一定的标准差范围来确定。
1.2冗余基因的预过滤
对于基因表达数据中的负值和极小值,由于没有生物意义,因此需要剔除。在计算基因表达数据的信号强度比率值时,如果参考样本信号强度很小,就可能造成单个异常大的峰数据,当参考样本信号强度很大时,又可能出现单个异常小的谷数据,通常这些数据由噪声引起,也需要剔除。最后就是对缺失数据的处理,可将缺失数据项的行向量或列向量直接去掉。
2基于改进的FDR特征基因选择
中国地鼠基因表达谱数据的每个样本中都记录了所有可测基因的表达水平,然而只有特征基因才包含样本的类别信息,大部分与样本类别无关的基因称为“无关基因”或“噪声基因”[3]。在衡量基因分类能力的问题上,Mika等人[4]提出了Fisher判别(FisherDiscriminantRatio,FDR)基因特征计分准则,即
FDR(gi)=(μ+i-μ-i)2(σ+i)2+(σ-i)2В1)
其中:μ+i表示基因gi在正类样本中的表达水平均值,μ-i表示基因gi在负类样本中的表达水平均值,σ+i表示基因gi在正类样本中的标准差,σ-i表示基因gi在负类样本中的标准差。由式(1)可知,如果基因gi在正类和负类中表达水平均值相同或相近,则被作为噪声基因剔除;如果该基因在两个类中的表达水平标准差差异较大时,说明它在标准差很小的类别中具有近似一致性的基因表达,则该基因很可能是此类别的特征基因[5]。因此,在衡量基因分类能力的问题上,还应该考虑基因表达水平分布方差不同对样本分类的贡献。为此本文将式(1)进行了修订,修订后的基因特征计分准则可表示为:
FDR(gi)=14(μ+i-μ-i)2(σ+i)2+(σ-i)2+12ln(σ+i)2+(σ-i)22σ+iσ-iВ2)
由式(2)知,修订后的基因特征计分准则由两部分组成:第一项体现了基因在两个类中分布均值的差异对样本分类的贡献;第二项体现了分布方差对样本分类的贡献。按照此记分准则对训练集中的每个基因进行计分,分值越大说明基因分类能力越强;然后按计算出的分值大小顺序对基因进行排序,并根据分类器的准确率选择前面一定数量的基因作为结果。
┑2期
杨俊丽等:基于支持向量机的中国地鼠分类特征基因选取
┆扑慊应用┑31卷
3冗余基因的剔除
基因之间存在着调控和相互作用的关系,这在基因表达谱中反映为不同基因在表达水平上存在着一定程度的相关性[6],即相似性。通过衡量基因之间的相似性,将相似基因中信息较少的基因去除,可有效地减少特征基因的数量。在实际应用中,常采用特征向量之间的距离作为相似性度量的标准。
本文在计算特征向量之间的距离时,将基因间的距离分为空间距离和功能距离两个部分,即
Е莫ij=δsij+δfijВ3)
其中:δsij为空间距离,δfij为功能距离。本文采用欧氏距离[7]计算特征向量间的空间距离,欧氏距离表示为
Е莫sij=∑dk=1(xik-xjk)2В4)
功能距离包括减少具有相同功能基因间的距离和增加不同功能间的距离,即:
Е莫fij=-FiFTj,i=j
1-FiFTj,其他В5)
如果基因i具有功能F或者功能未知,则Fi取值为1;否则取值为0。如果特征向量间的距离小于给定的阈值,就认为它们是共表达的,阈值根据分类器的准确率来确定。
4基于SVM的特征基因分类性能检验
本文采用支持向量机(SVM)作为分类器检验特征基因的分类能力。SVM是建立在统计学习理论基础上的一种机器学习算法[8],具有很强的泛化能力。SVM的优点是能够处理高维数据,分类精度高,且抗噪能力强[9]。因此,SVM在基因功能预测和基因分类方面非常有效。设训练样本个数为n,训练样本形式为{(x1,s1),(x2,s2),…,(xn,sn)},对于两类问题si∈{1,-1},xi∈{0,1}。对于多类问题可转化为两类问题处理。SVM的判别函数[10]表示为:
f(x)=sgn[∑Ni=1aisiK(x,xi)+b]В6)
其中:N为支持向量的个数,K(x,xi)为核函数。本文采用的核函数为径向基核函数(RadialBasisFunction,RBF)[11]。
K(x,xi)=exp(-x-xi2σ2)В7)
式(6)可表示为:
f(x)=sgn∑Ni=1aisiexp(-x-xi2σ2)+bВ8)
由于训练集中没有互相矛盾的样本点,因此该判别函数对训练集的准确率可达到100%,据此来确定错误惩罚常数CШ秃瞬问σ2。
5仿真实验
5.1实验数据描述
实验数据为山西医科大学实验动物中心饲养的中国地鼠近交系,它是我国目前唯一庞大的中国地鼠群体,已被英国收入“实验动物国际索引”[12]。“山医群体近交系中国地鼠”[1]分为A、E两家系,从A家系中随机抽取28个样本,其中包括18个训练样本和10个测试样本;从E家系中随机抽取22个样本,其中包括15个训练样本和7个测试样本。整个数据集的结构如表1所示。
表格(有表名)
表1训练样本和测试样本数
类别训练样本数测试样本数
A家系1810
E家系157
5.2实验结果与分析
对训练集样本进行特征基因预选后得到892个基因,利用改进的FDR计分准则计算其分类信息分值,具体分布情况如图1所示。
分区
图片
图1基因分类信息分值分布情况
由图1可知,分值越大,基因数量越小。按基因的分值分别选取分值高的前25个、50个和100个基因作为特征基因,然后将这些基因表达谱数据送入SVM分类器,进行分类能力的检验,实验结果如表2所示。
表格(有表名)
表2SVM分类器分类结果
特征基因数Cσ2ё既仿/%
1001B0000.02100.0
505000.02100.0
255000.0298.6
由表2可知,随着选取的特征基因数的减少,样本的准确率也随之下降。为了选择具有最小基因数并保持最高分类准确率的特征基因集,取C=500,σ2=0.02,选分值高的前50个基因作为特征基因,此时的分类准确率已达到100%,则该50个基因已经具备了完整的分类信息。接下来对这50个特征基因中可能存在的冗余基因进行剔除。本文采用空间距离和功能距离组成的新距离作为相似性度量的标准,当距离小于给定的阈值时,就认为它们是共表达的。图2给出了不同阈值对选择基因分类性能的影响。
图片
图2阈值对基因选择的影响
由图2可知,对于不同的基因数目g在阈值(│摹(0.8,0.9))的范围内基本都达到最高的准确率,这说明阈值过高或过低都不能得到最好的基因选择结果。当阈值δ=0.85时,得到对原始样本分类准确率保持100%的最小基因数,因此,去冗余分析后最终得到32个分类特征基因。
6结语
针对中国地鼠基因表达谱数据的特点,设计了一种分类特征基因选取的方法。该方法首先进行了特征基因的预选;然后利用改进的FDR基因特征计分准则对特征基因进行初选;最后采用由空间距离和功能距离组成的新距离作为相似性度量的标准进行冗余基因剔除。本文在特征基因选取的各阶段,均采用支持向量机作为分类器来检验选取的特征基因的分类能力,并以能正确分类作为标准选取最小特征基因数。实验表明,该方法选取的特征基因对中国地鼠的分类正确率达到100%,并满足了对中国地鼠正确分类的最小基因数。
げ慰嘉南:
[1]
宋国华,岳文斌,刘田福.中国地鼠线粒体Cytb基因测序及其分子进化[J].中国实验动物学报,2008,16(2):142-147.
[2]
VALENTINIG,DIETTERICHTG.BiasvarianceanalysisofsupportvectormachinesforthedevelopmentofSVMbasedensemblemethods[J].JournalofMachineLearningResearch,2004,5(12):725-775.
[3]
李颖新,阮晓钢.基于支持向量机的肿瘤亚型分类特征基因选取[J].计算机研究与发展,2005,42(10):1796-1801.
[4]
MIKAS,RATSCHG,WESTONJ,etal.Fisherdiscriminantanalysiswithkernels[C]//IEEESignalProcessingSocietyWorkshopofNeuralNetworksforSignalProcessingIX.Washington,DC:IEEEComputerSociety,1999:41-48.
[5]
李泽,包雷,黄英武,等.基于基因表达谱的肿瘤分型和特征基因的选取[J].生物物理学报,2002,18(4):413-417.
[6]
黄德双.基因表达谱数据挖掘方法研究[M].北京:科学出版社,2009.
[7]
RUIZA,LOPEZdeTERUELPE.Nonlinearkernelbasedstatisticalpatternanalysis[J].IEEETransactionsonNeuralNetworks,2001,12(1):16-32.
[8]
VAPNIKVN.Statisticallearningtheroy[M].NewYork:WileyInterscience,1998.
[9]
SOLLICHP.Bayesianmethodsforsupportvectormachines:Evidenceandpredictiveclassprobabilities[J].MachineLearning,2002,46(1-3):21-52.
[10]
KEERTHISS,SHEVADESK,BHATTACHARYYAC.Afastiterativenearestpointalgorithmforsupportvectormachineclassifierdesign[J].IEEETransactionsonNeuralNetworks,2000,11(1):124-136.
[11]
WILLIAMSONRC,SMOLAAJ,SCHOLKOPFB.Generalizationperformanceofregularizationnetworksandsupportvectormachinesviaentropynumbersofcompactoperators[J].IEEETransactionsonInformationTheory,2001,47(6):2516-2532.
-
护士节活动总结范文
有这样一个群体,她们用无微不至的护理换来了患者的康复,她们的工作平凡、枯燥、劳累,却无比神圣——她们被称为;白衣天使。以下是小编为大家整理的《护士节活动总结..
-
支教实习工作总结优选范文
听课学习、参与教研活动、看自习、批改作业等,真正感受如何作为一名一线教师。下面是由小编为大家整理的;支教实习工作总结优选范例,仅供参考,欢迎大家阅读。支教实习工作总结..
-
幼儿园食品安全工作总结范文大全
食品是维系生命健康持续的首需物资,食品安全是幼儿园安全工作的重中之重!七彩阳光幼儿园为了让孩子和家长朋友们更加了解和重视食品安全,在本周食品安全主题活动中,各教研组根据..
-
小学英语老师工作总结优选范文
英语老师坚持良好的阅读习惯,读有所思,思有所得,让我们一起走进他们的书香世界吧!下面是由小编为大家整理的;小学英语老师工作总结优选范例,仅供参考,欢迎大家阅读。小学英语老师..
-
医护人员医德医风工作总结优选范文
为深入贯彻落实;不忘初心、牢记使命主题教育,进一步改善医疗服务,加强行业作风整治,改善患者就医感受,提高患者满意度。下面是由小编为大家整理的;医护人员医德医风工作总结优选..
-
数学教师考核工作总结优选范文
为了及时了解新教师课堂的真实状态,帮助新教师更好的规范教学,尽快提高教学水平和技能。下面是由小编为大家整理的;数学教师考核工作总结优选范例,仅供参考,欢迎大家阅读。数学..
-
小学科学教学工作总结优选范文
以落实学共体理念、营造自主、合作、探究的课堂为抓手,以学教评一致性教学设计理论为依据,深入推进深度学习的高效课堂建设。下面是由小编为大家整理的;小学科学教学工作总结..
-
读后感作文范文怎么写(整理16篇)
15.读后感作文范文怎么写五今天,我读了一本好书,书的名字叫《一百个励志故事》。其中让我印象深刻的故事名叫《行行出状元》。这个故事主要写的是一个人,经过努力考上了状元,他..
-
大学生贫困生补助标准(6篇)
大学生贫困生补助标准篇1“1份关爱”:疾病是导致群众贫困的一个主要原因。据调查,南丰县因病致贫的贫困户有5950人,几乎达到建档立卡
-
农村文化建设调研(6篇)
农村文化建设调研篇1一、农村文化发展基本情况农村文化建设包括农村文明建设、农民思想道德素质提高、农村文化基础设施建设、文