您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页一种新的不一致决策表属性约简算法

一种新的不一致决策表属性约简算法

来源:爱go旅游网
维普资讯 http://www.cqvip.com 第28卷第2期 2008年2月 文章编号:1001—9081(2008)02—0525—03 一计算机应用 Computer Applications Vo1.28 No.2 Feb.20o8 种新的不一致决策表属性约简算法 汪小燕,杨思春 (安徽工业大学计算机学院,安徽马鞍山243002) (wxy ̄x@ahut.edu.cn) 摘要:针对目前求核方法存在的问题,提出一种基于分布函数的用于计算核属性的改进的二进制可辨矩阵。 改进的二进制可辨矩阵不仅规模小,而且适用于任何决策表求核。在获取核属性的基础上,提出一种新的不一致决 策表的属性约简算法,只要在用于计算核属性的改进的二进制可辨矩阵中简单增加相应的行,就可以利用逻辑运算 来获取属性约简。并将吸收律应用于属性约简,较大提高了属性约简的效率。 关键词:粗糙集;不一致决策表;二进制可辨矩阵;核;属性约简 中图分类号:TP301 文献标志码:A New algorithm for attribute reduction in inconsistent decision tables WANG Xiao—yan.YANG Si—chun (School of Computer Science,Anhui Univemi ̄of Technology,Ma anshan Anhui 243002,China) Abstract:In order to correct some problems of computing the core of a decision table,an improved binary discernable matix defrinition based on distibutiron function for computing the core was put forward in this paper.The improved binary discernable matix irs not only small in scale but also suitable for any decision tblaes for computing the core.A new algorithm or atftribute reduction in inconsistent decision tblaes was also presented based on getting the core.Only increasing appropriate rows in the improved binary discernable matrix for computing the core,attribution reduction will be obtained by utilizing logic operation.And the absorptive law Was used in attribution reduction,which raised the eficifency of attibute reductiron greatly. Key words:rough set;inconsistent decision tables;binary discernable matrix;core;attirbution reduction 0 引言 粗糙集理论是由文献[1]提出的处理不确定、不精确和 不完全数据的一种新的数学工具,主要用于知识的简化及知 识依赖性的分析。粗糙集的主要思想是,在保持信息系统分 类能力不变的前提下,通过属性约简,导出问题的决策或分类 规则。属性约简是粗糙集挖掘知识的核心内容之一,它通过 对决策表进行压缩,以最少的条件属性来表达原决策表的全 部信息。在属性约简算法中,搜索一个属性约简集通常是从 核开始的。因此,求核运算成了属性约简的关键步骤。文献 是一个信息函数,它指定U中每一个对象 的属性值。 r( )是对象 在属性r上的值,D( )是记录 在D上的值。 定义2 令S=(U,R=C u D,vJ)是一个信息系统, — [2—4]对核属性的计算都进行了专门的研究。但存在的不 足要么是求核属性的算法只适合一致性决策表,要么是算法 的时间和空间复杂度不理想。本文结合分布函数的定义,提 出一种改进的二进制可辨矩阵及其核属性计算方法,该矩阵 不仅规模小,而且实现简单,适用于任何决策表(一致与不一 致决策表)求核。改进的二进制可辨矩阵不能直接用于属性 约简,本文在获取核属性的基础上,提出一种新的不一致决策 表的属性约简算法,只要在改进的二进制可辨矩阵中简单增 加相应的行,就可以利用逻辑运算来获取属性约简。为简化 对任意P C或P D,关于属性子集P的二元关系 称为 不可分辨关系,定义: R ={( 。, ,) ,P)=,( ,,P),Vp∈P}。 不可分辨关系 是U上的等价关系,它构成对U的划分 i己为:U/RP={[ ]P I ∈U}。 定义3 令S=(U,R:C u D,vJ)是一个信息系统, 对任意口∈C,若POSc I(D)=POSc(D),称口在C中是不 必要的,否则。在C中是必要的。C的所有必要属性组成的集 合称为C的核,记为CORE(C)。 定义4 令S:(U,R=C u D,vJ)是一个信息系统, 若 。,则称决策表是一致的,否则称决策表是不一致 的。 逻辑运算,提高属性约简的效率,新算法将命题演算中的吸收 律应用于消除冗余的析取式,最后通过实例验证了该算法。 定义5 令S=(U,R=C u D,vJ)是一个信息系 统, C,U/R。={D ,D:,…,D },分布函数 ( )= {D(DI/ ]/[ ),D(D:/[ ] ),…,D(D / ] ), ∈U} 其中D(D / ] )=I D。n[ ] f/l[ ] I,显然 ( ) 是U/R。上的概率分布。 定理1|6 对属性o∈C,o是不可缺少的,当且仅当存在 ∈c (i∈[1,k])时,使得下列条件之一成立: 1)存在 ∈[1,k]且 ≠i,使得[ ]c_】口}n ≠ ; 2)[ ]C-{al n(U— )≠ 。 1 相关理论 定义1 令S=(U,R, )是一个信息系统,U为论域 且U={ , :,…, },R=C u D是属性集合,子集C和D 分别是条件属性集和决策属性集,V=u Vr是属性值的集 2 改进的二进制可辨矩阵及求核方法 定义6决策表 相应的二进制可辨矩阵M 构造如下: 合, 表示属性r∈R的属性值范围,即属性r的值域f:U× 收稿日期:2007—09—03;修回日期:2007—12—06。 基金项目:安徽省教育厅自然科学基金资助项目(KJ2007B245)。 作者简介:汪小燕(1974一),女,安徽桐城人,讲师,硕士,主要研究方向:数据挖掘,粗糙集理论;杨思春(1970一),安徽六安人,男,副教 授,主要研究方向:自然语言处理、自动问答和信息检索、数据挖掘。 维普资讯 http://www.cqvip.com 526 计算机应用 第28卷 矩阵M 的每一列对应一个条件属性,共有m列(m为条件属 D ,A 1,A, 1,因此m ((i, ), ):1。若条件(2)成 性韵个数)。每一行对应论域中的一个对象对( , ,),且 立,则存在A ,使得任意n∈C一{c },有 (A ,n)= d( )≠d( ,),M 至多有n(n一1)/2行(n为决策表中实例 (A ,口)且 (A ,c )≠ (A ,c ),由于A D ,A 为不一致 个数),矩阵元素为: 当 ,c )≠ ,,c )时, 对象类,故(A ,)∈D ,其中A 1,A ,因此 m((i, ), )=1,否则,m((i,J), )=0。 文献[7]中提出利用定义6中的二进制可辨矩阵来计算 mI*((i,J), )=1。所以CORE(C) SM(C)。 故SM(C)=CORE(C)得证。 核的方法。但是,由于存在不一致对象的比较会导致核属性计 实例1 表1为某一决策表,其中条件属性集C={c., 算的错误。为了能改进定义6中的二进制可辨矩阵对计算不 c ,c },决策属性集D={df。 一致决策表的核属性的不足,同时又能比定义6中的二进制 可辨矩阵的规模小,本文提出一种新的用于求核的改进的二 表1决策表 进制可辨矩阵M 。 定义7 令S=(U,R=C u D,v,f)是一个信息系统, U/Rc={Al,A2,…,A },U/R。={D ,D2,…,D },记D = {[ ] ,[y] :IX ( )≠ (y)},用 (A )表示属性c 关于A 的取值。定义二进制可辨矩阵M ={m ((i, ), )}为:矩 阵M 的每一列对应一个条件属性,每一行对应条件属性等 价类的一个对象对(A ,A,),矩阵中元素取值表示如下: M1"((i, ), )= r1, (A )≠ (A,),(A ,Aj)∈D , l A U1,Aj U1或A, I22 1 0, (A )= (A,),(A ,A,)∈D , L A 1,A. 1或A, 其中:U1=U ,/72=U—UI。 i=1 ㈤麓 性质1 令S=(U,R=C tJ D,v,f)是一个信息系统, U/Rc={Al,A2,…,A },U/R。={Dl,D2,…,D },记D = 3 新的属性约简算法 {[ ] ,[y] : ( )≠ (y)},若A 1,A, U1(i≠ ) 且A 和A,属于不同的决策类,则(A ,A )∈D ;若A 1, 定义7所定义的二进制可辨矩阵肘 ,不包含对象对(A , A, U2(i≠ ),则(A ,Aj)∈D 。 A,)((A ,A,)∈D 且A ,A (i≠ ))所在的行, 证明 由分布函数的定义可证。 所以一般用于决策表计算核属性,不能直接用于决策表属性 实际上,利用定义7建立二进制可辨矩阵时,不需要计算 约简。故提出另外一种改进的二进制可辨矩阵M ,使得该矩 每个实例对象的分布函数,根据性质1就可以判断:(A ,A ) 阵能用于不一致决策表属性约简。 ∈D 是否成立,这样可有效降低改进的二进制可辨矩阵的 定义8 令S=(U,R=C U D,v,f)是一个信息系统, 计算复杂度。 U/R ={Al,A2,…,A },U/R。={Dl,D2,…,D },记D’= 定理2 令S=(U,R=C U D, )是一个信息系统, {[ ] ,[y] :IX ( )≠ (y)f,用 (A )表示属性c 关于A 对于其改进的二进制可辨矩阵M ,若某一行中只有一个元 的取值。定义二进制可辨矩阵M ={m2 ((i, ), )}为:矩 素为1,其他为0,则称元素1所在列对应的条件属性为特征属 阵M 的每一列对应一个条件属性,每一行对应条件属性等 性。若记SM(C)={所有特征属性的集合},则有SM(C)= 价类的一个对象对(A ,A,),矩阵中元素取值表示如下: CORE(C)。 。,,. 、,、 f1, (A )≠ (A,) (A ,A,)∈D 证明 设U/R。:{Dl,D2,…,D },U/Rc:{Al,A2,…, 。  。L0, (A )= (Aj),(A。,Aj)∈D A }。若任意c ∈SM(C),则存在ml*((i, ), )=1,即对任 实际上,当决策表为一致时,利用定义8所建立的二进制 意口∈C一{c },有 (A ,口)= (Aj,口)。 ∈A , ∈A ,由 可辨矩阵等价于文献[2]提出的二进制可辨矩阵。 定义7知:A 1,设 ∈co (P∈[1, ]), ∈[ ]c, 隹 性质2 在二进制可辨矩阵M 中增加对象对(A , [ ]c,但 ,∈[ ]c_Ic }。若 ,∈U1,由(A ,A,)∈D 知: A )((A ,A,)∈D 且A ,A, /J2(i≠ ))所在的行,所 ,D)≠ ,,D),存在q[1, ]且q≠P,使得 ∈co ,则 [ ] …n cD。≠ 成立,由定理1知,c 是不可缺少的,即 得到的矩阵等价于 。 c ∈CORE(C)。若 ,∈ ,则[ c }n ≠ 成立,由定 证明 由定义7和定义8可证。 理1知,c 是不可缺少的,即c ∈CORE(C),则SM(C) 根据性质2,在对不一致决策表进行属性约简时,不需要 CORE(C)。 按照定义8重新建立二进制可辨矩阵Jljf ,只要在用于求核的 若任意c ∈CORE(C),由定理1知:存在 ∈c二进制可辨矩阵M 中增加相应的行就可以了。 o (i∈ [1,七])使得下列条件之一成立: 性质3 当决策表中只有一个不一致等价类或者所有不 一1)存在 ∈[1, ]且 ≠i,使得[ ] _】Ⅱ}n D,≠ ; 致等价类中对象的分布函数都相等,则根据二进制可辨矩 阵M 计算出的属性约简就是该决策表的属性约简。 2)[ ]C-l al n(U— )≠ 。 证明 当决策表中只有一个不一致等价类或者所有不 若条件1成立,则存在A。 Di,A D,,使得任意n∈ 一致等价类中对象的分布函数都相等时,二进制可辨矩阵 C一{c },有 (A ,n)= (A ,n)且 (A ,c )≠ ( ,c ), M 和M 是等价的,根据M 计算出的属性约简就是该决策 由于 D ,A, D,,故 (A ,D)≠ (A,,D),则( ,A,)∈ 表的属性约简。 维普资讯 http://www.cqvip.com 第2期 汪小燕等:一种新的不一致决策表属性约简算法 527 用于不一致决策表属性约简的新算法思想如下:利用二 进制可辨矩阵M=:l计算出核属性,再在矩阵M=:l中增加对象 对(A ,A,)((A。,Ai)∈D 且Al ,A /52(i≠ ))所在 的行对应-'C.V c3,c.包含于c.V c3中,故删除c V c3,则该 决策表的属性约简为{C ,C:}。 的行形成矩阵M 。最后利用矩阵M 进行属性约简。 算法步骤描述如下: 1)为决策表建立二进制可辨矩阵M ,计算出核属性。 2)在矩阵M 中增加对象对(A。,Ai)((A。,Aj)∈D 且 4 结语 针对目前大量存在的不一致决策表,结合分布函数的定 义,提出一种用于求核的改进的二进制可辨矩阵,该矩阵不仅 规模小,而且实现简单,适用于任何决策表求核。并通过理论 和实例证明了求核方法的正确性。用于求核的改进的二进制 可辨矩阵不能直接应用于属性约简,本文在该矩阵的基础上, 通过增加分布函数不相等的不一致对象类所对应的行形成新 的矩阵,利用新矩阵,在获取核属性的基础上,提出一种新的 A ,A U2(i≠ ))所在的行形成矩阵M 。若核属性 为空,则转第4步。 3)消除矩阵M 中所有包含核属性的行。 4)将矩阵M 中余下的各行表达成析取式,依次检查每 个析取式是否包含于其他的析取式中,将所有包含该析取 式的其他的析取式删除。 5)将剩下的析取式进行合取运算,得一合取范式,再将 一不一致决策表的属性约简算法,并将吸收律应用于属性约简, 大大提高了属性约简的效率。如何将用于属性约简的新矩阵 应用于不一致决策表增量式属性约简,将另文介绍。 参考文献: [1】PAWLAK Z.Vagueness and uncertainty:a rough set prospective[J】. International Journal of Computer Interlligence,1995,1 1(2):37— 41. 合取范式转换为析取范式,若核属性不为空,则析取范式中的 每一个合取项加上核属性为一个属性约简;否则析取范式中 的每一个合取项就是一个属性约简。 实例2 对表1中的决策表进行属性约简。 [2】HU X H,CERCONE N.Learning in relational databases:a rough set approach[J】.Computational Intelligence,1995,11(2):323—337. 按照算法在矩阵M 中增加(A.,A:)和(A.,A,)对象对 所在的行建立的矩阵M 如下: CI —C2 C3 [3】 叶东毅,陈昭炯.一个新的差别矩阵及其求核算法[J】.电子学 报,2002,30(7):1086—1088. 0 1 0 A4,Al 1 1 0 A4,A2 1 1 1 A4,A3 1 0 0 Al’A2 —1 O 1 l, 3 由实例1计算得表1的核属性CORE(C)={C },新增加 的对象对(A.,A:)所在的行对应-'C ,而对象对(A ,A,)所在 (上接第524页) [4】 赵军,王国胤,吴中福,等.一种高效的属性核计算方法[J】.小型 微型计算机系统,2003,24(11):1950—1953. [5】 张文修,米据生,吴伟志.不协调目标信息系统的知识约简[J】. 计算机学报,2002,26(1):12—18. [6】 杨明,孙志挥.改进的差别矩阵及其求核方法[J】.复旦学报:自 然科学版,2004,43(5):865—868. [7】 支天云,苗夺谦.二进制可辨矩阵的变换及高效属性约简算法的 构造[J】.计算机科学,2002,29(2):140—142. , 通过线程及Java 3D 对动画效果、交互式操作、形体组合、 复杂的应用程序的支持等来实现仿真(模型显示于界面右 部),并可通过按钮和菜单对仿真的过程进行控制。图6为系 统运行实例。 参考文献: [I】 任松涛.NC代码编译器的设计与实现[D】.西安:西北工业大 学,2007. [2】LEEW B,GAO D,LI J G.An NCtool pathtranslatorfor vitrualma- chining of precision optical products[J】.Journal of Materilsa Pro— cessing Technology,2003,140(1/3):21 1—216. [3】LIU Y,GUO X,LI W,et a1.An intelligent NC program processor for CNC system of machine tool[J】.Robotics and Computer-Integrated Manufacturing,2007,23(2):160—169. [4】 杨旭东,廖文和.仿真系统中通用NC代码处理技术的研究[J】. 机械制造与自动化,2003(1):49—51. [5】 金龙飞,刘磊.编译器前端构造工具及JLUCC的实现[J】.吉林 大学学报:信息科学版,2005(4):429—435. [6】PARR T.ANTLR reference manual[EB/OL】.[2007一O7一O8】.ht- (a)实例1 (b)实例2 tp://www.antlr.org/doc/glossary.htm1. 图6系统加工仿真实例 [7] 许宇胜,杨文通,王蕾,等.一个NC代码翻译模块的设计与开 发[J].机床与液压,2005(7):55—56. [8] 南雁.基于虚拟数控加工的NC代码翻译[D].西安:西北工业 大学,20o5. 4 结话 ●t、一 在分析NC代码组成及特点基础上,通过EBNF定义了 NC程序的语法规则,并使用Antlr技术快速构建编译器框架。 采用Java语言,在Eclipse开发平台上通过插件的辅助,简单 高效地开发了一个NC编译器原型系统。以FANUC规范NC 程序作为输入对其进行测试,试验结果表明:该NC代码编译 器具有匹配速度快、精度高、通用性和兼容性好的特性;可以 准确地对NC程序进行翻译;通过扩展EBNF定义的NC程序 语法规则增强了系统的可扩展性,采用模块化的设计以接口 的方式提供各种功能有利于系统的维护和二次开发。 [9]葛研军.数控加工关键技术与应用[M].北京:科学出版社, 20o5:229—248. [10]GUO DE—GUI,WANG SHENG-JUN.Precedence grammar and its transformation[C]//Software Engineering Research,Management and Applications.Los Angeles:IEEE Press,2006:171—176. [1 1]沙智华,张生芳,葛研军,等.通用数控代码编译系统研究与 实现[J].中国机械工程,2003,(9):763—766. [12]梁宏宝,杨胡坤,刘丽娜,等.虚拟加工中NC代码转化技术研 究[J].计算机仿真,2004,21(11):219—222. [13]何同林,张绪冰.基于Java3D三维虚拟场景的研究【J1.计算机 应用,2007,27(6):291—292. 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务