Computer Engineering and Applications计算机工程与应用 最小描述的多粒度覆盖粗糙集模型 黄婧,李进金 HUANG Jing,LI Jinjin 漳州师范学院数学与信息科学系,福建漳州363000 Department of Mathematic and Information Science,Zhangzhou Normal University,Zhangzhou,Fujian 363000,China HUANG Jing,LI Jinjin.Covering rough sets model based on multi—granulation of minimal description.Computer Engi— neering and Applications,2013,49(9):134-139. Abstract:In the covering generalized rough set theory,the original minimum description is primarily concerned with a single granulation.This paper first extends a single granulation to multi—granulation about the minimum description.A multi—granulariy tcovering rough set model is established.Based on this minimum description,two different types of upper and lower approxima- tion operators are proposed.Their corresponding properties are studied and a new algorithm for attribute reduction is given. Key words:covering generalized rough sets;minimal description;multi—granulation;approximation operators;attribute reduction 摘要:在覆盖广义粗糙集理论中,对最小描述的定义是建立在单一粒度基础上。将最小描述从单一粒度推广到多个粒 度,建立了多粒度覆盖粗糙集模型。在此基础上,用最小描述建立了两类不同的上下近似算子,研究其性质,给出了一种 基于最小描述下求属性约简的新算法。 关键词:覆盖广义粗糙集;最小描述;多粒度;近似算子;属性约简 文献标志码:A 中图分类号:TP18 doi:10.3778/j.issn.1002-8331.1109—0608 1 引言 粗糙集理论最早是由波兰的z.Pawlak于20世纪80年 代提出的。近年来,该理论在知识发现、数据挖掘、模式识 别等领域得到广泛应用,人们对Pawlak粗糙集理论又进行 了多种推广。如将经典粗糙集推广为覆盖广义粗糙集 , 给出了区别于经典粗糙集的一些性质以及粗糙集的公理 的;(2)两个粒度P 与Q 之间可以进行交运算;(3)目标概 念通过商集 /f尸UQ)进行近似描述。但是,在一般情况 , 、 下,这个假设不能满足实际问题,钱在文献[2]中给予了说明。 覆盖广义粗糙集理论作为经典粗糙集理论的一种推 广,它是把经典粗糙集理论中的划分推广到覆盖。在覆盖 粗糙集理论中,近似算子是其研究的核心内容之一,而最 小描述对于近似算子的定义又有着重要的作用。所以,对 覆盖粗糙集理论中最小描述的讨论是有着十分重要的意 义。本文将覆盖广义粗糙集中的最小描述,从单一粒度推 广到多个粒度,建立了多粒度粗糙集模型,讨论了两种不 同类型的上、下近似算子及其性质。粗糙集理论有多方面 的应用,其中一个应用是通过上、下近似算子获得属性约 简及其规则提取。本文根据不完备信息系统中的多粒度 粗糙集 ,给出了基于最小描述下多粒度近似算子的属性 约简。 化体系;将经典粗糙集理论中单一粒度推广到多粒度,由 此提出了多粒度算子及其相应的性质,并且给出了多粒度 下的几类测度 。 ;从拓扑学的角度对粗糙集理论进行深入 的研究,将粗糙集理论与拓扑学理论有机结合起来 ;许 多学者还将粗糙集和模糊集这两种理论创造性地结合在 一起 ・ “,提出了粗糙模糊集和模糊粗糙集理论等。 在粒计算过程中,对于一个信息系统,由等价关系(或 相容关系)导出的一个等价类,称为一个粒子。经典粗糙 集是在等价关系基础上,导出的一个等价类的集合,因此, 经典粗糙集理论是建立在单一粒度下。钱和粱将Pawlak 粗糙集模型中单一粒度推广到多粒度粗糙集模型,并且对 这类推广给出了3种假设:(1)任何两个属性必须是 摹金项日:国家自然科学基金(No.10971186)。 2粗糙集理论的基本概念 设 是一个论域,C是 的一个覆盖,由C诱导的一 作者简介:黄婧(1986一),女,硕士研究生,研究方向:粗糙集理论、粒计算;李进金(1960一),男,教授,博士生导师,研究方向:不确定理论 及其应用。E—mail:huangjing6658@163.corn.cn 收稿日期:2011.09.30 修回日期:2011-11-30 文章编号:1002—8331(2013)09—0134—06 CNKI出版日期:2012一叭一16 http://www.cnki.net/kcms/detail/11.2127.TP.20120116.0926.001.html 黄婧,李进金:最小描述的多粒度覆盖粗糙集模型 2013,49(9) 135 对覆盖近似算子 : (2)对任一 ∈PU Q( ),由上近似定义可得 P【J。( )n ( )={ ∈UIVK∈C, ∈K ̄KGX} x.o,因为 UQ x)-=-G(x)n ( ),对任一 ∈U,所以 e(x)=u{ ∈CIKNX ̄ } Ke x)n )n ≠ ,因此 e ),即 ( ) 若c是(,的一个划分,则广义覆盖粗糙集理论就退化为经 PUo(x)。由(1)可得,P+Q( ) PUQ(X)。 典粗糙集理论。 (3)因Bnp+a( ):P+Q( )一 ( ),BneuQ( )= 定义11”设(U,C,F)是一个覆盖近似空间,对任一 ∈U: 尸uQ( )一 ( ),且由(2)可得Bne+o( )DB. ̄oo( )。 Md(x)={K∈C[x∈ ^(VS∈C^x∈SASGK ̄K=S)} 定理2设u是一个论域,c是c,的一个覆盖族,对任 一称为x的最小描述。 xGu,P,O∈c,下面的性质成立: 定义2设 是一个论域,c是 的一个覆盖族,对任 (1)P+Q(X) ( ) ——x∈U,P,Q∈C: (2) ( ):P+Q( )= , ( )=P+Q(U)=U K,uQ={P(x)N Q(x)IP(x)∈AMd,( ),Q( )∈AMd口( )} (3) ( )=户( )n ( ),P+Q( )=e(x)uQ( ) 则 关于属性集P,a的上、下近似、边界分别定义为: (4) ( )= ( ),P+Q(X)=Q+P(X) PUQ(X)= uo( )NX≠ } 证明(1)假设x萑 ( ),则存在K∈Md x),使 得 n ≠ ,从而KG ,即K ,因为x∈K,所以 ( )= uQ( )cx} XG ( ),由此 ( ),又因为 ( ): B , 。( )= ( )一 ( ) ~P+Q(-x),所以尸+Q(x)cx,由此可得P+o(x) xc_ ( )。 3最小描述的二粒度覆盖粗糙集 (2)根据定义4,性质成立。 定义3设c厂是一个论域,C是 的一个覆盖族,对任 (3)若 ∈ ( ),则任一K∈Md ( ),使得KAX ̄ , —x∈U,P。O∈c: 因KG x)NK口(x),有KcKp x),且KGKp x),使得 Md (x)={ ( )NKQ( )I ∈Mdp(x),Ko∈MdQ( )} KNX ̄ 。所以存在KG x),使得KOX ̄- ,且存在 称为P,Q下 的最小描述。 KGKe x),使得 n ≠ ,故有K∈户(x)且 ∈O(x),所 定义4设c,是一个论域,C是 的一个覆盖族,对任 以Ke户( )n ( ),即 ( ) 户( )NO(x),反之亦 一XG U,P,Q∈C,则 关于属性集P和Q的上、下近 胜。根据 ( )=~尸+Q(— ),。可得尸+Q(x)= ( )u 似、边界分别定义为: Q(X)。 ( )= VK∈Md ( ),KnX ̄ } (4)根据上、下近似的定义可得,性质成立。 ( ):~尸+Q( ) 定理3设u是一个论域,c是 的一个覆盖族,对任 一B ( )=P+Q( )一 ( ) x,YGu,P,Q∈c,下面的性质成立: 可以验证,当c是 上的划分且P=Q时,定义4中的 (1)如果 Y,则 ( ) (y),P+o(x) 上、下近似算子退化为经典粗糙集中的上、下近似算子。 P+off1。 例1设 ={1,2,3,4,5},c={P,Q}是 的一个覆盖 (2) (xuY P+Q( )U (】,), 族,其中P={{1,2},{2,3,4),{4,5)},Q={{1,2,3},{3,4},{5)}, P+Q(XA Y ( )n (y)。 令 ={1,2,5),则K川Q:{{l,2),{2),{3)’{4),{5))。Md (1)= (3) (xnY ( )n (y), {{1,2”,Md (2)={{l,2),{2,3)),Md (3)={{2,3),{3,4)},Md (4)= ( uy 尸_ ( )U尸_ Q(y)。 {{4)},Md (5)={{5)}o ( )={1,2,3,5 —P+—Q(X)={1,5), 证明(1)若x∈ ( ),则任一K Md x),使得 PUo(x)={1,2,5),PUQ(X)={1,2,5)。 n ≠ 。因为Xc_Y,存在K∈Md’x1,有KN l,≠ , 下面讨论定义4中的上下近似的一些性质。 所以x∈ (y),由此可得 ( ) (y)。根据 定理1设 是一个论域,c是 的一个覆盖族,对任 对偶性,可得P+O(X) P+Q(Y)。 一XGU,P,Q∈C,下面的性质成立: (2)若x ( )U (y),得x∈ ( )或 (1) ( )=~P+Q( ),—PU—Q(X)=~PUQ(-X) x∈ (】,),根据上近似定义,任一K∈Md x),使得 (2)P+-o(x) PuO(x),P+Q(X) PUO(x) n ≠ 或 ny≠ ,因为 nfxUY)=fKAX1U (3)Bnp+Q( ) B , 。( ) (KNY)≠ ,所以 ∈ (xuY),由此可得 ( )u 证明由定义2.4,可得(1)。 (】,) (xuy)。又因为 ( )=~P十Q(-X), 136 2013,49(9) ComputerEngineeringandApplications计算机工程与应用 可得P+Q(XN Y) P+O(x)N P+Q(Y)。 (3)若x∈ (xn】,1,任一K∈Md x),使得KN ( )且x∈ (y), x一皇 ( ) 曰 ( )。即(X一皇 ( ))u皇 ( ) B ( )u皇 ( ),又因为( 一皇 ( ))u皇 ( )= 所以XG户+O(x)。综上户+O(x) (3)根据定义5,性质成立。 (XNY)≠ ,因为KN(XN】,)=(KNX)N( nY)≠ ,所 以 n ≠ 且KN】厂≠ ,故x∈ ( )n (y)。又因为 户+O(x)。 ,由于 即 ∈P+Q(X)N尸+Q(Y),由此可得 (xn Y1 ( )=~P+Q( ),得 (4)若x∈户+O(x),有K (x) 或K (x) x ( )或 P+Q(XUY) P+Q(X)UP+Q(Y)。 下面介绍另一种最小描述的二粒度覆盖粗糙集。 ( ),故x PAx)u ( ),即户+O(x) 曼( )U ( ),反之亦或立。所以 +O(x)=至( )uO(x)。 (5)根据上、下近似的定义可得,性质成立。 定义5设u是一个论域,c是u的一个覆盖族,对任 一xG u,Ji弓, ∈c,则x关于属性集j备和 的下、上近 似、边界分别定义为: ( )= Kp(x)_cX ̄K (x) } X = ~皇 ( ), ( )=U{Md ( ) ∈X } 声+O(x)=户+O(x)UB一( ) 可以验证,当户= 时,定义5中的上、下近似算子退 化为覆盖粗糙集中的上、下近似算子及边界” 。 例2设 ={I,2,3,4,5},c={户,0}是U的一个覆盖 族,其中户={{1,2},{2,3,4,5},{4,5}}, ={{1,2,3), {2,3,4,5),{5}}'令 ={2,3,5},则Kpu ={{l,2),{2},{2,3}, {4,5},{5}}。Md’(1)= 2}),Md (2)={{2}}jMd (3)={{2,3}}, Md (4)={{4,5 Md (5):{{5))。丛 ( )={2,3,5), ̄uO(x)= {l,2,3,4,5};户+O(x)={5},户+O(x)={2,3,5}。 下面讨论定义5中的上下近似的一些性质。 定理4设u是一个论域,c是u的一个覆盖族,对任 一XG U,户, ∈C,具有下列性质: (1)户+O(X) PUO(X) . (2)户+O(X)c—X—c户+O(x) (3)户+O(o)=户+ ( ): ,户+O(v)=户+O(u)=u (4)户+O(x)= ( )u ( ) (5)户+O(x)=O+P(x),户+O(x)=O+P(x) (6)户+ (户+ ( )1=户+ ( ), 两(两( ))=两( ) 证明(1)若 皇 ( ),有 x)GX或K0( ) 当Kp x)GX时,因为Kpu x)GKp( ),所以Kpu x) 即 ∈皇 ( ),当K ( )c_X时,因为K;,u0(x)GK ( ), 所以KpuO( ) ,即 ( ),由此得皇 ( ) ( )。 (2)若 ∈户+O(x),有Kp x)GX或K x)GX。由 于x∈K x) 或 ∈KD(x) ,故P+O(x)Gx。因 ——为B +。( )=U{Md (x) }, =X一皇 ( ),所以 (6)由声+O(x) 故Jl弓+ (户+ ( )) 户+ ( )。 没 萑 ( ( )),则 ( )且 皇 ( ),因为—P+—O(x) 所以Kp x) 且K (x) z 故 声+O(x),即J;i+O(x) 户+ (户+ ( )1,综上 皇 (皇 ( ))=皇 ( )。由 户+ ( ),故Jl5+ ( ) 户+ (户+ ( ))。 若 e户+ (声+ ( )),有x (户+ (x))uB 。(户+ ( )),即x e (户+ (x))或 Bn ̄+0(户+ ( ))。若x (户+ ( )),有 (x) + ( )或K (x) 户+ ( ),因为 ∈Kp( ),x Kd(x), 所以 户+ (x),即卢+ (户+ ( )l 声+O(x)。若 ~ (户+ ( )),有 e(户+ ( )),即 户+ ( )~ 户+ ( (x)),故x 声+ ( ),所以 (户+ ( ))∈ 户+ ( ),由此可得,皇 (户+ ( ))uB (户+ ( ))∈ 户+O(x),因为户+O(x)=户+O(x)UB ( ),所以 户+ (户+ ( ))∈户+O(x),综上可得户+ (户+ ( ))= 两( )。 例3下列各式一般不成立: (1)。蕊( ) —Pu—O(x) (2)’户+O(x)=~户+O(-x) (3)。户+O(x)=p(x)N O(x) (4)’户+0(-户+ ( ))=~声+O(X) (5) 户+ (~户+ ( )l=~ +O(x) 根据例2的结果,户+O(x)三PUO(x)不成立。 续例2,令 ={3,4,5}, ={1,2},则户+O(x)={4,5}, p+O(x):{2,3,4,5},户+O(-x)={1,2},-p+O(-x)={3, 4,5},所以户+O(x)=~户+O(-x)不成立。 令 ={1,2,5},贝0户+O(x)={1,2,5},户+O(x)={l, 2,5},曼( )={1,2},P(x)={1,2,3,4,5},垒( )={5), ( ): {1,2,3,4,5},户+O(x)≠p(x)nO(x)。 黄婧,李进金:最小描述的多粒度覆盖粗糙集模型 2013,49(9) 137 续例1令 ={2,3,4},则户+O(X)={2,3,4),~户+O(x)= 4最小描述的多粒度覆盖粗糙集 定义6设 是一个论域,c是 的一个覆盖族,对任一 (1,5), (~ ( ))= (~ ( )) ~ ( )。 令 ={1,4,5),贝0户+O(x):{4,5},户+O(x)={1,2, x 【,,P。,P ,…,P c,Md ( )={n ( ) ∈Mdp『 ( )} 称为P,,P ,…,P 下x的最小描述。 4,5},~户+O(x)= 卜J;l+ ( ))= ,户+ ( ̄户+-O(x))= {2,3,4),故J5+ (~声+ ( ))≠~户+O(x)。 定理5设u是一个论域,c是u的一个覆盖族, vx,lr u,声, ∈c,下面的性质成立: (1)如果 Y,则户+O(x) +O(r)。 (2)户+O(xny) 户+O(x)n +O(r)。 (3)户+O(xuY) 户+O(x)u户+O(r)。 证明(1)若 ∈户+ ( ),有K x) 或K,j x) 因为Xc_Y,所以Kp x) Y或Ko x) y,故 ∈户+ (y), 即j5+O(x) 户+0(r)。 (2)因为xf7 Yc_X且 n y ,,,所以户+O(xn Y1 ( ), ( n畦 (y),故P+O(xny) P+O(一x)N 户+ (y)。 (3)因为xcxU Y或y U Y,所以户+O(x1 户+O(xuY),户+0(r) 户+O(xuY),故户+O(x)u 鱼 (y) p+O(xu Y)。 例4下列各式一般不成立: (i)”如果 Y,则Ji;+O(x) 户+0(r)。 (2)”户+O(xuY) 户+O(x)u户+0(r)。 (3)”户+O(xn Y) p+O(x)n +O(Y)。 续例1冬 ={3),y={3,4},贝 +O(x): ,户+O(x)= {2,3,4}, ±0(r):{3,4),户+Q(Y)={3,4)。故声+O(x) .皇 (y)不成立。 令 :{1},y:(2},xuy={1,2},贝q户+O(x)= , J;l+O(x)={l,2),户+0(r)= ,户+0(r)={1,2,3), 皇 ( uY):{1,2),声+ ( u Y)={1,2)。故皇±鱼( u Y) 户+O(x)U户+O(r)不成立。 令 :{1,2},y={2), ny={2},贝U户+O(x):{1,2}, 户+ ( )={1,2), ± (】,)={2},户+0(r)={1,2,3}, P+0(xnY)={2),户+ ( nY)={l,2,3),故p+0(xnY) 户+O(x)n户+0(r)不成立。 通过比较定义4,定义5,以及由定义推导出的上下近 似算子的性质,可看出这两类二粒度覆盖粗糙集有着一定 的差异。第一类基于最小描述的二粒度覆盖粗糙集模型 中,上下近似基本满足粗糙集理论的一些主要性质。但在 第二类粗糙集理论中,许多性质一般不成立,这些都在上 面的例题中给予体现。基于二粒度下,容易把它们推广到 多粒度,由此给出了多粒度中上下近似算子的性质,以及 两类不同粒度算子之间的差异 定义7设【,是一个论域,c是 的一个覆盖族,对任 一 U,P1,P2,…,P ∈C,则 关于属性集P1,P2,…,P 的上、下近似、边界分别定义为: ∑P f=1 ( )={ 'qK∈Md ( ),KfTX ̄ } ∑P ( )=~∑P( ) i 1 1 B (X)=EP ( )一∑e(x) 1 一 可以看出,定义7将定义4中的二粒度推广到多粒度, 由此讨论定义7中的上下近似的一些性质。 定理6设 是一个论域,c是 的一个覆盖族,对任 一 u,P ,P,,…,P ∈c,下面的性质成立: (1)∑P i 1( )=~∑P 生L ( ),U尸 i=1( )=-mP 童L ( ) (2)∑P ( ) UP ( ),∑P ( ) UP ( ) (3) (x) (X) 一 定理7设u是一个论域,C是u的一个覆盖族,对任 一 U,P1,P2,…,P ∈C,下面的性质成立: (1)∑P ( ) ∑P ( ) L i 1 (2)∑P ( )=∑尸 ( )= ,∑P )=∑P ( )=u (3)∑P ( )=E(x)f7 ( )n…n ( ) i=l ∑P ( )= ( )UP_3(X)U…u ( ) 三 定理8设 是一个论域,c是 的一个覆盖族,对任 一 , ,…, u,P1,P2,…,P ∈c,下面的性质成立: — — (1)如果 ,则∑P ( ) ∑尸 ( ),∑P ( ) i=1 =1 =! ∑P ( ),(0≤后,,≤,z)。 三 一/n、 — 一 一 (2)∑Pfi 1 1 U j1 i 1∑P ( )u∑尸 i=1 ( )u…u∑P i=1 ( ), 厂n 、 m ∑P I n I ∑P ( )n∑P ( )n…n∑P ( )。 (3)∑P i 1 I n 【, 1 / ∑P i 1 ( )n∑Pi=1 ( )n n∑P ( ), 厂 、 m m ∑Pf lU I ∑P ( )u∑P ( )u u∑P,( )。 f=1 Computer Engineering and Applications计算机工程与应用 。F面介绍另一种最小描述的多粒度覆盖粗糙集。 m f n \ 小 m 定义8设 是一个论域,C是 的一个覆盖族,对任 一(8) ∑ I n 1 ∑ ( )n∑ ( )n…f7∑ ( )。 f:1 ,:i / ,=l f=I I=I ,~PXcU,2,…_~,Pm∈C,则 关于属性集 , ,…, 的下、上近似、边界分别定义为: 5属性约简 属性约简是在保持分类能力相同的基础上,通过对知 识进行约简,从而提取规则,是粗糙集理论的核心内容之一。 设 是一个论域,C是 的一个覆盖族,P.,P .., ( ) ( ) } ’= —E.E(x),B ( )=U{Md ( ) eX ) 三 一 鱼 ∑E(x)=∑E(x)UB ( ) 一 。 可以看出,定义8将定义5中的二粒度推广到多粒度, 由此讨论定义8中的上下近似的一些性质。 定理9设 是一个论域,c是【,的一个覆盖族,对任 一 U,~PP2,…~,~P1,m∈C,具有下列性质: (1)∑ ( ) U尸 ( ) 一t 一 (2)EE(x)_Ar_cEE(x) L =1 (3)∑ ( )=∑E(e)--e,∑ (u)=EE(v)=U 1 生一 f=1三三 一 (4)EE(x)=E(x)U ( )U…U ( ) 生 一 厂 、 —=一厂— 一 、— 一 (5)∑ IL\ L /圭 EE(x)I:∑ ( ),∑ I1 一1EE( x)I/=EE(一1 x) 一 定理10设 是一个论域,C是【,的一个覆盖族,对 任一 , ,…, ∈U, , ,…, C,下面的性质成立: (1)如果 ,则∑ ( ) ∑ ( ),(o≤ ,,≤,z)。 生 —一生 —一 m 厂n 、 m m m (2)∑ f J 1n f ∑ ( )n∑ ( )n…n∑ ( )。 一 一 一 一 m 厂n 、 m m m (3)∑ I U I E ̄(xju∑ ( )U…u∑ ( )。 三三 一 J 1 / —一 一 一 注:对于第二种多粒度粗糙集,以下性质均不成立。 (1) EE(x) Ug(x)。 (2) ∑户 ( )=~∑ ( )。 f 1 —一 (3)‘∑ ( ): ( )n ( )n…n ( )。 厂 卅 、 (4)’∑ I~∑ ( )f=~∑j;=( )。 £三 三 ■一, ■一 、 一 (5) i 1∑ l ~∑ (i 1 )l=~∑ (i 1 )。 (6)’如果 Y,则∑ ( ) ∑ (y)。 _=-厂 、_=- _ 『__ (7)’∑ I U l ∑ ( )u∑ ( )u…u∑ ( )。 P ∈C,U/IND(D)={D1,D2,…,D }记 f 一 -_一 一 ] ∑P 1 (D)={L 1∑P (D。),∑尸 i 1 (D ),…,∑P i l (D )J } m r m 肌 ] ∑P L (D)={∑P = (D。),∑P = (D:),…,∑P 三l! (D )J} 定义9设U是一个论域,C是U的一个覆盖族,P。, P2,…,P ∈C: (1)若∑P (D)=C(D),则P。,P ,…,P 为上近似协 f=1 调集。若P。,P2,…,P 为上近似协调集,且P。,尸 ,…,P 的任何真子集都不是上近似协调集,则P ,P ,…,P 为上 近似约简集。 (2)若∑P (D)=C(D),则P ,P。,…,P 为下近似协 三! 调集。若P。,P2,…,P 为下近似协调集,且P ,P ,…,P 的任何真子集都不是下近似协调集,则P。,P:,…,P 为下 近似约简集。 (3)若P ,P2,…,JP 既为上近似约简集,又为下近似 约简集,则P。,P2,…,P 为U上的近似约简集。 定义10设 是一个论域,c是【厂的一个覆盖族, P ≤k)为所有近似约简集,这时nP 为核记为Core(C), f≤k Core(C)=nP 。 f《k 下面给出多粒度下属性约简算法的一般步骤:设 (u,c,F,D)为覆盖决策近似空间,P,,P ,…,尸 是C中的 所有子集,记U/IND(D)={Dl,D2,…,D }。 步骤1根据定义3计算出每个对象在所有覆盖下的最 小描述,再通过上下近似算子的定义,求出C(D1以及 (D)。 步骤2令C。。={{尸1},{P },…,{P }}; Cl2={{Pl,P2},{P1,P3},…,{Pl,P )}, C22={{JP2,P3},{P2,P4},。一,{尸2,P }},…, C 1)m={{P Pm}}I..‘, C1 ={{P1,P2,・。。,P },。。。,{P1,P3,’一,P }};…。Cf.J中i 表示从P 开始取集合, 表示C¨中每个集合含多少个P 。 步骤3根据定义3计算出每个对象在各种粒度下的最 小描述,通过上下近似算子的定义,求出多种粒度下的上 下近似。 步骤4根据定义9中对近似约简集的描述,比较各种 黄婧,李进金:最小描述的多粒度覆盖粗糙集模型 2013,49(9) 139 粒度下的上下近似与所有覆盖下的上下近似,求出覆盖决 策近似空间中所有的近似约简集。 步骤5在求出所有的近似约简集下,根据核的定义, + (5)={{4,5,7,8),{5,6,8}} 找出覆盖决策近似空间中的核。 通过定义9,定义10,及以上算法计算出例5中二粒度 下的属性约简及核。 M4+ (6)={{5,6,8}},M4+ (7):{{7,8}} M4+ (8)={{8}};Ma;+ (1):{{1,2,4,5}) Md;+ (2)={{2,5}},Md;+ (3)={{2,3,5,6}) Md;+ (4)={{1,2,4,5),{4,5,7,8)} Md;+ (5)={{2,5),{5,8}) 例5设 ={1,2,3,4,5,6,7,8},c={P,Q,R,S}是 的一个覆盖族,其中: P={{l 2 3 4,5,6},{4,5,6,7,8)} Q=f{1 2 3 ,{4,5,6,7,8,9),{7,8}} R=f{1 2 4 5),{2,3,5,6),{4,5,7,8}) =f{1 2 4 5,7,8),{2,3,5,6,8)} U/IND(D)={{1,2,3},{4,5,6},{7,8}j (1)Md*A(1)={{1,2}},Md ̄(2)={{1,2},{2,3}},Md ̄(3)= {{2,3))'Md ̄(4)={{4,5)),Md](5)={{5 Md ̄(6):{{5,6}), Md;(7)={{7,8}),Md*A(8)={{8})。e(D)={{1,2,3},{4,5,6}, {7,8}}, (D)={{1,2,3},{4,5,6},{7,8}) (2)Md*p+。(1)={{1,2)),Md;+Q(2)={{1,2,3}) Md;+o(3)={{1,2,3}),Mdp+。(4)={{4,5,6” Md;+口(5)={{4,5,6}},Mdp+口(6)={{4,5,6)} Mdp+口(7)={{7,8)),Md;+Q(8)={{7,8}} Md;+ (1)={{1,2,4,5)} Md;+月(2)={{1,2,4,5),{2,3,5,6}} Mdp+ (3)={{2,3,5,6 ,Ma;+ (4)={{4,5}) Me;+ (5)={{4,5},{5,6}),Md;+ (6)={{5,6}} Md;+ (7)={{4,5,7,8}} Mg;+ (8)={{4,5,7,8},{5,6,8)} Md*p+ (1)={{l,2,4,5}} Md;+ (2)={{1,2,4,5),{2,3,5,6}) Md;+ (3)={{2,3,5,6}} Mdp+ (4)={{1,2,4,5),{4,5,7,8)1 Md;+ (5)={{1,2,4,5),{4,5,7,8}, {2,3,5,6),{5,6,8)1 Me;+ (6)={{2,3,5,6},{5,6,8}} Md;+ (7)={{4,5,7,8)} Md;+ (8)=f{4,5,7,8},{5,6,8)} + (1)={{1,2)),Me;+ (2)={{1,2},{2,3}) + (3)={{2,3)), + (4)={{4,5)} + (5)={{4,5},{5,6}}, + (6):{{5,6}) M4+ (7)={{7,8)), + (8)={{7,8)) M4+ (1):{{1,2)), + (2)={{1,2},{2,3)} Me;+ (3)={{2,3}),Md;+ (4)={{4,5,7,8}l Md*R+ (6)={{2,3,5,6),{5,6,8)} Md*R+ (7)={{4,5,7,8}},Md*R+ (8)={{5,8}) 尸+Q(D)={{1,2,3},{4,5,6),{7,8}} (D):{{1,2,3),{4,5,6},{7,8” P+ (D):{ ,{4,5,6), } (D):{{1,2,3),{1,2,3,4,5,6,7,8),{7,8)} —P+—S(D、= (D)={{1,2,3,4,5,6), {1,2,3,4,5,6,7,8) 4,5,6,7,8}} O+ rD {4,5,6),{7,8}j Q+ rD {4,5,6),{7,8}) Q+ (D ,{7,8}} Q+S(D {4,5,6),{4,5,6,7,8)} R+S(D、= 垒 (D)={{1,2,3,4,5,6}, {1,2,3,4,5,6,7,8},{4,5,6,7,8}} (3) (D)=e(D),P+Q(D)=C(D);Q- ̄R(D)=e(D), ——Q+ (D)= (D) 所以,{P,Q)和{Q, }都是覆盖决策信息系统的约简集, Core(C)={O}。 根据定义3,所得约简集、核与上相同。 6结论 在粗糙集理论中,上、下近似算子是获取属性约简及 规则提取的一个必要条件,也是学者们对该理论进行深入 研究的基础。本文提出了基于最小描述的多粒度覆盖粗 糙集模型以及讨论两类不同的上、下近似算子及其相应的 性质,从而获得相应的属性约简。关于对属性特征及其必 要、不必要属性的刻画会继续进行探讨。 参考文献: …1祝峰,王飞跃.关于覆盖广义粗集的一些基本结果[J】.模式识别 与人工智能,2002(1):6-12. [2】Qian Y H,Dang C Y,Liang J Y.MGRS in incomplete infor- marion systems[C]//IEEE Int Conf Granular Computer.[S.1.】: IEEE Press,2007:163—168. [3】Qian Yuhua,Liang Jiye,Li Deyu,et a1.MGRS:a mulit-granulation rough set[J].Information Sciences,20 1 0,1 80:94-97. (下转149页) 王桂华,秦湘清,陈黎,等:一种面向专业搜索引擎的查询推荐算法 2013,49(9) 149 综上所述,本文提出的QR.CH算法无论在相关性指标 cover search engines related queries[C]//Proc of LA—WEB, 2003. 还是在冗余性方面都比已有的类似算法——Ms—DM算法 效果好,也验证了QR.CH算法进行专业搜索引擎查询推荐 的有效性。 [6]Dupre G,Mendoza M.Automatic query recommendation using click—through data[J].Professional Practice in Artiifcial Intel— ligence,2006,218:303—312. [7]李亚楠,许晟,王斌.基于加权SimRank的中文查询推荐研究[J1. 5总结 专业搜索引擎与查询推荐目前都是研究的热点,但关 于专业搜索引擎的查询推荐的相关研究却非常少,本文对 中文信息学报,2010,24(3):3—10. [8]李亚楠,王斌.一个中文搜索引擎的查询日志分析[J].数字图书 馆论坛,2008(7):2-1o. [9]Mitra M,Singhal A,Buckley C.Improving automatic query 此进行了深入的研究。本文针对专业搜索引擎的特点,设 计了一个新颖的查询推荐算法QR.CH,该算法采用基于词 expansion[C]//Proc of SIGIR’98,1998:206—214. 语共现的方法和HITS算法提高了推荐词与原查询词的相 【10]Kruschwitz U.Exploiting structure for intelligent Web search[C]// 关性,而且基于HITS算法产生的文档排序有效地判断了 Proc of HICSS,2001:1356—1364. 推荐词的冗余性。实验也验证了本文的QR.CH算法在这 [1 1]Kruschwitz U.Intelligent document retrieval exploiting markup 两个方面都较文献已有的类似算法性能更好。 structure[M].The Netherlands:Springer,2005. [12]Mei Q,Zhou D,Church K.Query suggestion using hi ̄ing time[C]//CIKM’08,2008:469—478. r【 [ 参考文献: [13]朱小飞,郭嘉丰,程学旗,等.基于流形排序的查询推荐方法[U J]. [1]Spink A,Jansen B J.A study of web search trends[J/OL]. 中文信息学报,2011,25(2):38—43. Webology,2004,1(2).http://www.webology.ir/2004/v1n2/a4.hlm1. [14]Kleinberg J.Auflloritative sources in a hyperlinked environ— [2]Andre B.A taxonomy of web search[J].SIGIR Forum,2002, ment[C]//Proc of the 9th ACM SIAM Symposium on Dis- 36(2):3—10. crete Algorithms(SODA’98),1998:668—677. [3李亚楠,3]王斌,李.搜索引擎查询推荐技术综述[J]_中文信 [15]王日芬,宋爽,苗露.共现分析在知识服务中的应用研究[J].现 息学报,2010,24(6):75—84. 代图书情报技术,2006(4):29—34. [4]Beeferman D,Berger A.Agglomerative clustering of a search [1 6]Sanchez D,Moreno A.Learning non—taxonomic relation— engine query log[C]//Proc of KDD,2000:407—416. ships from web documents for domain ontology construe— [5】Fonseca B M,Golgher P B.Using association rules to dis— tion[J].Data&Knowledge Engineering,2008,64:600—623. (上接139页) 魏莱,苗夺谦,徐菲菲,等.基于覆盖的粗糙模糊集模型研究[J] .[4]胡军,王国胤,张清华.一种覆盖粗糙模糊集模型[J].软件学报, 计算机研究与发展,2006(10):1719—1723. 2叭0(5):968—977. Pomykala J A.Approximation operations in approximation 【5】李进金.粗糙集与拓扑空间的子集【J].系统工程理论与实践, space[J].Bulletin of the Polish Academy of Sciences,1987, 2005(7):136—140. 35(9/10):653.662. [6]李进金.覆盖广义粗集理论中的拓扑学方法[J]_模式识别与人 Pawlak Z.Rough set[J].International Journal of Computer 工智能,2004(1):7—10. and Information Sciences,1982,11:341—356. [7]李进金.覆盖上近似集与相对闭包[J].模式识别与人工智能, 张文修,梁怡,吴伟志.信息系统与知识发现[M].北京:科学出 版社,2004. 2005(6):675.678. 张文修,吴伟志,梁吉业,等.粗糙集理论与方法[M].北京:科 【8】Dubois D,Prade H.Rough fuzzy sets and fuzzy rough sets[J]. 学出版社,2001. Int’1 Journal of General Systems,1990,17(3/4):191—208. 张文修,仇国芳.基于粗糙集的不确定决策[M].北京:清华大 【9】Dubois D,Prade H.Putting rough sets and fuzzy sets together[M]/ 学出版社,2005. Slowinski R.Intelligent Decision Support:Handbook of Appli— Chen Degang,Wang Changzhong,Hu Qinghua.A new cations and Advances of the Rough Sets Theory.Boston:Klu— approach to attribute reduction of consistent and inconsis— wer Academic Publishers,1 992:203.222. tent covering decision systems with covering rough sets[J]. 【1 0]Li Ton ̄un,Leung Y,Zhang Wenxiu.Generalized fuzzy Information Sciences,2007,177:3500—3518. rough approximation operators based on fuzzy coverings[J]. Chen D G,Zhang W X.Rough sets and the topological International Journal of Approximate Reasoning,2008,48: space[J].Journal of Xi’an Jiaotong University,2001,35(12): 836—856 】31 3—1 31 5 f