您好,欢迎来到微智科技网。
搜索
您的当前位置:首页不确定性人工智能

不确定性人工智能

来源:微智科技网
1000-9825/2004/15(11)1583

©2004 Journal of Software 软 件 学 报 Vol.15, No.11

不确定性人工智能

123

李德毅1+, 刘常昱2, 杜 鹢3, 韩 旭2 (中国电子工程系统研究所,北京 100840) (中国人民理工大学,江苏 南京 210007) (中国电子设备系统工程公司,北京 100840)

Artificial Intelligence with Uncertainty

LI De-Yi1+, LIU Chang-Yu2, DU Yi3, HAN Xu2

123

(China Institute of Electronic System Engineering, Beijing 100840, China) (PLA University of Science and Technology, Nanjing 210007, China) (China Electronic System Engineering Company, Beijing 100840, China)

+ Corresponding author: E-mail: ziqin@public2.bta.net.cn, http://www.thss.tsinghua.edu.cn/ldy/index_ldy.asp

Received 2004-07-13; Accepted 2004-09-13

Li DY, Liu CY, Du Y, Han X. Artificial intelligence with uncertainty. Journal of Software, 2004,15(11): 1583~1594.

http://www.jos.org.cn/1000-9825/15/1583.htm

Abstract: Uncertainty exists widely in the subjective and objective world. In all kinds of uncertainty, randomness and fuzziness are the most important and fundamental. In this paper, the relationship between randomness and fuzziness is discussed. Uncertain states and their changes can be measured by entropy and hyper-entropy respectively. Taken advantage of entropy and hyper-entropy, the uncertainty of chaos, fractal and complex networks by their various evolution and differentiation are further studied. A simple and effective way is proposed to simulate the uncertainty by means of knowledge representation which provides a basis for the automation of both logic and image thinking with uncertainty. The AI (artificial intelligence) with uncertainty is a new cross-discipline, which covers computer science, physics, mathematics, brain science, psychology, cognitive science, biology and philosophy, and results in the automation of representation, process and thinking for uncertain information and knowledge. Key words:

entropy; hyper-entropy; chaos; fractal; complex network; power-law distribution

摘 要: 在主、客观世界普遍存在的不确定性中,随机性和模糊性是最重要的两种形式.研究了随机性和模糊性之间的关联性,统一用熵作为客观事物和主观认知中不确定状态的度量,用超熵来度量不确定状态的变化,并利用熵和超熵进一步研究了混沌、分形和复杂网络中的不确定性,以及由此带来的种种进化和变异,为实现不确 ∗ Supported by the National Natural Science Foundation of China under Grant Nos.60375016, 60496323 (国家自然科学基金)

作者简介: 李德毅(1944-),男,江苏泰县人,博士生导师,中国工程院院士,主要研究领域为人工智能,指挥自动化;刘常昱

(1973-),女,博士生,主要研究领域为人工智能;杜鹢(1971-),男,博士,高级工程师,主要研究领域为计算机网络,人工智能;韩旭(1978-),男,硕士生,主要研究领域为人工智能.

1584

Journal of Software 软件学报 2004,15(11)

定性人工智能找到了一种简单、有效的形式化方法,也为包括形象思维在内的不确定性思维的自动化打下了基础.不确定性人工智能是人工智能进入21世纪的新发展.这个由多学科交叉渗透构成的新学科,必将使得机器能够具备人脑一样的不确定性信息和知识的表示能力、处理能力和思维能力. 关键词: 熵;超熵;混沌;分形;复杂网络;幂律分布 中图法分类号: TP18 文献标识码: A

这个世界是确定的还是不确定的?无论在科学界还是哲学界,这都是一个长期争论的重要问题.爱因斯坦说:“上帝不会和我们掷色子”,而玻尔则认为“我们不能断言上帝该做些什么”.

以牛顿理论为代表的确定性科学,创造了给世界以精确描绘的方法,将整个宇宙看作是钟表式的动力学系统,处于确定、和谐、有序的运动之中.只要知道初始条件,就可以决定未来的一切[1].从牛顿到拉普拉斯再到爱因斯坦,描绘的都是一幅幅完全确定的科学世界图景.确定性论者也并非拒绝一切不确定性,但是他们认为产生不确定的原因是对初始条件的测量误差,或者人类自身认知的局限性和知识的不完备,而并非事物的本来面貌.确定性科学的影响曾经如此强大,以至于在相当长的一段时间内了人们认识宇宙的方式和视野,虽然生活在到处都有复杂混乱现象的现实世界里,科学家们看到的却只是钟表式的机械世界,科学的任务只是阐明这架钟表的结构和运行规律,而将不确定性看作是无足轻重的,并将其排除在近代科学的研究对象范围之外.

也有科学家对确定论提出质疑.麦克斯韦认为这个世界的真正逻辑是概率演算,玻尔兹曼则把随机性观点引入物理学,建立了统计力学.对确定论造成更大冲击的是量子力学的出现.海森堡的测不准原理表明,获得严格精确的初值在原理上是不可能的.这意味着,不确定性是客观世界中的一种真实存在,是存在于宇宙间的基本要素,与人类是否无知没有关系.

客观世界中的绝大部分现象都是不确定的,所谓确定的、规则的现象,只会在一定的前提和特定的边界条件下发生,只会在局部或者较短的时间内存在.随着不确定性研究的深入,世界的不确定性特征越来越得到学术界的普遍认可,无论是在物理学、数学、生物学等自然科学领域,还是在哲学、经济学、社会学、心理学、认知学等社会科学领域,虽然许多人还在从事着确定性的研究,但已经很难有人对世界的不确定性本质提出实质性的质疑了[2].越来越多的科学家相信,不确定性是这个世界的魅力所在,只有不确定性本身才是确定的.正是在这样的背景下,混沌科学、复杂性科学和不确定性人工智能才得到了蓬勃发展.

当然,不确定性和确定性并非完全对立,在一定程度上可以相互转化.例如,某一层次的不确定性可能是更高层次上的确定性,种种不确定性中还可能隐藏着某些确定的规律等.人工智能学家的任务,就是寻找并且能够形式化地表示不确定性中的规律性,至少是某种程度的规律性,从而使机器能够模拟人类认识客观世界、认识人类本身的认知过程.

1 随机性和模糊性是不确定性的最基本内涵

“不确定性”一词最早出现于1836年詹姆斯•穆勒的《政治经济学是否有用》一文中.诺贝尔经济学奖、图灵奖获得者赫尔曼•西蒙,从认知科学和行为科学出发,认为“不可避免的是,如果经济学家要与不确定性打交道,就必须理解人类行为面临的不确定性”.科学进入21世纪,不确定性问题的研究工作受到越来越多的关注,但是不确定性的内涵并没有得到公认的、必要的说明.人们目前所说的不确定性,其涵义很广泛,主要包括随机性、模糊性、不完全性、不稳定性和不一致性这5个方面,其中随机性和模糊性又是最基本的. 1.1 随机性和随机数学

随机性又称偶然性,是指因为事件发生的条件不充分,使得条件与结果之间没有决定性的因果关系,在事件的出现与否上表现出的不确定性质,可以用随机数学作为工具进行研究.

在现实世界中,科学家至今没有解释清楚宇宙是怎样形成的.地球的形成和人类的出现有很大的偶然性.地球至少经历了6次生物大规模灭绝,最著名的是6千万年前的恐龙灭绝.如果没有那次灾变,今天的地球是不是恐龙世界?人类是否还能是今天的模样?不仅仅是地球,包括太阳、行星等整个星系的形成与分布,生命的出现,

李德毅 等:不确定性人工智能

物种的演变,都含有许许多多偶然的因素.

1585

在现实生活中,你有祖父那样的鼻子,你的姐姐有叔父那样的眼睛,你们看着虽然相似,但又不相同,这是生命遗传中的变异.同一物种具有类似的特征,但差异也很明显,在细节上绝不相同.这是由于生物基因中的遗传特征在复制传递的过程中发生了随机的突变,导致新的细胞或个体和它们的祖先有了一些不同,这是当今计算机生物识别的基础.在物种进化中,正是由于随机变异,物种才能不断适应自然,在自然选择中优胜劣汰.

随机性真正为人类所认识,要归功于前苏联数学家柯尔莫哥洛夫.他在测度论基础上,于1933年在其《概率论的基本概念》一文中,首次提出并建立了概率论的公理化方法,使得人们可以用数学的方法研究随机性,将“随机性”用“概率”予以量化表示.借助于随机变量的分布函数,人们可以研究随机现象的全部统计特征[3].

以贝叶斯公式为基础的贝叶斯理论,在人工智能中一直是处理不确定性的重要工具.贝叶斯网用图形模式表示随机变量间的依赖关系,提供一种框架结构来表示因果信息.贝叶斯网可以表达各个节点间的条件关系.人们可以直观地从贝叶斯网中得出属性间的条件以及依赖关系.另外,贝叶斯网还给出了事件的联合概率分布,根据网络结构以及条件概率表可以得到每个基本事件的概率.贝叶斯理论利用先验知识和样本数据来获得对未知样本的估计,而概率是先验信息和样本数据信息在贝叶斯理论中的表现形式.这样,贝叶斯理论使得不确定知识表示和推理在逻辑上非常清晰并且易于理解.

此外,在基于概率的不确定性知识表示研究方面,Shortliff等人提出了带可信度的不确定推理,之后,Dempster和Shafer又提出证据理论,引入信任函数和似然函数来描述命题的不确定性.证据理论满足比概率论弱的公理,又称为广义概率论.当先验知识很难获得时,证据理论可以区分不确定和不知道的差异,比概率论更合适.而当先验概率已知时,证据理论就变成了概率论. 1.2 模糊性和模糊数学

模糊性又称非明晰性.它的出现是由于概念本身模糊,一个对象是否符合这个概念难以确定,在质上没有明确含义,在量上没有明确界限.这种边界不清的性质,不是由人的主观认识造成的,而是事物的一种客观属性.概念外延的不确定性质,可以用模糊数学作为工具来研究.

天空中变幻莫测的云彩、袅袅升起的炊烟、突然的一场大雾,每个人都熟悉这类现象,但是却无法准确地描述它们的形状.这是因为这类现象没有明确的边界,外观形状不规则、不光滑、极其复杂、随时间变化.边界的模糊性是自然界的一种美.

春夏秋冬,季节交替,人们可以说,某月是春天,某月是夏天,但是很难确定不同季节具体是在哪一天转换的,怎么能说今天是春天,而明天就是夏天了呢?同样,白昼黑夜,哪一刻是分明的界限?少年青年,谁会在一夜之间长大?广而言之,所有转变过程在微观上都是一个渐近的连续过程,不存在明确的、突变的界限,这也是一种模糊性.

1965年,美国学者L.A. Zadeh创建了模糊集合论,提出了模糊信息的处理方法.模糊集合论的贡献在于引入了集合中元素对该集合的“隶属度”,从而将经典集合论里的特征函数取值范围由二值{0,1}推广到区间[0,1],将经典二值逻辑推广至多值逻辑,使得模糊性可以用[0,1]上的区间来度量[4].由Pawlak提出的粗糙集理论[5],Gau和Buehrer提出的Vague集理论[6],都是对模糊集的扩充.粗糙集通过上下边界,Vague集通过对模糊对象赋予真、假隶属函数,来处理模糊性.

人工智能对模糊性的研究方法,通常是将原有的精确知识的处理方法以各种方式模糊化,如模糊谓词、模糊规则、模糊框架、模糊语义网、模糊逻辑等等.模糊逻辑后来又发展成为一种可能性推理方法,借助于可能性度量与必然性度量,更好地处理模糊性. 1.3 随机性和模糊性的关联性

人们分别用随机数学和模糊数学去研究随机性和模糊性,仅仅是从不同的角度去认识不确定性,并规定了各自的公理系统.

但是,当研究广义的不确定性的时候,这些公理作为前提条件是否成立,常常成了一个大问题.例如,通过概率分布函数,随机数学可以很好地刻画随机现象的统计特性,但是常用概率分布的前提条件过于严格.例如,常常要求影响随机现象结果的因素是几乎均匀而且的,随机变量之间是不相关的,基本事件概率之和为1,样

1586

Journal of Software 软件学报 2004,15(11)

本趋于无穷等等.模糊理论利用隶属函数精确刻画模糊现象的亦此亦彼性,却忽略了隶属函数本身的不确定性.这两种理论可以分别处理随机性和模糊性,没有考虑二者之间的关联性.更何况,研究客观世界和主观世界中的不确定性也并非总是要从这样的角度切入.

实际上,随机性和模糊性常常是连在一起的,难以区分和存在,作为人类思维和认知载体的语言,表现得尤为明显.近十几年来,我们在随机数学和模糊数学的基础上,提出用云模型来统一刻画语言值中大量存在的随机性、模糊性以及两者之间的关联性,把云模型作为用语言值描述的某个定性概念与其数值表示之间的不确定性转换模型[7,8].以云模型表示自然语言中的基元——语言值,用云的数字特征——期望Ex,熵En和超熵He表示语言值的数学性质.“熵”这一概念最初是作为描述热力学的一个状态参量,以后又被引入统计物理学、信息论、复杂系统等,用以度量不确定的程度[9].在云模型中,熵代表一个定性概念的可度量粒度,熵越大粒度越大,可以用于粒度计算;同时,熵还表示在论域空间可以被定性概念接受的取值范围,即模糊度,是定性概念亦此亦彼性的度量.云模型中的超熵是不确定性状态变化的度量,即熵的熵.云模型既反映代表定性概念值的样本出现的随机性,又反映了隶属程度的不确定性,揭示了模糊性和随机性之间的关联.

由于自然科学、社会科学中大量的随机现象都服从正态分布,正态云模型及其普遍适用性[10]受到了人们的普遍关注.

当然,不确定性还包含不完全性、不稳定性和不一致性.对这些性质的研究,也许要待随机性和模糊性的形式化方法建立之后,才能够深入展开.

2 混沌、分形和复杂网络

在不确定现象中,混沌、分形和复杂网络是目前人们研究不确定性最感兴趣的3个领域. 2.1 混 沌

混沌的发现是对确定论最大的冲击.过去科学家们认为确定的系统只能产生确定的结果,绝对不会产生随机性,而把产生随机现象的原因归结为外部的影响.混沌科学却告诉我们,确定性的系统也可以产生随机的结果.非线性动力学中的“混沌”概念有着严格的科学定义,而人工智能以及其他一般科学中的混沌,指的是由确定性系统产生的复杂的随机行为,是人类社会和自然界中普遍存在的一种不确定运动形态.

科学家曾经以为天气可以精确预报,甚至是可以控制和改变的.但实际上,天气每天都在变化,没有一天是相同的,即使预报方程完全确定,对天气状况做出长期的、准确的预报也是不可能的.亚马逊河热带雨林中的一只蝴蝶搧动了两下翅膀,可能两周之后会引发美国德克萨斯州的一场龙卷风,这个有趣的“蝴蝶效应”反映的是混沌现象——初始条件的微小差别能引起结果的巨大差异.这一效应在自然界和人类社会中无数次出现,正所谓“失之毫厘,差以千里”[11~13].

混沌理论研究如何从貌似无序而实际有序、表面上看来是杂乱无章的现象中找出其确定的规律.生物学家发现在人类的心脏中有混沌现象存在,显微镜下交叉缠绕的微细血管,高度复杂中也有惊人的有序性.在生物脑神经系统中,从微观的神经膜电位到宏观的脑电波,都可以观察到混沌的形态,这说明混沌是生物神经系统的特性之一.

现代脑科学把人脑的工作过程看成是复杂的多层次混沌动力学系统,认为人脑思维过程中存在多层次混沌.通过混沌动力学研究分析脑模型的信息处理能力.例如,利用动力学在多个吸引流域之间的来回变迁与沟通来模拟符号与记忆.人的思维包含丰富的概念、决策和情绪,不可能用静态的数学模型来描绘人类的精神和思想.人类思维是一个多尺度系统,神经元联系着各种微观尺度与宏观尺度,这与流体力学中的湍流十分相似.利用混沌学还可以进一步探索动态联想记忆,并应用到模式识别等领域.例如,利用混沌理论进行非线性预测和决策,利用混沌现象对初始值的敏感依赖性,构成模式识别系统等.

从20世纪90年代开始,人们进一步将混沌和神经网络结合起来,提出多种混沌神经网络模型,探索应用混沌理论的各种信息处理方法,例如,在神经元模型中引入神经元的不应性,研究神经元模型的混沌响应、不应性项的定标参数、不定性时间衰减常数等参数的性质,以及这些参数和神经网络混沌响应的关系等等.实验结果

李德毅 等:不确定性人工智能

表明,这种由混沌神经网络模型绘出的图形和脑电图极为相似[14]. 2.2 分 形

1587

20世纪70年代,Mandelbort把分形引入自然科学.一个启发性的问题是“英国的海岸线有多长”,答案是,长度随着尺度的不同而不同.许多自然现象,离开尺度来谈就毫无意义.同样,人工智能中的数据挖掘和知识发现,如果离开发现尺度来谈也没有意义.科学家们目前沿着“宏观的更宏观、微观的更微观”这样两个不同的方向来认识世界,同样都是在各自的尺度下发现真理.

自然界中分形形态随处可见,连绵起伏的山脉轮廓、四通八达的江海河川、蜿蜒曲折的海岸线,都具有不光滑性和不规则性.被测值随着测量尺度变化而变化,只有尺度确定了,测量值才能够确定.在一定测量范围内尺度和测量值之间存在幂律关系.如云彩的边界、地表的形状、湍体的湍流等等,都是存在于大自然中的分形不确定性.

分形是为了表征复杂图形和复杂过程而引入自然科学领域的,它使自然界中普遍存在的螺旋、树状、斑纹、云彩、火焰等复杂不确定现象的研究变得简单.由于计算技术和计算机图形学的发展,使得大量的自然景物可以模拟.自然界、人类社会中存在大量的复杂不规则现象和无尺度的不确定现象,如湍流、复杂网络上的传播行为、金融市场的价格波动等.这类无尺度、自相似中的不确定性都是分形的研究对象.金融市场的价格变化,表面随机、无序,但是通过对大量现实数据的分析,科学家们发现价格变化存在无尺度、自相似的特点,用分形可以模拟价格随时间的变化,多重分形还可以描述市场的不确定性.与常规的统计方法不同,分形将复杂体系分解,可以体现复杂体系中的内部精细结构和蕴含的信息,而统计方法只能得到宏观的、粗略的估计[15].

分形图像压缩是分形理论的一个成功应用,基于局部函数迭代系统的分形图像压缩技术可以得到很高的压缩比和不错的压缩效果. 2.3 复杂网络

具有小世界效应和无尺度特性的复杂网络近年来备受人们关注.大量的真实网络,如因特网、万维网、电力网、航空网、食物链、人际关系网都是这种复杂网络.

复杂网络拓扑结构的不确定性是复杂网络研究的基本问题.20世纪中叶,Erdos和Renyi突破传统图论,用随机图描绘了复杂网络拓扑.近年来研究发现,很多实际的复杂网络既不完全规则也不完全随机,而是介于完全规则和完全随机这两个极端之间,既具有类似规则网络的较大集聚系数,又具有类似于随机网络的较小平均路径长度,这就是小世界网络.人际关系网络中的“六度隔离”就是小世界网络的经典例子.

Watts和Strogatz于1998年提出了小世界网络模型,比较合理地反映了既不完全规则也不完全随机的网络的统计特性.节点的度分布是网络拓扑的重要特征.小世界网络和随机网络的节点具有大概相同的链接数,即度分布服从均匀的或者指数分布.然而,很多实际网络的节点度分布服从p(k)∝k−γ的幂律形式,并且通常2<γ<3.这种网络不同于服从均匀分布或者指数分布的网络,存在一些度很大的节点,但是大部分节点的度都很小.因为幂律分布没有任何特定的尺度,所以这种网络称为无尺度网络[16].

不少学者利用分形理论研究复杂网络上传播行为的特性,研究网络中出现的分叉、混沌现象.混沌、分形和复杂网络,都是研究不确定性的非线性科学,它们试图找出介于有序与无序、宏观与微观、整体与部分之间的新秩序.混沌、分形和复杂网络近20年来的发展,为研究人类复杂的不确定行为提供了新的理论.

人是一个能够感知、传输、处理、开发和利用不确定性信息的最复杂的系统.人通过各种感觉器官——听觉、视觉、触觉、嗅觉、痛觉、温度觉、深感觉等——来感知外部世界.人脑具有记忆、思维、意识和智能.从结构上看,人脑是包含140多亿个神经细胞的复杂网络,能灵活处理各种复杂的、不确定的信息.人们正试图构建具有复杂网络特性的认知模型,模仿以神经元为基本组成单元的中枢神经系统.近年来,人们也试图将神经网络模型、模糊推理和表示、进化算法等与混沌、分形理论结合起来,构造新的模型,以体现人类的不确定认知过程[17].

虽然国内外利用分形、混沌和复杂网络理论探索人的心智和思维机理的研究刚刚起步,但是已受到越来越多的学者的重视.

1588

Journal of Software 软件学报 2004,15(11)

3 人类认知过程的不确定性

如果从存在论和认识论两个角度理解不确定性,以上讲的主要是存在论意义上的不确定性,下面从认识论意义上讨论人自身认知过程中的不确定性.人类的认知,实质上是客观世界的一种映像.客观世界的不确定性,决定了人类主观认知过程的不确定性. 3.1 感知的不确定性

以视觉为例,人睁开眼睛就能看见这个五彩缤纷的世界.人从外界感知的信息中大约有80%是通过视觉得到的.所谓“眼见为实”,真的如此吗?以图1为例,有人看到的是一个少女,而有些人看到的则是一个老妇人.这是因为视觉对图像的不同部位注意程度有差异,注意整体还是注意局部,使得人们对相同的事物看到不同的结果.只注意到头发和衣领间的局部,可把它看成少女的侧面;而如果将少女的下巴部位看成是鼻子,少女的项链部位看成是嘴,就变成了一幅老妇人的画像.这就是视觉的不确定性.视觉还会有错觉.对于图2,人们会认为小圆内部的圆比大圆内部的圆要大,而实际上它们一样大.背景的干扰使得人们产生了错觉.眼睛还会因为光照、角度、色彩、运动等诸多因素的影响而产生幻觉.

Fig.1 Uncertainty in visual perception

图1 视觉感知的不确定性

Fig.2 An optical perception illusion

图2 视觉感知的错觉

图3(a)和图3(b)是两个左右对称的人脸像,有人会觉得图3(a)开心,图3(b)不开心;而在有些人看来则恰恰相反.这是感知不确定性的又一个例子.事实上,与光学平面镜被动地映射出的客观世界不同,眼睛感知的视觉信息常常是模棱两可的.外部世界经过视觉神经的过滤和选择,并且根据个体人的经验知识对这些信息做出不同的解释.包括视觉在内的所有感知觉都是主动的过程,因而带有一定的主观性和不确定性.其实,我们对这个世界的感知基本上都是不确定的,对同一对象,不同的人有不同感受.感知常常是建立在主体先前的活动和经验的基础上的,主体的自我意识、思维方式、经验知识、认知结构,甚至个人的爱好、兴趣、性格、价值观念等等无不渗透与影响着人们对客观世界的感受.因此,面对同一个感知对象,由于个人认知结构的不同,对感知对象的认识与理解也会出现差异,从而出现不确定性[18,19].

(a) (b)

Fig.3 Happy or unhappy? 图3 开心还是不开心?

人在不同尺度上的感知也具有不确定性.从广阔的银河系外的空间看地球,地球自身的大小被忽略,是一个0维的点.在太阳系中,比如乘航天飞机看地球,地球是三维的球体,而在飞机上看地球是球面,或者是平面,倘若站在旷野上环顾左右,则又是另一番景色.人类智能可以从极不相同的粒度或者尺度上观察和分析同一问题,而且还能很快地从一个粒度世界跳到另一个粒度世界,往返自如,这也是人类不确定性智能的魅力所在.

李德毅 等:不确定性人工智能 3.2 记忆的不确定性

15

记忆是人类智能的另一个基本方面,对于人类的学习和解决问题能力的培养十分重要.我们大脑中能够储存许多有用的知识和信息,为我们的心理发展、个性形成、社会活动提供必要的认知基础.但是记忆常常是不准确的,随着时间的推移,记忆中事物的面貌、过程的细节会变得模糊.一位朋友好久不见,他的音容相貌就会逐渐淡忘;一本书看过不久,就只能记得大概情节;无论短时记忆还是长时记忆,大脑都会记取事物的整体和特征,忽略无关紧要的细枝末节.这样,人们会得到不具体的、模模糊糊的印象,但却能长时间地保持记忆,并且在需要的时候仍然能把记忆中的有用信息提取出来[19].不少学者从事心象方面的研究,试图用心象来解释记忆的特性,我们在文献[20]中提出,用数据场来模拟人类的认知过程,用数据场的影响因子sigma来解释记忆随时间而模糊的现象.图4反映了人脸的记忆淡忘过程.

Sigma=0

Sigma=0.02

Sigma=0.04

Sigma=0.06

Sigma=0.1

Fig.4 Fading of a face from memory

图4 人脸的记忆淡忘过程

3.3 思维的不确定性

人类的思维有精确的一面,更有不确定的一面,尤其是涉及联想、创造、顿悟等形象思维时,更没有确切的规律可言.人类习惯于用自然语言进行思维,思维的结果往往是可能如何、大概如何等定性的结论.人类还擅长于通过幻想的、直觉的、抽象的、创造的形象思维来认识客观世界,几乎不可能像计算机一样做精确的运算或者严密的逻辑推理,和计算机相比,人脑并不具备快速、可靠的计算能力,或者海量数据的存储能力,但是这并不妨碍人们的学习和创造能力,不妨碍人们具有发达的、灵活的高级智能.可以说,在人类思维活动中,不确定的形象思维占据了绝大部分,与确定的、精确的符号思维活动相比,后者可以说是微不足道的.人类思维活动的这种定性特征,往往比定量计算更准确、更到位、更贴切.

4 自然语言的不确定性

语言,尤其是文字语言,是人类与其他一切生物在智能上的最大区别,也是人类智能最突出的表现.有了文字,才有了文化;有了传承,才有了人类的知识积淀.人类用语言描述和记载客观世界,描述和记载情感、心理和认知活动.因此,无论研究人类智能还是人工智能,应该从研究自然语言开始;研究不确定性人类智能和不确定性人工智能,也应该从研究自然语言的不确定性开始.十多年来,我们以自然语言值为切入点,建立定性和定量转换模型——云模型[7,8,10],其基本原因就在于此.

自然语言带有模糊性是显而易见的.人类感觉器官感受的客观事物往往是连续的,例如温度、颜色、气味、声音等等.但是,语言符号是离散的,用离散的符号去表示连续的事物,边界必然不明确,产生模糊性.比如,“冷”、“热”、“美”、“丑”等描述人类感官的词语,“一堆”、“三十几岁”、“两点左右”等描述数量的词语,还有在日常生活中使用频率很高的“很”、“非常”、“也许”、“大概”、“差不多”、“可能”等表示程度的词语都具有模糊性.

自然语言中还存在随机性.著名的Zipf定律最初就是从语言学中发现的.Zipf定律表明:在一定的领域范围内,如果将语言中的词汇按照出现的概率由高到低排序,那么某个词汇出现的概率P(r)与该词汇对应的序号r之间的关系是幂律分布:P(r)∝1/ra,其中a是一个正常数,称为Zipf指数,a的大小取决于具体分布.在英语中,a≈1.即在英语中,使用概率最高的词汇“the”的使用频率约是排在第2位的“of ”的2倍[21].Zipf定律揭示了在语言中经常使用的词汇只占词汇总量的少数,绝大部分词汇很少被使用.中文中的字和词也有很多类似的统计性质,被用来作为许多汉字输入方法的数学基础.目前,计算机中输入法的常用字库和一、二级扩展字库就反映了这一特性.

1590

Journal of Software 软件学报 2004,15(11)

自然语言中的不确定性,本质上来源于人脑思维的不确定性.这非但没有妨碍反而更加便利了人们的使用和交流.人脑的思维过程从来不是纯数学的、纯定量的,这种不确定性使得人们通过语言交互有了更富裕的理解空间和认知能力.上个世纪的确定性人工智能,建立了形形色色的比自然语言更精确、更严密的符号语言,与自然语言相比,它们过分地机械化和理想化了,缺少随机、模糊、混沌、分形以及不确定性.如果能让计算机不用精确、严密的符号语言“计算”,而直接利用自然语言来“思考”,这才是人工智能的方向.这也许就是Zadeh呼吁的“computing with words”的方向.

5 不确定性的计算机模拟

认识到不确定性在宇宙间广泛存在,确定性只是在某一个尺度上表现,是人类认识世界的重大进步.它提醒我们:不确定性是理解人类智能和机器智能之间巨大差别的关键所在.不确定性人工智能,必须超越不确定本身而寻求不确定中的基本规律性,寻求表示并处理不确定性的理论和方法,使机器能够模拟主客观世界的不确定性,使定性的人类思维可以用带有不确定性的定量方法去研究,最终使机器具有更高的智能,在不同尺度上模拟和代替人脑的思维活动.

不确定人工智能要以机器为载体,模仿人类智能,必须找到人脑的定性分析和机器的定量处理之间建立联系的方法.这个任务首先要由形式化来担当. 5.1 随机性、模糊性及其关联性的计算机模拟

根据云模型的数字特征,利用云发生器生成云滴,可以对定性概念进行计算机模拟表示.

我们通过一个例子说明云模型对随机性、模糊性及其关联性的描述和计算机模拟.图5(a)是3位射手的射击记录,统计方法用二维正态分布来反映弹着点在靶上的分布,前提是每次射击相互,并且不考虑天气、心理等因素的影响.模糊方法认为射中与射不中是相对的,可以用弹着点对目标靶的隶属度来表示.从靶心开始,分为10个等级,依次为10环,9环,…,1环,跑靶为0环,对应的隶属度分别为1,0.9,…,0.1和0,用二维隶属函数反映射手的水平.遗憾的是,这里忽略了隶属函数自身的不确定性[8].

(a)

(b)

(c)

Fig.5 A shooting example of the cloud model

图5 云模型的一个射击实例

通常,人们更习惯于用自然语言而不是数值的方法来评判射手水平.云方法认为:射手射中或射不中带有随机性,射中的程度又带有模糊性,每次射击的弹着点可以看作是一个云滴,射击若干次后形成的云团的整体特征反映了射手的总体水平.由于受多方面随机因素(天气、心理等)的影响,弹着点在靶标上只是近似呈正态分布,

李德毅 等:不确定性人工智能

1591

模云型用超熵来反映偏离正态分布的程度,如天气、心理等某些重要因素对射手的影响程度.用二维正态云模型描述总的射击情况:期望是所有云滴(弹着点)在靶纸上的平均点的坐标,反映了射手对准心的把握,是最能代表射手水平的靶位置;熵一方面反映弹着点的随机性,即分别在水平和垂直方向上相对于期望值的离散度,另一方面又体现了射中程度的模糊性——隶属度;超熵反映了熵的离散程度,体现了隶属度的不确定性及偏离正态分布的程度.云方法可以用定性的语言来描述3位射手的射击情况,反映“射手甲略偏右上且不够稳定,射手乙略偏右下但较稳定,丙的射点靠近靶心但不稳定”.

云方法通过逆向云发生器计算原靶图的数字特征,再利用正向云发生器模拟生成不同数量的云滴,大致还原出3位射手的水平,数字特征更容易反映出3位射手的水平.图5(b)和图5(c)分别模拟还原各射手10个和100个弹着点的射击情况.

云模型综合考虑随机性和模糊性,由定量到定性,用数字特征表示语言值.再从定性到定量,通过云发生器来模拟随机性、模糊性以及二者之间的关联性. 5.2 分形不确定性的计算机模拟

花草树木的形状常常都有分形性质,随着计算机图形学的发展,人们可以越来越方便地模拟生物的各种形态.分形最基本的性质是它的自相似性.这一性质为分形图形的计算机模拟提供了理论基础,通过简单的迭代,结合确定算法或者随机算法,可以生成复杂多变的植物形态.有许多生成分形图形的算法,如L系统、迭代函数系统、随机插值模型等等.云模型可以与分形迭代相结合,把不确定性思想融入分形迭代算法中,可以更直观地反映生物进化过程中的变异性.

设分形树按照规则R产生:

1. 以长度为L的线段为初始树干,从L顶部出发,左偏α°,生成长度为L*sl(0≤sl≤1)的左树枝1,右偏β°,生成长度为L*sr(0≤sr≤1)的右树枝2.

2. 从左树枝1的顶部出发,左偏(α+α)°,生成长度为L*sl*sl的左树枝3,右偏(β+β)°,生成长度为L*sr*sr的右树枝4;从右树枝2顶部出发,左偏(α+α)°,生成长度为L*sl*sl的左树枝5,右偏(β+β)°,生成长度为L*sr*sr的右树枝6.

3. 重复2,叠代至M次结束,由2(M+1)−1条线段构成一个二叉树形状,称为分形树. 例如,规则R中参数取α=β=40°,sl=sr=0.7,M=11,生成的分形树如图6中的期望树所示.

Expectation tree Variation 1 Variation 2

Variation 3 Variation 4 Variation 5

Fig.6 Simulate random variations by cloud-transfer parameters sets

图6 对参数集进行云变换模拟随机变异

如果以图6中的期望树为云模型的期望,对参数集Ex={α=β=40°,sl=sr=0.7}进行云变换,生成5个云滴,即图6中的5棵变异树.如果以图7中的期望树为云模型的期望,对规则R进行云变换,生成5个云滴,即图7中的5棵变异树.其中两次云变换的数字特征均为En={0.05,0.05,0.1,0.1},He={0.001,0.001,0.01,0.01}.按此方法,无论对分形参数集还是对分形规则集做云变换,都能够产生成千上万的变异树.

1592

Journal of Software 软件学报 2004,15(11)

Expectation tree Variation 1 Variation 2

Variation 3 Variation 4 Variation 5

Fig.7 Simulate random variations by cloud-transfer rules sets

图7 对规则集进行云变换模拟随机变异

云分形的思想能够很好地表示不确定性知识中的联系与差异.在具体的应用背景下,云的期望数据集有不同含义,可以是地形地貌特征、网络拓扑特征、种族遗传特征等等.与一般随机分形不同,云分形产生的随机数据集是期望的变异,熵反映了变异程度的大小,超熵则衡量了所有数据集分布偏离某一标准分布的程度.期望数据集和扩展规则集结合起来,可以得到不同的算法,产生不同的图形,反映植物遗传、地貌特征、网络拓扑变异中的关联性和不确定性.

5.3 网络拓扑不确定性的计算机模拟

网络的拓扑结构存在许多不确定因素,实际中的许多网络都是随机、动态地变化的.例如,在计算机网络中,某个机器突然死机、某段链路中断等;交通路线发生交通事故,或者因天气原因中断交通等等,都会造成网络拓扑的变化.网络拓扑可以用邻接矩阵来表示,将邻接矩阵作为云模型的期望数据集,对其进行云变换,可以模拟网络拓扑结构的随机变化.图8中的第1幅是某省通信网的网络拓扑简单示意图,将其邻接矩阵作为期望拓扑,再对期望拓扑进行云变化,即得到各种和期望网络拓扑既相似又不同的网络拓扑——云滴.如果考虑网络的带宽和流量,那么除了对网络的邻接矩阵进行随机变化以外,通过建立带宽或者流量数据集,并以此数据集为期望进行随机变化,可以得到有带宽表示的网络拓扑.图9是网络拓扑及流量的随机模拟图.

这样,通过网络拓扑结构的生成和模拟,可以表示现实网络拓扑结构和负载的动态变化.

Expectation topology

Variation 1

Variation 2

Variation 3

Variation 4

Variation 5

Fig.8 Random simulation of the communication network topology

图8 通信网络拓扑的随机模拟

李德毅 等:不确定性人工智能

1593

Expectation network

Variation 1

Variation 2

Variation 3

Variation 4

Variation 5

Fig.9 Random simulation of the communication network topology and traffic

图9 通信网络拓扑及流量的随机模拟

6 结 语

人工智能在模拟人类的确定性智能——逻辑思维方面,已经取得很大成就.但是,在人类不确定性智能的模拟方面始终没有太大的进展,而在模拟人类形象思维方面尚处在探讨阶段.因此,不确定性人工智能是人工智能中的研究热点,也是人工智能中的重大前沿课题[22,23].

人脑的神奇就在于它的形象思维能力,在于它解决处理不确定性问题的能力.大脑并不是靠“规则”或者“定理”解决不确定性问题,更不是靠精确的数理分析和计算来处理不确定现象,很多对计算机而言十分困难的问题,对大脑来说却简单、易行.由于在生物意义上,记忆、思维、想象、情感等奥秘远未揭开,脑科学和认知科学、人工智能研究的交叉还远远不够,奢望机器能够完全具备人类的不确定性智能、完全模拟人类的智能和情感还为时过早,期待脑科学、认知科学等多学科的突破.

我们目前所做的工作是力图从不确定性知识的表示入手,结合认知物理学思想,以此作为研究不确定人工智能的切入点,提出新思想和新模型.不确定性知识表示是研究不确定人工智能的一个很好的思路,这将是一项长期的基础课题研究,也蕴藏着重要的应用前景.

不确定性人工智能是人工智能进入21世纪的新发展,这个由计算机科学、物理学、数学、脑科学、心理学、认知学、生物学等自然科学和社会科学交叉渗透构成的新学科,必将使机器能够具备类似人脑的不确定性信息和知识的表示能力、处理能力和思维能力. References:

[1] Newton I; Wang KD, Trans. Philosophiae Naturalis Principia Mathematica. Wuhan: Wuhan Press, 1992 (in Chinese). [2] Handy C. Beyond Certainty: The Changing World of Organization. Pennsylvania: Harvard Business School Publishing, 1998. [3] Wang ZK. Applications of the Probability. Beijing: Beijing Normal University Press, 1995 (in Chinese). [4] Li HX, Wang PZ. Fuzzy Sets. Beijing: National Defence Industry Press, 1994 (in Chinese). [5] Pawlak Z. Rough sets. Int’l Journal of Computer and Information Sciences, 1982,11(5):341~356. [6] Gau WL, Buehrer DJ. Vague sets. IEEE Trans. on Systems, Man and Cybernetics, 1993,23(2):610~614.

[7] Li DY, Meng HJ, Shi XM. Membership clouds and membership cloud generators. Computers Research and Development, 1995,

32(6):16~21 (in Chinese with English abstract).

[8] Li DY. Uncertainty in knowledge representation. Engineering Science, 2000,2(10):73~79 (in Chinese with English abstract). [9] Qiu WH. Management Support and Applied Entropy. Beijing: China Machine Press, 2002 (in Chinese).

[10] Li DY, Liu CY. Study on the universality of the normal cloud model. Engineering Science, 2004,6(8):28~34 (in Chinese with

English abstract).

1594

Journal of Software 软件学报 2004,15(11)

[11] Ruelle D; Liu SD, Liang S, Li DL, Trans. Chances and Chaos. Shanghai: Scientific and Technological Education Publishing House,

2001 (in Chinese).

[12] Miao DS, Liu HJ. On Chaos. Beijing: Renmin University of China Press, 1993 (in Chinese with English abstract).

[13] Wang ZK. On chaos and randomness. Journal of Beijing Normal University, 1994,30(2):199~202 (in Chinese with English

abstract).

[14] Wang XY. Chaos in Complex Nonlinear Systems. Beijing: Publishing House of Electronics Industry, 2003 (in Chinese). [15] Sun X, Wu ZQ. Principles and Applications of Fractals. Hefei: University of Science and Technology Press, 2003 (in Chinese). [16] Wang XF, Chen GR. Complex networks: Small-World, scale-free and beyond. IEEE Circuits and Systems Magazine, 2003,3(1):

6~20.

[17] Lu RQ. Knowledge Engineering and Knowledge Science. Beijing: Tsinghua University Press, 2001 (in Chinese).

[18] Crick F; Wang YJ, Qi XL, Wu XN, Zeng XD, et al., Trans. The Astonishing Hypothesis. Changsha: Hu’nan Science and

Technology Press, 2003 (in Chinese).

[19] Wang S, Wang AS. Cognitive Psychology. Beijing: Beijing University Press, 2003 (in Chinese).

[20] Li DY, Gan WY, Liu LY. Artificial intelligence and cognitive physics. In: Progress of Artificial Intelligence in China 2003. Beijing:

BUPT Publishing House, 2003. 6~14 (in Chinese).

[21] Zipf GK. Psycho-Biology of Languages. Cambridge: MIT Press, 1965.

[22] Ford K, Hayes P. On computational wings: Rethinking the goals of artificial intelligence. Scientific American Presents, 1998,9(4):

78~83.

[23] Hearst M, Hirsh H. AI’s greatest trends and controversies. IEEE Intelligent Systems, 2000,15(1):8~17.

附中文参考文献:

[1] Newton I,著;王克迪,译.自然哲学之数学原理.武汉:武汉出版社,1992. [3] 王梓坤.概率论基础及其应用.北京:北京师范大学出版社,1995. [4] 李洪兴,汪培庄.模糊数学.北京:国防工业出版社,1994.

[7] 李德毅,孟海军,史雪梅.隶属云和隶属云发生器.计算机研究和发展,1995,32(6):16~21. [8] 李德毅.知识表示中的不确定性.中国工程科学,2000,2(10):73~79. [9] 邱菀华.管理决策与应用熵学.北京:机械工业出版社,2002.

[10] 李德毅,刘常昱.论正态云模型的普适性.中国工程科学,2004,6(8):28~34.

[11] Ruelle D,著;刘式达,梁爽,李滇林,译.机遇与混沌.上海:上海科技教育出版社,2001. [12] 苗东升,刘华杰.混沌学纵横论.北京:中国人民大学出版社,1993. [13] 王梓坤.论混沌与随机.北京师范大学学报,1994,30(2):199~202. [14] 王兴元.复杂非线性系统中的混沌.北京:电子工业出版社,2003. [15] 孙霞,吴自勤.分形原理及其应用.合肥:中国科学技术大学出版社,2003. [17] 陆汝钤.世纪之交的知识工程与知识科学.北京:清华大学出版社,2001.

[18] Crick F,著;汪云九,齐翔林,吴新年,曾晓东,等,译.惊人的假说.长沙:湖南科学技术出版社,2003. [19] 王甦,汪安圣.认知心理学.北京:北京大学出版社,2003.

[20] 李德毅,淦文燕,刘璐莹.人工智能与认知物理学.见:中国人工智能进展,2003.北京:北京邮电大学出版社,2003.6~14.

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 7swz.com 版权所有 赣ICP备2024042798号-8

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务