基于—模型下的新型属性分类信息的扩散机制研究
探究分类信息的扩散机制,关键在于构建信息的分类特性与其传播途径间的桥梁。虚拟社会网络作为当前最主要的信息扩散途径,在影响信息扩散的深度、广度及速度上有其显著特点;并且,这些特点能通过网络的结构特性得到具体的反映。当前,国内外对于社会网络特性的研究已经相当成熟,一些经典的成果已经可以为本研究的所借鉴:
(1)复杂网络(complex social network)的拓扑结构及无尺度特性(scale-free network)。自学者1999年提出互联网的无尺度特性以来,基于小世界模型()的社会网络拓扑结构()及节点中心度分布(例如López-Pintado,2008;Garry et al.,2009)的分布规律层出不穷,眼花缭乱。其中,节点中心度的幂律分布(无标度特性)是公认的标准(),它表明网络中节点的连通性概率分布遵循公式【】。基于此,学者们发现了社会网络因为优先依附(preferential attachment)法则而呈现的自组(self-organize)特性(),即社会网络的直径(diameter)可以随着新加入的节点的增加而进化【】。进而构建了以互联网拓扑结构为代表()的各式各样的网络拓扑结构,得到了一定技术发展下社会网络进化的规律,从而给人以直观的结构概念的理解,为本研究所建机制模型中的网络结构参数设定提供了借鉴。当前技术条件下,网络拓扑结构的建模已经颇为成熟,
(2)社会网络中集群(Cluster)的划分。通过对集群进行划分,可以得到网络中人群在不同维度下的相似性分布规律,有助于区分不同小世界的特点,发现它们之间的联系。长久以来,划分集群的模型主要通过基于结构等价()、保守等价()及规则等价()等算法的块式()(blockmodeling),CONOR(),Pearson-correlation()等模型予以实现;随着虚拟社会网络的出现,数据的离散性及差异性进一步增加,有学者结合传统算法的优点,建立了广义集群划分模型(generalized model of clustering),该模型能够结合当前社会网络中信息多且杂的特点,考察样本的相似性,且得出的一模(one-mode)数据相似度模型遵循【】。此模型为信息恒定本质对特定人类集群的映射提供了参考。
(3)网络节点的重传机制。已有研究证明节点的活动性对信息的传递-采纳-中转的三步微观过程是信息扩散输出的决定性因素()。并且人们对信息的感知由“质量”,“传输速度”,及“可靠性”界定,亦有学者证明了信息的活化与钝化的情感特性对其扩散结果的不同影响(),指明富含正面情感特征的信息可以被更多的节点重传,并在网络中扩散得更远。然而,相关的结果多来自于统计学的结果,数学的模型并没有得到深入的介绍,有关信息对人群特点的映射却不识庐山真面目。
(4)信息扩散机制与扩散输出的关系。信息扩散输出考察某一特定时间网络中的采纳者总数,而信息扩散机制是引起输出结果的毕竟过程。综观信息扩散机制的模型,广而多,有线性门槛模型(linear threshold model)(),它通过给节点设置门槛值,给节点间关系设置权值来考察信息扩散规律;有基于级联模型(independent cascade model)的检索模型(Retrieval Model)(),它通过分析信息扩散的历史进程得出扩散规律;有广义的级联模型(generalized cascade model)(),它将线性门槛模型和级联模型结合,通过节点间联系的概率和相应的门槛值来计算出信息扩散的规律。基于门槛值的模型认为信息在节点间的流通进程可以由阈值或门槛(threshold)进行定量衡量,每当扩散门槛(diffusion threshold)大于临界门槛(critical threshold)时,信息得以在无标度网络中按照幂律【】进行扩散()。以门槛值为基础的SIS模型、谣言传播模型(rumor spreading model)在一些领域中得到了
应用。而对网络中节点关系,以及这些关系对于信息扩散的作用的代理模型(Agent Based Model),是最广泛应用于研究社会网络问题的()。代理模型关注于社会网络动力学特性的微观变化,考察二元或三元(triadic)小组的信息传递速率,通过设置所需参数,便可以测出网络的结构特性,进而总结出信息扩散的规律()。最近有研究基于ABM模型建立了信息亲和模型(Message Affinity Model)(),通过给网络的节点设置倾向值(propensity value)来描述节点对信息的认知程度,通过两个参数:亲和力分布、亲和力阈值来控制模型,将节点对信息进行了映射,进而考察了信息扩散规律。
综合以上文献的成果,可以发现,探究信息与人的关系已经成为趋势,然而,技术的进步引发社会结构的变迁,人对信息不同属性的认知也在不断改变。而虚拟社会管理要求防患于未然,由社会结构变化导致的变化有其滞后性。出于此目的,信息对变迁的社会结构的不变映射就成了本研究的重点所在。而根据相似性的一致性(),信息的本质属性可以作为一条恒定的有向输出,贯穿于以上四个研究范畴的始末,使得整个对社会网络的研究成为一个相对封闭的系统(如下图所示)。
(1)信息扩散的途径(Social Networks; Social Structure)。复杂性网络是由大量相互作用的子系统构成,其复杂性体现在:①包含非常庞大数量的节点;②网络节点之间的联系关系异常复杂。 “网络”是通过人和群体之间的传播创造出来的社会结构(Stohl,1995;Monge,1987),直接影响信息在网络中扩散的深度、广度及速度。在现实社会网络中,信息的扩散速度受到信息传播渠道的,空间距离成为影响信息流动最大阻碍(例如Hagerstrand,1953)。随着互联网和Web2.0技术的发展,信息传播真正突破了时空和地域的,人们在持续不断的传播中建立各种各样的联系,网络结构也呈现出动态性的特性,学者们对虚拟社会网络结构进行了大量的理论与实证研究。标志性成果包括:度分布(例如López-Pintado,2008;Garry et al.,2009)论证了网络中具有中心度(吴思竹,张智雄,2010)的节点连接及分布规律,是分析网络结构特性的重要参数;小世界效应(Watts et al.,1998)提出网络中的节点由一条随机的短路径相连,节点之间的信息传递因此而加速;以此为理论基础的小世界模型(例如Kazuo Yamaguchi,2002;Newman et al.,2000),成为了对社会网络结构建模,研究信息扩散途径的重要基础;互联网拓扑结构及无尺度特性(例如胡海波 et al.,2009;Jon,2008;Reka et al.,1999;Albert-Laszlo et al.,1999)对互联网进行了结构建模和特性分析,证实了信息的在虚拟社会网络中的快速传播遵循幂次定律。虚拟社会网络的次数、群集、平均距离性质作为探究信息扩散规律的立足点,已经建立了相当完善的理论体系。 (2)信息扩散的参与者(Actors; Nodes)。人作为信息接收与传播的主体,在信息扩散过程中具有关键性的作用。随着“线上社会网络”概念的深入人心,虚拟社会在结构上更加趋进于实际社会,信息扩散中个体的作用被广泛研究。许多学者将影响集(Merton,1968)、易感人群(Watts & Dodds,2007)等经典理论和信息扩散机制加以整合分析,并结合实际调查研究,发现节点(个体)的连通性是影响信息扩散的重要因素(例如Shintae et al.,2011;Forrest & Jonathan,2010;Garry et al.,2009;López-Pintado,2008;赵金楼,2006)。连通性关注节点在网络中的位置与影响力对信息扩散效果的影响。最新研究指出,节点的活动性(信息采纳者二次传播的动力与能力)是影响信息扩散的决定性因素(Andrew et al.,2010;胡海波,2010)。已有研究验证了信息的情感特性对信息采纳及信息扩散结果有重要的影响。鉴于互联息的内容可能引发社会或个人情绪这一客观事实,学者将信息按照情感因素分为活化(正面)情感和钝化(负面)情感,指明具有活化情感特性(敬畏,惊异,正面的,令人感动)的信息比后者更能够促进个体的传输进程,在病毒式的扩散过程中走得更远
(Jonah et al.,2010)。此外,在信息传输过程中,传递者对信息情感特性的适应度(即传输过程是否符合传递者的动机或认知能力),也是影响传输过程的一个重要方面(Jonah et al.,2010)。
(3)信息的扩散机制(Diffusion Mechanism or Dynamics)。信息扩散机制构建了在社会网络中影响信息扩散要素的基本研究框架。静态的网络结构特性引发了学者对动态的网络结构变化的研究,基于复杂网络的动力学特性(Boccalettia et al.,2006),学者发现了诸如代理模型(例如Iribarren & Moro,2010;Garcia & Rummel,2007;Bonabeau,2002),门槛模型(例如王萍,2009;Granovetter,1978)、级联模型(Jacob et al.,2001),网络维力和信息扩散场(邓忆瑞,2008)等重要的结论,多角度揭示了人际交互及网络结构动态变化对信息扩散的促进作用,同时揭示了信息价值的存在时间对信息扩散中一些作用(邓忆瑞,2008)。此外,社会网络分析(SNA)作为一种相对的研究社会结构的方法,已发展成为一种具有专门的概念体系和测量工具的研究范式,具有自己的理论基础和方原则。
无疑,线上社会网络的出现,从根本上改变了人与人之间信息流通的方式,加速了信息的扩散(Jon Kleinberg, 2008),也引起了大批学者对此现象的讨论和研究。关于线上社会网络与信息扩散的关系的研究,是一个微观-宏观-微观的过程。
早期的研究关注社会网络中人与人的交互作用(social interaction),提出了影响集(influentials)的概念(Merton, 1968),在一些特定的领域,如社会学,产品营销,技术、创新扩散,影响集的概念得以建模和扩展,社会传染(Marsden and Friedkin, 1993),社会学习曲线(Bandura, 1971),口碑效应(Engel et al., 1969)等重要成果,都是这个时期的产物。这一时期,包括专家,明星,领导者在内的影响集(Merton, 1968),被认为是形成社会共同观点或观点(collective attention/public opinion)(Katz and Lazarsfeld, 1955),制定营销策略(Van den Bulte and Joshi 2007; Vernette 2004),技术、创新扩散(Rogers 1995; Valente 1995)的主要影响因素。此时,对于影响集的建模关注个体连接的广度,遵循主导的二步流程(Bineham 1988; Katz and Lazarsfeld, 1955)。
随着对个体连接方式研究的广泛深入,以影响集为中心,人们构建了小世界模型(Kazuo Yamaguchi, 2002; Massimo Marchioria and Vito Latorac, 2000; Watts, Duncan J. and Steven H.Strogatz, 1998),使得这种观点更加成熟。然而,随着线上社会网络的出现,越来越多的小世界被整合和扩展,研究从微观层面发展到宏观层面,研究的重点也从普通的社会网络转向了线上社会网络,通过将小世界的模型级联,人们定义了节点,并为其赋予了特殊的参量,连通性。通过众多学者的研究,人们对线上社会网络的网络结构建立了ABM等成熟,适用的模型,以此将不同影响集(或者枢纽)连接起来,并广泛应用于各个领域,得出了许多重要的结论(R. Garcia, P. Rummel, J. Hause, 2007; E. Bonabeau, 2002; C. Cioffi-Revilla, 2002; Brady Baybeck and Robert Huckfeldt, 2002) 。这一时期,连通性与网络结构的关系,与信息扩散的关系,是研究的重点,是偏向于数理方向的,对于网络中其它因子的特性,并没有过多的讨论。随后,学者针对信息扩散输出的结果的探究,发现了引起信息扩散的级联现象并最终形成社会共同观点的原因并不是因为影响集,而是社会中普遍存在的大量易感人群(Watts, Duncan J. and Peter Sheridan Dodds , 2007),在此基础上,对基于ABM等模型的连通性分布,自由尺度特性的研究及应用,使得对线上社会网络,社会网络的研究的日趋成熟(Shintae Kim, Keeheon Lee, Jang Kyun Cho, Chang Ouk Kim, 2011; Forrest Hare, Jonathan Goldstein, 2010; Garry Robins, Pip Pattison, Peng Wang, 2009; López-Pintado, 2008; Feng Fu ,
Xiaojie Chen, Lianghuan Liu, Long Wang,2007; Robert L. Goldstone and Marco A. Janssen, 2005)。研究也从社会学与数理,计算机学的交叉转变到了社会学,心理学,流行病学与数理,计算机学的交叉,这又引发了对网络中个体特性的探究热潮。
至此,对宏观层面的扩散研究又回到微观层面,使得对社会网络的研究成为了一个螺旋上升的循环。现在,对社会网络的研究分为两个的模块,向下,仍旧是个体(或节点,传递者)与信息扩散结果的关系;向上,则是信息本身属性与信息扩散的关系。
在个体与网络的关系上,学界普遍认为宏观层面上的扩散输出是由微观个体层面上的传输进程决定的(Andrew T. Stephen, Yaniv Dover, Jacob Goldenberg, 2010; Jonah Berger and Katherine L. Milkman, 2010; Jon Kleinberg, 2008)。在最新的研究中,学者提出了传输-消费-中转的三步传输进程,通过研究,证实了网络中节点的活动性而非连通性对微观层面上传输进程的起到了决定性作用,并且它能影响最终的扩散输出结果(Andrew T. Stephen, Yaniv Dover, Jacob Goldenberg,2010)。
在信息本身属性与信息扩散的关系上,一些学者认为,人们对信息的感知由“质量”,“传输速度”,“可靠性”界定,扩散过程中,信息的接收者对信息来源(节点)的活动性认知体现在后两项上,而信息“质量”并不重要,因为它是活动性的附加属性(Andrew T. Stephen, Yaniv Dover, Jacob Goldenberg,2010)。但是,另一些研究者发现线上的信息内容引发了社会或个人情绪,并依此发现了信息条目的情感特性对其社会传输过程有重要的影响,在这里,他们将信息按照情感因素分为活化(正面)情感和钝化(负面)情感,指明活化情感特性(敬畏,惊异,正面的,令人感动)的信息比后者更能够促进传输进程,在病毒式的扩散过程中走得更远,并且,在传输过程中,传递者对信息情感特性的适应度(心理学过程:即传输过程是否符合传递者的动机或认知能力),也是影响传输过程的一个重要方面(Jonah Berger and Katherine L. Milkman, 2010)。
这样,对于信息本身对网络扩散输出结果的关系,学界并没有一个完整统一的认定。
此外,一些对文学,市场营销(技术扩散)和社会心理学的较新研究发现,小说中大多包含情感因素,且改变行文的风格会影响读者的数量(Milkman, Katherine L., Rene Carmona, and William Gleason (2007));当人际交流中出现了情感分享时,那么人的交际圈会变得更加紧密(Peters, Kim and Yoshihasa Kashima (2007));人们自我提升的愿望能够促进具有交换价值的有益信息(正面的情感)的交互过程(Wojnicki and Godes 2008, Fehr, Kirchsteiger, Riedl 1998);分享感情丰富的条目能够增加连接和加深社会联系(Heath, Bell and Sternberg 2001; Peters and Kashima 2007)。
将这些结论,结合网络中个体的偏主观特性(活动性)的作用,我们似乎可以发现,研究信息条目本身的特性,对在信息的扩散或采用的过程中的作用,并具体阐明其中的机制,或许是有着重要意义的。
然而,值得注意的是,以上分析结论大多是建立于信息所包含的情感特性与扩散结果的关系上的,对于其它特性的信息,鲜有学者去涉足。这是因为,对于信息的界定,并没有一个统一的概念,我们只能挖掘信息中与传递者相关的特性去探讨它的作用,基于传递者活动性对于传输过程的决定作用的结论(Andrew T. Stephen, Yaniv Dover, Jacob Goldenberg,2010),考察信息属性对传递者的影响。此外,想要更深入了解这个复杂的问题,不仅需要考察个人
层面上的机制(社会网络或心理学上的扩散驱动因素),还要探究他们如何共同作用去影响输出结果的(JONAH BERGER, KATHERINE L. MILKMAN, 2010)。
如果从扩散输出的结果入手,逆向分析,有研究表明,作为输出结果的一种,大范围的集体注意力(社会共同观点)的动态变化是以新奇性为因子随时间而衰减的(Wu, Fang and Bernardo A. Huberman (2007)),那么,根据网络的分布结构,这里所提到的新奇性必然只是信息本身的特性。为此,就必须要探讨什么样的信息具有新奇性,能够引发社会的共同观点,这其中又隐藏着怎样的机制。同样,每个线上社会网络的分布各有其特点,网络中的节点亦有其特点,既然已经知道了节点的重要性,那么,能否对不同的节点进行分类,结合它们在网络中的分布,针对它们对各类信息的适应度,探讨不同信息对特定社会网络的扩散输出结果的影响。