1.2.1 社交网络分析研究方向

频道:社交专题 日期: 浏览:9

1.2.1 社交网络分析研究方向

信息传播

社会交往网络剖析也就是 SNA 的探究展现有着诸多角度、多个层次等这类特征的情形 。在 1967 年的时候 Stanley Milgram 在他所公开的名为 The Small World Problem 的论文即关乎所谓小世界问题这项内容里提挈出关于六度分隔的一种理论 。于这一篇文稿当中爱游体育app下载官网,他凭借连锁信实验得出的成果 ,提出来声名远扬的六度分隔理论 ,也就是任意两个彼此不相识的美国人相互之间 ,平均而言仅需经由六个人便能够构建起关联 。这样一个理论揭示出人际网络之中人们关系的紧密的状况 ,并且对于后续的社交网络的研究造成了意义重大的较为长远的影响 。

有人针对信息传播展开研究,这研究主要分成三个方面,分别是流行度分析,信息传播建模,还有信息溯源。针对流行度分析,Szabo和Huberman等人提出了SH模型,借助回归分析来预测信息的流行度。他们给流行度分析构建理论基础,运用数学模型以及数据分析方法,去探索信息流行度的形成与演化机制。胡长军等人所著的《在线社交网络信息传播研究综述》系统归纳了流行度预测以及流行度演化分析的方法,涵盖基于回归分析、用户行为以及时间序列的方法。

较常用的信息传播模型,主要有独立级联模型,也就是in-dependent cascade model,简称为IC,还有线性阈值模型,即linear threshold model,简称为LT,以及传染病模型中的,SI模型、SIS模型、SIR模型、SIRS模型、SEIR模型等。Myers和Leskovec,研究了多条信息在社交网络中的,竞争与合作机制。他们运用博弈论以及传染病模型,去分析复杂信息交互对于传播效果所产生的影响,进而建立起了愈发精细的传播模型。在2001年的时候,Domingos和Richardson提出了基于马尔可夫随机场也就是Markov random field的社交网络影响力模型,此模型主要是用来分析社交网络里用户行为之间的相互依赖关系这个情况的,尤其是在信息传播以及影响力扩散的过程当中 。方滨兴等人所著的其中名为《在线社交网络分析》的书本里,介绍讲述了单信息传播建模相关方法,以及多信息传播建模相关方法,特别是尤其基于复杂网络理论以及动态变化特性的模型,借助通过改进改良传统传播模型,考虑思索时间延迟、异步传播以及其它类似种种因素,进而能够更准确精确地描述阐述信息传播整个过程。

有关信息溯源方面的研究开启进程比较早,其理论基础相对比较扎实,研究途径趋向多样且具有精致细密的特性。众多学者不单单留意溯源算法的精确程度以及效率高低,还着重看重溯源技术于公共健康、信息传播控制一类领域得以运用的状况。举例来说,Lokhov等人提出来一种借助基于动力学消息传递算法而得生出的溯源办法路径,可凭借网络其中节点之间所存在的连接关系以及所观察察觉到的感染状态情形,朝着反方向去推行并演算推导得出最具有可能性的感染源头。这种办法途径于复杂网络环境设置情况下展示流露出来比较高的严密准确度以及前行效率。他们在研究里运用了三种算法,分别是动态信息传递算法,还有SIR模型假设法以及统计推理法。其中动态信息传递算法借助在网络中迭代传递信息,以此来更新每个节点作为潜在源头的概率。在每一次迭代时,每个节点依据其邻居节点的状态以及连接关系,计算并且更新其被感染的概率,这般逐步逼近真实的感染源。SIR模型假设法,通过假设信息传播遵循SIR模型,也就是易感者-感染者-恢复者模型,此模型中节点处于三种状态之一,分别是易感状态、感染状态或恢复状态,并且会通过一定概率在这些状态之间转换,经由这个过程,最后结合动力学信息传递以及统计推理的方法,针对网络中每个节点作为源头的可能性展开评估以及排序,最终敲定最可能的感染源,Prakash等相关研究探讨了在不完全时间戳条件下里的信息溯源问题,还提出了基于部分观测数据的溯源算法。Zang等人针对社交网络里发现多个信息传播源节点这一问题展开了研究,进而提出了多源溯源方法,该方法是基于反向传播以及节点分区的。国内学者于信息溯源领域主要聚焦在复杂社交网络结构情形下的高效且准确的溯源方法。其研究方法涵盖基于节点属性的方法、基于传播模型的推理法以及融合大数据与机器学习的创新方法。胡长军等人对信息溯源的基本方法、挑战以及最新进展进行了综述,还介绍了基于中心度测量、统计推理等的多种溯源技术。方滨兴等人探讨了社交网络分析里的信息溯源问题,尤其是不完全观测状况下的溯源方法。

情感分析

社交网络分析,最早是由英国那位著名的人类学家Radcliffe - Brown(拉德克利夫 - 布朗)提出来的,他主张去对社会结构做分析,还呼吁学者们开展关于社会网络的系统研究以及分析。而情感分析(sentiment analysis)的引入,是作为一种针对自然语言处理(NLP)的技术发展起来的,其目的在于对人类言论等行为所表达出来的情感导向进行分析。社交网络分析里的情感分析,从严格意义上来论,是属于观点挖掘这一范畴的,它是依据用户于社交网络中的系列行为,像是评论、点赞等,以心理学、行为学等这些理论作为基础,运用自然语言分析处理技术等那样的方法,去剖析社交网络用户针对实体,比如产品、事件、观点、个人等等所表达出的观点及情感倾向等 。

互联网技术快速发展着,在此情形下,包括Facebook、Twitter、微博等在内的在线社交网络,快速地崛起了,成为人们平常生活没法缺少的一部分,诸多平台给用户提供了分享生活的空间,提供了表达观点的空间,提供了表达情感的空间,进而产生了大量的用户生成内容,也就是UGC,其中涵盖文本,涵盖图片,还涵盖视频等 。社交网络数据具备规模极其庞大的特点,有着动态性,还呈现出多样性,它为情感分析供给了丰富的数据源,同时这些数据涵盖着用户真实的情感表达,对于领会公众情感、预测社会事件等且有着重要意义,这致使企业、政府以及学术界对理解公众情感的需求不断增长,情感分析成为自然语言处理领域里极为热门的一个研究方向,而情感分析意在从文本数据之中提取情感信息爱游戏ayx官网登录入口,像情感倾向、情感强度等,用以支撑决策制定、市场研究以及舆情监控等应用这些情感处理需求具备特殊性,情感分析有特定效果,二者相结合,使得情感分析应用格外重要。

社交网络分析与情感分析的结合,是计算机科学、社会学以及心理学等多学科交叉融合而产生的结果,不同领域的学者,从各自学科的角度,针对这一问题展开研究,这同时也推动了情感分析在社交网络分析方面的应用与发展。

社区发现

社区发现,即community detection,是在社交网络里识别、提取具有高度内部连接的节点子集或群体的过程,社区一般代表社交网络中结构紧密、联系密切的子群体,像朋友群、兴趣小组或专业网络,发现这些社区对理解网络的结构、功能意义重大,社交网络分析里关于社区发现的研究成果丰硕,且发表了大量相关文献。这些研究不仅给出了多种社区发现算法,还探究了社区发现在社会网络分析、信息传播以及推荐系统等多个领域的运用。在社区发现算法的相关成果里,比较常见的有基于模块度的优化算法、谱聚类算法、标签传播算法以及动态社区发现算法等 。

Newman快速贪心算法,是基于模块度的优化算法里较为常见的一种算法,首次由Girvan等系统地研究了复杂网络中的社区结构并提出。他们先是定义了网络中的社区结构,此结构指网络可被划分成若干内部连接紧密且外部连接稀疏的子图,还定义了边介数,边介数是网络中所有最短路径里经过某条边的比例。基于边介数设计了一种迭代算法,以发现网络中的社区结构。基本步骤为,持续移除网络里边介数最高边,每次移除后重新计算剩余网络边介数,直至网络完全划分成孤立节点或达到预设停止条件,通过对多个真实网络分析,展示了Girvan - Newman算法有效性 。

谱聚类算法,也就是spectral clustering ,是一种聚类方法,该方法基于图论 ,它借助数据的相似度矩阵,也就是亲和度矩阵,通过其特征值以及特征向量实施聚类 。在社交网络分析的研究里 ,借助构建社交网络中的用户关系图 ,谱聚类算法能够发现社交网络中的社区结构 。Luxburg等将谱聚类的理论基础 、算法步骤以及在不同场景下的应用进行了详细介绍 。他们以图割的视角为出发点, 对谱聚类算法的本质与优点作出了解释 就谱聚类算法的一致性这一问题展开探讨 也就是伴随着样本量增长 谱聚类算法可实现稳定收敛至真实聚类结构这类情况 于理论证明层面 针对谱聚类算法在特定的一些条件下的一致性问题予以了分析 这些条件涵盖了数据的生成模型 以及相似度矩阵做出选择 和聚类数量予以确定等方面 同时还探讨了谱聚类算法于不同条件下的收敛速度 和能够收敛至真实聚类所需要的充分必要条件 。这些分析,为谱聚类算法的应用,提供了重要的理论依据,最终,从理论上,证明了谱聚类算法,在某些条件下的收敛性和一致性,为谱聚类算法的应用,提供了坚实的理论基础。Ng等,提出了一个具体的谱聚类算法,并分析了其性能。该算法,基于数据的相似度矩阵的特征向量,通过K - means等简单聚类方法,完成最终的聚类过程。

有一种基于图的半监督学习方法,叫做标签传播算法,也就是LPA,其主要用于数据聚类或者任务分类。Zhu等人首次把标签传播算法提出来,该算法借助构建数据项之间的相似度图,把已标记节点的标签信息,通过图结构传递到未标记节点。算法的基本思想是依据图的局部一致性假设,也就是相邻节点往往倾向于拥有相同的标签,然后将这个假设应用于半监督学习问题当中。在2007年,Wang等人提出了一种全新的标签传播策略,该策略是利用节点的线性邻域关系去指导标签的传播,他们引入了线性邻域的概念,也就是说每个节点不但和其直接邻居相连,而且和它邻居的邻居也就是二阶邻居等以线性方式存在关联,这种线性邻域关系借助考虑更广泛的上下文信息来改进标签的传播,另外为了提升算法的效率,他们还提出了基于稀疏矩阵的优化方法,利用稀疏矩阵运算去加速标签的更新过程。2010年,Liu等人开展了研究,研究的内容是在大规模图上构建有效标签传播算法的方法,该方法通过构造稀疏图结构来降低计算复杂度,并且同时保持较高的分类性能 。

动态社区发现算法重点在意的是,怎样于动态网络里高效地辨认以及跟踪社区的演变。伴随社交网络的兴起,还有在线交互数据的爆发似增长,动态社区发现成了复杂网络分析里的一个重要研究范畴。Greene等人针对动态社交网络里的社区演变做了研究,借助关注动态社交网络中社区随时间的变化进程,表明动态社交网络中的社区结构是随时间持续变化的。他们介绍了多种社区发现算法,模块度优化算法是其中一种,同时他们提出了一种社区发现算法,该算法适用于动态网络,能够处理网络拓扑结构的快速变化,还能跟踪社区的演化过程,此外他们定义了量化社区演化过程的指标,社区存活时间、社区大小变化率等是这些指标,用于评估社区演化的稳定性和动态性,通过这些指标,可以对不同社区的演化模式进行比较和分析。

舆情传播

在社交网络以及媒体平台之上,公众意见得以形成,情感得以形成,态度得以形成,这一形成过程还伴随着扩散,从而构成了舆情传播。互联网普及开来,社交媒体普及开来,在此情形下,舆情传播的速度显著增强,影响力显著增强,进而成为社会舆论的重要组成部分,成为公共政策的重要组成部分。舆情传播已然成为社交网络分析里的一个热门研究领域,此领域吸引了众多学者给予关注。国内在社交网络分析方面取得了显著进展,在社交网络分析于舆情传播中的应用方面同样取得了显著进展。国内学者对经典信息传播模型如独立级联模型、线性阈值模型进行改进,进而提出多种适用于社交网络的信息传播模型,以此来更好地描述舆情传播过程。在舆情监测与预警方面,基于社交网络大数据展开研究,探究舆情事件的监测、预警机制以及舆情演化之趋势预测。比如,国内有多个研究团队开发了舆情监测系统,借助实时监测社交网络里关键词、情感倾向等指标,为政府与企业提供舆情预警服务 。

国外在社交网络分析方面,研究起步较早,在舆情传播方面,研究成果丰富多样。国外研究者不仅关注舆情传播的基本机制。而且还深入探讨了舆情传播与社会现象之间的关系,深入探讨了舆情传播与公众情绪之间的关系,深入探讨了舆情传播与政治态度之间的关系。同时国外的研究还注重跨学科合作,把计算机科学 领域的知识和方法结合起来,把社会学领域的知识和方法结合起来,把心理学等多个领域 的知识国外学者所提出的信息传播理论,是从复杂网络、传染病模型、博弈论等多个角度得来的,它为解释舆情于社交网络里的传播机制,提供了重要的理论框架。其中,Myers和Leskovec所提出的竞争传播模型,考虑了信息之间的竞争与合作关系,它能够预测多种信息在社交网络中共同传播的情形。他们构建了一个信息传播模型,是基于进化博弈论的思想,用来模拟多种信息在社交网络中的传播过程。该模型考量了信息间的竞争以及合作机制,借助量化信息间彼此的相互作用,去对不同信息的传播情形作出预测,试验完毕之后发现这般基于进化博弈论的信息传播模型,能够较为出色地对多种信息于社交网络里的共同传播情形予以预测,并且同传统的独立级联模型相比较而言,此模型在预测精确度方面有着显著的提升,能够更优地捕捉到信息间的相互作用,这种模型为舆情传播研究供给了一种全新的视角以及方法爱游戏最新官网登录入口,有助于更为深入地领会舆情于社交网络中的传播规律以及机制。同时,这种理论框架为舆情监测提供了有效的工具和方法,为舆情预警提供了有效的工具和方法,为舆情管理提供了有效的工具和方法,对于监测舆情传播效果具有重要意义,对于维护社会稳定具有重要意义。Vosoughi等收集大量来自不同在线社交网络的数据,这些在线社交网络如Facebook、Twitter等,数据包括真实新闻和虚假新闻传播数据,通过分析,通过对比,发现虚假新闻在某些情况下传播得更快,发现虚假新闻在某些情况下传播得更广。他们探讨真实新闻和虚假新闻在社交网络中的传播差异,而这对理解舆情传播中的信息真实性问题具有重要意义。

国内的研究,既有关注舆情传播那时时刻刻广泛存在着的、涉及范围涵盖诸多方面的宏观过程,又向深入到细微、精密境地中那微观部分推进,去剖析包含个体行为、社交关系、作为信息传递线路样式的信息传播路径等在内各项因素对于舆情传播的所产生的影响。相应的研究成果在被应用于政府决策、企业公关、针对社会舆论开展的监控等多个领域之时,为有关部门给出了具有重要价值能当作参考凭借的依据 。

推荐系统

有这样一种技术名为推荐系统,它会去分析用户行为,还会分析用户偏好来为用户提供个性化产品,或者提供个性化服务,又或者提供个性化信息建议。推荐系统在电商平台广泛应用,在社交媒体被广泛应用,在流媒体服务广泛应用,就连新闻网站亦广泛应用,其目的是来提高用户体验以及用户为满意度,同时让平台的用户黏性增加并且商业收益也得到增加。社交网络分析在系统推荐方面存在许多研究,其中有的研究是比较深入的,在这里我们会在三个研究方向对这些研究展开探究。

第一个方向是基于图结构的推荐算法,它把社交网络视作图结构,借助图算法挖掘用户间潜在联系,以此改进推荐效果。比如Baltrunas强调,在实际应用里,用户兴趣和偏好会随时间变化。所以,传统静态推荐方法常常不能准确捕捉用户动态需求,他提出构建时间感知推荐系统的必要性,目的是通过考量时间因素提升推荐的准确性与个性化程度。他探讨了利用隐式反馈数据构建推荐模型的方式,特别是怎样从非直接反映用户喜好的行为里提取有用信息,隐式反馈如浏览历史、点击行为等,与显式反馈如用户评分相比,更为丰富且易于获取。他介绍了一种基于时间感知的协同过滤推荐算法,该算法在建模时考虑了时间因素对用户兴趣及偏好变化的影响,利用时间戳对用户的隐式反馈数据排序和分组,通过分析不同时间段用户行为差异捕捉用户的动态兴趣变化。最后,经过开展实验证实了,这种算法在表现的情况下,于准确性这一方面,以及个性化具体程度此类关键问题上,都呈现出了显著的提升现象。

第二个研究方向为社交影响跟推荐,借助探究用户于社交网络里的相互影响行为,来探寻怎样运用这种影响增强推荐的可信度以及接受度。比如Ozsoy等阐述过基于信任的推荐系统,突出了在社会化网络中,用户间的信任关系对推荐效果具备显著影响。用户的信任网络给予了有关用户偏好以及可靠信息源的重要线索。他们对能够分析传统推荐系统局限性的情况进行了分析,传统推荐系统存在基于内容的推荐、协同过滤等形式,其局限性在于处理稀疏性的时候存在不足,在处理冷启动问题的时候有所欠缺,还存在对用户间信任关系忽视的缺点。 不同类型的信任度量方法被介绍,这里面有显式信任,还有隐式信任,基于此,如何构建信任网络经过了讨论,基于这些信任网络相关来改进推荐算法的事宜也被讨论。经过例子说明,通过整合信任网络信息以及用户评分数据生成更加准确推荐的情况得以说明。最终,通过实验以及案例分析,考虑用户间信任关系对于提高推荐系统性能的重要性被证明了 。依赖信任的推荐系统会生成更契合用户真实需求以及偏好的推荐成果,来提升用户的满意度与忠诚度。

最后的那个,研究方向是深度学习,在社交网络推荐里的应用,它利用深度学习模型,像卷积神经网络,循环神经网络,图神经网络等,去处理社交网络里的复杂数据,达成更精准的推荐。

网友留言(0)

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。