面向虚拟社区的社会化专家建模及应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 绪论

1.1 研究背景及意义

传统社区是以一定划分标准聚集在一起的群体,这个标准可以是专业领域、行政区域或者地理位置等,但虚拟社区是互联网时代的新产物,有着特殊的互动法则和动态特性。虚拟社区通常是指通过互联网媒介的虚拟空间进行相互沟通,分享知识和信息的群体,该群体彼此之间具有共同的兴趣,通过彼此间的沟通及关怀构建网络空间中的联系。随着移动互联网的发展,越来越多的人趋向于利用碎片化的时间浏览微信朋友圈、微博、知乎等虚拟社区,并在社区中表达自己的观点、情感或兴趣,产生了大量的用户生成内容(User Generated Content,UGC)。对虚拟社区用户生成内容进行挖掘,以发现用户知识和偏好的准确描述,即虚拟社区用户建模,是开展虚拟社区个性化推荐等服务的核心基础。对虚拟社区的用户进行准确建模和分析,有利于在虚拟社区中开展社会化专家推荐等一系列个性化推荐服务,还能够及时为用户提供或获取在线社会支持等服务,通过提升用户体验,也可以促进虚拟社区更加健康地发展。

在当前网络环境下,虚拟社区的用户生成内容不是一成不变的,尤其是随着网民对互联网和虚拟社区的认可和参与度的提高,虚拟社区中用户生成内容呈现的动态变化特征愈加显著。识别这种动态性并分析其所呈现出来的规律成为提高用户建模准确性和有效性需要解决的关键问题。现有的虚拟社区用户建模方法尚未达到理想状态,常见的用户建模方法有用户画像、链接预测及基于图论的对象关系建模等,但这些方法都或多或少存在一些不足。本书系统地梳理了虚拟社区用户建模的相关研究,并在此基础上对现有用户建模理论研究进行改进,以提高用户建模的准确率。现有虚拟社区用户画像建模主要使用的数据包括属性类数据、行为类数据和内容类数据。属性类数据统计是目前用户画像建模较多使用的方法,但仅通过属性类数据统计构建的用户画像信息有限。通过行为类数据统计构建的用户画像难点在于行为类数据记录的成本较大,对用户内容类数据的关注较少。因此,本书借鉴现有用户画像的构建方法及表示方式,从文本词项的角度出发,探索基于LDA主题模型的虚拟社区用户画像构建方法,同时融入时间维度,考虑虚拟社区静态用户画像和动态用户画像的构建方法,并通过用户画像可视化的方法,探索虚拟社区用户画像的规律。传统的基于共同邻居的链接预测算法将所有的邻居同等看待,没有区分各邻居对链接预测的贡献;而且主要针对无权网络,没有考虑加权权重对链接预测的影响。因此,本书提出了节点亲密度的概念,既考虑了加权网络环境下,不同节点对于链接预测的影响,也提出了节点内容相似性的链接预测方法,并将节点的时间属性、拓扑结构属性及内容属性融合进行链接预测。图能够以简单而系统的方式建模对象之间的复杂关系,包含更为丰富的信息,成为近年来数据挖掘的一个重要方向,基于图的推荐已从单部图推荐向二部图、多部图乃至混合图推荐转变,并随着图中信息的逐步丰富,在缓解数据稀疏、提高推荐精度上表现出更加明显的优势。基于此,本书从图模型角度出发,将虚拟社区抽象成一个能够全面表达社交网络的用户—专长—词项混合图模型,包含支持文档类、社交网络类、用户评价类和情境类证据等各类专家证据信息。

在对虚拟社区中的用户进行建模研究的基础上,如何更好地将其应用于虚拟社区中,以此提升用户体验,是社区运营者和用户共同关心的热点话题。虚拟社区中的应用有很多,其中社会化专家推荐和在线社会支持是与用户切身利益相关的两个典型应用。社会化专家推荐旨在发现虚拟社区中具有专业特长的用户,并推荐给信息需求者,以快速获取其帮助,共享其隐性知识,它有助于用户快速准确地获取所需信息或知识,对于解决信息过载、提升用户体验和知识共享水平具有重要作用,近年来引起了学术界和业界的广泛关注。与传统学术领域和企业组织中相对成熟的专家推荐相比,虚拟社区中的社会化专家推荐存在数据稀疏、信息质量良莠不齐甚至作弊行为导致的推荐精度低问题,以及推荐专家能否及时响应用户的推荐可用性问题。基于此,本书借鉴现有的基于图的推荐、基于情境的推荐、专家检索与推荐等相关研究成果,从图论的角度出发,探索了一套基于混合图的社会化专家推荐方法。由于具有低成本、匿名性、无时空限制等显著优点,在线社会支持已经覆盖并拓展了传统社会支持的应用领域,各式各样的心理、疾病、戒毒、法律和赈灾等在线支持论坛应运而生。在线社会支持作为一种极具潜力的社会支持方式,通过提供广泛的信息、情感和网络陪伴等支持能够改善社会成员身心健康、实施弱势群体救助和提升社会幸福感。此外,通过特殊领域的深度支持,能够有效地疏导转型时期的社会情绪、缓解社会矛盾、降低高危传染性疾病的不良传播(例如,识别出艾滋病论坛中的艾滋病患者并重点干预支持),但与蓬勃发展的在线社会支持实践相比,相关理论研究则显得相对滞后,主要集中于在线社会支持影响因素、内容分析、线上线下支持对比分析等角度,对在线支持网络的结构特征及演化规律研究极其匮乏。因此,研究虚拟社区在线社会支持网络特征与演化问题具有较强的理论意义和应用价值。

综上所述,本书通过刻画用户在虚拟社区中的行为,精准识别用户的各属性偏好和专业技能,在此基础上进行社会化专家推荐,并通过相关技术的创新改进来实现更加高效的、精准的在线社会支持是十分重要且具有现实意义的。