2.3 信息检索行为相关理论与模型
与信息检索行为相近的概念包括信息行为、信息查寻行为、信息浏览行为等。Wilson[20]认为用户的信息行为包括信息查寻行为、信息检索行为和信息利用行为。同时,将查寻行为和检索行为进行区分,后者是指微观层面用户使用计算机系统交互时所表现的行为,专指用户使用计算机情报检索系统进行检索的行为,如图2-3所示。Liebscher[37]将用户的信息浏览定义为一种探索行为,通过意外发现而获取信息的一种信息查寻行为。信息浏览行为是指用户事先有需求但缺乏明确目标的非正式的信息查寻行为。
图2-3 Wilson对相关概念的区分
关于信息检索的研究始于20世纪60年代,早期研究主要立足于信息系统的视角来分析用户检索行为。20世纪80年代中后期,相关研究者开始将研究焦点聚焦于用户。国外关于信息检索行为的研究涉及领域较为宽泛,包括检索行为模型的研究、不同行业领域人群、不同性别用户群体、基于不同信息类型的用户信息检索行为研究等。国内外学者主要通过定性或定量或二者相结合的方式对用户信息检索行为进行探索,如问卷调查法、德尔菲法、专家观察法、访谈法、日志分析法等,研究群体主要集中在高校师生、网络消费者、旅游用户、儿童用户、农民工用户等。研究内容主要探索用户的信息行为特征,尤其是在具体情境下的信息检索行为特征,挖掘影响用户信息检索行为的因素等[38]。
2.3.1 信息检索行为理论
2.3.1.1 采莓理论
1989年,Bates[39]提出了采莓理论(Berrypicking Model),认为用户在信息检索过程中,可能伴随着信息的吸收而产生新的想法,其需求与检索行为也随之发生变化。用户往往不会一次检索就获得满足,而是需要经历一系列的检索活动。用户的信息检索过程类似于采草莓,通过演进式的检索过程来满足其信息需求[40]。
2.3.1.2 意义建构理论
20世纪70年代,Dervin[41]及其研究团队经过8年的实证研究,基于Dewey[42]、Taylor[33]等的研究成果提出了以用户为中心的意义建构理论。其基本假设包括:现实世界不是完整的、固定不变的,而是由普遍存在的鸿沟所组成的;信息不是独立于人类所存在的,而是人类认知的一种结果;信息具有主观性,它受制于个人的生理情况以及过去、现在和未来的时空情境;信息的查找与使用是一种建构活动;信息检索是意义建构的组成部分[43]。
2.3.1.3 社会认知理论
社会认知是社会心理学与认知心理学相结合的产物,是从社会心理学的角度探讨人在认知过程中会受到哪些社会学方面因素的影响,以及这些因素怎样影响人的认知过程。社会认知是对社会信息的加工处理,认为用户不只是由外部事件塑造的有反应性的机体,而是自我组织的、积极进取的、自我调节和自我反思的[44]。在信息检索过程中用户的信息行为受到内部因素(认知、情绪、动机等)和环境因素的影响[45]。
2.3.1.4 知识方程式理论
1980年,英国学者Brookes[46]基于Popper的“三个世界”理论提出了知识方程式,他指出,用户通过信息检索获取客观知识来改进其认知结构,知识是相关概念的集合,信息能够被用户吸收并形成知识结构。其中,ΔI是新增的信息,使检索者原有的知识结构K[S]转化为新的知识结构K[S+ΔS],ΔS是指检索者知识结构的改变量。知识方程式理论认为,信息的增加是通过改变检索者原有的知识结构而形成的信息知识结构[47]。
K[S]+ΔI→K[S+ΔS]
2.3.1.5 认知负荷理论
20世纪80年代,Sweller J.等[48]提出了认知负荷理论,该理论基于资源有限理论和图式理论。认知负荷是指用户在信息加工过程中所必需的心理资源的总和。该理论假设人类的认知结构由工作记忆和长时记忆组成。工作记忆又被称为感觉记忆,每次只能存储5~9条基本信息。如果同时进行多种学习活动,其所需要的资源量超过个体的资源总量时,就会产生认知负荷过重现象[49]。在图式理论中将图式视为一种认知结构,指知识能够在用户的长时记忆中以图式的形式存在。图式能够帮助用户对信息进行归类,通过足够的练习可以使认知活动自动化[50]。认知负荷理论指出,在信息处理过程中应该注重信息的连续性,既要在信息加工过程中甄别出非连续的信息,也要在信息产品的推送中注重连续性和相关性。
2.3.2 信息检索行为模型
2.3.2.1 Wilson信息行为通用模型
1981年,Wilson[9]第一次提出“信息行为通用模型”(见图2-4),该模型融合了图书情报学、心理学、生理学、市场学等多个领域学科的用户信息行为。对从影响用户需求的因素,到整个信息行为过程的影响因素进行了全面的分析和总结,阐述了产生用户行为的原因——用户信息需求,通过信息的检索、处理和利用满足用户的信息需求。该过程是由各种信息行为共同组成的有序循环,这个循环包含了各种变量及影响因子。
图2-4 Wilson信息行为通用模型
2.3.2.2 信息检索过程模型
1991年,Kuhlthau[51]将信息检索行为视为一个建构过程,在最开始的信息检索阶段,用户充满不确定性,同时伴有焦虑情绪。随着任务的不断展开,获取的相关信息不断增加,用户焦虑感逐渐减少,情绪也随之变化,同时用户获取的信息和满足感在不断增加。Kuhlthau将用户的检索过程假设为6个阶段,分别为初始、选择、探索、规划、收集和结束。这六个阶段是线性关系,只有完成了上一个阶段才能转移到下一个阶段。同时,Kuhlthau将检索过程视为用户的感知过程,每个阶段都包含了用户的情感、认知和行为,具体如下:
阶段1:任务初始阶段,是指用户意识到自己有信息需求。在科学研究中,课题选择受用户的专业、经验等的影响,在这一阶段用户的认知并未起作用。
阶段2:题目选择阶段,是指用户识别并选择有利于调查研究的研究内容与研究方法。认知发展水平较高的用户会根据已有的研究成果,结合新技术、新方法等来确定研究内容;而认知发展水平较低的用户往往向有经验的用户求助,结合相关建议和意见确定选题。
阶段3:预聚焦探索阶段,是指用户根据预选的题目进行相关内容的检索,从而加深对题目的理解,扩展题目的内涵。在这一阶段,认知水平较高的用户往往会通过不断地扩大或缩小检索范围来获取所需的信息。
阶段4:聚焦规划阶段,是指用户对自己所查到的相关信息资源进行筛选的过程。在这一过程中用户所获取的相关信息会逐步精确化,用户对检索主题也更加明确。
阶段5:收集阶段,用户收集与聚焦主题相关的信息,用户通过作者权威性、期刊等级等相关评判标准来收集相关信息。
阶段6:结束阶段,在这一阶段用户认为所查找到的信息已经满足了自己的需求,从而结束检索。
2.3.2.3 Ellis信息检索行为模型
1993年,Ellis[52]采用扎根理论,对社科工作者的信息检索行为的特点进行分析比较、归纳总结,把信息检索活动划分为六个基本阶段,分别是:开始、连接、浏览、区分、监测和抽取。
(1)开始阶段:是指用户在开始进行信息检索时的行为特征,用户能够从系统反馈的信息中识别已使用的信息以及有可能使用的相关信息。
(2)连接阶段:以开始阶段找到的信息资源为出发点,从脚注、参考文献等多个角度出发进行相关资源的链接,“向前”或“向后”追溯其他资源。
(3)浏览阶段:是指用户从系统所反馈的信息中找到感兴趣的内容进行浏览,浏览的内容不仅包含图书、期刊等,还包括回溯文献检索中出版物的参考文献和摘要。
(4)区分阶段:是指用户依据某些条件和标准对已获取信息进行区分,如利用作者的影响因子、期刊的等级、信息的质量等进行筛选。
(5)监测阶段:用户定期跟踪特定资源,包括专业期刊、行业新闻、前沿图书等,以保持与行业发展同步。
(6)抽取阶段:是指用户从特定的信息源中有选择地识别相关信息。
1997年,Ellis[53]在工程师和科学家的信息检索行为研究基础上,将该模型进行了扩充,将信息检索行为模型划分为8个阶段,分别是测量阶段、连接阶段、监测阶段、浏览阶段、区分阶段、过滤阶段、抽取阶段以及结束阶段。但该模型并未深入分析各阶段之间的顺序以及相互之间的关系。
2.3.2.4 信息检索与交互分层模型
1996年,Saracevic[54]提出了信息检索与交互分层模型(见图2-5),并在1997年对模型进行了修订。该模型以语言学的分层理论为基础,同时结合人机交互的相关研究发展而来。该模型认为,用户通过与信息检索系统的交互来利用信息,信息利用与用户的认知以及所处的情景有关。该模型详细地展示了用户在检索过程中所涉及的生理感知、认知、情感以及所处的情境四个方面,同时将用户与计算机共同视为信息检索过程中的关键因素。
图2-5 Saracevic信息检索与交互分层模型
2.3.2.5 信息检索行为过程模型
1999年,Choo[55]在研究用户信息检索行为时将用户的信息活动分为信息需求、信息搜寻和信息利用,同时充分考虑了用户的认知心理、情感状态、所处具体情境以及客观环境对信息检索过程的影响。Choo在已有信息检索行为模型的基础上进行了优化,提出了信息检索行为过程模型。如图2-6所示,用户的信息需求受到用户的认知差异、问题维度以及不确定性压力的共同影响,信息需求的感知是认知情感和情境因素共同作用的结果。信息源的质量、用户的动机和兴趣,以及信息源的可访问性决定了用户的信息搜寻过程。在用户对信息的利用过程中,用户的认知模式、处理过程中的情感反应,以及相关的规范和规则都会影响用户处理、利用信息的结果。
图2-6 Choo信息检索行为过程模型
2.3.2.6 多任务信息检索行为模型
2002年,Spink[56]在已有研究基础上首次提出了多任务信息检索行为模型。该模型指出信息检索过程中会出现多次信息检索任务的转换,同时伴随用户情感、认知以及情境的变换而发生转移。随着网络技术的不断发展,用户可查找的信息源的种类不断增加,信息服务方式向着多元化发展,越来越多的用户从事多任务的工作。用户的信息检索过程不再是一次检索即可完成的,也不是一系列连续的检索组合过程,而是一个受到用户的认知观念、用户情感以及客观情境影响的整体。
2.3.2.7 非线性信息检索行为模型
2004年,Foster[57]提出一种新的非线性信息检索行为模型(见图2-7)。该模型包括用户检索中的三个关键过程——开始、定位和整合。同时还包括三个层次——认知方法、内部情境和外部情境[58]。其中,开始、定位和整合三个关键过程可相互转换,而认知方法、内部情境、外部情境三个层次的交互由若干个体活动及特征组成,这种动态交互性呈现出非线性特征[59]。对该模型进行整体分析可知,用户的非线性信息检索行为的三个关键过程与三个层次相关,伴随着任务的不断变化以及检索者经验的不断积累,用户的信息需求与检索时机也发生着变化。在模型中,整个过程和情境的不断交互使每个过程都容易转换或重复,体现了用户信息检索过程中的非线性和动态性的特点。
图2-7 Foster非线性信息检索行为模型