
第1章 绪论
1.1 研究背景和意义
1.1.1 研究背景
IDC发布的《2020年的数字宇宙:大数据、更大的数字阴影以及远东地区实现最快增长》指出,从2013年到2020年,数字宇宙的规模每两年翻一番,数字宇宙是对一年内全世界产生、复制及利用的所有数字化数据的度量,2020年全球新建和复制的信息量将超过40ZB。在这种大数据时代环境下,作为个体的每个人都受到了这种急速发展的冲击,个人每天创建、收集和存储以备日后使用的信息的数量不断增多,虽然此时计算机的数据处理能力也在不断增长和改进,但是仍然不能完全满足个体对于其个人信息的管理需求,于是个人信息管理(Personal Information Management,PIM)——个人如何创建、收集、组织和检索他们以电子形式存储的个人信息,近年来逐渐成为信息管理领域的一个重要研究主题。近年来用户信息行为的研究引起了多个学科极大的关注,2005年出版的来自10个国家85名学者编写的《信息行为理论》(Theories of Information Behavior)[1]一书中介绍了74种信息行为理论和方法模型,其中有43种来自图书馆学情报学领域[2]。随着信息环境和用户信息需求发生根本性变革,用户信息行为研究也正向着更为广阔的领域发展。在第77届国际图联大会上,来自英国的德里克(Law Derek)教授在报告中指出Web 2.0的网络环境逐渐改变了人们对信息的处理方式,人们正更加主动地创建、选择、使用和共享信息[3],因此需要充分了解用户的行为和影响用户行为的多重因素。随着科学技术高度专门化和综合化的发展趋势,随着知识爆炸的信息社会的快速发展,人们对于信息资源在点和面上都有更高的需求,不同群体的用户对信息资源需求表现出很大的差异性,需求的专业性越来越高,层次也越来越深。
(1)科研人员须对个人学术信息进行及时有效的管理的重要性凸显
个人信息管理的研究内容包括人们为了获取、组织、维护和检索日常所用信息而进行的诸多活动。理想的个人信息管理能够使人们在适当的时间和地点,以适当的形式获取质量较高的信息。Web 2.0时代随着个人拥有的信息量不断增加,个人计算机性能的增强、存储容量的日益扩大、存储设备的便捷,科研人员将大量的学术科研信息存储到个人信息空间。随着学术信息的长期积累,由存放位置、信息组织和管理等带来的问题使得科研用户在需要的时候无法及时找到所需资源,往往会导致学术信息的重复下载并浪费一定的时间和精力。具有高知识依存度和高协同工作度特点的科研人员如何对个人学术信息空间内的信息进行有效的组织和管理,从而高效地完成科研任务是一个重要的研究课题。处于信息爆炸时代的学术科研人员工作压力大,需要提升自身的工作效率,更希望在短时间内找到对自己有价值的信息。个人学术信息资源种类繁多,按照学术信息的媒体表现形式划分,可分为文本学术信息、图像学术信息等;按照学术信息的来源划分,可以分为电子书刊、软件资源等。对于科研人员而言,学术信息资源是指包含较高学术价值、满足其学术科研需求的信息。高校教学科研活动的主体是高校师生和学术研究人员,他们在教学与研究工作中查找、利用信息是为了满足自身教学、研究和知识创新的需要,与社会大众对信息资源的需求有一定的区别。这种区别表现在科研人员对信息的质量要求较高,长期持续进行的学术研究需要数量庞大、内容延续的专业文献。他们需要的信息资源要能够反映本学科的前沿发展水平和发展动态,具备良好的学科内容范围和准确性。
(2)科研人员个人学术信息管理存在许多问题和困难
以数字化、网络化为代表的现代信息技术全面而快速地改造着科学研究的基础环境和运作体系,形成科学研究的数字化生存状态,这对于科研人员的信息交流和处理方式都将带来巨大变化[4]。数字信息环境是科技创新的主要科研环境,当前科研互动交叉融合、协同创新趋势明显,科研条件和交流环境日趋网络化、数字化,用户强烈要求提供桌面化、网络化、个性化的科研信息服务。科研人员信息行为模式和信息需求正在不断发生变化,国内图书馆界也很重视网络环境下用户信息行为的调查分析。但对于构建个人科研信息空间来说,目前关注的这些科研信息行为还不够全面。比如,学术科研人员对个人科研信息的保存、组织和利用情况,对新兴技术的使用情况(如Web 2.0应用、个性化订阅推送服务的使用等),对科学数据的使用等与个人科研信息空间功能框架的确立直接相关的方面的调查和研究还不多[5]。开放数字资源环境下,科研人员的学术信息环境发生了深刻的变化,科研信息行为模式和信息需求也发生了显著变化。随着拥有的数字化学术信息资源的不断增加,科研人员也面临着因个人学术信息超载带来的信息组织和管理的问题。个人学术信息管理的基本目标是:①个人学术信息管理可以包括各种类的学术信息,以建立统一的学术信息管理结构,方便用户日后的信息查找;②有效地对个人学术信息进行组织管理,解决信息格式不统一、信息分散和同步共享等问题。但是由于学术信息类型格式异构、种类多样化而带来的个人学术信息空间碎片化,科研人员信息保存行为的随意性和学术信息素养薄弱等都会给个人学术信息的管理带来一定的困难。
本书就是以科研人员个人学术信息管理行为为切入主题,对行为的发生原因、表现形式、环境特点及其影响因素进行深入研究,为提高科研人员学术信息利用率和工作效率、加速知识的应用和创新、开展人性化的学术信息服务和开发设计面向科研人员的个人学术信息管理工具提供可靠的依据。
1.1.2 研究意义
本研究的理论意义主要表现为以下三个方面。
一是丰富和发展了个人信息管理的理论体系。在理论研究方法方面,本研究综合运用深度访谈、扎根理论、调查研究等研究方法展开研究,研究结论均建立在数据的分析基础之上,提高了本研究的科学性和结论的可信性。将社会科学多种研究方法与本研究的具体研究内容有机结合,为个人信息管理领域吸收和借鉴其他学科相对成熟的研究方法进行有意义的尝试,有利于国内个人信息管理研究的进一步规范化和科学化,进一步推进个人信息管理理论研究方法的不断丰富和发展。
二是进一步完善了科研人员信息行为研究。本研究通过引入心理认知学、用户行为理论和社会心理学等交叉学科思想,从定性研究和定量研究两个方面对科研人员个人学术信息管理行为影响因素进行研究,构建科研人员个人学术信息管理行为影响因素模型,进一步丰富了对科研人员信息行为的研究。
三是对信息资源管理理论的进一步拓展和完善。学术信息资源是数字化科研环境中的重要信息资源,是科研人员实现个人知识创新的理论基础。对学术信息资源的有效管理可以提升科研效率,进一步推动知识创新。本书对科研人员个人学术信息管理行为的研究是对网络环境下信息资源管理理论的拓展和完善。
本研究的实践意义主要表现为以下两个方面。
一是结合科研人员自身的特点以及其在学习、工作中对学术信息进行管理的实际需求,探讨科研人员个人学术信息管理行为影响因素。基于扎根理论对科研人员个人学术信息管理行为影响因素进行分析,为了构建更加合理的模型,以便对科研人员个人学术信息管理行为进行更精确的测量和分析,本研究在已有文献的基础上结合定性研究结果进一步构建科研人员个人学术信息管理行为影响因素模型,提出理论假设,并进一步明确各潜变量及其之间的关系。良好的个人学术信息管理可以使科研人员利用自己有限的资源(时间、金钱、能力等),充分利用个人信息实现知识创新,提升科研工作效率。
二是通过对科研人员个人学术信息管理行为的相关影响因素的研究为开发适合科研人员的个人信息管理工具提供具体指导与建议。根据信息技术发展的辅人律和拟人律的规律,个人学术信息管理工具的设计要符合科研人员在当前学术科研环境中的信息需求,实现辅助性管理功能。本研究通过定性和定量研究结果所提出的工具设计思路在一定程度上反映了科研人员的内在需求,有利于后续工具的开发设计和推广。
1.1.3 科研人员学术信息管理行为研究现状
由于个人信息在数量分布、需求差异等方面存在不同,不同职业、不同群体关注的信息是不同的,因此针对某一群体进行具体研究更能提高个人信息管理的效率。包冬梅等人指出目前个人信息管理方面的研究侧重于个人私人生活和工作信息的有效管理和再发现,少有对个人学术信息资源的关注。对于科研人员而言面对复杂的数字信息资源环境和大量的学术信息资源,如何有效地对个人学术信息资源进行组织和管理,对提高自身科研水平和效率非常重要[6]。信息技术的快速发展使得信息沟通交流和知识创新的基本形式和主要方法也发生了重大变化,数字学术科研环境下科研用户信息行为也在不断发生改变。信息从一种被动的资源变为知识创新的工具,为科研人员知识发现、探寻未知领域和引导研究方向提供支持。美国数字图书馆联盟对高校用户的学术信息环境利用行为进行了调研,主要是为了对高校用户用于科研、教学和学习的信息进行了解[7]。
(1)科研人员学术信息管理问题和困境的研究
OCLC发布的报告“美国研究人员的研究生涯”中指出研究人员在个人信息管理方面存在很多问题,如文件、数据集的存储与管理,信息检索能力的提升以及参考文献的输入、存储与管理等[8]。2005年加拿大科技信息研究CISTI发布的“发现信息与支持创新——2005—2010发展战略规划”对未来科研用户的需求和期望进行了分析,并据此提出短期与长期的服务策略,其预期目标是构建整合的学术信息基础设施,提供通用、无缝和永久的信息接口获取科学信息及相关信息,从而更有利于科研人员进行科学研究和创新[9]。华盛顿大学信息学院启动的“寻找需要的信息”(Keep Found Things Found)课题主要研究人们对已发现和遇到的信息是如何管理的,以及在未来的某个时间点上是如何使用这些信息的,研究内容细化为如何保存信息、如何重新找到信息、信息保存方式的效用和使用频率,以及文件夹在个人信息组织和管理中的作用。米兹拉希(Diane Mizrachi)和贝茨(Marcia J. Bates)指出大学生作为“数字原住民”的一代,有效地对个人纸质和电子学术信息资源进行管理对于他们在学习和生活中能否取得成功非常重要。作者采用民族志研究方法和质性扎根理论对18—22岁有代表性的本科学生的个人学术信息管理行为进行调研,主要是研究学生如何将数字工具和信息整合到他们的学术信息世界、在组织策略和工具选择方面有何种偏好,以及在哪种情况下他们选择使用技术管理工具[10]。吴跃伟分析了网络环境下科研用户在信息获取、信息组织和信息发布方面存在的障碍及其产生的原因,科研人员在信息利用过程中对于“偶遇”信息或与研究领域相关的信息不加以整理、加工和有效组织等问题,对信息资源缺乏有效的组织是影响信息利用的障碍之一[11]。科研人员对科研信息的需求是时变的、学科化的、个性化的,科研人员需要科研个性化信息环境,白光祖等人提出建立一个面向用户的科研信息空间,用户可以存取各种类分布式科研信息[12]。随着现代信息技术的进步以及互联网的普及,人类的信息环境发生了显著变化,信息资源数字化、传播速度高速化、信息载体多样化、信息利用普及化必然会引起科研人员学术信息素养随之发生改变[13]。包冬梅指出可以从两个方面解决目前个人学术信息管理中所存在的困境,一是从客观上开发设计和优化工具,二是从主观上培养科研用户对学术信息组织和管理的意识和技能[14]。张静波认为大数据时代科研人员需要具备数据素养,有效地获取、管理、分析、利用数据以及进行数据共享,对于提高科研产出效率非常重要[15]。齐俊景采用问卷调查法,从e-Science环境感知、科研信息获取、科研数据存储与管理、科研信息分析与利用及科研交流与合作对青年科研人员的科研信息素养现状展开调研,并由此提出提升其科研信息素养的相应对策[16]。大数据时代科学研究发生巨大改变,推动了以数据为核心的新型科研方式的产生,凌婉阳指出提高科研人员的科研素养对促进科研创新具有重大作用,并提出了基于项目和数据生命周期及职业发展的科研数据素养培养框架[17]。
(2)科研人员信息行为及其特征
沃宾(Henk Voorbij)采用问卷调查和焦点小组访谈的方法对荷兰某高校科研人员的信息检索行为进行了研究,研究表明大多数科研人员利用互联网作为学习和工作的辅助工具查找一些事实性、概括性和短暂的信息[18]。2008年,英国图书馆与联合信息系统委员会JISC发布了“未来研究人员的信息行为”研究报告,对未来的科研环境以及“谷歌的一代”成为科学家后表现出的信息行为进行了预测,报告指出越来越多的用户正在通过email、Blog、Wiki、个人网站等方式发布自己制造的内容,信息环境的变化带来科研过程的变化,科研用户希望从自己存储的大量信息中进行有效的知识挖掘,发现新的信息,进行科研创新[19]。哈格伦德(Lotta Haglund)等人对瑞典的教师进行了问卷调查,发现年轻的教师更倾向于使用谷歌获取信息,他们认为利用图书馆获取信息相对而言还是比较复杂的[20]。梅霍(Lokman I. Meho)通过电子邮件访谈收集数据,在对埃利斯信息搜寻模型修正扩展的基础上分析了社会科学家的信息查找行为包括起始、链接、浏览、监视、获取、区分、提取、验证信息、网络化和信息管理,科研用户认为对收集到的信息进行管理非常重要,通过有效地存储和组织能够进一步促进研究的发展[21]。扎克(Lisl Zach)采用案例研究的方法深入了解艺术管理人员的信息查寻行为[22],采用电话访谈的方式访问了英国450所研究型大学中不同领域的395名研究人员和55名图书馆员,研究发现信息检索是科研工作不可或缺的一部分,他们希望于从大量的检索结果中筛选出自己所需信息,大部分科研人员认为能够很好地处理大量的信息,但令他们苦恼的是过多的邮件。大部分科研人员(62%)往往是利用信息推送服务获取新的信息,他们选择电子邮件而不是RSS订阅所需信息[23]。康纳维(Lynn Silipigni Connaway)等人选取了12份来自英国和美国的关于用户信息行为的研究报告,研究结果指出:不同学科的研究人员在查找信息时存在差异;用户查找信息时主要依赖Google及其他搜索引擎;网络速度和便捷程度对科研人员至关重要;科研人员更倾向于通过个人用户终端访问学术资源,对自身使用信息搜索工具的能力很有信心;科研人员的信息素养并没有明显的提高[24]。格(Xuemei Ge)采用访谈的方法调查了社会科学领域科研人员的信息查寻行为,研究发现数字信息资源在科研人员信息寻求中发挥重要作用,并且扩展了埃利斯信息搜寻行为模型,添加了准备计划和信息管理两个特征[25]。纳赛尔(Al-Suqri Mohammed Nasser)采用基于电子邮件访谈、面对面访谈和焦点小组访谈的方式对发展中国家中东部大学的社会科学学者在新信息环境下的查寻行为进行了调查,认为经典研究的信息行为模型仍然适用于新环境下对用户信息查寻行为的分析[26]。
黄长著等人对北京大学图书馆、清华大学图书馆、中国科技信息研究所、国家图书馆、中国科学院文献情报中心1500多个科技用户网络信息行为调查发现图书馆和互联网是目前用户获得信息的主要途径。学术科研用户对质量高的数字化信息资源的需求量更大,他们的信息需求主要是依靠图书情报机构满足[27]。董小英等人对我国学术界用户信息查询行为、信息利用及其评价进行了分析和讨论,调查发现科研要求高的学术用户信息需求也会更加强烈,对互联网信息资源的利用率也更高,科研和教学群体更重视信息的使用,而且能较为熟练地利用网络数字资源[28]。张晓琳指出,随着信息技术的快速发展,信息沟通交流的形式也发生了根本的变化,科学研究的环境也在朝着数字化网络化方向发展。科技信息用户行为也在不断发展:依靠数字化网络环境获取信息资源、随着信息获取物理障碍的消失用户习惯于在自己工作现场和过程中数字化地进行信息交流和处理、科研用户信息活动的重点转变为知识发现和知识创造[29]。数字环境下信息资源组织结构、载体形态和存储分布都发生了深刻变化,科研用户的信息行为也随之发生改变。熊太纯等人指出,网络环境下信息源及其获取途径更加复杂,科研用户的信息行为也出现了新的特点:获取信息的方式更加多样;信息需求更加系统、完整、明确;信息内容要求高、专深[30]。彭骏利用在线问卷调查工具对中美医学研究者与科研信息行为相关的信息获取、信息资源、信息素养、信息利用习惯和对图书馆服务的评价等因素进行了调查,对比了两者科研信息行为的特征和异同点[31]。胡昌平等人对高校科研人员(教师、硕士研究生、博士研究生)的信息获取和利用行为进行调研,科研人员的信息查寻行为不仅对查准率有所要求,而且还需要通过信息查寻有效地解决任务和问题[32]。张静、李桂芳、路莹等人对药学科研人员信息行为特征的深入调查,指出科研人员的专业知识背景、检索费用、信息素养等都是影响药学科研人员信息行为的因素,有效管理、快速获取已经检索到的信息资源是科研人员面对的新问题[33]。曹霞等人对中科院科研人员标准信息需求与获取行为进行调查研究,总结了其信息需求和获取行为特征,并对面向科研创新的标准信息保障模式的构建进行了初步探讨[34]。李晓东等人通过抽样问卷调查分析了不同学科(工科、社科、理科、人文)教师和学生信息需求、信息查询与利用的情况[35]。沙勇忠等人采用网络计量工具对中科院信息中心网站的网络日志文件进行了分析,对关于科研人员信息行为的具体量化指标进行了分析,从而发现并总结了网络环境下科研人员的信息行为特征,为学术信息服务的优化提供了理论依据[36]。丁韧通过对高校学生进行场景模拟实验,从用户社会组织背景、用户情感、用户知识结构、搜索任务、信息对象、检索工具六大维度出发,探讨影响用户网络信息搜索行为的相关因素[37]。包冬梅等人以OCLC的“学术科研信息工作框架模型”为基本研究框架,采用问卷调查和访谈的相结合的方法对数字信息环境下学术科研人员的科研信息行为(信息查找、存取、组织、阅读利用、写作和学术成果分享等活动和行为)和需求的特点与现状展开调研和分析,以期为科学定位个人科研信息空间的功能框架和探索研究图书馆资源建设和服务提供实证指导依据[38]。陈春通过对科研人员采用深度访谈的方式,对科研过程及科研用户信息需求特征进行了调查分析[39]。田立忠等人使用关键事件和扎根理论的分析手段,对科研人员信息偶遇的影响因素进行了调查分析,研究结果表明:个人、情境和信息是促进偶遇发生的主要影响因素,其中广泛阅览型用户将更多地体会到信息偶遇[40]。在线社交网络是未来科学交流的重要平台,科研信息服务系统的社交化是目前发展的一个重要趋势,张耀坤等人归纳总结了科研人员在线社交网络使用行为研究现状,对科研人员在线社交网络使用动机、内容创建和获取行为特征、科研人员的群体行为等进行主题归纳研究[41]。李文文等人应用扎根理论方法对科研人员信息行为研究相关的实证研究文献进行分析比较,研究发现不同学科领域科研人员信息行为存在差异,人文社会科学领域的科研人员学术交流和合作较少,而自然科学领域科研人员对数据依赖较大,科学数据管理和共享意识也较强[42]。
(3)科研人员信息行为影响因素及其模型
信息行为模型是对用户信息需求、用户信息查询和用户信息检索等行为过程进行简化描述而形成的,模型对具体行为的影响因素和表现形式进行了分析,是进行用户信息行为研究的重要理论基础[43]。最早的科研人员信息行为体系模型是由埃利斯(David Ellis)等构建的,1989年埃利斯构建了社会科学研究人员的信息搜寻行为模型,1993年又构建了一个化学、物理学科研人员信息行为模型,通过比较发现社会科学行为模型和自然科学行为模型的不同,最终构建了针对所有科研人员的信息搜寻行为,主要包括八个类别的行为:开始、链接、浏览、区分、跟踪、采集、核实和结束[44]。甘利人等人在Wilson模型、Kuhlthau模型等基础上,针对学术型用户的特点构建影响科技数据库网站用户信息搜索行为因素模型,将用户的实际搜索行为过程总结为“任务驱动—信息源选择—概念、检索式及检索方式选择—浏览与反馈选择—信息提取”的循环往复过程[45]。
随着互联网的普及和网上资源的日益丰富,网络环境下用户信息行为的研究已成为新的热点,影响用户信息行为的因素有外部环境、情境和内部个体认知、情感层面。高丽等人认为影响科研用户信息行为的因素有:①科研人员的知识结构、水平会进一步影响用户对信息的选择、吸收和对信息的具体利用;②外部环境中信息资源数量的增大会耗费科研人员鉴别、选择和过滤信息的精力,产生信息管理疲倦从而降低了用户对信息的利用率;③信息管理工具的易用性也会对科研人员对信息的利用和管理产生影响[46]。甘利人等人根据科技数据库网站和用户的特征,提出了以用户、环境和系统为框架的信息搜索行为的影响因素模型,从用户、系统和环境三个角度对影响信息搜索行为的因素进行分析[47]。宋剑祥指出影响高校教学和科研人员的信息需求行为的因素包括个体的、社会的、自然的、信息检索系统及服务方面的因素[48]。乔欢指出影响社会科学家信息行为的主要因素有:信息的可获取性、易得性、质量、成本、使用的难易程度,使用者的资质、经验、专长、受教育水平、职业和主观印象、项目进展阶段以及物理、社会、政治和经济环境等因素[49]。王伟等人通过非结构式访谈和质性扎根理论的研究方法,对科研人员信息查寻行为影响因素进行了探索性的研究。结果发现个体因素、查寻任务和情境因素这三大类属对科研人员信息查寻行为存在显著影响,并在此基础上构建了科研人员的信息查寻行为影响因素模型个体—客体—行为模型[50]。张耀坤等人调查了2013年和2014年长江学者在Research Gate、Mendeley、Academia和学术圈四个学术社交网的基本数据,研究发现学科领域差异是影响科研人员信息行为的关键性要素,理学、工学和医学相比人文社会科学的使用行为频率高[51]。