- 相关推荐
聚集学术机构知识的中心:机构库(Institutional Repository)探析
1 引言
早在1988年,Peter Drucker就在《即将到来的新组织》一书中预言,“对一个组织来说,最重要的是该组织所拥有的知识资源,对其加以有效管理是组织成功的最关键因素。”[1]学术机构是人才和知识的集中地,收集、管理、利用其成员在学术科研等多方面的高质量数字信息资源,对增强机构实力、赢取竞争优势等都具有重要意义。时至今日,各学术机构成员可在互联网上以各种方式发表、传播和交流学术信息,这给组织、管理这部分信息带来了相当大的困难的同时,传统出版模式的局限性也日趋明显,不利于学术交流的开展。有鉴于此,2001年,俄亥俄州立大学的高级行政官员和该馆馆长布兰宁(Joseph J.Branin)在探讨开开发远程教育体系时,提出并着手建立俄亥俄州立大学知识库(Ohio State University Knowledge Bank),以保存该校师生员工的数字知识资源,这也成为机构库(Institutional Repository,以下简称IR)最初的雏形。2002年,麻省理工大学(Massachusetts Institute of Technology,MIT)和惠普公司(Hewlett-Packard Corporation)合作推出DSpace,宣告IR的正式诞生。同年,在“第六届欧洲数字图书馆先进技术研讨会”上,MacKenzie Smith做了《DSpace:来自MIT图书馆和惠普实验室的机构库》的学术报告,详细介绍了DSpace的构建原理、运行情况及在开放学术交流和数字资源长期保存中的重要作用[2],这一报告引起了各国学者的关注,也促成了世界范围内关于IR的大规模理论与实践研究。
2 机构库的定义
关于IR,目前尚无统一的定义,比较有代表性的两种观点是:
(1)美国网络信息联盟(Coalition for Networked Information)的常务董事Clifford Lynch认为,IR是指大学为方便其共同体组织、整理、存储和利用师生员工相关的数字知识资源而提供的一系列服务[3]。此定义强调IR的目的是为用户提供一系列服务,但服务对象局限于IR所属的机构成员,服务的目的是协助大学共同体组织、利用其师生员工的数字知识资源。
(2)加拿大研究图书馆协会(Canadian Association of Research Libraries,CARL)则提出,所谓IR就是指搜集、存储学术机构成员的知识资源,并提供检索的数字知识库,同时认为IR可以作为一个全球知识库的子库,为世界范围内的网络用户服务[4]。此定义认为IR是一个聚集数字信息资源的知识库,其资源对任何国家的所有网络用户开放,但该定义遗漏了一个重要的内容,即IR中的绝大部分资源可免费获取。
据此,笔者认为:所谓IR,就是以搜集、组织、存储学术机构(大学、大学共同体等)相关数字知识资源为主要任务,并将其中绝大部分资源对任何网络用户免费开放的知识库。
3 机构库产生的原因及其主要特点
2.1 机构库产生的原因
IR之所以在人类刚跨进21世纪的时候兴起,原因是多方面的,但最为根本的原因在于:
(1)网络给信息组织带来的困难。网络环境下,学术机构成员可以通过各种方式(如个人网站、blog等)在互联网上发表、传递各种学术信息资源,据MIT的统计数据表示,43%的学者会把预印本(preprint)上载到个人网站上,60%的人则通过e-mail传递预印本文献[5]。发表、传递方式的多样性虽然在一定程度上促进了学术交流,但由于这些方式的随意性太强,使得搜集、组织、存储、利用某一学术机构的知识资源就相当困难,给相关机构造成难以估量的损失。这也是建立IR最根本的原因。
(2)传统的期刊出版模式带来了学术交流障碍。近年来,随着出版机构的兼并和商业化,期刊价格大幅度攀升,大大超过了图书馆经费所能承受的范围。美国研究图书馆协会(Association of Research Libraries,ARL)的统计表明,在1986-2000年之间,科学、技术和医学方面的学术期刊价格增长了226%,同期商品零售价格指数增长幅度为57%,在此期间,图书馆购买期刊的经费增长了192%,但购买的期刊品种却下降了7%[6]。虽然图书馆也尝试通过馆际互借、加大数据库的购买力度、远程文献传递等措施来缓解经费短缺的压力,但效果并不理想,也没有从根本上解决学术交流的问题,从而促使人们思考传统的期刊出版模式之不足,并探讨新的方式以促进学术交流。
(3)网格技术和开放源代码的推动。网格计算源于元计算(Metacomputing),其初衷是将分布的多台超级计算机连接成为一个可远程控制和访问的元计算系统,网格体系根据高速和共享两大特征,正在不断向基于更大的网、共享更多的资源、构建更大的计算能力的目标迈进。网格技术将有助于解决大并发量访问、海量信息检索以及资源共享等方面的技术问题。而开放源代码的意义则在于将人类大量宝贵的创造力从“重复创造”中解放出来。近年来,开放源代码在数字图书馆领域的应用已经相当普遍。美国的OCLC,英国的UKOLN,以及新西兰的DL项目都是图情领域推动开放源代码应用的代表[7]。网格技术和开放源代码为IR的建立奠定了关键的技术基础,使IR思想的实现和快速发展成为可能。
3.2 机构库的特点
(1)综合性。IR不仅包括常见的研究性学术资源,如期刊论文、电子预印文本、技术报告、会议论文、学位论文、数据库及数字图书馆资源,还包括部分学术数据库所不收录但又具有较高价值的资源,如工作文件、图像、音频和视频文件、学习资料等[8]。这样IR即可全面系统地反映所属学术机构的教学和科研成果,不仅有利于分析自身教学、科研的优势与不足,衡量现有的研究水平和明确今后的发展方向,还可作为对外展示其综合实力的窗口,以提高该学术机构的知名度和影响力。
(2)开放性。进入新世纪以后,实现学术资源、科研成果的开放共享已经成为国际潮流。IR以其开放性的特点成为开放共享运动中的弄潮儿,IR对世界范围内的所有用户不抱任何偏见,任何用户随时都可以通过互联网不受限制地合理利用其中的知识资源,这既利于本领域学者之间的学术交流,也利于其他学科研究者跨学科获取知识与信息,更重要的是它打破了国家界限,特别是有助于发展中国家的科学研究者追踪世界著名学府研究的最新发展,从一定程度上缩小发展中国家与发达国家之间的知识鸿沟。
(3)动态性。一般来说,信息一旦输入数据库就不再发生变化,IR则不同,为了使最新研究成果能在最短的时间内发布,提交者可根据自己的最新研究随时修改、更新之前提交给IR的信息,使IR体现出明显的动态性特点。这一特点虽然可以加快学术交流的速度,但也有可能使IR中的内容更迭过于频繁,对其稳定性产生负面影响。
4 国内外相关项目简介
近两年来,随着各学术机构对IR的日益重视,IR的建设也取得了初步成效,现选取其中具有代表性的3个项目介绍如下:
4.1 DSpace
2000年3月,惠普公司出资1800万美元,与MIT图书馆合作开发DSpace,2002年11月,DSpace正式面世并迅速成为一个由剑桥大学、哥伦比亚大学等七家著名学府直接参与的联合机构库。DSpace是目前全球最有影响力的机构库,其收录的信息资源主要包括研究报告、数据库、音频和视频文件以及其他格式的MIT认为确实重要的文件,但不收录MIT学生的研究资料、机构记录以及非MIT教师的研究成果等。DSpace提供一系列遵循开放档案信息系统参考模式(Reference Model for an Open Archival Information System)的上载、管理、传播数字信息的工具,并使用DC、OpenURL与OAI-PHM等一系列开放标准,因而成为其他机构开发IR的首选软件,据统计,在成立后不到一年就已经有3500家来自全球的机构下载了DSpace的开放源代码[9]。因此可以说DSpace是一个搜集、管理、标引、传播数字信息的系统、工具和平台。
DSpace的垂直体系结构包括三级层次:存储层、事务逻辑层和应用层,每一层都内嵌API(Application Programming Interface),方便系统的升级,同时也使其他大学在开发IR时能根据实际情况调整相关部分,提高DSpace的灵活性。存储层的主要功能是存储数字化信息,事务逻辑层是整个系统的核心部分,主要包括工作流管理模块、内容管理模块、检索和浏览模块,这些子模块也都相应地嵌有API;应用层则主要作为用户检索信息的界面[10-11]。
4.2 CARL机构库导航项目
CARL机构库导航项目(The CARL Institutional Repositories Pilot Project)由加拿大12所大学于2002年发起建设,目前主要由西蒙·弗雷泽大学、多伦多大学等5所大学图书馆负责操作管理,导航项目旨在通过联合加拿大众多学术机构的知识库,提高加拿大学术机构及研究人员的曝光度和影响力,同时,通过实践操作为加拿大其他机构开发IR提供经验。2004年,西蒙·弗雷泽大学推出名为“CARL收割机”(The CARL Harvester)的搜索引擎,作为导航项目检索服务的操作界面,通过此界面任何国家的用户都可以免费检索其中的资源。目前该搜索引擎已经收录了来自马尼托巴大学等9个IR的4493条记录并保持每日更新,提供简单检索、高级检索和分类浏览等3项检索功能,用户可按任意词、作者、题名、摘要、索引号、日期、语种等多种途径查找所需信息[12-13)。
4.3 学术信息库
为推进香港中文大学(The Chinese University of Hong Kong,CUHK)印刷文献的数字化进程,加强图书馆的电子导航功能,CUHK图书馆于2004年夏天开始建设学术信息库(Scholarly Information Repository,SIR),SIR以尽可能多地收录CUHK共同体成员出版物信息为目标,收录的文献种类包括学校出版物、各院系及教师出版物、教师工作文档、期刊论文、报纸、书籍、书籍篇章、学位论文、会议论文、技术报告以及专利信息,除提供引文和简单著录信息之外,还尽可能地提供全文的链接。
提交者通过SIR系统中的“引文输入系统”输入出版物的详细信息,这部分信息在传递给SIR系统的同时,还会传送给研究与科技管理局中的在线出版输入系统,SIR的检索界面则允许用户浏览和检索所需信息,并在结果中提供图书馆所购买的电子资源、互联网上免费和有偿电子资源的链接[14]。
共2页: 1
论文出处(作者):5 现阶段存在的主要问题
5.1 知识产权的保护
IR中包含多种类型的信息资源,因此相应的知识产权问题也比较复杂,目前争论的焦点主要集中在学术论文发表于传统期刊之后版权归谁所有的问题上。在传统的出版模式下,当作者愿意将其研究成果发表在某一份学术期刊上时,就已经将版权交给出版社或者说同意出版社拥有“排他性许可”(exclusive licence)出版的权利。这样一来,IR收录这些已经发表的学术论文就会构成侵权。但大部分作者并不认同此类规定,据RoMEO(Rights Metadata for Open archiving)的调查显示,61%的作者认为机构应该保留论文的版权,90%的人也确实将版权交给所属的机构[15]。随着作者和学术机构对拥有版权的呼声日益强烈,这一问题正在向有利于IR的方向发展,如在2003年,《Nature》出版集团允许作者“可以重新利用他们发表在纸制期刊上的论文,可以将论文的电子版上载到其个人网站(非商业目的),可以重新利用论文中的数据和表格”等,但同时也明确规定,作者不能将论文提交给开放性档案网站(open archival website)。最近《Nature》出台新的规定,允许作者在论文刊出6个月后将电子版提交给IR,条件是在记录中提供杂志社网站的链接[16]。
对于IR来说,关键的是应该在向公众开放信息的同时尽可能地保护知识产权所有者的利益,至少须确保IR不是有意侵犯版权或其他知识产权。因此,许多IR都要求作者提交资源时能保证其为版权所有者,且不会涉及到除作者和IR以外的第三方,或者要求作者在提交资源时将部分知识产权转交给IR,如DSpaee就在其软件包中包括“非排他性分发许可”(Non-Exclusive Distribution Licence)协议,要求提交者允许IR在不改变论文内容的情况下以各种格式在多种媒体上将其复制、翻译和传播。SIR则认为版权归学校及其作者所有,学校和作者都希望能扩大研究成果的传播范围,因此SIR尽量满足用户出于研究目的的全文检索需求。不过Lynch认为不管IR以何种方式来规避侵犯知识产权,大学或大学共同体以IR的形式来拥有或控制知识资源这一行为本身的合法性就值得商榷[17];类似于《Nature》的期刊出版商也只是少数一部分,RoMEO的统计表明这类出版商只占4%,而90%的出版商要求作者在发表论文时将版权移交给出版商。因此,令出版商、IR、作者等多方实体均能接受的知识产权保护办法尚待探讨。
5.2 经费的预算与管理
IR的开发、运行经费受诸多因素的影响,首先就是员工薪水问题,结构库不仅需要技术人员开发、调试、维护系统,还需要大量的非技术人员保证IR的正常运转;其次是设备问题,主要包括系统开发和升级等所需软、硬件的选择,如网络服务器和数据库的选用等;此外,运行经费还受到用户培训、所属学术机构的管理策略、专业设置、机构变动(如机构合并)等外部因素的影响。这些都会给经费带来不确定的因素,从而影响经费预算和管理的准确性。学术机构逐渐认识到IR经费预算与管理的重要性,并在实践中采取一定的措施对经费加以控制,如DSpace邀请图书馆馆员参与IR的建设,依靠他们已有的相关专业基础进行用户培训、资源建设等工作,以降低成本;罗彻斯特大学则要求图书馆馆员抽出1/3的工作时间来为IR服务。但效果并不能令人十分满意,IR的开发、运行经费依然高昂,如MIT每年在IR上花费28.5万美元,皇后大学每年仅支付员工薪水就需要10万加元[18]。这种状况可能导致决策者对IR信任值和支持度的降低、部分工作无法按计划进行等问题,给IR的平稳发展及在世界各国尤其是发展中国家的普及带来负面影响。因此,有必要对如何建立一个科学、合理的经费预算与管理体系加以研究探索。
5.3 质量的控制与评价
质量是IR的生命线,如果IR中充斥的都是价值不高甚至垃圾信息,不仅会造成人力、物力等资源的浪费,还会损害学术机构的声誉。因此,如何保证IR中信息资源的质量是IR必须面对的一大挑战。
传统学术期刊在长期的发展过程中形成了一整套的质量控制与评价机制,如专家评审或同行评议制度。这些机制对IR中信息质量的控制与评价有一定的参考价值,但IR不仅包括已在传统学术期刊上发表的学术性论文,还包括大量未发表的preprint、学习资料、工作文件等,不同类型的资源有不同的质量评定方法。故完全借鉴传统学术期刊的做法是行不通的,必须针对不同类型的资源拟定与之相适应的质量控制和评价体制。但由于IR的理论与实践研究尚处于初级阶段,研究重点主要集中在系统构建和资源建设等方面,对IR中信息资源的质量控制关注不多,也没有建立全面、系统的质量控制评价体系,目前部分项目仅通过一些简单的方法对质量加以初步控制,如对提交者、提交的文件类型和格式进行限定等,DSpace就不收录学生的研究成果、机构记录、非MIT教师的研究成果等。但这样并不能够确保IR的质量,同时,一部分有价值的信息会被排除在外,不利于真实反映一个学术机构的整体实力。
5.4 其他问题
除上述三个主要问题之外,IR还面临稳定性、元数据等方面的问题,其中,稳定性主要受两个因素的影响,一是所属机构是否在战略上和经济上给予支持,Lynch认为学术机构经常会发生变化,如开设新的学院或研究中心、关闭部分夕阳专业、与其他机构合并等,这些都有可能使其对IR的战略支持或经济支持发生变化,因此,IR的建设有必要争取机构高层领导的支持,并且需制定长期的发展计划,以减少上述变化带来的负面影响[19]。其次就是IR中的知识资源能否长期保存,资源的长期保存是长期开放的基础,目前IR中包含大量不同格式的资源,给其长期保存增虽不稳定性因素,James就认为IR应该适时预见多格式知识资源给长期保存带来的风险[20]。此外,IR动态性的特点、组织者的管理策略、元数据等都会对知识资源的长期保存产生影响。
元数据方面的问题主要是不同资源的元数据之间存在矛盾,在IR中,不同的资源可能采用不同的DC元素;信息提交者在自我存档(self-archiving)时也有可能使用不规范的DC元数据;基于不同软件开发而成的IR所确定的元数据也有可能存在差异,不利于联合多个IR(如CARL机构库导航项目)提供集成服务。目前,有关机构对此已采取了相应措施,如DSpace使用标准DC元数据来描述信息,在提交资源时只有题名、语种、提交日期等三项信息必须提供,其余如文摘、关键词等均为选择性提供。CARL也正在讨沦起草“国家机构库元数据文件”(National Metadata Profile for institutional repositories)[21],力求规范IR中的元数据,进一步推进资源共享。
6 图书馆应如何面对机构库带来的机遇与挑战
在学术期刊出版市场日益商业化的今天,图书馆经费捉襟见肘,而IR的发展,则给图书馆带来了难得的机会,它冲击着传统的出版模式,有利于减少图书馆经费短缺的压力,扩大了图书馆的发展空间;但是,我们也应该看到,IR充分利用一切可运用的技术手段,收集多种类型的知识资源,并将其中的绝大部分免费向所有网络用户开放,给图书馆在信息服务、学术交流中的中心地位带来了强有力的冲击。图书馆要确保现有地位并有所发展,就必须发挥自身优势,积极面对来自IR的机遇与挑战:(1)整合资源,义不容辞,图书馆拥有的丰富信息资源无疑是网络中的宝贵资源,但无序的信息只会让用户淹没在信息的海洋中而无法找到所需信息,IR的出现让图书馆认识到整合信息资源,尤其是知识资源(如学术机构、实验室形成的知识资源)的重要意义,同时,IR还能减轻图书馆经费短缺的压力,使得图书馆有更多的人力、物力、财力进行资源的整合,因此图书馆应抓住机遇,大力推进信息资源的有效整合,为图书馆提高信息服务水平奠定基础;(2)积极参与,互助双赢,当前,图书馆在数字图书馆的研究与实践中,有很多思路与IR不谋而合。比如,IR的目的之一就是实现资源的高度开放与共享,促进学术交流,而图书馆界一直在提倡和实践信息资源的共建共享。因此,图书馆应积极参与IR的建设,利用其在信息组织、信息标引等方面的专业优势以及数字图书馆建设中的经验与教训,为IR的顺利建设保驾护航,而图书馆通过参与IR的建设,有机会亲身了解、学习最新的信息技术、全新的信息服务模式,从而有利于促进图书馆的创新、改革和整体水平的提高。
【参考文献】
1 Drucker,Peter.The Coming of the New Organization.Harvard Business Review on Knowledge Management.Harvard Business School Press,Cambridge,MA,1988
2 MacKenzie Smith.DSpace:An institutional repository from the MIT Libraries and Hewlett Packard Laboratories[2005-04-06]http://www,nstl.gov.cn/nstl/user/xxnyl,jsp
3 Anonymous.DEFINING AN INSTITUTIONAL REPOSITORY[conference article].Library Technology Reports.Chicago:2004,140(4):6-10
4 CARL.Institutional Repositories:Innovation in Scholarly Publishing[2005-04-06].http://www.carl-abrc.ca/projects/ir/about-e.htm
5 Anonymouts.BENEFITS OF AN INSTTTUTIONAL REPOSITORY[conference article].Library Technology Reports.Chicago:2004,40(4):11-16
6 David C.Prosser.The Next Information Revolution-Can Institutional Repositories and Self-archiving Transform Scholarly Communications?[2005-04-06].http://www.iatul.org/conference/proceedings/vol13/papers/PROSSER-fulltext,pdf
7 吴建中.图书馆VS机构库——图书馆战略发展的再思考.中国图书馆学报,2004(5):5-8
8 Weller,Mary Case.BACKGROUND AND DEFINITIONS FOR CIC SUMMIT ON SCHOLARLY COMMUNICATION [2005-04-06].http://www.cic.uiuc.edu/groups/CICMembers/archive/documents/backgroundforsummit,pdf
9 Tom Storey.University Repositories:An Extension of the Library Cooperative OCLC Newsletter.2003(7):7-11
10 MacKenzie Smith,etc.DSpace:An Open Source Dynamic Digital Repository[2005-04-06]http://www.dlib.org/dlib/january03/smith/01 smith,html
11,15 RoMEO Project.Key Findings of the RoMEO Project.The Intellectual Property Rights Issues Facing Self-archivin.[2005-04-06].http://www.dlib.org/dlib/january03/smith/01 smith.html
12 Kathleen Shearer.CARL Institutional Repositories Project[2005-04] http://www.carl-abrc.ca/projects/ir/survey-results-2004.pdf
13 website:http:[2005-04]//www.carl-abrc.ca/projects/ir/
14 Colin Storey,etc.The Institutional Repository:The Chinese Universityof Hong Kong'SIR'Model.[Conference artical].Lecture Notes in Computer Science,2004,3334:236
16 Philip Hunter,Michael Day.Institutional repositories,aggregator services and collection devel-opment.[2005-04-06]http://www.rdn.ac.uk/projects/eprints-uk/docs/studies/coll-development/coll-development.pdf
17,19 Lynch,C.A."Institutional repositories:essential infrastructure for scholarship in the digital age."[2005-04-06]http://www.arl.org/newsltr/226/ir.html
18 Anonymous.COSTS[conference article],library Technology Reports.Chicago:2004,40(4):54-56
20 James,H.etc.Feasibility and requirements study on preservation of e-prints.[conference article]London:Joint Information Systems Committee.2003
21 Anonymous.CARL Institutional Repositories Project.[2005-04-06]https://dspace.ucalgary,ca/handle/1880/360.
共2页: 2
论文出处(作者):【聚集学术机构知识的中心:机构库(Institutional Reposi】相关文章:
评析机构股东积极主义03-21
机构养老的需求及问题分析03-20
民间养老机构的政府监管03-10
浅论检测机构的人才建设03-18
技术论文发表杂志较好的机构推荐03-08
建立公共保险评估机构的构想03-20
论我国反垄断执法机构的设置03-07
牛头刨床六杆机构简介05-20
浅论如何构建高效的内部审计机构03-18