数字图书馆引论 - kevenlw.name  · web...

94
目目 目目 ............................................ 3 . 信信 .................................................3 信. 信信 .................................................4 信. 信信信信信 书传统书............................................6 信. 信信信信............................................. 10 目目目 目目 ........................................... 13 . 信信 ................................................13 信. 信信 ................................................15 信. 信信信信信信信 信信信 信信信信信信信 ..............................29 目目目 目目目目目 目目目目目目目 ................................42 . 信信信信信 信信信信信信信 ....................................42 信. 信信信信信信信 ........................................45 信. 信信信信信信信信信信信.....................................49 信. 信信信 信信信信信信信信信信信 ..............................51 信. 信信信信信信信信信信信信 信信 ..................................55 信. 信信信信信 信信信 ........................................57 信. 信信信信信信信 信信信信信 ....................................57 目目目 目目目目 目目 目目目目 传统书 .................................59 1

Upload: others

Post on 29-Feb-2020

22 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

目 录第一章 数字图书馆带来的机遇与挑战...........................................................3

一. 信息化背景下的数字图书馆..........................................................................3二. 数字图书馆的特点及其功能..........................................................................4三. 数字图书馆对传统图书馆的挑战..................................................................6四. 几点说明........................................................................................................10

第二章 数字图书馆的出现和世界各国的发展.............................................13

一. 数字图书馆的出现........................................................................................13二. 数字图书馆的发展........................................................................................15三. 世界各国数字图书馆研究、开发与建设情况............................................29

第三章 国内数字图书馆研究开发现状.........................................................42

一. 我国数字图书馆建设简要回顾....................................................................42二. 文化部及国家图书馆....................................................................................45三. 中国科技信息资源网络系统........................................................................49四. 教育部(中国高等教育文献保障系统)....................................................51五. 中国科学院文献网络共享系统工程............................................................55六. 上海数字图书馆项目....................................................................................57七. 复旦大学数字图书馆开发项目....................................................................57

第四章 数字化对传统图书馆的变革.............................................................59

一. 数字化资源建设新领域................................................................................59二. 电子文献整理新标准....................................................................................63三. 网上读者服务新形式....................................................................................68四. 资源共建共享新网络....................................................................................70五. 数字图书馆市场运作....................................................................................72

第五章 数字图书馆实务.................................................................................75

一. 为什么要建设数字图书馆............................................................................75二. 数字图书馆的需求决策................................................................................76三. 数字图书馆的体系结构................................................................................77四. 数字图书馆资源库建设的具体步骤............................................................79五. 信息资源的数字化技术................................................................................80

第六章 数字图书馆建设中的著作权保护问题研究.....................................90

一. 缘由................................................................................................................90二. 网上作品的著作权保护问题........................................................................91三. 网上作品的确权问题....................................................................................93四. 著作权集体管理组织....................................................................................94

1

Page 2: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

五. 关于作品的上下载和复制问题....................................................................96六. 数据库的著作权保护问题..........................................................................100七. 数字化转换的法律性质问题......................................................................101八. “ ”图书馆的 特权 问题..................................................................................103九. 几点启发和思考..........................................................................................106

第七章 数字图书馆人才建设.......................................................................109

一. 数字图书馆建设对人才的需求..................................................................109二. 数字图书馆建设所需人才队伍的结构......................................................110三. 数字图书馆员的角色定位..........................................................................115四. 数字图书馆员的素质与能力要求..............................................................116五. 数字图书馆员队伍建设..............................................................................121

2

Page 3: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

第一章 数字图书馆带来的机遇与挑战

1945年 7月,当时担任美国科学研究和开发办公室主任的Vannevar Bush在《大西洋月刊》(Atlantic Monthly)上被认为是首次谈到了数字图书馆的观点。二十年以后,试图用数字计算机改变图书馆面貌的美国学者 Licklider于 1965年出版了《未来的图书馆》(Library of future)一书,他大胆地预测了二十世纪末数字图书馆的面貌。以上两位学者被认为是数字图书馆的先驱。当他们提出数字图书馆的观点并对未来图书馆进行大胆预测的时候,这些前瞻性的科学预测对全世界的图书馆员来说还鲜为人知。半个世纪之后,他们的观点和预测已经逐渐地变为现实,而数字图书馆(Digital Library)一词已为图书馆界人所共知。数字图书馆正在全世界迅速发展,它对传统的图书馆的未来发展带来了无可限量的发展机遇,同时也提出了一系列严峻的挑战。对图书馆界来说,我们必须聚集一堂,用我们的全部智慧和关注来认真探讨这一挑战对图书馆未来发展的涵义,否则我们就有可能走上歧途甚至可能被淘汰。

一.信息化背景下的数字图书馆当我们来讨论数字图书馆给我们带来的机遇与挑战时,我们首先应该把数字图书馆放

在全球信息化的大背景下来加以考察和认识。我们正在步入以“数字”、“网络”为标志的信息化社会。1993年,美国总统克林顿上

任不久就提出了“信息高速公路”的信息化发展计划,其中包括投资 4000亿美元兴建美国“国家信息基础结构(National Information Infrastructure)”。半年之后,世界各国群起仿效,英国、法国、日本、加拿大、新加坡、韩国、台湾等国家和地区也先后提出了兴建各自的“信息高速公路”的计划。1994年,美国又提出了建立“全球信息基础结构”的倡议,这是一个全球性的科技发展战略目标,其目标是实现全球的联网和各国之间的信息共享 。1998年 1月 31日,在美国加利福尼亚科学中心召开了 Open GIS Consortium年会,会上,美国副总统戈尔提出了数字地球(Digital Earth)的计划。戈尔认为,数字地球是指以地球坐标为依据的、具有多分辨率的、由海量数据组成的、能立体表达的虚拟地球。据悉,数字地球的计划将由美国宇航局协同其他部门组织实施,计划至 2005实现,到 2020年正式建成。数字地球计划是继信息高速公路之后又一全球性的科技发展战略目标,是信息化社会的重要组成部分。无论是信息高速公路也好,数字地球也好,这种信息化的过程,就是以计算机与通信

网络为基础,以数字化、网络化、智能化和可视化为其特征的;而其中数字化又是基础,只有通过数字化后才能运用计算机操作和在网络上运行,智能化与可视化才能实现。所以数字化被认为是信息化的核心内容。自本世纪九十年代以来,“数字”一词已进入各个领域

3

Page 4: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

如数字中国、数字城市、数字政府、数字农业、数字交通、数字长江流域、数字社区、数字企业、数字家庭、数字图书等等。数字化的信息必须通过计算机和网络来传递,而当代的计算机网络已经进入了第三代。第一代计算机网络是 50年代中期出现的以单个计算机为中心的远程联机系统;第二代计算机网络是 60年代后期出现的以多台具有自主处理能力的主计算机通过通信线路互联起来而为用户提供服务的互联网络;第三代计算机网络是 80年代中期出现的以开放式、标准化为特征的计算机互联网络。随着当代信息技术的发展,新一代的计算机网络正在向高速化、多媒体化、以宽带主干网为基础的多网融合的方向发展,将逐步实现 5个W的个人通信:即任何人(whoever)可以在任何时间(whenever)、任何地点(wherever)都可以和任何一个其他人(whomever)通过网络进行通信,以传递任何信息(whatever)。在这样的背景下,数字图书馆便被适时地提上了议事日程,成为全球信息高速公路和信息化过程中不可或缺的一个组成部分。数字图书馆丰富内涵和广阔发展前景,对于成千上万个图书馆来说,都是一个新的起点和发展目标,既是一种发展的机遇,又是一种严峻的挑战。

二.数字图书馆的特点及其功能与传统的图书馆相比较,数字图书馆具有其独有的特点和功能,这些特点及其功能,

正是众多传统图书馆的未来发展方向。(一) 信息资源数字化信息资源数字化是数字图书馆的基础,因为数字图书馆的其他特点都是建立在信息资

源数字化的基础上的,这也是数字图书馆与传统图书馆最大的区别。因为数字图书馆的本质特征就是利用现代信息技术和网络通信技术将各类传统介质的文献进行压缩处理并转化为数字信息,以“0”和“1”来组成信息资源的细胞,并组成无数个比特(bit)和字节(byte)的信息元素和单元。数字是信息的载体,信息依附于数字而存在。离开了信息资源的数字化,数字图书馆就成了无源之水,无本之木。信息资源的数字化是一项巨大的渐进的社会工程,它不可能由某一个图书馆来完成,甚至也不可能由整个图书馆界来完成,它需要社会各个方面的通力协作。信息资源的数字化可以有几个方面的来源。

1、 图书馆馆藏文献资源的数字化 如英国国家图书馆自 1993年 6月以来,正在将馆藏中的照片、期刊、缩微文献、专利文献以及善本予以数字化。这项名之为“存取创新”计划的数字图书馆工程共包含了 20个创新实施项目,其数字化的资源已超过 1000GB。又如,由美国国会图书馆等 15家图书馆以及相关机构组成的“美国数字图书馆联盟”也正在致力开发反映美国历史与科技文化成就的数字式资源库及分布式数字图书馆系统。这一联盟在 2000年前后将首先实现 500万页的数字化影像。上海图书馆自 1997年开展馆藏文献数字化建设以来,已先后实现了一批特色文献的数字化。其中有反映上海一百多年发展历史的近万张照片,有反映上海发展进程的 70多种年鉴,有 20世纪上半叶出版的民国图书的全文,有 130万页的古籍善本全文数据,有各类剧种的老唱片,有全国报刊篇名数据库,有科普录象,有新产品数据库,有 EBSCO期刊目次库,有妇女之窗网页,有科技会议录,等等。

2、 电子出版物与纸质出版物相比,目前电子出版物的数量与日俱增,增长速度令人震惊。 1995年 5

月,美国商务部国家技术与标准研究所发布了美国电子书标准的草案。1999年 8月 30日,在美国旧金山举行了“21世纪出版大会”,美国微软副主席布莱斯预测,到 2005年,电

4

Page 5: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

子书的用户将达到 25000万人,到 2018年,90%的书将以电子的形式销售。随着出版工业的现代化,现在纸质图书期刊的印刷大都具备了电子文本,这就为数字图书馆提供了可能的巨大的数字化文献资源。如图书馆界与出版界在遵守知识产权的前提下能联手合作,则大部分图书期刊的网上全文查阅时代就将来临。

3、 网上数字资源全世界难以数计的各类网站中集聚了无数的数字化、多媒体的信息资源。如上海东方网

www.eastday.com上就能查阅到上海图书馆收藏的 8000张照片,能看到上海图书馆馆藏的国家级文物《郁孤台法帖》的全文及其解题文字,还能欣赏到上海图书馆馆藏的京剧、越剧、沪剧、评弹等老唱片的唱段以及孙中山、毛泽东等人的演讲声音。除了几上三个方面之外,社会各个行业各个系统均有许多自建或共建的数字资源,也

可以加以利用。可见,信息资源的数字化是一项需要不断进行建设的社会工程。(二) 信息传递网络化在信息资源数字化的基础上,数字图书馆需要通过以网络为主的信息基础设施来实现。

目前,数字图书馆正通过由宽带网组成的因特网(Internet)和万维网(WWW)的高速、大容量、高保真的计算机网络系统将世界各国的图书馆和无数台计算机联为一体。如美国正在实施建立国家信息基础设施计划,这一计划要求在 2015年以前,在全美建立起一个连接所有家庭和社会机构的光纤通信网络。而中国国家信息化基础设施(CNII)也正在加紧实施,其近期目标中就包括建立金桥网信息中速国道,将以光纤、卫星、微波、程控、无线移动等多种通信方式,形成天地一体的网络结构。这些正是数字图书馆所必须依赖的信息基础设施否则,数字图书馆的一大特征——即信息传递的网络化将难以实现。在中国的图书馆界,在数字图书馆的建设中也把信息基础设施建设放到了突出的位置。如中国国家图书馆自1998年 10月开始实施千兆位馆域网工程,并于 1999年 2月 11日正式开通,并先后连接了CERNET 网、CHINANET网,并与北京大学、清华大学、中国科学院等单位的宽带 IP互联。这些网络化建设的措施,为中国国家图书馆的数字图书馆建设以及实现图书馆的各项职能打下了坚实的基础。数字图书馆信息传递网络化的特点也同时给数字图书馆带来了以下这些特征。

1、跨时空。数字图书馆使信息的传递交流突破了时间和空间包括国界和语言的限制,数字图书馆使多少年来困扰广大读者和图书馆员的两大难题——图书馆服务时间的限制和服务空间的限制有希望得到根本解决。

2、开放型。网络化的信息传递使成千上万的读者可以不受限制地进入数字图书馆。这样,传统的有墙图书馆开始虚拟化;原本一个个相对封闭的图书馆向公众打开了书库的大门,沉睡的文献任由读者随意取阅,以往少数信息享用特权随着网络化的发展而不复存在。图书馆成了人人可以利用的文化信息机构。

3、标准化规范化。自 90年代初Web诞生以来,网上资源已成为人们获取信息的重要来源。而这种信息的传递与交流只有在标准化与规范化的前提下才能快速有效地进行。这就对以往的国际机读编目格式(UNIMARC)提出了挑战。为了适应网上电子资源整序的标准化与规范化,元数据(Metadata)技术便应运而生。1995年 3月,反映元数据技术的都柏林核心集(Dublin Core)在美国产生,其中凝聚了 52位来自图书馆、电脑、网络方面的学者和专家的智慧。(三) 信息利用共享化

数字图书馆在实现了信息资源数字化和传递网络化之后,必然会提出一个信息利用的共享化问题。虽然以往图书馆在理论与实践上也提倡资源的共建共享,但信息利用共享化作为数字图书馆的一大特点,其共享化的广度与深度是以往图书馆所无法相比的。由于有了数字化与网络化的坚实基础,数字图书馆的信息利用的共享化特点体现出跨地域、跨行业

5

Page 6: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

的资源无限、服务无限的特征,体现出跨地域、跨国界的资源共建的协作化与资源共享的便捷性。信息传递的网络化,使众多图书馆能够借助网络获取各类数字资源以满足读者用户对知识信息日益增长的需求。在数字图书馆时代,图书馆联盟的信息共建共享模式将会日益发展,原先的信息壁垒和围墙将逐渐拆除。在信息共知、共网的基础上,信息共建、共享的步伐将会较之以往愈益加快。近年来内地、台湾、香港、澳门、新加坡等国家和地区的华文资料共建共享计划就是一个典型的例子。这一计划将把中国国家图书馆、台湾中央图书馆、上海图书馆等图书馆中的碑帖、善本、家谱等特藏文献相继建成数据库。这一例子正是数字图书馆信息利用共享化特点的体现。(四) 信息提供的知识化

与传统的图书馆不同,数字图书馆已经并将实现由文献的提供向知识的提供的转变。数字图书馆将图书、期刊、照片、声像资料、数据库、网页、多媒体资料等各类信息载体与信息来源在知识单元的基础上有机地组织并链接起来,以动态分布式的方式为用户提供服务;而自动标引、元数据、内容检索、不同数据库的互联等知识发现与组织的技术将成为数字图书馆发展的技术关键。数字图书馆信息提供的知识化将会为广大读者用户提供“知识水库”、“学术银行”、“数据仓库”。由于信息加工组织的知识化、智能化和完备的信息检索系统的建立,使数字图书馆能够为读者用户一次性地提供所需要某一主题的目录、论文和著作的全文、图片、图像、声音等各种知识信息。总之,数字图书馆信息提供的知识化,使信息加工趋向智能化,为读者用户创造了一个良好的有利于产生和发现新知识的信息环境。(五) 信息实体虚拟化

数字图书馆使实体图书馆与虚拟图书馆结合了起来,在实现图书馆的基础上体现出虚拟化的发展趋势。所谓虚拟图书馆,是指运用计算机技术生成一个逼真的、具有视觉、听觉等效果的,可交互、动态的图书馆。人们可以对虚拟图书馆中的实体图书馆进行操纵和利用。在数字图书馆中,实体图书馆与虚拟图书馆是相辅相成的两个方面:实体图书馆是虚拟图书馆赖以服务的基础;而虚拟图书馆则是实现图书馆藉以发展的方向。随着图书馆的发展实体图书馆中的虚拟馆藏、虚拟阅览室、虚拟参考馆员、虚拟服务将会不断得到发展。但需要指出的是,数字图书馆的建设并不是在实体图书馆之外另建一个数字图书馆,而是在实体图书馆的基础上建设数字图书馆。在实体图书馆与虚拟图书馆的关系方面,我们提倡“虚实共存论”,而不赞成“取代消亡论”。至于个别纯虚拟的数字图书馆也会出现,但它并不带有普遍意义。

三.数字图书馆对传统图书馆的挑战 数字图书馆的信息资源数字化、信息传递网络化、信息利用共享化、信息提供知识化、信息实体虚拟化等五大特点,为众多图书馆在 21世纪的发展提供了广阔的空间和机遇,但同时也给传统图书馆带来了挑战。在数字图书馆的环境下,传统图书馆正面临着一系列的改组、调整、重建,并将在图书馆管理、人才队伍建设、业务机构重组、服务内容与服务方式更新等方面引发一系列的革命。(一) 图书馆建筑面临的挑战

在数字图书馆的环境下,无论是图书馆的新老建筑,都面临着一个如何适应网络管理和网络服务的问题。首先是网络建设和网络布线的问题。网络建设和网络布线在 90年代中期开始引起中国

6

Page 7: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

各大图书馆的重视。1995年,上海图书馆在新馆开馆前一年,将网络建设和网络布线纳入建筑设计计划。上海图书馆新馆的计算机管理系统的网络结构是以 ATM作为主干网,以以太网、令牌网作为分支网的网络结构,通过光缆连接至上海科技网、上海邮电网以及中国教育科研网,并与因特网相连。为了适应数字图书馆的发展要求,上海图书馆在全馆各区域内设置的信息点从 1996年的 746个增加到 2000年的 1071个。与此同时,广东中山图书馆、辽宁省图书馆、浙江省图书馆、南京图书馆、天津图书馆、福建省图书馆等也先后进行了网络建设。即使是中国中西部地区的甘肃省图书馆、广西桂林图书馆等在资金十分缺乏的情况下,也进行了初步的网络建设。如甘肃省图书馆于 1998年 7月与甘肃省多媒体数据通信局合作,通过DDN专线,实现了因特网的连接,并制作了本馆的网页,为读者提供了Web服务。其次是空间布局问题。自 80年代以来,许多图书馆在数据库建设,特别是书目数据库

和机读目录的研制、生产方面取得了很大的进展,这样就提出了一个新问题,即原先设计的图书馆建筑中,几乎无一例外以传统手工检索的目录大厅将如何重组,即在图书馆告别了成排的卡片目录柜之后,目录大厅将作如何的调整;同时也带出了一个同样的问题,即在书目数据库已经基本实现了电子化的情况下,未来的图书馆新馆建筑中,是否还要设计大空间的目录大厅,如果要设计的话,其功能将作怎样的调整。这些问题都是值得我们思考的。图书馆建筑面临的挑战还包括图书馆的家具和设备。在数字图书馆的环境下,计算机

多媒体的演示成为图书馆许多空间经常遇到了问题。如贵宾接待室、会议厅、报告厅、多功能厅等,在有条件的情况下均应设计能够进行计算机网络大屏幕演示的建筑设计并配备相关的设备。此外,一此图书馆的家具也应考虑到网络布线、计算机及现代通信设施的安置、电源插座等方面的因素。(二) 图书馆业务机构设置面临的挑战

图书馆业务机构可以说是几十年一贯制,各个馆大同小异。如采编部、典藏部、阅览流通部、参考咨询部,还有一些图书馆设有历史文献部、现代技术部等。显然,这些部门的设置,已难以完全适应网络环境下数字图书馆业务拓展和内部管理特别是读者用户日益增长的信息需求。因此,图书馆的业务机构必须进行一定程度的重组与调整。如随着网络建设的进行,在网管工作的设备中,有交换机、各类服务器、阵列盘、叠加

集线器和各类子网等。像这样庞大的网络系统需要有一个专门的部门负责管理并对全馆的系统网络进行管理维护和应用开发。上海图书馆就曾根据网络管理的新的发展需求,于1997年专门成立了系统网络中心的业务机构。随着因特网技术的不断发展和普及,网上信息也已成“浩如烟海”之势,让人叹为观

止,网上和参考咨询便提上了议事日程。在如此众多的信息中,不乏领导机构所需要的决策咨询信息。有的图书馆便因此而相应成立了“战略信息中心”,体现出了信息时代对于决策咨询的快速、准确、全面、简洁、分析、翻译的特点。为了将信息资源逐步数字化,中国国家图书馆成立了数据中心,新建的首都图书馆设

立了古籍数字化生产车间,上海图书馆专门开设了数字生产工厂,广东中山图书馆在多年大力开发建设文献资源数据库的基础上,新近也成立了网络资讯部,计划大规模地开展馆藏资源数字化的建设。在目前图书馆网络技术已有发展而又没有充分发燕尾服的条件下,网上的读者用户服

务显然是图书馆所面临的一大难题。如有的读者或在网上提出各类问询和专题咨询,或在网上提出各类表扬和批评,或在网上提出借阅及复制等各种要求,或在网上提出要求采访订阅的各类书籍报刊,如此等等。如果按照目前图书馆的业务机构设置,显然难以快速便捷地为读者用户提供良好的服务。因为采编部门和阅览部门一般没有专门的网络服务人员而现代技术部门在获取了读者的咨询信息后,对许多问题也难以直接解答。因此,如能新

7

Page 8: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

成立一个“网上读者服务部”,来集中统一协调并处理网上读者所提出的各类问题,也不失为目前图书馆能够做的权宜之计。这样的机构重组生建,势必打破图书馆业务机构设置的传统格局,而将采编阅藏和咨询管理融为一体,从而使图书馆的管理和业务部门产生新的分合。(三) 图书馆服务内容面临的挑战在数字图书馆的环境下,图书馆的业务内容正在发生重大的变化,原有的内容或进行

调整,或逐步淘汰,或推陈出新;新的业务生长点不断出现,新的业务范围不断拓展,新的共享协作不断扩大。就图书馆的采访而言,一方面在传统手工采访的基础上,网上的采访开始出现;另一

方面,图书馆的采访工作正面临电子出版物的挑战,电子出版物的急剧增长在一些图书馆的采访工作中已初露端倪。由于网上书店不断涌现,网上电子版图书期刊与日俱增,加上电子商务和因特网的不断发展与普及,有的专家预测,网络采访将成为图书馆文献采访的发展方向。就图书馆的编目而言,网络资料的著录方式——元数据(Metadata)正应运而生,开

始逐步普及推广,为越来越多的图书馆和图书馆员所接受。DC(Dublin Core)在设计上富有特色,如内在本质原则、易扩展原则、无必须项原则、可重复原则、可修饰原则等,使DC元数据具有意义准确、富有弹性、最小规模等特点。在此基础上,人们正根据各种文献的特点,对元数据的著录格式进行补充。Metadata作为数据本身及其变化的描述,简言之,作为数据之数据 (data about data),成为有关信息的信息 (information about information),必将成为未来数字图书馆网上信息编目工作的标准化规范化的著录格式。就图书馆的阅览而言,目前许多图书馆均辟有“电子阅览室”或“光盘阅览室”,这

是在信息技术并不十分发达、电子出版物数量比例并不大的条件下的产物。随着信息技术的发展和电子出版物的急剧增加,电子出版物将进入各个阅览室。如古籍善本全文光盘将放置在善本阅览室,《人民日报》全文数据库将放置在报纸阅览室,《中国大百科全书》全文光盘将放置在参考工具书阅览室,等等。这种服务内容的重建不仅顺应了信息技术的发展,而且也比较符合读者的阅读查询习惯。在数字图书馆时代,“电子阅览室”这种看似先进实际落后的服务内容和形式将首先在设施先进的图书馆中逐步淘汰。就图书馆的咨询而言,传统的剪报式咨询虽然仍会有一些市场,但网络的参考咨询和

利用网络的参考咨询已经有了很大的发展,而这种发展趋势将越来越明显。如上海图书馆与新新加坡有关方面合作,于 2000年 3月起,利用上海图书馆独特的家谱馆藏优势和新加坡信息网络和市场营销的优势,通过网络向全世界的读者提供寻根、家谱、人物等方面的信息咨询。这就是适应网络技术和环境而产生的新的业务内容。值得一提的是,2000年 2月 24日,中国国家 863计划中国数字图书馆发展战略组与中

国国际广播电台就建立中国数字图书馆示范工程试点单位一事签订了合作协议书。中国国际广播电台是中国各地电台、电视台互联网络链接中心,其所具有的多语种语音视频新闻资源将成为中国数字图书馆资源建设的重要组成部分。这一事例说明,在网络环境下,图书馆的资源建设已完全突破了以往图书馆资源建设的局限,这不能不引起图书馆界的深思可以说,网络时代的到来为各个图书馆的发展提供了一个新的施展才华的大舞台,哪个图书馆把握了这一机遇,它就将在其中扮演主角;反之,或公充作配角,或被社会开除“网籍”,从而失去应有的社会地位。图书馆业务内容的重建并不局了限于以上几个方面。如读者服务方面的网上读者用户

与馆长馆员的对话;在资源建设方面的利用网上资源按读者用户的需求进行主题知识库的重建,海内外各大图书馆资源的网上相互钩连;在图书馆管理方面的图书馆各项业务统计的重新调整,网络环境下图书馆形象的重新设计,等等。可以预见,随着数字图书馆建设

8

Page 9: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

的不断深入,图书馆业务内容的重建将越来越丰富,从而引发图书馆业务建设的一系列变革。(四) 图书馆服务方式面临的挑战在数字图书馆的环境下,图书馆的服务方式面临的挑战主要体现在服务时间、服务空

间和服务手段方面。以图书馆的服务时间而言,以往读者意见较为集中的就是几乎所有的图书馆都是开放

时间太短,要求延长开放时间。现在,众多的公共图书馆实行了 365天每天开放的服务方式,一些图书馆还取消了中午休息的时间,不少大学图书馆开放至晚上 10点,但读者仍然不满足。在数字图书馆的环境下,读者用户的信息需求日益增长,传统的图书馆服务时间显然已经难以适应这样的增长。在网络技术的支持下,一些图书馆已经对读者提供了全天候即24小时的服务,不同的读者可以根据自己的习惯和安排,在自己认为合适的时间在网上利用图书馆,而不必受图书馆开放时间的限制。只是图书馆目前在网上的数字资源还十分有限,所谓全天侯的服务还只能满足较为少量的读者需求,大量的读者需求还必须由读者直接到图书馆才能得到满足。但这种网上的满足率正在不断地上升。据悉,现在全天侯服务的图书馆还不多,有的大学和科学院图书馆在晚上或假期中便关闭了网络服务,但这种局面必然伴随着信息技术的发展和图书馆管理服务理念的变化而改变。以图书馆的服务空间而言,以往读者感到不方便的应是空间距离的障碍,且不说从中

国的中南地区、西南地区、华东地区到东北地区、西北地区和华北地区有多么的不方便,即使是同一地区、同一个城市的不同地点,也会给读者带来许多麻烦。由于图书馆网络技术的发展,现在跨地区、跨国界的馆际互借也较以往更为方便、更为迅速。这种服务空间障碍的克服,将使全世界的图书馆成为一个互相联系、资源共享的系统;在不久的将来,这种系统将成为一个地球村中的“图书馆院”。以图书馆的服务手段而言,以往读者感到不满意的是手工操作的缓慢:手工查卡、手

工抄写、手工借还、手工搬运,而读者服务一集中应会形成长时间的排队、等候,图书馆员的劳动强度也很大。以计算机为代表的现代信息技术使图书馆的服务方式正在发生重建。如计算机编目正在取代手工编目,从而大大提高了图书馆编目的效率;公共机读目录查阅系统使文献的查阅较之以往的手工查阅更为快速、便捷、完备和准确;计算机借还系统使每位读者借还手续在几秒钟之内即可完成;大型图书馆的庞大书库由于有了计算机的支持,使数以百万计的各类图书的取架在 10分钟左右就能完成,一些图书馆文明规范服务中的限时服务的承诺得以实现;读者服务区中的导读、大型公告也以计算机和大型电视屏幕的形式向读者展示;计算机已经进入图书馆的办公区、公共阅览区中的各个阅览室以及书库等区域,计算机信息管理系统使图书馆的服务手段在很大程度上已经或将要取代以往的许多手工操作。(五) 图书馆人员而临的挑战在数字图书馆的环境下,图书馆队伍如何适应这种变化,答案只有一个,就是进行图

书馆人员队伍的重建。这种重建可以通过三个层次来展开:一是图书馆管理层的重建,二是原有图书馆员队伍的重建,三是引进和猎头新成员的重建。我们已经进入了信息管理和知识管理的时代,作为图书馆管理来说,不仅需要了解和

掌握一般的管理知识和规律,而且必须了解和掌握国内外图书情报事业的最新进展和未来的发展趋势,还必须了解和掌握信息技术的基本知识,对于本馆的网络拓扑图做到胸中有数。图书馆管理者的知识结构至少应当包括以下五个方面:一是领导管理的知识;二是图书馆学情报学的知识;三是信息技术的知识,包括数字图书馆的知识;四是文化法律的知识;五是市场财会的知识。原有的图书馆员队伍的得建要通过以业务改革为目标的人事制度改革来进行。首先要

9

Page 10: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

进行全员信息技术的启蒙培训和继续教育;其次要使图书馆员逐步向网络馆员和参考馆员发展,实施竞争上岗,优胜劣汰,让最合适的人安排在最合适的岗位;第三要使整个图书馆成为一个学习的组织,在各个环节都倡导并激励每个成员不断充电、不断进取、不断发挥潜在的能力和创造力。引进和猎头的新成员是图书馆适应网络环境在人员重建方面十分重要的一环。引进和

猎头的新成员应该是高层次的、复合型的、掌握现代网络技术的或经营型人才。要改变图书馆的一些岗位是什么人都可以上岗的陈旧观念。使图书馆,特别是一些大型的公共图书馆和大学、科研机构的图书馆成为学术研究型机构。(六) 图书馆理念面临的挑战数字图书馆环境下的图书馆给图书馆的管理理念也带来了冲击。多少年来,一些图书

馆管理中已习以为常的观念,在数字图书馆的环境下已显得不协调、不合理、不能体现未来发展了。一是图书馆的大小。以往衡量评判一个图书馆的大小,主要是两大数据,一是图书馆

的馆藏文献数量(主要是图书),二是图书馆的面积。根据这样的标准,于是就有了世界十大图书馆的统计,也就有了亚洲三大图书馆的统计。这样的衡量本无可厚非;但是在数字图书馆的环境下,这样的衡量在观念上又是陈旧的,难体现信息技术条件下面向新世纪的数字图书馆的新形象和新发展。以《四库全书》电子版为例,现在国家图书馆、甘肃省图书馆、浙江省图书馆和台湾中央图书馆分另收藏有《四库全书》。但随着《四库全书》电子版的发行,一些图书馆已拥有电子版《四库全书》,其对读者服务的便捷程度和其收藏所占的空间所体现出来的优势,都是纸质型《四库全书》所无法相比的。所谓小图书馆可以收藏大文献,小图书馆也可以进行提供丰富文献的大服务;反之,如果大图书馆藏而不用,收藏而不联网,那么作为一个图书馆来说,其虽大犹小。二是图书馆的业务统计。如图书出借率的统计、入馆人数的统计、购置各类文献的统计

等等。这些统计是十分必要的,但是随着信息技术的发展和图书馆功能的拓展,有些业务统计和统计的原则已难以适应图书馆事业的新的发展。如入馆人数的统计,以往较多的是根据入馆读者进入阅览室和外借图书读者的统计,但是自图书馆进行网络建设以来,上网读者日益增多,他们在网上利用图书馆的馆藏数字文献,如在网上阅读元版《农桑辑要》,在网上查阅《上海经济年鉴》,在网上欣赏图书馆收藏的京剧唱片,在网上检索《全国报刊索引篇名数据库》,等等,这些网上的查阅与读者自己到馆利用馆藏文献应该是一样的道理。因此,在统计读者人数时,应当把上网的读者人数统计在内。此外,图书馆具有教育和智力开发的功能,在图书馆举办讲座、展览等就充分体现了这样的或能。读者到图书馆看一本书,或听一个讲座,或参观一个展览,或欣赏一段音乐,都是图书馆发挥作用的体现,因此都应该列入读者统计的范围,如果仅仅把看印刷型的图书报刊的读者作为统计的对象那么如何体现数字图书馆时代读者利用图书馆的新变化呢,如何体现图书馆的多功能和文化中心的作用呢,如何体现出信息技术高度发展后图书馆服务的先进性呢。三是图书馆的经费管理。公共图书馆作为公益性的事业单位,其经费可以分为人头费、

行政费和购书费等。但是随着信息技术的发展和数字图书馆的建设以及图书馆网络的逐步建立,图书馆每年除了购书费之外,非常大的开支就是数字图书馆网络的维护保养和更新升级;同时,文献载体的多样化和电子出版物的不断上升,使用权图书馆的计算机和网络设施等来断增加,这在本来已经十分短缺的购书经费中无法开支也不允许开支,这就需要申请专项经费或在原有的购书经费中列入新的相关项目。这些图书馆管理的新理念不仅在图书馆的管理层要重建,而且要进行宣传,使图书馆的各级主管部门和财政部门的管理层也进行相应的理念重建。四是图书馆的形象战略。在本世纪 70年代,曾经开始了 CI (Corporate Identity)即企业形

10

Page 11: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

象的战略并风靡一时,图书馆也曾受其影响;到了 90年代, CS (Customer Satisfaction)即顾客满意战略开始流行,笔者曾经将其改造为 RS (Reader Satisfaction)即读者满意战略;现在,企业形象战略和顾客满意战略还在全球运用,而一种新的战略已经开始出现,这就是 CL (Customer Loyalty)即顾客忠诚战略。在网络环境下的图书馆同样可以导入 CL的管理理念并将其生组为 RL (Reader Loyalty)即读者忠诚战略。因为在网络环境下,图书馆应当考虑吸引一大批固定的读者群来上网,以增加点击率并提高图书馆数字资源的利用率,这同以前图书馆想方设法提高印刷型图书的利用率是一样的道理。在不同的图书馆,这种固定的读者群是可以有所区别的。

四.几点说明数字图书馆带来的机遇与挑战是一个大题目,其中有许多问题还有待进行深入的探讨,

使用权图书馆在新的网络环境中得到调整、重组、重建、更新,以便适应数字图书馆的未来发展。我们在这里讨论数字图书馆建设和发展的同时,也有几个问题需要在这里专门提出来讨论。(一) 数字图书馆的建设既要积极又要慎重数字图书馆的建设动工要积极又要慎重是基于以下两点考虑:一是我们讨论数字图书

馆建设及其未来的发展,是就中国图书馆的发展、特别是大中型和研究型图书馆的一般规律而言,中国是个发展不平衡的国家,沿海地区和中西部地区的经济文化发展不平衡,各个馆的情况不同,不可一概而论,不能言必称数字图书馆而盲目地随风而去;尤其是对于一些文献采访经费和日常维持经费都还比较困难的图书馆,对于数字图书馆的建设就应采取实事求是的态度。二是在进行数字图书馆建设的过程中,必须各个图书馆的情况,进行科学的论证,在网络建设、馆藏资源建设、和引入数字资源的过程中切忌一哄而上;同时,要严格按照知识产权的各项规定进行数字图书馆建设的各项工作。在数字图书馆的建设中还应始终把资源共知、共网、共建、共享作为主线贯彻始终。(二) 数字图书馆建设要注意缩小图书馆间信息知识的差距数字图书馆是 21世纪图书馆的发展方向。数字图书馆在提高图书馆服务水平和服务质

量方面,在满足读者用户日益增长的信息需求方面具有极大的潜力。不可否认,由于本身馆藏资源的多寡和信息基础设施的优劣以及经济文化发展的不平衡,在中国各大图书馆之间,特别是在东部和中西部地区图书馆之间,存在着信息技术、网络通信、数据仓库、经费支持等方面的鸿沟。2000年 7月 22日,美国、日本、德国、英国、法国、意大利、加拿大和俄罗斯等八国领导人在日本冲绳名护市聚会,会上发表了《全球信息社会冲绳宪章》,其中提到了要消除富国和穷国在信息方面的差距以及存在的“数字鸿沟”。在建设数字图书馆的过程中,我们同样要注意缩小图书馆之间的“数字鸿沟”,通过数字图书馆的网络建设和资源的共建共享,克服相当数量图书馆的“信息贫困”。在数字图书馆的建设中,注意多样性和层次性,促进整个图书馆办的共同进步与繁荣。(三) 数字图书馆建设对于数字化的数据保存要做到未雨绸缪如同纸质文献的大量出现而出现了纸质文献的保存问题一样,数字信息的大量涌现也

带来了数字信息的保存问题,由于数字信息目前保存的年限并不长,这一问题就显得更为重要。当“数字”这一词汇离我们越来越近的时候,数字化信息的保存正逐渐成为包括数字图书馆在内的信息管理技术最具有挑战性的工作之一。数字化数据的移植、仿真和维护将

11

Page 12: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

成为数字图书馆未来所面临的一大难题。如同书本式的文献存在剔除一样,并非所有的数字化信息均要长期保存下去,那么随之而来又产生了另一个问题,即哪些数字化的数据应该是长期保存的呢。在数字化数据的使用过程中,由于种种原因而导致数字信息质量下降、流失、以至无法为读者服务,这些,都提出了在未来数字图书馆的管理与服务中,数据的有效管理将成为图书馆业务的重要内容。如果我们在建设数字图书馆之初不对这些问题做到有所预见并采取相应的对策,那么,人无远虑,必有近忧。参考文献Ross Harvey. An Amnesiac Society The Problems of Keeping Digital Data for the Future. Paper Presented at the Lingnan University Summer Workshop July 2000/10/11王世伟。论网络环境下图书馆的六大重建。图书馆,2000(4)承继成等。数字地球导论。北京:科学出版社,2000年吴基传。信息技术与信息产业。北京:新华出版社,2000年王荣国、卢朝霞。数字图书馆。沈阳:东北大学出版社,2000年王世伟。图书馆学文献学论丛。上海:上海书店出版社,2000年

12

Page 13: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

第二章 数字图书馆的出现和世界各国的发展

一.数字图书馆的出现

(一)数字图书馆的缘起回顾历史,很多成就巨大的事业都源自于零星的思想火种。诚如前文所述,数字图书

馆的概念萌芽可以追溯到半个世纪以前,这时第一台电子管的“电子计算机”刚刚诞生,工程技术人员整天为获得一丁点“数字化信息”的计算结果,不断地更换象灯泡一样电子管器件(如图:世界第一台电子计算机 ENIAC)。富有远见的专家学者一直随着计算机信息处理技术的发展,不断对人类知识的载体——图书馆的未来形态进行着构想,在一系列新事物,如因特网(1984)、SGML(1985)、CD-ROM(1985)、多媒体(1986)、万维网www、国家信息基础设施NII等产生之时,“数字图书馆”也迅速成为一个时代的特征之一。

“数字图书馆”这一名词的出现与美国政府提出兴建国家信息基础设施(NII)的提出和因特网的迅速普及处在同一时期,显示了它们之间不可分割的联系。最早进行“数字图书馆(digital library)”探讨的文献始见于 1992年1,2,这一年七月美国国家科学基金会NSF主持了一个“电子图书馆研讨班(Workshop on Electronic Libraries)”3,会上 John Garrett

在介绍美国国家先导研究公司 CNRI的研究项目时提到数字图书馆计划,同年十二月同样的研讨班就更名为“数字图书馆研 讨 班 ( Workshop on Digital

Libraries)”,美国著名数字图书馆研究专家 Michael Lesk作了主题发言,名为《数字图书馆:它是什么,为什么是这样的》4,此后以“数字图书馆”冠名的各类会议、论文层出不穷,一发而不可收。数字图书馆的基础根植于整个 80

1 Garrett, John R. and Alen, Joseph S., Toward a Copyright Management System for Digital Libraries, Copyright Clearance Center, Inc. March 1992(一说本文发表于 1991年)2 参见 Fox, Edward, ed. Digital Library Source Book. 1993. URL: http://fox.cs.vt.edu/DLSB.html

3 CNRI project: John Garrett, Corporation for National Research Initiatives. Workshop on Electronic Libraries, July 20-21, 1992 NSF

4 Michael Lesk “The Digital Library: What is it? Why should it be here?” Workshop on Digital Libraries Xerox Palo Alto Research Center December 9-10, 1992

13

Page 14: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

年代对联机情报检索孜孜不倦的追求和探索5,以及全文本、多媒体信息处理技术的成熟,其发端可以归因于因特网出现后美国政府对信息基础设施的研究和投入。图书馆员和信息专家对早期的数字图书馆项目有独特的影响,但最主要的贡献却是来自计算机技术前沿。到今天,图书馆、信息机构、出版发行公司等大量地走上了数字图书馆的历史舞台,但背后的导演仍然是最新的信息技术,图书馆及其它信息机构的社会角色在技术带动的根本性变革的驱动下正在发生着深刻的变化。我们研究数字图书馆的根本目的,就是要把握这一变化,适应这一变化带来的挑战。

(二)数字图书馆的定义对于数字图书馆这样一个正处在不断变化发展的新生事物,追求一个科学完整而又公

认的定义是不可能的,我们整理过的定义就有近百种之多6,几乎每个研究项目都有一个自己的界定,有多少著作就有多少定义。本书无意于评判这些定义,但从历史角度作一简要回顾,有利于形成本书对于“数字图书馆”的界定,从而有助于阐明本书的立论基础。数字图书馆的概念定义首先是从技术的角度作出的,而且一开始就有异于人们对于图

书馆的传统理解。以下是几个典型定义:“数字图书馆是一个分布式的信息环境,其相关技术使得创建、传播、处理、存储、整合

和利用信息的困难大幅降低。”7这是一个早期定义。“数字图书馆是一系列的信息资源以及相关的、将这些资源组织起来的技术手段,如创

建、检索、利用信息的技术。涵盖了现有分布式网络中所有数字媒体类型(文本、图像、声音、动态图像等)的存储和检索系统。”8这是美国国家科学基金会资助的一项有关数字图书馆的“国家级挑战”项目报告中的定义。

早期研究引用较多的一个定义来自美国研究图书馆协会(ARL):“数字图书馆不是一个单独的实体,需要有关技术提供到其它资源的链接,该链接对用户应该是透明的,目标是做到任意检索(universal access),数字馆藏应超越传统馆藏而不能仅成为其替代品”9

美国著名的数字图书馆研究计划“数字图书馆先导研究计划”第一期将数字图书馆的研究范围限定为“分布式知识工作环境(Distributed Knowledge Work Environments)”,在 1997年对第一期项目进行总结并对第二期项目进行规划时,专门就该项目对于数字图书馆的定义问题举办了研讨会,研讨会认为上述认识不尽准确,数字图书馆不仅仅是数字馆藏及管理工具的集合,而应包括信息、数据和知识在整个创建、发布、利用、存储等生命周期内的所有活动10。

综合上述各种定义,我们对于数字图书馆给出一个限定外延的描述性定义:“数字图书馆是在分布式计算机网络环境中信息资源的组织形式,提供国家信息基础设施(NII)的关键性信息管理技术,并提供其主要的信息资源库。”这个定义试图抓住数字图书馆的最本质特征——分布式网络环境中的数字化对象的集合,以及最广义的适用范围——NII的资5 D. Woelk and W. Kim, Multimedia Information Management in an Object-Oriented Database System,Proc.13th VLDB Conference, 319-329, Brighton (1987).文中实际上已经提出数字图书馆概念。

6 请参见上海图书馆数字图书馆资源网站 http://www.istis.sh.cn/digilib 中的有关总结。7 http://ei.cs.vt.edu/~dlib/def.htm E.A. Fox (ed.), Source Book on Digital Libraries, TR93-35, Dept. of Computer Science, Virginia Tech, (1993);8UCLA-NSF Workshop on Social Aspects of Digital Libraries, Final report, November, 1996 http://www-lis.gseis.ucla.edu/DL/UCLA_DL_Report.html。NII/IITA的国家级挑战计划。9 http://www.ifla.org/documents/libraries/net/arl-dlib.txt 10 http://scholar.lib.vt.edu/DLI12/defineDL.html

14

Page 15: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

源库。而对于数字图书馆内涵,我们认同最宽泛的解释:任何利用数字技术和计算机网络获取、存储、存取、发布信息的图书馆或信息机构都可以称为数字图书馆。一个初生婴儿的发展有无限的可能性,我们为什么要作茧自缚呢?不论信息以何种形式存在,图书馆的任务始终只有一个:对于知识信息的收集和整理,

以便更好地传播和利用。传统图书馆收集、存储并重新组织信息,使读者能方便地查到其所需要的信息,传统图书馆还跟踪读者使用情况,以保护信息提供者的权益。数字图书馆抽象地看,与传统图书馆几乎具有相同的工作流程,不同的技术手段为同样的工作环节服务数字图书馆需要收集或创建数字化馆藏,这集成了各种数字化技术,如高分辨率数字扫描和色彩矫正、光学字符识别、信息压缩、格式转换等。数字图书馆利用建立在各种关系数据库或面向对象数据库系统上的有关数字对象的组织、管理、查询技术能够帮助用户便捷地查找信息,并将信息按照用户期望的格式发送。在安全保护、访问许可和记帐服务等完善的权限管理之下,数字图书馆内经授权的信息能够利用 INTERNET的发布技术,实现全球信息共享。数字图书馆有三个基本要素:数字化资源、网络化存取和分布式管理。数字化资源:大量的数字化资源是数字图书馆的“物质”基础。数字图书馆中的数字

化资源应该能够直接提供读者所需的信息,而不只是二次文献(仅使用户获得如何得到文献的线索),然而也应该包含大量的查找信息和帮助信息,因为二次文献也可能是某些读者的最终需求,所以书目数据,索引文摘等应该是数字图书馆的有机组成部分,同时由于数字化把各种不同的载体统一于 0和 1两个简单的数字,书籍、期刊、录音录像带、缩微品、光盘或者古籍、善本、手稿、碑帖、字画、X光片等等,在数字图书馆中都消失了原本的物理形态,多媒体自然也成了数字图书馆的特征之一。网络化存取:高速的数字通信网络是数字图书馆的存在基础。数字图书馆依附于网络

而存在,其对内的业务组织和对外的服务都是以网络为工具或载体,使得它得益于网络也受制于网络。只有利用网络所提供的一切便利和优势,才能最大限度地发挥数字图书馆的作用和优势。分布式管理:分布式管理是数字图书馆发展的高级阶段,它意味着全球数字图书馆遵

循统一的访问协议之后,数字图书馆可以实现“联邦检索”,全球数字图书馆将像现在的INTERNET联接网站一样,把全球的数字化资源连为一体,组成一个巨大的图书馆,使组织和共享人类所有知识成为一种可能。目前关于数字图书馆的最关键的技术研究和开发重点就在于此,这也是数字图书馆之所以聚集众多的人力财力、受到各国特别是发达国家高度重视的最主要原因。

二.数字图书馆的发展

(一)数字图书馆发展的背景数字图书馆产生和发展的社会历史背景离不开近 30年来知识经济或信息经济成为目前

全球经济的最重要的火车头的转型过程,以及人们对知识和信息的经济学意义的逐步认识。。

从世界范围看,信息产业形成于 60年代,成长于 70至 80年代,快速发展于 90年代。然而早在 1912年, 德国经济学家熊彼特就认识到创新才是社会发展的一个根本原因,而

15

Page 16: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

创新的关键就是知识和信息的生产、传播、使用。1957年美国经济学家索罗研究了 1909年至1949年美国经济构成情况,发现非农业部门劳动生产率翻了一番,技术进步占了 87.5%,劳动和资本的贡献只占 12.5%。1962年美国经济学家马克卢普发表了《美国的知识生产和分配》,详细地分析和论证了知识和信息在经济发展中的作用,首次提出知识产业的概念。 1967年,波拉特测定出美国从业人员中有 50%被人雇用在信息产业中,产值占当时美国国内生产总值 GNP的 45%,这项测算产生了深远影响,并导致了对各国产业经济的重新划分和深入研究。欧美各工业国先后开始对本国信息产业作出波拉特式测定,我国也在 80年代末测算信息产业从业人数占总就业人数的 8.8%,产值为当时 GNP的 15%。值得一提的是,1996年诺贝尔经济学奖授予了对信息经济学研究有开创作用的詹姆斯 ·莫里斯 (James Mirrlees)教授和威廉姆·维克瑞 (William Vickery)教授,以表彰他们的贡献。计算机和网络技术的发展彻底改变了人类交流知识和信息的方式,网络消灭了时空差别,而数字图书馆消除了信息占有的差别(技术上),信息上的平等带来交易上的平等,从而具有了经济学上的意义。

人与人之间的知识和信息的交流本来都是意识形态的东西,然而由于技术的发展和人类无止境的需求,它不折不扣地成了经济的主导产业,反过来带动了参与知识信息产生与交流的整个生命过程的各行各业,使这些行业甚至得以提高到国家发展战略的高度,纳入“国家级挑战”等基本国策来重视和扶植。数字图书馆即是其中一员。

从一般意义上说,工业革命极大地拓展了人类的体力,信息革命正在扩展人类的脑力,仅仅在跨越二十世纪的几十年的岁月中,人们对资源的认识经历了从“原子”向“比特”的进步,信息资源已上升为与能源平等的战略资源,而信息之所以成为资源,主要体现在信息的掌控和利用能力。数字图书馆的产生原因和存在价值在于它能够更好地整理、保存和传送信息。(二)数字图书馆的起源初创期( ~1993年)

Vannevar Bush在大脑中发明的信息机“Memex”11一直被当作数字图书馆的概念起源,1945年的计算机甚至连存储设备都没有,Bush设想的Memex系统以缩微作为信息的存储体,计算机负责信息索引和查询,实际上是一个计算机辅助检索系统。这个想法在 50年代至 60年代就被马萨诸塞技术学院实现了,该学院的 Intrex项目将一个收藏两万篇科学文献的缩微库与一个计算机目录检索系统相连,实现了自动检索。第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到 20世纪 60年代末,首

先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio Bar Automated Research System,是后来著名的 LEXIS系统的前身)能够提供法律状态的联机检索,空军建立的法律信息电子系统(LITE)索引了当时美国所有的法律法规和司法解释,提供检索服务。70年代 IBM基于文本存储与检索技术开发了 STAIRS系统,安装在许多大型机中,提供当时许多图书馆用于流通管理等。虽然当时面临一系列的技术障碍,例如昂贵的计算机、居高不下的存储成本、简陋的用户界面以及网络的缺乏,仍然产生了上述可圈可点的应用,当然图书馆界最值得一提的事件是美国国会图书馆成功开发了MARC格式,这是一种机读目录格式。美国图书馆联机中心(OCLC)多年来利用MARC为全球的图书馆进行服务,节省了可观的费用。同时早期产生了一些信息服务,如联合编目、法律信息系统和美国国家医学图书馆的

Medline联机数据库系统等,当时采用的是主机-终端模式,少量的信息装载在一台大型计算机上,用户坐在专门的终端前,通过一种低速的通信联接(例如电话线或专用网络)与中央计算机交换信息。这些系统要求用户训练有素,以便通过简陋的字符型人机界面,自11 见 http://www.theatlantic.com/unbound/flashbacks/computer/bushf.htm

16

Page 17: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

动搜索,获取本地无法得到的信息。这种模式一直沿用到八十年代中期,这时大型国际联机检索系统,例如DIALOG、ORBIT、STN等已获得普遍应用,通过它们,Medline、化学文摘(CA)、科学文摘(INSPEC)、美国政府研究报告(NTIS)、世界专利文摘(WPI)等非常重要的科学数据库得到广泛传播,虽然通信费用昂贵,仍然成为各国有一定规模的图书馆和信息机构所必备的信息源。真正形成数字图书馆概念核心的技术应用发生在 80年代中期,随着计算机信息存储成

本的大幅下跌和信息处理能力的提高,特别是个人电脑的普及,1985年产生了 CD-ROM这种电子出版的主要载体,接着多媒体出现,一时间联机(Online)和光盘成了两种互相竞争的技术,万维网的出现和迅速普及打断了这种争论,多媒体数字信息,而不仅仅是二次文献或事实型数据库全面通过网络提供成为可能,半个世纪的数字图书馆的畅想从云端落到了地面。在这里我们把万维网出现之前的一些通过网络提供服务的全文信息系统看作是早期数

字图书馆应用,它们中有许多延续至今,且已经改头换面,但仍然是数字图书馆的先驱,它们为数字图书馆概念框架的形成做出了许多贡献,参与这些系统设计和开发的许多专家都成了后来数字图书馆领域的活跃分子。这些项目有卡内基•梅隆大学的Mercury计划、康奈尔大学的 CORE 计划、Elsevier Science Publishing 的 Tulip 计划、以及著名的美国国会图书馆“美国记忆”计划等等。美国弗吉尼亚技术大学的 Edward A. Fox在《Digital Library Source Book》中详细介绍了

“数字图书馆”在美国产生和兴起初期的情况,介绍了当时召开的一些著名的研讨会,阐述了美国政府基于战略上的考虑,积极促进其研究部门,如美国科学基金会等,在催生数字图书馆中所起的重要作用。

数字图书馆的早期项目卡内基•梅隆大学的Mercury 数字图书馆计划(1987-1993)是建造校园数字图书馆的第

一个尝试。卡内基•梅隆大学具有先进的计算机及网络设施,其计算机科学系和大学图书馆历来就有革新的传统,该计划的目标是建立一个科技期刊的影象全文服务系统,他们从四家出版公司:ACM(美国计算机协会)、IEEE(电气与电子工程协会)、Elsevier和 Pergamon处获得了许可,选取了计算机科学领域中最常用的 16种期刊,完成了格式转换、贮存和在校园网上传递页面图像等功能。

Mercury计划在技术上有一些创新,例如它开发了一套数字化生产系统(主要是扫描图像和标引);体系上才用了客户机/服务器结构,并选择 Z39.50的早期版本作为客户机与服务器之间的协议;它引入了参考服务器概念(类似于 IBM数字图书馆中的图书馆服务器),负责存放维护目录索引等信息,维护可检字段、访问控制信息以及与图像的连接等为了显示位图,该计划还开发了一个新的算法,按每页 1-2 秒的速度完成压缩图像的获取、网络传输、解压缩和显示等一系列工作;利用该大学成熟的Andrew网络服务来认证和打印,信息通过电子邮件的形式来发布给用户。康奈尔大学的 CORE 12计划是 Bellcore、康奈尔大学、OCLC以及美国化学学会于 1991

年到 1995年间共同实施的合作项目。它转换了美国化学学会出版的 20种期刊共 4年的文章,总计约 40万页。在技术上与Mercury计划非常相似,它的一个特点是开发了一套具有化学特点(如显示特殊的分子式等)的用户界面,这个特点至今在因特网通用浏览器上还没有得到很好体现。CORE项目还首创了几个新做法,有些成为以后许多数字化项目的典范,例12 Richard Entlich, Lorrin Garson, Michael Lesk, Lorraine Normore, Jan Olsen, Stuart Weibel “Making a Digital Library: The Chemistry Online Retrieval Experiment—A

Summary of the CORE Project(1991-1995)” D-Lib Magazine December 1995

17

Page 18: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

如每篇文章有存储两种版本:图像版本和用 SGML标记的文字版本,图像用来显示和打印,保证了与原印刷版本完全一致,而 SGML文本则用于全文检索,图像也存储两幅:一幅分辨率较高(300dpi)的黑白图像用于打印,另一幅分辨率较低(100dpi)的灰度图像用于显示。该计划在当时面临海量信息(约产生了 80GB的数据)的管理问题,也为以后的项目所重视。继Mercury 和 CORE 之后,又出现了一大批其他计划,也都是来探索期刊论文扫描图

像的有效利用方法。一个最著名的例子是 Elsevier Science Publishing的 Tulip 计划,Elsevier 向卡内基•梅隆、康奈尔等大学提供了材料技术领域的 43 种期刊扫描图像。美国最有影响的数字图书馆项目可能要算“美国记忆(American Memory)”计划了。它起

初是一项试验计划,从 1989到 1994年,它选择并复制了一部分对研究美国历史和文化有着重要意义的收藏,以数字化的形式在美国国内发布,探索各种媒体的资料(印刷品、底片、早期电影、录音等)的处理和利用方法。最初采用 CD-ROM(数字形式)与激光视盘(模拟形式)相结合的方式,但从 1994年 6月之后,万维网成了该项目的主要甚至唯一发布方式。该项目之后,美国国会图书馆又展开了“国家数字图书馆计划” ,将上百万具有史料价值的藏品转换为数字形式(主要是图像扫描配合全文索引)并通过因特网访问。作为一个收藏宏富的国家图书馆,其数字化政策和方法是非常受人瞩目的。保藏和利

用是其考虑数字化计划的两个要点,该计划的许多做法也影响了后来许多公共图书馆的数字图书馆计划,其网页也成为许多图书馆网页的参考对象。

部分早期数字图书馆项目一览13

通过扫描得到影象数据的数字化转换项目也是目前我国数字图书馆建设的通常做法,反映了出版业尚未完成“数字化”前的状态,没有真正“数字版”的出版物可以作为数字图书馆的源泉。印刷业使用多年的计算机排版完全是为了印刷品的生产而组织的,目前美国的正在跨越这个阶段,数字图书馆开发和建设可望直接采用标准化的资源形式,可以将注意力集中在更加专业的问题上。

万维网技术的产生和普及对催生数字图书馆有着异乎寻常的重要意义。虽然目前的万维网技术对数字图书馆来说不是非常理想的技术,但由于其开放性和标准化,以及目前得到了空前广泛的应用,为数字图书馆的内容发布提供了强大的平台。特别是万维网浏览器存在于所有标准的计算机和操作系统中,数字图书馆计划不再需要为不同类型的计算机开13 资料来源:dloverview1.pdf,见本书网站

18

Page 19: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

发特殊的用户界面,这一点也使得数字图书馆技术能够专注于分布式资源存储管理、资源揭示等核心领域,使得大量的数字图书馆项目或数字化项目能够有一个共同的技术基础。这也是将万维网技术的出现和普及作为数字图书馆早期与“概念成型期”历史分野的主要原因。

图:数字图书馆早期相关技术:

(三)数字图书馆的概念成型期(1994~1999)虽然本书采用较为宽泛的定义,但我们仍然需要清晰地了解数字图书馆概念的产生和

演变的历史,我们应该知道别人所谈论的“数字图书馆”是什么概念,与我们是否有什么不同,这样我们在交流时才可能更好地沟通和彼此理解。

站在今天的角度,可以认为过去的二十多年一直在为数字图书馆的突现进行技术积累,清除技术障碍。直至 90年代早期,一系列的技术进步彻底破除了建立数字图书馆所面临的最后障碍。虽然技术永远是不充分的,但经济廉价的设备和急剧成长的网络规模最终产生了量变到质变的飞跃:数字图书馆最终成为一个明确的研究开发领域,而获得大量的研究经费,得到高度重视。1993年 11月至 1994年 2月间,美国连续有四次与“数字图书馆”有关的专题会议召开 14,“数字图书馆”这一名词已经不是计算机界或图书馆界的专业术语,而成了许多专业会议14 1994年 IBM Research Report RJ 9840, May 1994.Submitted to IEEE Computer Society Press, Proc. Workshop on On-line Access to Digital Libraries,见本书网站。

19

多媒体CD-ROM ILS图书馆集成管理系统

图书馆专家系统

全文检索系统

超文本技术万维网技术

SGML

关系数据库

面向对象技术

分布式存储及查询

OCR

图像扫描

数字图书馆

Page 20: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

的口头语。“数字图书馆”这一名词被广泛使用用,此时人们对于规范数字图书馆这一概念内涵提出了强烈要求。这一概念最早来自于人们对于计算机信息处理能力的憧憬,来自于技术所提供的可能性,也来自于构建国家信息基础设施的要求。从文献上看,自 1993年至 1998年,美国进行过数次大规模的研讨,包括后面将提到的美国信息基础结构技术与应用工作组 IITA(全称 U.S. Government's Information Infrastructure Technology and Applications)的专题研讨,虽然并没有形成完全统一的认识,但无疑对统一认识、交流成果起到了非常积极的作用。

首当其冲的依然是具有美国政府背景的研究机构及非赢利性公司等。1986年成立的美国“国家先导研究公司”(Corperation of National Research Initiative,简称 CNRI)是一个非赢利性研究机构,其总裁兼首席执行长(CEO)曾经是美国国防部高级研究计划署信息处理部主任、Internet前身ARPANET的主要设计者、被《今日美国》称作因特网之父的罗伯特·卡恩(Robert E. Kahn,见照片)。CNRI公司主要从美国政府获得经费,承担许多国家信息基础设施建设所必须的基础性研究,可以说是设计美国国家信息高速公路的主要机构后来负责维护大多数因特网协议、标准及草案等等。“数字图书馆的基础结构”是卡恩 1995年发表的数字图书馆奠基之作15,从某种意义上说卡恩也是数字图书馆之父。

该报告确立的数字图书馆基础结构获得了随后大多数研究计划的一致支持,被称为 Kahn-Wilensky结构(下文简称 k-w结构),曾有 William Arms 等写过为数不多的几篇论文对这个主题进行进一步深化和讨论16,17,但基本都沿用了该报告提出的基本概念和体系结构。本书将在第 章中较为详细地介绍这一体系结构。该报告提出的数字图书馆是一个在广域网中面向对象的分布式的数字资源组织体系。提出这些想法能够从本质上改进目前因特网在资源组织上的与生俱来的弱点。该报告提出一整套新的概念体系,例如“数字对象” (digital objects)、“调度系统”(handle system)、“元数据与键元数据”、“统一资源命名域(URN:Universal Resources Namespace)及其认证”、“资源库访问协议”(repository access protocol)等,影响了以后的所有数字图书馆技术研发项目,包括美国数字图书馆先导研究计划(DLI1)中的许多项目、美国国会图书馆的国家数字图书馆计划以及各大公司对于数字图书馆的理解。可能由于该报告提出的设想过于“基础”,实际上是对整个因特网结构的优化,在因特网的应用如日中天之时,不可能得到普遍推广,到目前为止我们还只能看到一些试验性应用开发项目。

该公司并不满足于提出一些基本概念和基础结构,而是与美国政府资助的许多数字图书馆项目密切合作,不断推出一些试验原型系统或“测试平台” (Testbed),并利用其下属著名的“数字图书馆杂志”(http://www.dlib.org)发表成果,展开交流讨论。《数字图书馆杂志》创刊于 1995年 7月,全称是 d-lib magazine: a magazine of the digital

library forum,至今已发表了大量的高水平的数字图书馆研究论文,成为名副其实的论坛。该杂志很好地利用了电子出版的所有优势,同时借鉴了传统期刊的特点(例如准时、定期出版,对过刊的完整保留等),不仅是学术研究工具,同时其本身也成为数字图书馆许多新观念新理念的实践者。这是一本数字图书馆领域名副其实的核心期刊,具有难以替代的地位,并且做到了“免费”与“高质量”这一对矛盾的和谐统一。15 Robert Kahn and Robert Wilensky, "A Framework for Distributed Digital Object Services", May 1995. (http://WWW.CNRI.Reston.VA.US/home/cstr/arch/k-w.html)

16 William Y. Arms “Key Concepts in the Architecture of the Digital Library” D-Lib Magazine, July 1995

17 William Y. Arms, Christophe Blanchi, Edward A. Overly “An Architecture for Information in Digital Libraries”

(http://www.dlib.org/dlib/february97/cnri/02arms1.html)

20

Page 21: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

1994~1995年间美国关于数字图书馆方面的研讨会(workshop)不断,美国政府感到有必要统一大家对这个问题的看法,于是美国信息基础结构技术与应用工作组(U.S. Government's Information Infrastructure Technology and Applications:简称 IITA)组织了一次声势浩大的专题研究,试图弄清楚数字图书馆的研究范围、内容和应采取的步骤。IITA是美国航空航天局 NASA设立的一项“高性能计算与通信计划(High Performance Computing and Communications Program,简称 HPCC)”中的一个项目组18,是美国国家信息基础结构NII的最高技术委员会。 会议邀请了多达 60位数字图书馆及相关领域的活跃分子,向他们询问了三个基本问题:a. 什么是数字图书馆?它与一般的信息库或因特网有什么区别?将会有多少数字图书馆?它们相互之间的关系怎样?用户看到的数字图书馆是怎样的?

b. 数字图书馆需要怎样的基础结构?由哪些要素组成?与 NII所需的更宽泛的基础结构有何不同?基础结构与标准的关系如何?谁会使用这些基础结构?这些基础结构怎样处理与知识产权管理有关的出版商关心的问题?

c. 怎样评价数字图书馆?如何知道三四年后现在的研究项目成功地为用户开发了有效的数字图书馆服务?为了使会议避免无休止的争论、更好地达成一致看法,会议还根据专家的不同背景分

了五个小组,它们是:出版界、商业、图书馆界、因特网领域和多媒体领域,分别进行讨论和总结19。会议就数字图书馆研究急需解决的问题达成了初步一致的意见,并基本确认了 k-w结构作为数字图书馆基础结构所确立的基本框架。结论分为 5个方面:互操作性、数字对象及对象库的描述、收藏的管理与组织、用户界面与人机交互以及经济、社会和法律问题,为以后的研究工作确立了框架,理清了思路,划定了边界,对以后美国国内数字图书馆的研究发展产生了巨大的影响。

这一时期是数字图书馆研究与开发大发展的时期,各类有关事件非常多,各国各机构所列项目也非常多,我们不可能一一介绍,因此就这一时期的一些大事我们制作了表格如下,内有许多事件的连接可以参考,关于世界各国数字图书馆的重要项目介绍见下节。

表 :国际数字图书馆发展大事记时间 事件 责任者 说明1945年 7月 Atlantic Monthly 发 表 关 于

Memex信息机的构想Vannevar Bush

50年代至 60年代

Memex设想的具体实现。Intrex项目将两万篇科学文献的缩微库与一个计算机目录检索系统相连,可自动检索

马萨诸塞技术学院

60年代 OBAR系统提供法律状态的联机检索,LITE法律信息电子系统索引了当时美国所有的法律法规和司法解释,提供检索服务。

OBAR为美国俄亥俄法律自动研究系统LITE 系统属于美国空军

18 请参见 IITA1997年年度报告 iita1997.rdf,见资源网页。19 见本书网站上 IITA有关资料。

21

Page 22: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

1969年 美国国会图书馆开始发行MARCII机读目录

70年代 在大型机上开发 STAIR系统,用于信息检索

IBM

70年代 OCLC、RLIN、WLN等联机编目网络产生

70年代 DIALOG、ORBIT、BRS等商业性联机情报检索系统开始服务

80年代 图书馆普遍采用自动化集成系统,提供业务和服务的自动化管理

1991 年 10月

起草关于建立国家科学、工程与技术电子图书馆的白皮书

Edward Fox20,Micheal Lesk, Mike McGill

受美国 NSF国家科学基金会委托

1992年 3月 发 表 “ Toward a Copyright Management System for Digital Libraries” Copyright Clearance Center, Inc.

Garrett, John R. and Alen, Joseph S.,

最早出现“数字图书馆”提法的文献(一说本文发表于1991年)

1992 年 12月 9-10日

Digital Library Workshop (数字图书馆专题研讨会),地点:施乐公司 Palo Alto研究中心

Micheal Lesk由NSF主持召开

第一次明确针对数字图书馆而召开的专题研讨会

1993 年 10月 25日

DLI研究计划招标 要求 1994/2/4 前申报项目

1994年 美国国会图书馆宣布开始“国家数字图书馆(NDL)”计划)

(http://lcweb.loc.gov/ndl/per.html

1994 年 6 月19-21日

“第一届数字图书馆理论与实践年 会 ” 召 开 ( Digital Library’94)

由 Texas A&M 大学的Hypermedia Research Laboratory主办

http://csdl.tamu.edu/DL94/

1995年 3月 用于对数字化信息进行编目的都柏林核心(Dublin Core)元数据工作组第一次会议(DC-1)在俄亥俄的都柏林召开

OCLC http://purl.org/dc

1995 年 5月,比利时布鲁塞尔

西方七国集团(后为八国集团)部长级会议,确立 11项有关全球信息化的导向性计划,电子图书馆为其第四个项目

http://www.ispo.cec.be/intcoop/g8/g8pp_matrix.html

1995 年 5月, Austin, Texas

Robert Kahn和 Robert Wilensky提出数字图书馆基本结构

1995 年 5 月18-19日

IITA数字图书馆专题研究 召集全国 70余位数字图书馆专家共同研讨数

http://www-diglib.stanford.edu/

20 Edward A. Fox Director of the Digital Libraries Research Group at Virginia Tech.

22

Page 23: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

字图书馆内容及发展方向问题

diglib/pub/reports/iita-dlw/main.html

1995年 6月, Austin, Texas

“第二届数字图书馆理论与实践年 会 ” 召 开 ( Digital Library’95)

由 Texas A&M 大学的数字图书馆研究中心主办

http://csdl.tamu.edu/DL95

1995年 7月 《数字图书馆杂志》(D-Lib Magazine)创刊

主编:William Arms属于 CNRI

1996 年 3 月20-23日

第 一 届 美 国 计 算 机 学 会(ACM)“国际数字图书馆研究与开发会议”

http://fox.cs.vt.edu/DL96/

1996 UCLA-NSF Workshop on Social

Aspects of Digital Libraries , Final report, November, 1996

。NII/IITA的国家级挑战计划。

http://www-lis.gseis.ucla.edu/DL/UCLA_DL_Report.html

1996 年 4 月16-18 日 , Silver Spring, Maryland

First IEEE Metadata Conference http://www.computer.org/conferences/meta96/meta_home.html

1996年 荷兰的 Tilburg大学举办第一届国际性的数字图书馆培训班

由于其良好的效果,至今未停,今年已经举办了第五届,影响较大

2000 年的网站见http://cwis.kub.nl/~ticer/summer00/

1997 年 7 月23-26日

美国计算机学会(ACM)“第二届国际数字图书馆会议”

http://www.sis.pitt.edu/~diglib97/

1997 年 9 月1-3 日 : Pisa, Italy

First European Conference on Research and Advanced Technology for Digital Libraries.

ECDL’97 http://www.ercim.org/publication/Ercim_News/enw31/peters.html

1998 年 3 月 17-20 日 , 新加坡

第一届亚洲数字图书馆会议Digital Libraries Asia 98 Conference & Exhibition: The Digital Era: Implications, Challenges & Issues

http://dla98.digilib.org.sg/

(已不可连接)

1998 年 6 月 23-26 日 , Pittsburgh, PA USA

美国计算机学会(ACM)“第三届国际数字图书馆会议”

1999 年 11月 8-9 日,台北

第二届亚洲数字图书馆会议 The Second Asian Digital Libraries Conference

http://www.lis.ntu.edu.tw/adl99/

23

Page 24: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

目前我们已经历了数字图书馆概念形成的阶段,基础的技术框架也已经形成,但技术开发仍然是现在数字图书馆研究和发展的主题,对于将来数字图书馆的形态仍然起着决定性的作用。至今我们仍然不能确定将来的数字图书馆究竟是怎样的,我们还处在数字图书馆的成长期,那些对“无纸化时代”的预测曾引起学术界激烈争论,已经数次落空,我们不愿再作类似的预言。然而直到现在,技术的研发还没有看到放慢脚步的迹象,人们依然在大量地往数字图书馆里面投资扔钱,在数字图书馆领域集中了计算机与通讯里的最尖端的东西,虽然有许多不能算是主流,但非常前沿。

在这个领域我们不得不重点介绍一项著名的研究计划——数字图书馆先导研究计划(Digital Library Initiative,简称 DLI),现在已进入了第二期。这些项目虽然偏重于技术领域,在我们的分类中属于典型的“技术主导型”,基本上是对于数字图书馆基本结构(即上文提到的 k-w结构)的实现,然而它影响巨大而且深远,甚至主宰了人们对于数字图书馆的认识,成为数字图书馆研究开发的楷模而被各国所纷纷效仿。作为对于一个新领域的初次大规模探索,这些项目大都是试验性质,并没有成型、定论,就第一期项目来说,有些甚至并不能说做得很成功。

数字图书馆先导研究计划(Digital Library Initiative:1994~1998)意识到数字图书馆对于国家信息基础设施的重要作用,美国三个最著名的基础和应用

研究机构:美国国家科学基金会(National Science Foundation,简称 NSF)、美国国防部高级研究计划署(Defense Advanced Research Project Agency,简称 DARPA)和美国航空太空总署(National Aeronautics and Space Administration,简称 NASA)总结了以往的相关研究,于1993年秋天提出了一份“数字图书馆宣言”,并向全国征集“数字图书馆研究先导研究计划”的侯选项目。1994年 9月美国科学基金会的 DLI 项目组从 73个项目中正式遴选了 6个项目,投资 2400万美元,开始了为期 4年的研究,该计划还要求每一个承担单位配套提供等额或数倍于国家投入的资金。DLI计划由于后来有了后续计划,该项目被称为数字图书馆先导研究计划第一期。

本期先导研究计划在招标之前进行了精心的准备,从研究目标、形式到项目内容范围、检查与验收办法等,都作了详细规定,非常明确。a. 项目目标:促进数字资源的收集、存储、和组织的手段,使之能够以一种对用户非常方便的方式,通过网络进行查询、检索和处理。

b. 项目人员组成:强调要有各方面的专家合作进行,包括研究人员、应用开发人员和用户。本期先导研究计划都是由大学主要负责,但参加人员包括了四个方面:

1) 数字图书馆的用户(如特定的研究团体和信息使用者);2) 商业公司,从而使得数字图书馆系统商业化(如出版商、软件商、股票交易所、设备制造商和通讯公司);3) 公共或私营信息库(如图书馆、数据库、政府或私营信息服务);4) 相关的计算机和其它科学技术研究团体(如学术性团体、超级计算机中心和商业化的试验室)。

c. 项目鼓励如下领域的研究: 数字信息的获得; 电子信息的分类和组织; 大量数据、影象和文本信息的查询、筛选和摘要的先进软件的研究; 大量影像的快速浏览的可视化和交互技术;

24

Page 25: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

对网络协议和标准的研究; 对网络信息资源利用方法、途径的简化; 与数字图书馆有关的个人和群体的行为、社会和经济问题的研究。

d. 最后确立的 6个项目分别是:1) 加州大学伯克利分校——环境电子图书馆:可升级的、智能化和分布式电子图书

馆的原型(经费 400万美元)。目标是“开发一整套对海量分布式馆藏(包括照片、卫星遥感图像、地图、全文本信息等多种载体类型混合而成的资源库)进行智能化存取的技术。”

2) 加州大学圣巴巴拉分校——亚历山大项目:图像和空间参考信息综合服务的分布式数字图书馆的初步探索(经费 400万美元)。该项目目标是开发一个数字图书馆,提供对地图、图片或图像类资源的检索工具,并提供新型电子图书馆服务。该项目从 Santa Barbara, Ventura, 和 Los Angeles地区的地图、图片、飞机航拍图的数字化做起,逐步扩大到收录其它学术团体、联邦机构、公共组织和图书馆的全国性收藏。

3) 卡内基﹒梅隆大学(Carnegie Mellon University)——信息媒体:集成声音、图像和语言理解技术创建和探索数字视频图书馆(经费 480万美元)。该项目试图建立一个交互式的网上视频资料图书馆系统,允许读者存取、浏览和检索科学及数学方面的录象资料。该系统集成了语音、图像和自然语言理解技术,研究还涉及计算机和人的交互问题、视频数字资料的定价问题和收费使用问题,以及隐私权和安全问题等等。

4) 伊利诺大学厄尔巴那分校——构建互联空间:为大学工程学科建立数字图书馆的基本架构(经费 400万美元)。基于Grainger工程图书馆信息中心的丰富收藏,该计划专注于工程类期刊杂志,重点开发语义检索技术,设计可扩展的信息系统(交互空间:Interspace),研究人们对这样一个数字图书馆进行利用的社会学评价体系。

5) 密歇根大学:智能信息搜索(经费 400万美元)。该项目的目标是开发一个多媒体数字图书馆的测试平台(testbed),数字图书馆的资源内容涉及地球及空间科学,该原型系统希望被各类读者,包括高中和大学教师和学生以及公共图书馆图书馆的用户,进行广泛地进行测试和评价。

6) 斯坦福大学——斯坦福综合电子图书馆(经费 360万美元)。该项目旨在进行互操作性方案的研究,开发一套技术,能够建立一个综合性的虚拟图书馆,提供用户对网络信息进行统一的存取,该项目还要进行通过网络使用付费信息的研究,以及信息资源版权信息的收集、如何做到合理使用等问题的研究等等。

数字图书馆先导研究计划第二期(1999~ )1998年春,在首期先导研究计划面临结束之时,经过认真的总结和调研,美国政府打

算从各个层面加深拓宽研究领域,于是发布了先导研究计划第二期招标书21。首先,主办机构从首期的三个赞助,增加到七个,增加的四个机构是美国国会图书馆

(LC, Library of Congress)、美国国立医学图书馆(NLM,National Library of Medicine)、美国人文学科基金会(NEH,National Endowment for the Humanities)和美国联邦调查局(FBI,Federal Bureau of Investigation),可见增加了图书馆的比重应用成分。其次,项目的持续时间和经费增加了。DLI2计划持续 5年,五年中上述 6个单位计划提供 4000到 5000万美元。第三,为了资助更多的项目,资助方法与第一期有所不同。到 99年 9月为止就有21 见 nsf9863.pdf

25

Page 26: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

30个项目入围(见表一),目前(至 2000年 10月)已经有 36个项目获得资助。这些项目分为两类:单独的研究项目和多学科综合项目,单独项目资助一到三年,资助上限为 20万美元,大项目资助一到五年,资助上限为 120万美元。第四,研究目标有所侧重,重点提出三个中心:以人为中心、以系统为中心、以技术为中心,具体研究目标是:

为数字图书馆界定适当的发展领域,有选择性的开展研究和实验活动; 使数字化资源的扩充、管理、存取更加迅速、便利,增加利用信息的深度; 创造新方法、新机会,使数字图书馆更好地为不同教育水平的、现有的和潜在的用户群服务;

推动从社会学和经济学角度对人与数字图书馆交互作用的研究。第五,极大地扩展了数字图书馆应用领域(见表二学科分布),首期项目以研究为主,所牵头的六个高校都具有极强的计算机技术背景,而这一期涉及到许多专业领域。当然图书馆和情报方面还嫌太少,虽然有一些项目针对情报检索问题(如加州伯克力大学项目),但总的比例太小。可喜的是确有一些图书情报专家领衔进行一些项目的开发工作。第六,该期计划加强了项目管理,同时也注意促进项目间的交流和成果的转化与推广。该计划重新建立了一个网页,将所有项目分为资助项目(36个)、大学教育项目(8个,专为提供大学教育用的学科资源库建设)、国际合作项目(与英国、德国和欧盟合作的一个项目)、特别项目(14个)及专题研讨会等 5个栏目,包含了最新会议及项目进展的介绍,所有阶段性研究报告都可以找到,还有大量的新闻、事件、论文、报告、相关项目和相关信息的链接。

表三是这些项目所涉及的原始资源的媒体类型情况,表四是这些研究涉猎的技术领域。这些图表翻译自 Edward A. Fox “Digital Libraries Initiative (DLI) Projects (1994-1999)” Bulletin of the American Society for Information Science October/November 1999。由于涉及到三十多个具体项目,在此无法一一介绍,请参阅DLI2网页:http://www.dli2.nsf.gov。

26

Page 27: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

27

Page 28: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

三类数字图书馆研究美国数字图书馆先导研究计划第一期的成功和第二期的实施,对美国国内乃至世界各

国的数字图书馆的建设起到了极大的推动作用。近几年各国数字图书馆的研究开发高潮迭起,通过因特网可以查到的有关项目、课题有数百个之多。数字图书馆领域的研究开发是体现数字图书馆理念最好实例:充分利用因特网的便利条件,信息公开,依靠技术提高信息的可获得性。该领域的绝大多数研究资料都可以通过因特网直接得到,包括许多会议论文(例如 IEEE 的早期数字图书馆会议录全文),部分可能要通过付费方式,例如ACM(Association for Computing Machinery,实际上的美国计算机协会)的技术报告等。我

28

Page 29: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

们所浏览和调查过的项目不下 200个,美国研究图书馆协会(ARL)资源网站中收录了403个22(2000年 9月),通过我们整理的“核心资源”、“重要论文”“大事记”23等资料,您可以看到目前的繁荣局面。

如此纷繁复杂的局面有时很难让人看清楚目前数字图书馆领域到底在搞些什么,哪些与自己正在从事的工作有关,是否可资借鉴或参考。不加分析地罗列许多项目,或者对每个项目进行逐个介绍我们认为毫无意义,这些项目不仅对于初入道者,甚至资深的图书馆员和计算机网络专家也常常不得要领。作为“引论”,我们希望尽可能理清数字图书馆的发展脉络,尽可能从政策、机制、宏观管理、技术进展的意义等宏观方面对各个项目进行分析。通过对目前数字图书馆研究课题和开发项目进行一个大致分类,应该有助于认识目前数字图书馆领域所发生的事情。

根据我们分析,国外目前数字图书馆计划和项目大致可分为三种类型:技术主导型、资源主导型和服务主导型,基本区分见下表:

类型 内容 特征 举例技术主导型 以涉及数字图书馆资源获取、

存储、组织、检索、发布和版权管理等方面的技术创新和开发为目标,资源库通常作为测试环境或副产品。

求得某一方面的技术进展,成果为技术报告,资源库只作为测试环境(Testbed)

DLI1、DLI2项目

资源主导型 以资源数字化为目标,借助一定的技术手段(不一定是最先进的),提供因特网浏览和检索

可以是资源网站,任何商业机构、个人都可以开发建设,很多项目属于传统图书馆资源的数字化。

“美国记忆”项目,纽约公共图书馆历史收藏项目, UNCOVER等

服务主导型 以各类型资源库的整合和系统服务为目标,结合各种先进的服务手段,如个性化服务、自动定制等,并常常用到各种电子商务手段,如用户认证、付费管理等。

深层次的情报服务,常常是传统图书馆向数字图书馆转型期的必然选择

加里福尼亚数字图书馆项目、大英图书馆项目

上述分类反映了目前数字图书馆研究的丰富性,所有这些相关努力带来了数字图书馆的繁荣,每一个具体的组织机构都站在它的角度、以它自己的理解进行研究或开发,涓涓细流汇成大海。数字化图书馆从一开始就不局限于一个行业或学科领域,它不仅仅是数字化资源的集合,而是数字化资源与服务,以及一系列工具的有机组成,数字图书馆的建设也不仅仅是技术问题,而是一系列目标与政策的合力。

有一点需要注意的是,上述三类区分并不是绝对的,他们之间有相互交叉、影响或难以区分的情况。例如一些DLI1的项目已经建立起初具规模的资源库,一直在对用户提供服务;美国国家数字图书馆计划也采用了许多新开发的技术(如统一资源命名技术);大英图书馆的数字化计划是我们见到的传统图书馆最富挑战性的数字化计划,这主要受益于英国图书馆界一贯的对数字图书馆技术的重视,当然它的立足点始终不移地放在更好地为读者服务上。近期NSF资助的一些项目非常强调强调要结合技术、资源库、服务的结合,例如今年四月结束招标的 NSDL 项目( National Science, Mathematics, Engineering, and

22 http://www.arl.org/did/23 参见本书附件和本书网站。

29

Page 30: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

Technology Education Digital Library)24。以此为分类标准,我们有重点地具体分析一些数字图书馆项目。

三.世界各国数字图书馆研究、开发与建设情况80年代起兴起的以电子出版物的收藏、处理、利用和服务为特征的电子图书馆是传统图

书馆在数字时代到来时的一种调整和适应,这是图书馆领域所进行的数字图书馆转型的初级阶段,还没有与NII或GII的建设者们所提出的数字图书馆概念汇流。数字图书馆的研究开发一开始并不属于图书馆领域,而是整个社会在面临以数字化和网络化为特征的信息革命的冲击下做出的调整和适应,目的是解决网络时代(或称为数字化时代)的信息的收集保存、处理、传播、利用问题,各国相继提出的数字图书馆研究与开发无一不是这个目的,而这正是传统图书馆的社会功能。传统的图书馆和信息机构在各国的数字图书馆研究与开发中积极参与、非常活跃,它们不仅加入到象美国数字图书馆先导研究计划 DLI这样一些技术开发项目中去,自己还常常领导一些数字图书馆项目,这就形成了数字图书馆领域纷繁复杂的繁荣局面。

我们把世界各国数字图书馆的研究开发项目分成三类:技术主导型、资源主导型和服务主导型,传统的图书馆和信息服务机构所进行的数字图书馆研究开发,多半是服务主导型的项目,有一些是资源主导型,很少是专为解决技术问题的,站在图书馆和信息机构的角度,我们真正关心的是数字图书馆作为一个整体,怎样处理信息资源、怎样提供服务、怎样完成知识信息在其生命周期过程中的每一个循环。技术开发固然非常重要,新技术有可能决定数字图书馆的未来形态,但建设数字图书馆必须使用现成的成熟技术,最多需要进行一些必要的技术集成,还要注意技术之间的兼容和协调,除非专为新技术提供测试平台。

世界各国的研究开发有时体现了一个国家鲜明的特色。美国的项目非常多,形形色色都有,但最明显的特点以美国国家科学基金会(NSF)资助的项目为代表,集中体现了技术主导型研究,偏重于计算机技术的研究开发,建立信息存储、处理、检索的新工具新方法。日本可以说是另一个极端,基本受其国立国会图书馆影响,全都是资源主导型。欧洲国家介于两者之间,正好是服务主导型为主。

在项目的国际性方面各国的差别也很大。有些国家以民族性的特色馆藏为重点,强调“民族的就是世界的”;有些国家强调本国利用因特网上的国际性信息资源,或矢志建立某一类文化的“门户”(例如新加坡),借助于新加坡人英语和汉语都非常精通的特殊优势;北欧一些国家也非常“国际化”,这个特点也带到他们的数字图书馆建设中,北欧许多国家的在这个领域做得相当出色。

在美国,数字图书馆融合了出版业、信息服务业和图书馆行业,电子出版与新型的数字信息服务模式层出不穷,出版业在深感受到挑战的同时,积极参与变革,图书馆走出围墙,在整个行业重组时有时起到举足轻重的作用;而有些国家的数字图书馆仅仅把自己定位在“文化保存”,与出版业隔膜很深,井水不犯河水。

本节主要介绍各国或国际组织进行数字图书馆开发建设的情况,有选择地介绍一些具体的数字图书馆项目,重点在服务主导型项目,主要选择依据是根据项目的重要性(如各国的国家数字图书馆计划)、影响程度(如 G8计划及 UNESCO计划等)以及是否有特色等,注重宏观、整体、独创性,不追求具体细节问题。24 见 http://www.nsf.gov/cgi-bin/getpub?nsf0044

30

Page 31: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

项目列表项目名称 类型 说 明 备注

数字图书馆先导研究计划(DLI)(

技术主导型项目

美国国家级技术开发项目,第一期六项,目前第二期已三十多项,国家投资逾 7200万美元

前文已介绍

西方八国集团项目 资源主导型

由各国政府牵头,各国国家图书馆作为成员馆参与

美国国会图书馆“美国记忆”项目

资源主导型

前文已介绍

美国国家数字图书馆竞争计划

资源主导型

美国国会图书馆与 Ameritech 公司联合主办,全国招标项目

大英图书馆国家数字图书馆计划

服务主导型

澳大利亚国家图书馆数字图书馆计划

服务主导型

加里福尼亚数字图书馆项目

服务主导型

美 国 遗 产 项 目( American Heritage Project)

http://sunsite.berkeley.edu/amher/加里福尼亚大学、加州大学伯克利分校、斯坦福大学、杜克大学和弗吉尼亚大学合作进行

(一)西方八国集团(G8)项目认识到信息与通信技术的发展将提供未来信息社会的基础,并将导致一个崭新的经济

和社会结构的建立,西方七国集团(后由于俄罗斯加入,遂称为八国集团 Group 8,简称G8)在九十年代中期对于全球信息化和与此相关的各个主题:电子商务、文化交流与保存、教育、环境、卫生保健和公共管理等给予了高度重视。1995年 2月 25-26日,西方七国集团(G7)和欧盟主管电信或信息产业的部长们在布鲁塞尔召开了一次讨论全球信息基础设施的重要会议,这次会议是根据前一年 7月G7首脑在那不勒斯会议上的“全球信息社会倡议(Global Information Society Initiative)”,经过大半年的准备而召开的,会议认为在集团成员国内部实施一些“示范计划(Pilot Projects)”会有助于明确信息全球化的方向,加强国际间合作,提供实施方案,进而促进世界各国的信息化进程,会议根据讨论的主题提出了十一项“全球信息社会示范计划(Global Information Society Pilot Projects)”,它们是:

全球总目录计划(GIP: Global Inventory project) (由欧洲委员会和日本负责) 全球宽带网互操作性(GIBN: Global Interoperability for Broadband Networks)(加拿大和日本负责)

跨文化教育培训(Tel*Lingua: Cross-Cultural Training and Education)(法国和德国

31

Page 32: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

负责) 电子图书馆(Electronic Libraries / Bibliotheca universalis)(法国和日本负责) 世界文化遗产多媒体存取/电子博物馆计划(Multimedia Access to Word Cultural

Heritage /Electronic museums)(意大利和法国负责) 环境与自然资源管理(ENRM: Environment and Natural Resources Management)

(美国负责) 全球紧急管理(GEMINI: Global Emergency Management)(加拿大负责) 全球保健应用(GHAP: Global Heathcare Applications)(欧洲委员会负责) 网上政府(GOL: Government On-line)(英国负责) 全球中小企业市场 Global Marketplace for SME's (欧洲委员会、日本、美国负责) 海事信息系统(MARIS: Maritime Information Systems)(欧洲委员会、加拿大负责) 该示范计划 1999年在德国科隆峰会进行了演示和总结25,许多项目实际上已经超出了

G8成员国范围,而扩展到非成员国及许多发展中国家。通常我们较为关注的是其第四项“电子图书馆”计划,然而实际上大多数项目都属于数字图书馆领域,例如第 1项、第 3项就是建立一个分布式的网络资源库,并提供相应的服务;第 5项是“数字博物馆”项目,本身与数字图书馆没有本质区别;第 6项更是“虚拟图书馆”项目;第 8项开发的内容也是目前美国数字图书馆向导计划第二期的一个项目,当然研究重点有所不同;其它项目主要探索建立专门信息系统的全面或局部问题,如标准问题等,或为建立一种国际间合作模式,或为了宣传推广普及的目的。表 根据该计划的最终报告将每一个子项目的成果进行了汇总。

表 :G8全球信息社会示范计划成果序号 项 目 名 称 成 果

1 全球总目录计划(GIP)

建立关于世界各国的网上信息资源(特别是多媒体资源)的统一入口,收录了 4000余个信息源。

2

全球宽带网互操作性(GIBN)

宽带网是 21世纪全球信息高速公路的基础。该项目加速了全球宽带信息网络的互联性和互操作性的研究和开发,演示了一系列先进的宽带应用,提高人们对于宽带网技术、产品、服务的认识。

3

跨文化教育培训(Tel*Lingua)

该项目期望通过一组国际性的服务器机群,为作者、教师、培训人员以及市民提供有关语言和跨文化学习的统一检索入口。该项目开发了一个可运行的原型系统,提供虚拟的语言服务器,不同的语言用一种相似的结构提供服务。

4电子图书馆 该项目通过协调参与馆的数字化项目,确定以“人民之间的交

流”作为整个各参与成员馆的数字化资源内容,最终产生了一项国际间加强数字图书馆技术与机构间合作的正式协议。

5世界文化遗产多媒体存取/电子博物馆计划

通过诸如“罗马天主教法器多语种词表”之类的子项目,加强国际间多种文化遗产的整理,并共享不同国家在数字化方法和技术方面的经验。

6 环境与自然资源管理(ENRM)

该项目开发了一套必要的工具,用以建立一个环境与自然资源管理的“虚拟图书馆”,在信息网络化、资源揭示与检索等方面非常强调采用国际标准,它在有关大气变化、生物多样性等

25 见 http://www.ispo.cec.be/intcoop/g8/g8pp_matrix.html,最终报告见本书网页存档资料。32

Page 33: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

全球环境信息的资源定位服务方面达成了全球共识。7

全 球 紧 急 管 理(GEMINI)

GEMINI包括演示项目和一系列会议,涉及以及利用先进的信息技术手段帮助进行全球范围内的灾害管理的许多领域。该系统为各参与国建立全球灾害信息网络打下了良好的基础。

8全 球 保 健 应 用(GHAP)

该项目演示了医学数据库、影像、病历卡及计算机培训资料可以全球共享,并实现对癌症和心血管疾病进行远程辅助诊断。该项目有助于实现该领域的国际标准。

9网上政府(GOL) 该项目旨在促进政府更好地为市民提供联机的服务。该项目通

过 32个主题领域的合作获得了很好的经验,有助于形成全球性的政策和行动。

10

全球中小企业市场

该项目的目的是在即将到来的信息社会为中小企业增强在全球贸易中的竞争力,特别在因特网上建立了“国际商务信息网”,关于如何面对全球电子商务的挑战,为中小企业在制订政策方面提供了经验。该项目还支持了一些第三方的国际性试验系统,并专为中小企业出版了操作指南。

11

海 事 信 息 系 统(MARIS)

MARIS项目尝试将现代信息技术全面应用于海事领域,以促进海洋工业的新发展及国际间的合作。该项目的主要重点在相关标准的研究,为建立全球性和区域性海事信息系统和合作网络必须首先确立一系列标准。

第四个项目——电子图书馆项目的正式参与成员都是国家图书馆,项目开始时有七个图书馆,分别是法国国家图书馆、日本国会图书馆、美国国会图书馆、加拿大国家图书馆、意大利国家图书馆、德国国家图书馆和大英图书馆。后来又增加了五个国家馆,它们是比利时、捷克、荷兰、葡萄牙、西班牙和瑞士的国家图书馆,该项目还有联合国教科文组织(UNESCO)和欧洲委员会两个国际组织作为“观察员”。

该项目虽然不是一个集中管理的项目,而且经费都需要各个国家自己承担,实际上都是各个图书馆自己承担,但由于各国政府或国会都给予了一定的重视,恰逢一些国家正在进行数字图书馆建设,一些参与馆对馆藏珍品的数字化工作取得了另人瞩目的成果,影响很大。表 列出了这些成员馆的数字化项目和它们的网址。

表 :电子图书馆项目的各参与成员馆和它们的数字化项目参与馆 数字化项目

比利时国家图书馆http://www.kbr.be/

加拿大国家图书馆http://www.nlc-bnc.ca/

加拿大国家图书馆(NLC)数字化计划http://www.nlc-bnc.ca/digiproj/edigiact.htm

捷克共和国国家图书馆http://www.nkp.cz/

Memoriae Mundi Series Bohemicahttp://digit.nkp.cz/search.htm

法国国家图书馆http://www.bnf.fr/

Gallica, images et textes du dix-neuvième siècle francophonehttp://www.gallica.fr/ (未连通)

德国国家图书馆http://www.ddb.de/

Digitalisierungsprojektehttp://www.ddb.de/partner

意大利国家图书馆

33

Page 34: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

日本国会图书馆http://www.ndl.go.jp/

数字化计划http://www.ndl.go.jp/

荷兰国家图书馆http://www.kb.nl/home-fe.html

KB digitization programme and KB Digital collectionshttp://www.kb.nl/kb/sbo/digi/index.html

葡萄牙国家图书馆http://www.ibl.pt/

西班牙国家图书馆http://www.bne.es/

Memoria Hispanicahttp://www.bne.es/europ4.htm

瑞士国家图书馆http://www.snl.ch/

大英图书馆http://www.bl.uk/

Digital Library Programmehttp://www.bl.uk/services/ric/diglib/digilib.html

美国国会图书馆http://www.loc.gov/

American Memory http://memory.loc.gov

该计划在 1999年促使各参与国的国家图书馆签署了一份长期合作协议,协议要求:所有参与本计划的组织承诺:

- 共享经验(通过工作组、出版物等),并在“电子图书馆”网站上展示其成果;- 为创建“电子图书馆”而在国际层面协调各国自身的全部或部分数字化政策;- 为电子图书馆首期计划的主题“人民之间的交流”而积极组织资源,进行数字化。每一个参与者可以专门为该项目组织资源进行数字化,或以其自身数字化项目中的一部分资源作为参与该项目的资源;

- 参与电子图书馆数字资源库的网络化工作;- 促进公共组织、私人企业与国际组织之间(CENL, CDNL, European Commission,

UNESCO, IFLA , ISO等)的合作。该项目向所有计划将其资源进行数字化的国家图书馆开放,并且如果项目指导委员会同意,观察员或其它机构也可以参与该项目。首期协议有效期三年:1999-2001。

该项目作为西方发达国家最高首脑在世纪末所提出的信息社会示范项目之一,其基本目标是“建立促进数字图书馆领域国际合作的平台”,基本上属于由各个国家图书馆分别实施的资源数字化项目,其在形式上的意义远大于实际内容。该项目“人民之间的交流(Exchange of People)”作为电子图书馆主题,但最后并未形成一个统一的资源库,允许各成员馆专门为此项目组织资源,进行数字化,或者将各馆已经开展或计划开发的数字图书馆内容的一部分作为参加该项目的资源内容。项目最后提议采用面向对象的分布式技术解决数字化标准、系统互操作性、全文检索、统一查询等问题,由加拿大国家图书馆负责技术开发。

(二)美国的数字图书馆建设美国对数字图书馆的高度重视不仅是基于建设国家信息基础设施的考虑,促进产业经

济的发展也是十分现实的目标。美国尝到了从50年代起大力投资信息服务产业的甜头,七八十年代信息产业的崛起,有很大一块直接受惠于信息服务业。据美国商业部统计,1993年美国“数据库及信息服务”服务贸易出口额7.35亿美元,进口只有0.88亿,如果算整个信息服务业(包括软件产业),美国1994年出口32亿,而进口只有区区4亿。1994版的《美国

34

Page 35: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

产业经济百科全书》26说:“美国联邦政府60年代的投资是一把火种,带来了信息检索业80至90年代的繁荣。”信息业带来的经济利益还不光是这些,信息业的进步对传统产业降低成本、促进销售所带来的附加价值也非常可观,据测算美国成衣业可以依靠信息技术的进步而节省27%的成本,工人的工资成本只占到10%,不付工人工资也没有靠信息技术的进步所得更多。美国联邦政府正是看到了这些才不遗余力地向信息技术投资,数字图书馆只是一颗种子,为了未来的丰收而播种。以国家科学基金会NSF为代表的各种基金会是美国“技术主导型”数字图书馆研究开

发的主要资金来源,这说明目前美国这方面的开拓还基本属于研究开发、探索试验阶段。资源主导型项目在美国也比较普遍,已经有大量的称作各种各样的“数字图书馆”资源库在网上运行,包括美国许多大型出版发行机构和科技信息服务中介所开发的系统,以及许多高校的数据库、资源库等等,美国国会图书馆为首的国家数字图书馆项目也属此列。以加州大学9个校区图书馆为主,加州州立公共图书馆系统参与联合建设的“加州数字图书馆”,是个非常好的实用系统,是传统图书馆服务的延伸,这是“服务主导型”数字图书馆的典型案例。招投标制是美国数字图书馆建设的主要方式,“数字图书馆先导研究计划(DLI)”

这样的大型国家项目就是采用招标制,美国国会图书馆与Ameritech公司合作进行的美国国家数字图书馆竞争项目也采用招标制,实践证明这种方式行之有效。但这种招投标首先建立在对目标的全面掌握、大量的可行性调研和专家咨询的基础上,招标书在目标原则和要实现的具体指标有相当具体的描述,且对于项目运行的监控、决策组织运行机制、测试验收、未来的运行等都有明确的规定。在运行上参照一般项目运行模式:一般有一个类似于董事会的最高决策委员会,代表投资方,根据投资方的意见制订项目目标,掌控项目是否按照投资人最初制订的目标进行,通过与项目有关的原则、规定条文,决定目标是否应该有所调整,是否应该继续投资等等。该委员会定期听取专家组(多称专家委员会,有些还有起监理作用的委员会)和执行/项目经理的工作报告,对重大事件提出决策意见,审议年度工作报告或进展报告,进行评鉴。书面工作(paper work)在项目制的运行和管理中是非常普遍和繁重的。技术专家组负责进行技术决策,确定所采用的技术路线是否能够符合项目目标,是否具有一定的先进性、经济性,是否在整个系统中能与其它技术很好地协调,等等。项目执行经理常常是专家组的成员,但一般不是主要成员。专家组向项目董事会负责,一般性的技术问题在这一层就应该得到很好解决,董事会不可能涉及许多技术问题的讨论。项目执行经理负责日常开发、运行工作的管理,在项目制订的各种目标、任务、规章制度下进行工作,掌握项目进度,协调各相关问题,并负责定期或不定期的提交报告。层级制的管理在目前的信息技术企业中不是非常推崇,特别是大型信息企业,走向没落的管理原因常常归咎于这种传统的管理方式。信息技术开发项目的管理也是这样,矩阵式的平面管理常常能够更好地沟通,保证部门间的有效协调,运行更有效率,避免官僚主义。一些高校自己寻求资助、提出的开发项目和一些机构委托某些高校或公司开发的项目也普遍参照招标制的管理模式,取得了良好的效果。美国国会图书馆可以说是美国数字图书馆的一个领袖。除了不断地积累“美国记忆”,

集资6000万美元增加了500万件数字藏品之外,还牵头组织美国最大的15个研究图书馆,成立“国家数字图书馆联合会(National DL Federation)”,以推进美国文化遗产的普及和利用。联合会成员的项目包括耶鲁大学的Open Book计划,将一万本有关美国外交历史的著作从缩微胶卷转换成数字化文档;康乃尔大学将1850年至1950年间的主要农业出版物进行了数字化,并和密歇根大学一起开始了“美国的建国”项目,将有关美国历史的重要文献进行数字化。26 Hillstrom “Encyclopedia of American Industries” 1994

35

Page 36: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

高校是美国数字图书馆的主力。不仅是DLI的项目以大学为主进行开发之外,许多大学还从不同渠道筹集资金,开展了许多数字图书馆项目,例子数不胜数。例如提供美国计算机学会(ACM)出版物全文检索服务的Envision计划,由著名的弗吉尼亚技术大学的Ed Fox领导。9所大学参与了Elsevier出版公司42种期刊全文数字图书馆项目,他们是CMU,Cornell, Georgia Tech, MIT, University of California, Michigan, Tennessee, Washington 和 Virginia Tech。这就是著名的Tulip计划。图书期刊的出版发行业一直是美国数字图书馆的一个策源地。美国DLI项目之外也有一些高校在进行项目研究,例如Virginia Tech and Texas A&M。

其它许多高校Georgia Tech, Cornell, MIT, University of Tennessee, Washington and California and Virginia Tech (known for the Envision system of Ed Fox)都有系统的研究项目,另外University of Virginia, University of Georgia and Columbia University也有参加一些项目。Digital Asia Library Project (DAL) by The General Library System (GLS), University of Wisconsin-Madison (see The Digital Asia Library Initiative (DAL).htm)

*****The Computer Science Technical Reports Project (CSTR). A collaboration involving CNRI, five universities, and the Library of Congress.

纽约公共图书馆(New York Public Library)的历史收藏数字图书馆计划 The New York Public Library's Digital History Projects (http://digital.nypl.org/brochure/index.html)NINCH: National Initiative for a Networked Cultural Heritage http://www.ninch.org一个协会,促进美国文化遗产的数字化计划,并提供技术交流。美国遗产项目(American Heritage Project): http://sunsite.berkeley.edu/amher/由美国国家人文科学基金提供部分资助,美国加里福尼亚大学、加州大学伯克利分校、斯坦福大学、杜克大学和弗吉尼亚大学合作进行“美国遗产虚拟档案计划”,创建一个基于EAD(一种用于档案的元数据方案)标引的共享数据库,促进对美国历史和文化的文献的整理和利用。该项目的主要目标是开发一个实验系统,提供对分布式数字图书馆资源的检索,并评价该“虚拟档案”原型系统的有效性和灵活性。

(三)英国数字图书馆建设:英国数字图书馆的起步与美国处于同一时期,从规模、资金投入和参与的组织上来说

并不逊色于美国,同时具有其自身鲜明的特点。高校是英国数字图书馆研究和开发最活跃的群体,其管理者是英国高等教育委员会下的英国联合信息系统委员会(the Joint Information Systems Committee:简称JISC),代表计划是eLib项目27;英国国家图书馆领导了其它一些数字图书馆计划。英国数字图书馆项目区别于美国同行的主要特点是图书馆成为各类开发研究项目的主

体,大多数项目的着眼点在帮助和指导图书馆选择合适的技术进行数字图书馆建设,主要目的在于大幅度提高现有图书馆系统通过网络提供信息资源的能力。由此可见,英国的数字图书馆计划更接近于开发项目,更注重面向市场,利用成熟的技术直接投入到应用中去,27http://www.ukoln.ac.uk/services/elib

36

Page 37: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

注意面对图书馆的现实,而不是象美国数字图书馆先导研究计划那样的以技术研究为重点。这也造成了认为其研究质量不高的诟病。另一个与美国计划不同的特点是英国的项目比较注重包容图书馆传统的信息源,它的

项目中包括了许多书目数据建库、文献数字化及数据共享等项目,体现了英国对于数字图书馆的认识:不仅全文信息、多媒体信息,二次文献和书目信息也是非常重要的信息源。这方面有一些著名的计划如Burney项目(对1800以前的报纸进行数字化),Cantersbury Tales计划(扫描所有1500以前的手稿),以及“电子Beowulf计划”,这是一个国际合作项目,由美国 Kevin Kiernan (University of Kentucky), Paul Szarmach (Western Michigan University)与大英图书馆合作进行,书目和二次文献是这些项目的基础。估计总投资1亿英镑以上的ELib计划是介绍英国数字图书馆建设时不得不谈的内容。该

计划起始于1993年英国图书馆评审联合基金会(the Joint Funding Council's Libraries Review Group)的一次研讨会,讨论图书馆资源如何面对电子信息“爆炸”所带来的挑战,这次研讨会得出结论:“发展信息技术是未来图书馆提供高效服务的关键”。于是英国高等教育基金(the Higher Education Funding Bodies)以“变革高等教育机构中知识使用和存储”为主题征集项目,1500万英镑的启动资金分配给了“电子图书馆计划”(Electronic Libraries Programme,简称eLib),由出资单位的代表——联合信息系统委员会(the Joint Information Systems Committee:简称JISC)管理。后经过不断的扩充,许多出版发行机构也参与进来,形成了现在的eLib计划。

eLib项目的第一浪高潮开始于1995年春季,总项目数大约有60个,分成13个领域,具体项目及其所属领域见表 。有一些项目已经结束,另一些开始了新一轮的深入研究,或得到了后续资金仍然在继续研究。目前eLib计划进行到了第三个阶段,这一阶段的主要内容是表 中的前三个领域,以及将第一和第二阶段中的成果进一步应用于实践。总体来说eLib计划主要的职责是为英国高等教育提供一个有形的电子资源和服务的实

体,并且促进英国图书馆服务从传统的信息存储和访问向现代的以网络为基础的电子资源服务转型,以配合JISC的主要目标:促进信息系统建设及有效利用,为英国的高等教育和研究提供高质量的国家网络基础设施。据估计eLib计划总投资超过1亿英镑,其中研究计划(一期和二期共三年)总投资

1500英镑,另有2400万英镑用于数据服务,以及5000万英镑用于网络设施建设。ELib计划虽然没有建立一个统一的数字图书馆,但它播撒一大批种子,正在成就一大批英国的数字图书馆。

表 :英国eLib电子图书馆计划项目一览领域 数

量项目名 项目网站

复 合 型图书馆

5 Agora 伯明翰大学综合发展和电子资源的建设

图书馆网络环境中的复合电子访问与递送

复合图书馆的未来 以用户为中心的复合图书馆的管理-----MALIBU

http://hosted.ukoln.ac.uk/agora/ http://builder.bham.ac.uk/ http://www.headline.ac.uk/ http://www.unn.ac.uk/~xcu2/hylife/ http://www.kcl.ac.uk/humanities/cch/

malibu/

大 规 模 4 苏格兰协作学术信息检索网络— http://cairns.lib.gla.ac.uk

37

Page 38: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

资 源 的开发

CAIRNS M25链接 音乐在线图书馆 一个约克郡图书馆网关

http://www.lse.ac.uk/blpes/m25/ http://www.musiconline.ac.uk http://www.shef.ac.uk/~riding/

数 字 化存储

1 数字档案中的 CURL 样本 --CEDARDS

http://www.leeds.ac.uk/cedars/

网 络 资源 的 访问

10 艺术,规划,建筑学以及多媒体信息的王馆---ADMA

因特网上的商业教育--- Biz/ed 因特网上的存档矛盾--- CAIN 大学电子资源管理的方法 ---

CATRIONA II 爱丁堡工程虚拟图书馆----EEVL IHR-Info 医学网络信息的组织-----OMNI 主题服务中资源的组织与发现—

ROADS 市内规划信息资源--- RUDI 社会科学信息网关---- SOSIG

http://www.adam.ac.uk/ http://www.bized.ac.uk/ http://cain.ulst.ac.uk/ http://catriona2.lib.strath.ac.uk/catriona/ http://www.eevl.ac.uk/ http://ihr.sas.ac.uk/ http://omni.ac.uk/ http://www.ukoln.ac.uk/roads/ http://rudi.herts.ac.uk/ http://sosig.ac.uk/

数字化 2 早期杂志的因特网图书馆 艺术与设计中的数字化----DIAD

http://www.bodley.ox.ac.uk/ilej/ http://tdg.linst.ac.uk/tdg/research/diad/

电 子 文献发送

5 电子文献发送的综合解决方案--- EDDIS

威尔士电子网络环境中教育资源的共享—SEREN

联合电子文献发送软件项目 ---JEDDS

伦敦和曼彻斯特的电子文献发送--- LAMDA

信息自行车

http://www.ukoln.ac.uk/services/elib/ projects/eddis/(相关链接)

http://seren.newi.ac.uk/user/seren/ http://jedds.mcc.ac.uk/website/index.html http://lamdaweb.mcc.ac.uk/ http://www.bids.ac.uk/elib/infobike/

homepage.html

电 子 期刊

14 电子期刊项目联盟--- CLIC 因特网考古学 学报的同步出版--- PPT 超期刊项目 电子堆栈项目 历史上的电子研讨会 历史上的电子评审 电子出版资源服务--- EPRESS 高等教育中教与学的思考 图书馆的新闻代理 信息,法律及技术期刊—JILT 开放式期刊项目 社会学在线研究

http://www.ch.ic.ac.uk/clic/ http://intarch.ac.uk/ http://ppt.geog.qmw.ac.uk/tibg/

ppt_hom.html http://www.superjournal.ac.uk/sj/ http://www.dcs.kcl.ac.uk/journals/stacks/ http://www.ukoln.ac.uk/services/elib/

projects/history-seminars/(相关链接) http://www.ukoln.ac.uk/services/elib/

projects/history-reviews/(相关链接) http://www.epress.ac.uk/ http://www.lgu.ac.uk/deliberations/

home.html

38

Page 39: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

电子期刊与学术社团项目 http://www.sbu.ac.uk/~litc/newsagent/ http://elj.warwick.ac.uk/ http://journals.ecs.soton.ac.uk/ http://www.soc.surrey.ac.uk/socresonline/ http://Journals.eecs.qub.ac.uk/

电 子 短期 借 贷项目

4 通过网络的课程阅读访问 -ACORN

电 子 存 储 版 权 管 理 系 统 --ERCOMS

显 示 文 科 教 学 在 线 资 源 —PATRON

英国大学的电子存储---ResIDe

http://acorn.lboro.ac.uk/ http://www.iielr.dmu.ac.uk/Projects/

ERCOMS/ http://www.lib.surrey.ac.uk/Patron/

Patron.htm http://www.uwe.ac.uk/library/itdev/reside/

图像 3 国家军事调查数码地图数据的在线访问-DIGIMAP

高等教育的图像转换图书馆 ---HELIX

医学图像:数字相关信息库 --- MIDRIB

http://digimap.ed.ac.uk:8081/ http://www.helix.dmu.ac.uk/ http://www.midrib.ac.uk/

随 选 出版

8 学习资源的内部网络---- eOn Phoenix Edbank 随选高等教育资源---HERON 人文学科中的随选出版 苏格兰合作随选出办企业—

SCOPE 管理研究中的电子阅读--- ERIMS Eurotext

http://eon.unn.ac.uk/ http://www.hud.ac.uk/schools/phoenix/

pages/homepage.htm http://www-edbank.open.ac.uk/edbank/ http://www.stir.ac.uk/infoserv/heron/ http://www.livjm.ac.uk/on_demand/ http://www.stir.ac.uk/infoserv/scope/ http://erims.temp.ox.ac.uk/erimsproj/ http://eurotext.ulst.ac.uk/

预印本 4 CogPrints 在线教育:教育与培训中的电子文本

编排 经济学中的工作论文--WoPEc

http://cogprints.soton.ac.uk/ http://www.leeds.ac.uk/educol/index.html http://formations.ulst.ac.uk/ http://netec.mcc.ac.uk/WoPEc.html

质 量 保证

1 电子化子任务及其同位评审 http://www.espere.org/

支 持 研究

3 模式:将图书馆服务转向分布视网络环境

推动 2:监控组织与文化转变 文献发送选择的重点研究—

FIDDO

http://www.ukoln.ac.uk/models/ http://ilm.unn.ac.uk/impel http://www.lboro.ac.uk/departments/dis/

fiddo/fiddo.html.

培 训 与认知

7 Ariadne 网络教育中的卡通图像--- CINE 高等教育图书馆员工的教育发展—EduLib

http://www.ariadne.ac.uk/ http://www.kcl.ac.uk/projects/cine/ http://www.hull.ac.uk/edulib/ http://netways.shef.ac.uk/

39

Page 40: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

网络链接:支持网络学员的协作专业发展

网络技术:服务于英国高等教育社团的网络技术

跳读:新信息职业者技术 网络环境中的培训与认知计划----

TAPin

http://www.netskills.ac.uk/ http://www.plym.ac.uk/faculties/research/

skip1.htm http://www.uce.ac.uk/tapin/

British Library Digital Library Programmehttp://www.bl.uk/services/ric/diglib/digilib.html (old)http://www.bl.uk/diglib/diglib_menu.html(new)大不列颠图书馆的数字图书馆计划是一个传统老牌图书馆走向数字化的典型。典型性

表现在:从收藏和利用的角度出发,考虑到数字媒体的大量涌现,图书馆无法不正视,读者

也需要数字媒体;扩大读者群体,发展图书馆的无疆界服务;成为国家数字信息网络的重要组成部分,参与信息基础设施计划;实现国家提出的继续教育和终身教育职能。寻求商业运作模式,由政府机构(研究与创新中心:Research and Innovation Center)

大力促进企业界的参与和赞助(但从其总结报告中看似乎也不太成功)。

法国: 扫描古代手稿是其主要数字图书馆项目,Tresor de la Langue Francaise project(由

Nancy大学主持开发)。法国同时是西方七国集团电子图书馆和数字博物馆计划的两个主持者之一。

德国28:德国研究协会(The German Research Association)是德国有关图书馆项目的主要资助

者,该协会的经费60%来自于联邦政府,40%来自于州政府。目前该协会支持了三个有关数字图书馆的研究开发计划,1.“科学图书馆的现代化和理性化(Modernnization and Rationalization in Scientific Libraries)”,包含14个项目;2.“电子出版”计划,主要研究电子出版物和多媒体的图书馆服务问题,包括11个项目;3.回溯资料的数字化计划,包括20个项目。1997年由计算机领域的专家提出“分布式电子文档的处理和管理”课题,启动了25项研究,98年该协会资助在研的63个项目共投资1100万德国马克,建立专门学科领域的数字资源库是目前的重点工作。

德国联邦政府教育研究部是数字图书馆研究的另一个主要经费来源。该部主持了德国电子文档传输系统SUBITO的开发,目前正在实施教育类电子出版方面的“多媒体图书”大型项目,另一个著名的数字图书馆项目是GLOBAL INFO项目,估计投资将达1000万马克。28 Rudi Schmiede “Digital Library Activities in Germany: The German Digital Library Program GLOBAL INFO” Proceedings of the IEEE forum on Research and Technology Advances in Digital Libraries” IEEE Computer society, May 1999

40

Page 41: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

德国网络协会(DFN)也支持了一些项目,主要是建立基于网络进行服务的科学信息系统,如MathNet, PhysNet, SocioNet等。

德国的高校在数字图书馆开发中所起的作用没有美国那么明显,这主要由于资金来源的问题,德国高校的经费来自于16个州,私立高校在这方面的研究开发刚刚起步,通常大学在研究性开支占其总预算的20%-25%,研究方向主要由州政府有关部门掌握。经费充足是德国数字图书馆建设的一个特点,如果算上联邦政府投向科技信息系统领

域建设数字图书馆的经费,1998年德国在这方面的投资达到4-6千万马克,作为国家投资来说,与美国、英国、澳大利亚等国基本上不分伯仲。加拿大数字图书馆建设

加拿大数字图书馆的建设起步稍晚,大约在 1997年前后,由国家图书馆为主开始实施加拿大数字图书馆先导研究计划(Canadian Initiative on Digital Libraries ,简称 CIDL ) ,这是加拿大最重要的一项计划。另外在加拿大国家图书馆的网站上可以找到几乎所有的加拿大数字图书馆项目链接,其中“加拿大数字图书馆总汇”(Inventory of Canadian Digital Library Initiatives,见 http://www.nlc-bnc.ca/initiatives /index. html )集中了加拿大全国 100多个数字图书馆资源库;“国家图书馆数字化计划”( NLC Digital Projects,见 http://www.nlc-bnc.ca/ digiproj/edigiact.htm)汇集了国家图书馆主持或参与的 30多项计划。

1997年秋,加拿大国家图书馆在先期充分调研的基础上,联合 50多家图书馆,成立了加拿大数字图书馆联盟,开始实施加拿大数字图书馆首倡计划。该计划以促进数字化资源的转换和利用为目的,通过加强各成员馆之间的交流,推进标准化等手段,协调整个国家的数字化项目,保证一定的互操作性和高水平。联盟的目的就是促进,调整和推动加拿大数字化馆藏和服务的发展,从而促进加拿大与其它国家在数字图书馆领域的合作,并推进加拿大数字图书馆资源的网络检索。

该项目的具体目标主要有: 进行不断增多的数字图书馆项目的交流和宣传; 评价数字图书馆项目,推荐典型案例,发布有关数字图书馆的标准; 探索更好的方法进行机构间的协调,避免资源数字化的重复劳动; 使数字图书馆资源内容国际化; 在当前版权法的框架内考虑和解决知识产权问题进行探索; 协调和沟通从信息创造到信息存档整个知识生命周期中各个环节的参与者之间的

联系,如信息创造者和出版者、技术及基础设施提供者、档案馆、博物馆和文化机构,以及各部委、省、市、地区的政府机关等;

提高加拿大数字图书馆在国际上的形象。该首倡计划与其说是一个项目,不如说是一个跨机构的协调全加拿大数字图书馆建设

的管理机构。该计划的所有成员单位都是自愿加入,并保证对加拿大的所有图书馆开放资源和服务。成员机构提供专有技术、建议,并愿意为解决问题而作出努力,对他们员工中的参与者提供经济援助,同时还要为首倡计划的运行每年提供一定量的经费。

该项目的最高管理机构是执行委员会,每年由首倡计划全体成员提名选出的六名成员组成,他们代表联盟的利益,国家图书馆另有一成员作为委员。这些成员将共同合作去领导和调整首倡计划的工作。执行委员会的责任有:

确定首倡计划的发展方向; 制定有关首倡计划的参与、资金、范围、期限等的政策; 鼓励和推动更广泛的成员关系,同时也促进成员组织的积极活动; 检查下属委员会的工作,调整首倡计划的执行和贯彻情况;

41

Page 42: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

适当的讨论并坚持下属委员会和成员提供的建议; 确保成员定期受到工作通知,了解正在进行的工作的状态; 确保首倡计划的工作和他们的发现能够在他的公共网站上被浏览到; 管理和负责资金的使用; 评价首倡计划工作和结构的效果。委员会下设工作组,由执行委员会或首倡计划根据需要提议设立,作为常设或特别机

构,执行委员会决定其工作任务和权限。工作组的成员由首倡计划的成员机构中选出。工作组的主要角色是跟踪并报道各子项目的发展状况及趋势以及制定政策、评价执行

情况、选择样板案例。联合国教科文组织(UNESCO)“世界记忆”计划 http://www.unesco.org/webworld/mempage.htm历史文献反映了语言、人民和文化的多样性,是客观世界的镜子和记忆。但这面镜子、

这份记忆又是非常脆弱的,每时每刻都有碎片从记忆中永远地消失。为了避免人类的文化遗产不从我们手中消失,我们希望保存任何形式的文献,不论是

手稿、抄本,还是声像或电子化的资料,基于这个目的,联合国教科文组织发起了这一项数字图书馆计划:“世界记忆(Memory of the World)”。

UNESCO希望这项计划即保护历史文献又能促进其利用。该计划设想宏大,需要各方面技术、资金、智力的广泛参与,UNESCO把自己定位在协

调者和促进者的角色。一个国际性的咨询委员会负责整个项目的实施,决定是否所选的项目是否够资格入围“世界记忆”计划。参与国家也将设立委员会负责项目选择和监督。该计划首先选择一批急需获得保护和整理的图书馆或博物馆馆藏,采用最先进和合适

的技术进行处理而保护起来,是否易于存取和传播也是这个项目选择的标准之一,不仅可以选择图书馆或博物馆的珍本手稿,也可以是声像资料或数字化资料。该计划从提出开始就十分受人瞩目,但要真正做好还有大量的工作要做。其它地区:

欧共体资助了一大批数字图书馆计划。详细情况见“欧洲数字图书馆会议”: 第二届:http://www.ics.forth.gr/2EuroDL/ 第三届:http://www-rocq.inria.fr/EuroDL99/ Third European Conference on Research

and Advanced Technology for Digital Libraries Paris, France, September 22-24, 1999 日本主要由日本国会图书馆主持数字图书馆研究开发和建设,许多高校积极参与,

1998年前总计约投入5千万美元进行研究开发,同时非常注重文献传递系统的建立和OCR技术的开发。澳大利亚秉承保护资源的传统,对历史资源的保护与自然资源同样看待,较早就进行

了数字图书馆建设,1996年约投资1千万美元用于古老特种文献(手稿、绘图等)的数字化,其计划详见《数字图书馆杂志》1996年12期专稿29。新加坡宣布建设“智慧岛(Intelligent island)”,继芯片、软件产业之后,内容产业是另一

个支柱。

29 Renato Iannella Australian Digital Library Initiatives D-Lib Magazine, December 1996

42

Page 43: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

第三章 国内数字图书馆研究开发现状

一.我国数字图书馆建设简要回顾我国数字图书馆研究是从译介国外有关项目开始的,90年代初就开始有介绍国外“电

子图书馆”的文章在国内专业刊物上发表3031,93年随着国外无纸化社会理论的引入、CD-ROM电子出版物的出现等,电子图书馆的讨论明显增多,94年开始有“数字图书馆”的提法32,95年 IBM与国内三家单位合作,进行“数字图书馆”的开发试验,虽然当时 IBM在美国非常关注数字图书馆的研究开发,在一些工作组(Workshop)中表现活跃33,其“数字图书馆”解决方案软件已经在研制之中,但在其资助的这三个项目中却丝毫看不出后来的“数字图书馆”概念,而更象为解决一些专门的技术问题(例如海量存储)而进行的试验性资料库的开发。

真正在我国提出数字图书馆概念,并导致后来开始大规模研发工作的是 1996年在北京召开的第 62届国际图联(IFLA)大会,以及在此前后的几个相关会议。上海图书馆副馆长缪其浩在本届 IFLA大会的一个会前会上呼吁,数字图书馆应成为中外图书馆合作的一个新领域,并在这一年文化部召开有关图书馆科研课题的选题和申报讨论会上提出,应将分散的、具体的研究课题合并为系统的、宏观的对我国发展数字图书馆问题的研究。

由文化部报国家计委立项、国内 6家公共图书馆参与的“中国试验型数字图书馆”项目实施是我国数字图书馆建设的一个开创性标志。该项目不仅引发了随后的辽宁省图书馆、上海图书馆进行的大规模数字化建设,以及以国家图书馆为首的、跨部门和地区的“中国数字图书馆工程”的批准建设,而且在高校系统、科研系统以及信息服务业都引起了很大反响,带动了我国信息基础设施建设的资源建设向数字图书馆方向迈进。

传统的图书馆和信息服务机构是我国数字图书馆研究、开发和建设的主力,高校图书馆在其中更显突出,这一点与国外类似,但从总的规模、影响面来看没有象美国、欧洲等国家那样波及到相关的各个学科和行业,如计算机技术开发与研究领域、出版行业等。尤其是出版行业在我国尚没有对数字图书馆引起充分重视,他们应该是数字图书馆建设中的活跃成员,因为其中涉及到许多与其未来“数字化”生存密切相关的主题。企业方面最先表现得较为积极的是进行系统集成服务、或提供传统资源数字化服务的计算机公司,而真正提供软件方案、并进行研究性开发的软件公司还没有真正介入,大多数计算机公司不关心数字图书馆的具体需求,只一味地推销产品,把数字图书馆当成容纳一切应用的百宝箱。

本章在讨论我国的数字图书馆研究开发情况、介绍数字图书馆项目时不仅关心各单位各系统具体的数字化项目,也关注传统图书馆正在进行的图书馆自动化方面变革,传统的30 郑军等 从预言到现实——电子图书馆时代的到来 福建图书馆学刊 1991.1 p55-5731 赖茂生 电子图书馆的构想与实现 情报科学技术 1991.3 p14-1832 许中才 关于“数字图书馆”的对话 图书与情报工作 1994.4 p63-6533 1994年 5月 IBM在 IEEE计算机协会出版的“数字图书馆联机访问工作组 ( Workshop on On-line Access

to Digital Libraries) ”会议录中发表了编号为 RJ9840的专题研究报告,讨论了许多数字图书馆的基本技术问题。

43

Page 44: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

二次文献数据库的网上服务、以及结合传统文献提供手段所进行的数字图书馆服务。限于我国经济社会发展水平,以及我国数字图书馆的建设主体仍然是图书馆和信息行业,传统的图书情报机构所进行的数字化探索更有可能成为今后我国数字图书馆建设的一种主要模式我们同时也非常关心信息服务行业如何借助网络手段完成转型,抓住事业体制改革和我国现代企业制度的建立而实现真正的市场化运作。目前也涌现了一些具有典型意义的项目。

这方面我们已经看到一些具有鲜明特色的数字图书馆建设模式正在形成。一些有条件的高校图书馆在这方面起步较早,由于其自身收藏、服务对象、设备人员条件等方面的特点已经初步具备了数字图书馆雏形,高校系统有一些项目得到国家的重点扶植和大量投资,在数字化文献资源的保障和利用方面一直处于领先水平;国家跨部委的国家级“科技文献信息中心”定位在建立一个以虚拟网上图书馆为主的信息实体;由国家科技信息研究所剥离和改制的万方信息股份有限公司完全走上了另一条以信息增值服务为主的产业化道路;而超星公司“网上图书馆”则是在探索一种新的因特网时代电子商务模式,自由地游走于社会转型期由高新技术、信息资源和风险投资组合而成的夹缝中;国家图书馆站在建设国家信息基础设施的高度,获得只有国家级的工程项目才能得到的政府支持和大量资金,也试图通过市场化运作,统领数字图书馆研究与开发全局;各地有条件的公共图书馆虽偏于一隅,仍在不断探索以实体图书馆为基础,依靠自建、购买等多种数字资源获取途径,结合电子信息网上服务手段,带动图书馆业务流程重组的数字图书馆凤凰涅磐、自我更新之路。

表 :国内数字图书馆建设大事记

日期 事件 说明1994年 图书与情报工作于第四期发表许

中才文章《关于“数字图书馆”的对话》

目前所查到的国内最早明确提出“数字图书馆”的文章

1995年 清华大学、复旦大学和中国石油天然气总公司与 IBM合作,进行三个专题的数字图书馆研究开发工作

复旦大学承担“中国历史地图”

1996年 8月 第 62届 IFLA大会在北京召开,数字图书馆成为会议的一个讨论专题

1997年 全国信息化工作会议 进一步明确把信息资源开发利用作为我国信息化建设的首要任务

1997年 7月 “中国试验型数字式图书馆项目”由文化部向国家计委立项, 期限 1997/7- 1999/12,后延长一年。

国家图书馆、上海图书馆、深圳图书馆、中山图书馆、辽宁图书馆、南京图书馆参加

1997年 9月 辽宁省图书馆与东大阿尔派公司签署“IBM数字图书馆集成方案实施协议”

国内首家图书馆应用商业软件进行数字图书馆开发

1997年 9月 成立“亚太数字图书馆论坛” 由 IBM倡议,由 17个成员馆参加1997 年 11月

召开“97中国电子图书馆技术”研讨会

由国家教委高校图工委、Sun公司在上海召开。

44

Page 45: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

1997 年 12月

汪冰出版《电子图书馆理论与实践研究》

1998年 4月 IBM在上海复旦大学举办“数字图书馆培训班”

1998年 8月 文化部成立中国数字图书馆工程筹备领导小组

文化部副部长徐文伯同志担任组长,北京图书馆党委书记、副馆长周和平同志担任副组长,文化部有关司局和国家图书馆、广电总局、国家税务总局、航天总公司、中国农业银行等单位的有关负责同志作为领导小组成员。

1998年 9月 文化部两次召开”中国数字图书馆工程”专家研讨会

众多院士、专家就数字图书馆的工程意义,资源建设,网络建设,软件开发,经营管理以及人才建设等方面发表了意见,并就统筹规划,分步实施,加强研究,指定标准,以及技术开发要立足国内等等方面提出建议

1998年 9月 IBM公司、东大阿尔派公司与辽宁省图书馆联合举办数字图书馆技术研讨会

全国 20多家大型图书馆参加

1998 年 10月

李岚清副总理视察北京图书馆,指出“未来图书馆的模式,就是数字图书馆”

李岚清同志还说:“数字图书馆是没有围墙的图书馆,但有围墙的图书馆是没有围墙图书馆的中心”,并指出,国家图书馆的“二期工程要结合数字图书馆去研究”。

1998 年 12月至 1999年3月

国家图书馆完成“数字图书馆试验演示系统”开发

国家图书馆集中人力、物力,开发研制成功数字图书馆试验演示系统,并向有关领导进行汇报演示。

1999年 2月 国家图书馆向文化部提交关于中国数字图书馆工程申请立项和成立中国数字图书馆有限责任公司的请示

1999 年 4 月14日

经国家经贸委向国务院报文,国务院批准成立“中国数字图书馆有限责任公司”

1999年 3月 国家图书馆文献数字化中心成立 扫描年产量 3000万页以上1999年 6月 中国数字图书馆论坛(CDLF) ‘99

年会北京翠宫饭店召开 http://www.cdlf.ict.ac.cn/cdlf/

1999 年下半年

“中关村科技园区数字图书馆群软课题研究”。总体目标:在中关村科技园区内逐步建成超大规模的、高质量的资源库群,通过高速宽带网络系统向本地区、全国乃至于全球提供服务。

由国家图书馆、中国科学院文献情报中心、北京大学图书馆、清华大学图书馆合作进行

2000年 7月 “数字图书馆应用技术交流会”在国家图书馆举办

主办单位:“中国数字图书馆工程建设联席会议办公室”,会议发言代表 25名,另有十多家公司进行了相关产品的演示。会上还演示

45

Page 46: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

了部分国家 863-306计划有关计算机方面的研究成果。

2000年 6月 亚太地区城市信息化数字图书馆合作建设项目

http://202.175.19.62/InterCity/ 首批参与项目的图书馆为:上海图书馆、澳门中央图书馆、香港大学图书馆、香港城市大学图书馆、韩国国会图书馆、泰国国立国会图书馆、新加坡国家图书馆、日本图书情报大学图书馆

2000 年 11月

武汉数字图书馆会议 武汉大学图书情报学院2000 年 11月

国家图书馆资源建设会议

二.文化部及国家图书馆国家图书馆在各国数字图书馆建设中具有极其重要的地位,它集中了一个国家文献类

历史文化遗产的精华,同时承载着收藏、保存、传播和发扬光大的职责,各国往往将最新的技术首先运用于国家图书馆,集成最新信息技术数字图书馆建设已成为各国国家图书馆近年来的重要工作,我国国家图书馆也不例外。

1998年 10月,国务院副总理李岚清考察国家图书馆时指出“未来图书馆的模式就是数字图书馆”,同时提出国家图书馆“二期工程要结合数字图书馆去研究”。在我国政府有关领导的高度重视下,文化部与国家图书馆经过长期的准备和努力,终于启动了中国国家数字图书馆工程34,负责该工程的“中国数字图书馆有限责任公司”也经国务院特批于1999年 4月挂牌,标志着中国数字图书馆工程进入实质性操作阶段。

该工程是国家科技创新的重点工程之一。作为一项跨地区、跨部门、跨行业的宏大系统工程,集中了多个部委、科研机构、高校协同作战,参与的机构有科技部、国家“八六三计划”、广电总局、国务院信息办、中国电信、国防科工委、中国科学院、北京大学、清华大学、北方交通大学、航天集团等单位。该工程实际上已经远远超出了国家图书馆的范畴,国家图书馆通过其控股的“中国数字图书馆有限责任公司”进行市场化运作。公司依托中国国家图书馆丰富的馆藏资源,借助遍布全国的信息组织与服务网络,运用数字图书馆核心技术和先进的经营理念,从事信息资源内容组织、数字化加工、数字图书馆技术总体解决方案、数字资源库建设的应用开发,面向全球提供专业性、系统性、主动性的多媒体信息资源内容服务。

作为中国数字图书馆工程建设的市场服务体系,中国数字图书馆有限责任公司利用市场先导优势,以数字图书馆技术为基础,以市场需求为导向,以资源建设为中心,以国内外资本市场运作为手段,通过先进的互联网工具,建立起在信息资源深层次开发、数字图书馆技术研发与实现、大规模应用性资源库建设与服务等方面有所创新的、可持续发展的商业运行机制。

目前该工程的一系列工作正在展开,确立工程组织架构、制定“中国数字图书馆工程实施方案”、数字图书馆相关标准规范的研究与应用、规模型数字图书馆资源库建设、探讨34 详见该工程主页:http://www.d-library.com.cn

46

Page 47: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

解决数字图书馆建设中知识产权的方案、数字图书馆关键技术的研发、建设数字图书馆样板工程等多项实质性工作也已紧张地进行。

该工程提出实际上是以一系列先期研究为基础的。90年代中期以来,文化部、国家图书馆和国内一些主要公共图书馆开始对国外数字图书馆发展动向的进行了跟踪,进行了一系列课题研究。特别是对数字图书馆总体框架及相关技术、标准、规范进行了深入调研,取得了第一手的经验和的认识,同时进行了一些试验性开发。在 1998年 7月提出该项目时,已经基本掌握了技术路线,如何实施和操作成为推进我国数字图书馆建设的首要问题。

这些先期进行的研究项目主要有如下一些,后面将会逐一简要介绍。 “中国试验型数字式图书馆” 国家图书馆数字式图书馆试验项目 基于特征的多媒体信息检索系统的研究开发项目” “SGML的图书馆应用” “数字图书馆试验环境及演示系统” 国家 863项目“知识网络———数字图书馆系统工程项目”

“中国数字图书馆工程”项目的提出还基于以下考虑:一是由“中国试验型数字式图书馆”进行的先期研究限于经费等原因只是作了初步摸索,规模范围都很有限;二是国际上数字图书馆发展迅速,如果我们再不行动,就会错过时机,拉大与国际先进水平的差距三是国家图书馆的书库已近饱和,需要立即着手进行二期工程的建设,而二期工程按何种思路进行设计和建设是首先要论证的关键问题。

中国数字图书馆工程的总体目标是在宽带 IP网上形成超大规模的、高质量的中文资源库群,支持国家整体创新体系的形成与发展,通过国家骨干通信网络系统向全国乃至于全球提供服务,其总体技术水平与国际接轨。其建设原则是:统一规划、统一技术标准、统一运行规则;联合建设,实现资源共享;利用国家现有的公用网络,防止重复建设,建设周期初步计划为 10年。其中,要完成国家图书馆的二期工程,建设 5万平方米的数字图书馆国家中心;要建设一批超大规模的资源库群;要完成中国数字图书馆的实用技术,推动我国数字图书馆的全面发展。

中国数字图书馆工程项目的主要特点有: 虚拟网络。是一个超大规模的、开放的、分布式的数字信息资源网络体系结构,能提供复杂信息加工存取功能;

海量信息的生成与存贮; 以中文为基础,包括外文和民族语言的信息资源; 网络系统具有兼容性,良好的互操作性,开放式的可扩充性及快速反应能力; 网络系统、信息资源和信息系统应符合国际标准和规范。该工程项目采用的主要技术路线是:在技术实现途径上采用与国际同类主流技术有接

轨前景的方案,如标准通用置标语言(SGML),统一资源名称(URN),公共对象请求代理体系结构(Common Object Request Broker Architecture,CORBA)等;严格遵循电子信息处理与电子信息交换的相关国际标准及工业标准;统一的总体框架与灵活的子项目实施相结合;采用适用于网络环境的分布式面向对象的软件技术;立足国内自行开发与引进国外先进成熟技术相结合。工程项目的具体技术目标是:实现中国数字图书馆的总体架构采用高新技术解决数字图书馆建设中的技术难题,建设中国数字图书馆的资源库,在国家宽带网络系统和因特网上实现对各种资源库的查询与检索。

该工程还必须考虑长短期的社会经济目标,对于这一点该工程的考虑是:该工程需要建设广泛的国内社会服务体系,并具有极富特色的国际信息交流能力,必将促进文化信息产业的发展,增强国家的国际竞争实力;同时力争在十年内,创造近百亿元的直接经济效

47

Page 48: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

益和近千亿元的间接经济效益。工程计划实施两级数字图书馆资源中心,国家级中心建立在国家图书馆,这一级中心

必须做到:a. 建立和健全全国数字图书馆使用的各种标准及规范b. 协调与规范资源库建设c. 建立数字图书馆国家中心的元数据共享、检索系统d. 建立数字图书馆全国调度系统。e. 建立数字图书馆国家中心对象数据系统。f. 建立与数字图书馆分中心联系的多样性高速网络g. 建立数字图书馆研究发展中心h. 建立卫星链路,覆盖边远地区的数字图书馆资源中心可保证边远地区享受数字图书

馆的资源。i. 建立各种用户接入网络j. 数字资源加工中心k. 法律中心

而对于地区级数字图书馆资源分中心,规定了其主要职责如下:a. 贯彻数字图书馆建设的各种标准b. 协调与规范资源库建设c. 建立数字图书馆国家中心的元数据检索镜像系统。d. 建立数字图书馆地域调度系统。e. 建立数字图书馆分中心对象数据系统f. 建立与数字图书馆国家中心联系的多样性高速网络g. 建立各种用户接入网络。h. 数据加工中心作为工程项目建设的一个部分,1999年 3月国家图书馆已经建立了“国家图书馆文献

数字化中心”,年生产规模已达到 5000万—6000万页全文影像数据。目前,国家图书馆网络可为读者提供 1000G存储量的网上信息服务,已初步成为网上信息资源的中心枢纽。

在提出“中国国家数字图书馆工程”项目之前,文化部、国家图书馆已经牵头进行了许多项目的研究,以下是一些简略介绍:

中国试验型数字式图书馆项目1996年 5月,在国家图书馆、上海图书馆等联合提议下,文化部向国家计委申报了中

国试验型数字式图书馆项目,并于 1997年获得批准立项,成为国家重点科技项目。项目以国家图书馆为组长单位,有上海图书馆、辽宁省图书馆、南京图书馆、广东省中山图书馆和深圳图书馆等参加。

中国试验型数字式图书馆项目的目标是建立一个多馆协作、互为补充、联合、一致的中国试验型数字图书馆。实现由多类型、分布式、规范化资源库组成的一个试验型数字图书馆,为我国建设规范化数字图书馆提交一份初步成形的、实用的实现技术。

按照计划,该项目要组织建设若干个整体性好,符合统一技术要求的数据库,以在数字式图书馆系统中形成一个多馆合作的、具有一定规模的、整体性较强的数据库。主要有:旅游多媒体数据库、法律法规数据库、孙中山文献全文数据库等,另外该项目促进或带动了各参与馆的许多数字图书馆项目的开发,例如中国古籍善本影像数据库、中国博士论文影像数据库、历史舆图与图片数据库、、深圳特区文献数据库、民国时期(1911--1949)南京政府文献数据库、东北文献图录数据库和国际数字图书馆文献数据库等,这些库不一定最终纳入该项目,但都是直接或间接的项目成果。

48

Page 49: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

项目计划开发完成一套与国际接轨的数字式图书馆实现技术,包括:建立以 SGML为基础的对象描述和编辑系统;建立统一的元数据;组织开放体系结构的数字式对象库,建立通用的库访问协议;试验建立分布式不同源数字式对象的调度系统;设计并实现方便的网络用户界面与实用的系统管理界面;数字式对象的描述方法要支持不同源的分布式查询和检索;初步实现对超大容量数据库的快速检索,支持中英文屏幕界面;试验建立多种类型的规范化信息库等,以使该项目在因特网上提供试用性的服务。

同时,该项目还要完成"数字图书馆概念与发展研究"的报告,要对数字图书馆从理论到实践,从技术到应用进行全面的调研,对数字图书馆的概念、涉及的主要技术、各国动向、应用发展前景、对社会的作用和影响、经济效益等内容进行全面分析,了解现状,跟踪趋势,掌握相关技术,并针对我国图书馆的现状和资源特点,提出建设我国数字图书馆的战略规划建议等。

该项目定位为“试验型”,主要是基于一种初步探索的考虑,在实施中由于没有现成的经验可以借鉴,经费、人员条件有限,各馆的联络协调、项目的控制管理都存在问题,因此提出有限目标。该项目的直接成果是为提出国家数字图书馆工程作了必要的摸底,从技术上、认识上打下了一个比较坚实的基础。该项目计划于 2000年底结束。

国家图书馆数字式图书馆试验项目国家图书馆 1996年初在文化部申请立项"数字式图书馆试验项目",项目以中国博士论

文影像数据库为基础资源,目录数据与影像数据分别存放于不同的服务器中,查询采用客户/服务器模式,目录服务器负责管理数据的索引和查询,全文影像服务器负责数字化原文的信息,这种结构与 IBM的数字图书馆解决方案极其相似。该库扫描影像采用 300dpi的分辨率,经过压缩,初期方案是以 CD-R作为载体形式存放于 JukeBox上,支持网络访问。该项目为后面各个数字图书馆项目进行了预研。

基于特征的多媒体信息检索系统的研究该项目是中科院计算技术研究所与国家图书馆的合作项目,列入 1996年国家"863"攻

关计划,已通过技术鉴定。项目主要研究基于内容特征的图像信息检索,实现按照图像的纹理、颜色、形状等特征对图像信息进行检索;研究中文信息全文检索,利用相关检索机制,提高检索效率;研究信息存储管理方法,实现跨平台的客户端检索。它是跟踪国际上数字图书馆检索系统所使用的高新技术自行研究开发的项目,其成果可用在面向影像内容的数字图书馆检索系统中。

SGML在图书馆应用该项目是 1997年文化部立项的科研项目,由国家图书馆现代文津信息技术研究中心承

担,与北京大学计算机研究所合作开发。SGML(标准通用置标语言)是国际标准化组织ISO于 1986年 10月发布的信息处理标准,目前已发展成为具有 12个国际标准的系列。我国在 1994年将其定为国家标准,主要应用在新闻出版的信息处理领域。现在互联网上使用的HTML是它的一个应用实例,而XML是它的子集。该项目是数字图书馆资源数字化生产系统的关键技术之一,是数字图书馆资源库数据生产加工的必备条件。

国家图书馆现代文津信息技术研究中心参照国外利用 SGML的情况,开发了基于SGML的图书馆应用系统,使用户可以通过因特网的WWW浏览器直接存取 SGML应用系统的数据。系统于 1998年 2月开始在国家图书馆提供用户使用,取得良好的效果,于 1999年 5月验收。

49

Page 50: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

知识网络--数字图书馆系统工程项目 它是 1998年国家"863"攻关项目,由国家图书馆与北京曙光天演信息技术有限公司合

作完成。 该项目要实现一类数字图书馆体系结构的设计与开发,初步建立一个中国试验型数字

图书馆系统。该系统要构筑在因特网环境上,其体系结构包含多个分布式数字资源库。系统将采用人工智能技术,实现横跨多个资源库的快速查询。数字资源建设要符合当前数字图书馆研究和实践的相关规范,以便为在互联网上建设一批中文资源库提供一种有效的实施方案。通过该项目,可以大大缩短我国与发达国家在数字图书馆研究和实践领域的差距。

在技术水平方面,该项目在要达到具有网络管理、多媒体信息查询与检索、海量信息的存贮与检索、知识产权的权限管理等功能,要实现在因特网上有一定的互操作性,数字式对象的描述方法要支持不同源的分布式查询和检索,支持法律规定的知识产权保护和纳税义务,提供对超大容量数字式对象的快速检索子系统,提供方便的网络用户接口等目标。

此项目将参照国际上主流的数字图书馆研究方法和成果,结合中文数字资源特点,在系统总体框架及开发技术上与国际接轨;开发的主体工作将围绕基于 SGML/XML的以中文资源为主的系统的建立、维护和发布;对在知识挖掘、知识聚集等方面将通过智能代理方式予以集成;对国外已有比较成熟和定型的技术,将引进并消化吸收;系统将重点考虑应用于下一代因特网的实用性。

中国数字图书馆实验演示系统国家图书馆于 1998年底开始集中人力、物力和财力,利用三个多月时间,开发完成了

试验环境及演示系统。演示系统在多媒体数字资源的创意、设计和加工,元数据抽取和元数据库的生成,对

象数据库建设,调度系统的选用,以及实现多库的跨库检索和用户界面等方面进行了探讨取得了初步的实践经验。开发了数据加工、置标、管理方面的软件;开发了元数据和对象数据装入和管理方面的软件;开发了包括多媒体对象在内的动态页面生成软件;开发了支持SGML和分布式数据库检索、查询软件以及元数据和对象数据连接的接口软件等。

整个系统运行在国家图书馆的千兆位馆域网上,运行稳定,达到实时传送,没有丢帧和断帧现象。该系统建设了千家诗、中国古代建筑、北京故宫、海洋世界和宇宙的结构五个多媒体资源库,信息量约 5GB。在这五个资源库中,有两个资源库的部分数据安置在距总馆10公里之外国家图书馆的分馆。按照数字图书馆的建设要求,这五个资源库与国家书目数据库和部分大百科术语数据库进行了 SGML标引,各库实现了互联,实现了跨库检索功能。

三.中国科技信息资源网络系统 八家成员单位:

中国科技信息研究所 中国科学院文献情报中心 中国农业科学院文献情报中心 中国医学科学院信息研究所 中国化工信息中心 机械信息研究院

50

Page 51: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

冶金标准信息研究院 国家质量技术监督情报所

项目的目标和任务本系统按照“集中检索、分步服务”的原则,以《文献资源共建共享系统》收集的一次文献为基础,通过 INTERNET网络化手段,把文献资源共建共享系统八家单位分别加工的二次文献集中在中心站点,免费提供检索服务。授权用户可以根据检索结果提出原文请求。对于授权用户的原文请求,中心站点根据文献来源,转发给八家单位,八家单位向用户提供相应原文。中心站点进行费用清算和相应信息的统计分析。中心站点将围绕中西文文献信息提供全面的WWW服务,包括检索服务、SDI服务和共建共享分站点的个性化服务。

统一的Web用户界面 检索服务 原文请求管理 二次文献传输和加载 用户管理 帐务管理 查询和统计分析 系统管理

主要关键技术问题和解决方案 检索服务器性能(数据容量、响应时间等) 高可用性

可靠传输 并发访问、负载共享和均衡

可伸缩性 安全性 开放性,保证应用的扩展性和可适应性 集成,充分利用现有的软硬件资源

主要关键技术问题和解决方案 系统总体框架和集成技术 异构平台(计算机机种、操作系统等)通信 异构信息源的数据交换、分布数据一致性/完整性控制,数据复制等 Internet Web接口 Legacy系统接口和系统集成技术,如集成银行信用卡系统 规范化(包括信息编码、接口、界面等)

系统特点 采用三层体系结构,高系统吞吐量 采用消息队列进行数据传输,高可靠性 采用组件结构,高扩展性 系统层和应用层分开,利于升级和移植

系统方案/逻辑结构

51

Page 52: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

四.教育部(中国高等教育文献保障系统)

CALIS China Academic Library & Information System CALIS

一期(九五)建设内容(见图) 一期建设具体工作(自建部分)图解

各软件系统的服务对象 联机合作编目系统 高校联合目录数据库建设

52

用户管理帐务管理文献信息W

WW服务二次文献库检索系统

原文订购系统

系统管理员用户 其它文

献系统

银行

共建共享原文库

二次文献传输系统

统计分析

Calis 系统各成员馆等馆藏

资源

联合目录数据库

中文期刊目次库

其它自建特色库

论文数据库

Z39.50服务器群

Web服务器群

馆际互借服务器群

OPA

C

服务器群

IE Netscape、等浏览器

自建数据库建库软件

Calis 系统各成员馆等馆藏

资源

联合目录数据库

中文期刊目次库

其它自建特色库

论文数据库

Z39.50服务器群

Web服务器群

馆际互借服务器群

OPA

C

服务器群

针对不同用途的各种服务器

Calis 系统各成员馆等馆藏

资源

联合目录数据库

中文期刊目次库

其它自建特色库

论文数据库

多种多样的二次文献数据库

Cal i s 系统各成员馆等馆藏

资源

丰富的各种文献资源

Page 53: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

自建数据库系统 其它自建数据库建设 OPAC系统 向读者提供对 CALIS各类自建数据库全面的、一致的检索服务。 馆际互借系统 向读者提供一次文献的索取及费用结算服务

联机合作编目系统主要特点 支持 USMARC、CNMARC标准格式书目数据编目,能自动识别不同格式的

MARC数据; 支持名称规范、主题规范编目和规范MARC数据编目; 全面支持基于 Z39.50协议(第 3版)的数据检索、浏览和数据的上、下载等功能。• 支持广域网上大用户数实时联机合作编目,采用“分散下载,集中上载,实时复制”的工作方式,在各成员馆内最大限度地共享书目编目数据,减少重复编目;

支持 Unicode字符集,实现多语种编目; 支持对上载数据的合格性检查、自动与人工判重、重合数据的归并处理,支持批量数据上载等;

上、下载数据与用户上、下载权限的多级管理; 数据编目规则、合格性判据、索引、归并处理原则以及免费下载数据可提供字段,均可自由配置,适用面广。

服务器软件基于 JAVA编程,跨平台性能好。联机合作编目系统结构:

自建数据库系统的主要特点 可根据具体数据对象采用USMARC、CNMARC、CCFC和基于Dublin Core元数据的自由格式数据编目;

采用“分散加工,集中服务”的非实时编目工作模式; 采用USMARC、CNMARC、CCFC等数据格式时,支持基于 Z39.50协议(第

53

Page 54: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

3版)的数据检索、浏览和数据的下载等功能。 支持 Unicode字符集,实现多语种编目; 支持对批量上载数据的合格性检查、自动与人工判重、重合数据的归并处理; 数据编目规则、合格性判据、索引、归并处理原则以及免费下载数据可提供字段,均可自由配置,适用面广;

自带Web网关,可直接发布数据; 服务器端基于 JAVA编程,跨平台性能好; 支持最新文献报道功能及检索权限管理。

OPAC系统主要特点: 基于Web方式,采用 Java Servlet 技术; 自带 Z39.50网关,采用 Z39.50协议定义的标准查询和浏览检索方法,可检索利用 CALIS软件系统建立的数据库或其它所有带有基于 Z39.50协议检索服务器的数据库;

支持同时对多个数据库进行一次性查询。 支持 Unicode字符集。 集成了 ILL网关功能,可与 CALIS馆际互借系统通讯,直接发出馆际互借

申请。 对注册用户可保留多次查询条件。

馆际互借系统主要特点: 基于 ISO10160/10161协议(第 2版)标准; 采用链接模式进行馆际互借交易; 支持返还式及非返还式馆际互借交易; 在协议基础上扩充了结算功能,并在协议允许范围内扩充了多种本地子状态,交易管理全面; 采用路由表技术,可根据参加馆际互借的图书馆的数量规模、地域分布特点以及接入 Internet的方式灵活配置,以采用馆—馆、馆—中心—馆或馆—中心—中心—馆等不同的结算模式或混合结算模式; 对无 ILL协议机的其它图书馆,可采用 ILL协议状态进行馆际互借的仿真交易,便于统一管理; 有较强的用户管理功能,采用保证金制度,区分本馆用户和馆外用户,用户与资金帐户分别管理,并留有与其它电子商务系统的接口;

服务器端采用 Java编程,支持 Unicode字符集,易扩展到多语种借阅; 与OPAC系统配套使用,支持网上直接申请,并提供网上实时跟踪查询交易情况; 采用保证金与馆担保编目规则、合格性判据、索引、归并处理原则以及免费下载数据可提供字段,均可自由配置,适用面广;

集成文献传递软件。 馆际互借系统结构

54

Page 55: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

CALIS软件系统集成

五.中国科学院文献网络共享系统工程中国科技网上的文献信息系统科学数据库服务

中国之窗

国家自然科学基金委员会信息服务

农业资源信息服务

文献信息系统服务

中国国际互联网络新闻中心

中国科学院文献信息网络系统工程项目的必要性 、现状

信息量的剧增

55

H EW LE T TPA C K AR D

OPAC网 关

I l l 服 务 器

I l l 数 据 库服 务 器

I l l 管 理客 户 端

Browser读 者

文 献 传 递 服 务 器

编 目客 户 端

/学 位 会 议 论 文数 据 库 服 务 器

Z39. 50服 务 器

现 刊 目 次数 据 库 服 务 器

联 合 目 录数 据 库 服 务 器

Z39. 50管 理客 户 端

Page 56: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

文献资源的分散 书刊的涨价、知识产权的保护 信息网络的发展建设目标和原则 目标:采用先进的计算机技术和通信技术,建设一个以 CSTnet 网为支撑环境的,以北京院文献情报中心为核心的,四个地区文献情报中心、科大、八个分院为分中心,一百二十三个研究所为节点的文献信息网络服务系统。在文献信息网上统一配置开放性好、性能价格比高的计算机系统平台。把全院的 12个分院 123个研究所联接起来,形成分布式体系结构、开放型的文献信息网络。原则:1. 统筹规划,统一标准,统一设计2. 文献信息网络建设和图书情报自动化建设相结合3. 计算机、通信、数据库三位一体的模式4. 建设一个具有开放型、分布式文献信息资源共享系 统。 5. 系统工程项目分两 步实施:96-98年上半年着重完成项目的工程性部分;98年下半年-2000年全面完成工程性、研究性任务。项目将按照系统工程的理论、方法及管理模式 组织实施 项目的关键技术及指标

文献情报业务的自动化 中科院文献情报中心、四个地区文献情报中心、科技大学图书馆及八个分院图书馆的自动化系统全面开通,建成实用的中科院文献情报系统的 图书馆自动化网络

中科院文献情报中心及四个地区文献情报中心、一校和八个分院的 联机联合编目系统的研制与开发

中科院文献情报系统的书刊采购协调 文献情报服务的网络化

开发出 TCP/IP广域网环境下的符合 ANSI NISO Z39.50(ISO10163)协议的用于文献情报检索的服务器和客户机软件

研制开发 Internet互连网上的中科院文献情报系统Web服务器 开发期刊目次系统 研制开发中科院文献情报系统的馆际互借系统 建立广域网光盘检索系统

文献情报资源的数字化 书目数据库的建设。 “九五”后期,CSTnet 网上各类书目文献数据库约 40个,数据总量约 100GB。

讨论制定各种数据加工规范和数据质量控制标准。 研制开发多信息处理平台间的信息编码转换系统。

文献情报工作人员的专业化 文献情报系统全员计算机普及知识培训。 数据加工人员培训。 文献情报自动化,网络化应用培训。 计算机和通信网络管理与维护培训。

56

Page 57: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

研究方法和技术路线 网络结构图

数据库资源 中科院文献情报中心和四个地区文献情报中心的中西文书目数据库,约 40万条记录,覆盖 70-80万件馆藏。

中科院文献情报中心(A)、北京大学图书馆(P)、清华大学图书馆(T)的中西文联合书目数据,约 50万条记录,覆盖 350万件馆藏。

中、西、日、俄文期刊联合目录数据库,包括全国主要图书情报机构的期刊馆藏,特别是西文期刊联合目录的收录范围覆盖我国进口原版西文期刊的 90%以上的馆藏。

中国科学文摘数据库(英文版),收录从 1982年以来我国出版的重要学术期刊的论文,经加工形成的英文文献型数据库,目前数据量为 9万条。

中科院科技成果数据库,收录中科院 100多所研究所和 300余家公司的实用科技成果,目前数据量为 1万余条。

中国物理文献数据库,收录 1987年以后出版的 200余种中文期刊的物理文献,现有数据 6 万条。

中国数学文献数据库,收录 1993年以后出版的 200余种中文期刊的数学文献,现有数据 1.6万条。

中国科学引文数据库,收集我国出版的 315种中英文重要期刊上的 1991-1994年间发表的约 13万篇论文及其 45万条引文。是进行科技文献检索、文献计量研究和科学活动定量分析评价的有力工具。支持 www/browser方式检索。资源地址为:http://www.las.ac.cn

六.上海数字图书馆项目

七.复旦大学数字图书馆开发项目

57

Page 58: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

中关村虚拟图书馆介绍   中关村科技园区数字图书馆建设是 1999年北京市信息化工作软课题项目,也是为启动中关村科技园区信息化建设总体目标中七个应用子系统之一。课题分两个阶段进行:完成整体架构的设计,提出书面报告;完成实施方案的设计,提出书面报告。  该项目由北京市信息化工作办公室主管,由国家图书馆、中国科学院文献情报中心、中国科学院网络中心科学数据库、CALIS、北京大学图书馆、清华大学图书馆、清华大学计算机系、国防大学图书馆、首都图书馆、北京市技术监督局、首都信息发展有限公司等多个单位共同承担。在前一阶段软课题的深入研究、调研国内外数字图书馆建设情况及中关村科技园区实际需要的基础上,项目组现已提出建设中关村数字图书馆群的一个整体架构和实施的可行性方案,即启动建立中关村虚拟数字图书馆。  中关村虚拟图书馆群是一个开放的、跨部门的巨大信息资源网络,是对若干个信息资源服务系统的整合、导引、检索和咨询。它是以宽带网为依托,以分布式海量信息资源库群为基础,采用信息组织整合技术,形成有序的信息资源体系,为园区内院校教育、学术科研和高新技术产业部门提供一个传播快捷、检索迅速、内容丰富的科技信息网络系统。

中国国家图书馆、中国数字图书馆有限责任公司,中国科学院文献情报中心、中国科学院网络中心、北京大学图书馆、清华大学图书馆作为园区内主要的信息集藏、加工及传播单位,将继软课题的研究成果,应用数字图书馆核心技术,综合各单位资源库资源及特色馆藏,合作构建一个集信息收集、信息组织、信息加工、信息管理、信息传播为一体的信息整合发布环境,作为中关村科技园区数字图书馆群项目硬启动的实验系统。

58

Page 59: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

第四章 数字化对传统图书馆的变革

全世界 90%以上的数字图书馆是在传统图书馆基础上成长起来的,美国图书馆学专家兰开斯特(Lancaster,F.W.)归纳了因特网和图书馆业务相结合后出现的 8个变化:

1.图书馆同行和内部员工之间、图书馆与读者之间广泛使用电子邮件进行交流,促进业务合作与研究。

2.通过网络共享因特网信息。3.通过远程数据库检索支持各种类型的参考服务,解决疑难咨询问题。4.开发和利用其它机构的信息目录,提供在本地无法获得的检索站点。5.自动地广泛收集读者反馈信息,加强定题信息服务。6.提高馆际互借能力(接受申请,核对互借信息、网络结算),开展文献传递和团体

文献共享业务。7.网上采购,联机编目。8.通过网页提供馆藏信息资源服务。把这些变化结果综合起来就可以勾勒出一个数字图书馆的雏形,因此,数字图书馆既

与传统图书馆紧密结合,又促进传统图书馆的变革,提升传统图书馆的服务能力和服务质量。

一.数字化资源建设新领域文献信息资源数字化对图书馆变革的影响极大,这一载体形态的变革直接影响了图书

馆藏书建设、文献加工和读者工作的全部业务流程,促使多方面的业务改革。数字化资源部分脱胎于传统文献,如报纸、期刊、图书、音像资料的电子版;更多的是各种类性的数据库和网络资源。数字化资源的发展很快,以电子期刊为例,美国《联机全文期刊来源》1997年收录 7600种,1999年 5月收录 8900种,每年以将近 10%的速度增长,其中学术性期刊占10%。在藏书建设方面数字化资源与传统的文献资源有很大不同。

1.联机或网络数据库数据库是数字化资源的主体,其内容极其丰富,类型也很多。图书馆常用的有书目数

据库、文献检索数据库、经济科技信息数据库、企业机构名录数据库、学术论文数据库、科技报告数据库、专利文献数据库、标准文献数据库等等,除了部分由图书馆自建外,绝大部分通过采购获得。数据库的存储量很大,只有少数以光盘形式发行,多数是通过网络发行的 。90年代以前,数据库发行主要采用专线联机方式,称为联机数据库;因特网发展以后,各出版商或数据库生产商纷纷利用因特网发行的文献信息数据库,用户通过因特网访问使用。

相对网上众多无序的免费资源来说,网络数据库按学科组织和排序,针对性和检索功

59

Page 60: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

能强,更适合于科研、教学、商务、政府等用户的需要。由于网络数据库文献含量大,不象光盘数据库受载体容量的限制,所以出版商和数据库生产商越来越多地利用因特网发行带有全文的数据库,一些二次文献数据库也提供限时的原文服务(24-48小时以内),用户都愿意通过网络数据库尽快得到一次文献。

网络数据库在服务上有许多优势,由于规模大,价格不菲,其采购方式与传统文献完全不同。以期刊检索和全文一体化的数据库为例,出版商在宣传时往往强调它的规模,收入有多少种期刊,其中有多少种是全文,其实这些数字并不能全面反映数据库的作用和价值。采访人员一定要详细考察该数据库收入的期刊中不同学科的比例是多少,核心期刊和一般期刊的比例是多少,全文侧重于哪个方面,这些都是衡量数据库价值的重要因素。在选购网络数据库的过程中,出版商通常会提供 1—3个月的免费试用,图书馆要充分利用这段时间对数据库进行系统的考察。需要了解的主要问题有:

(1)数据库信息来源的情况,学科比例和侧重、核心数据占多少。(2)数据库的检索功能如何,能否满足各类检索要求。(3)用户检索界面是否友好,检索方法是否简便易学。(4)数据库的检索反映和网络传输速度是否满意。(5)其它功能:输入馆藏目录、用户使用统计、原文传递请求等。在试用过程中,采访人员要与参考咨询人员、检索人员密切合作,并且组织有代表性

的读者使用,了解他们的意见,认真做好统计,为采购决策提供依据。采购二次文献数据库时尤其要结合馆藏期刊综合考虑,此外,网络数据库是通过因特

网服务的,图书馆在采购时要充分考虑自身的网络环境和通讯费的解决方式。传统图书馆的采访重点是考查文献内容的价值,数字化资源建设采访除了考查该资源的内容外,另一个重点就是要看它的软件功能,这是直接影响资源利用效率的关键因素。

2.电子期刊在形形色色的电子出版物中发展最快的是电子期刊,参与电子期刊编辑和发行的有专

业学会、社会团体、商业出版社、书刊发行商、联机数据库、因特网信息服务商等,形式上有一部分电子期刊沿袭印刷版的格式体例,大部分采用自行创新的格式,与印刷版相差甚远电子期刊的类型很多,大致可以分为五种:

(1) 联机服务型。由研究机构或专业学会、专业组织编辑出版的电子版期刊有较高的学术参考价值,这类期刊的一部分是由学会或组织自己通过联机方式发行,多数是由书刊发行商或数据库经营商把相同主题或同类的电子期刊组合起来,形成一个产品,通过专线提供服务,近年来大都改为通过因特网传递。例如 EBSCO是著名的期刊代理商,它代理了全世界 4万多家出版社 2.6万多种印刷本期刊和 4000多种电子期刊的发行。

(2)CD—ROM型。是以印刷版为母体,内容完全相同,并且与印刷版同时发行电子版期刊,图书馆只要增加少量的费用就可以获得两个版本。也有单独发行 CD—ROM的,如《中国学术期刊(光盘版)》。

(3)过渡型。印刷版是主体,电子版内容仅有重要论文的文摘以及部分论文的全文,通常在因特网上提供免费的浏览和下载,目的是为了扩大刊物传播范围、提高知名度、吸引读者订购印刷版。目前许多图书馆网络导航中的免费电子期刊资源大都是这种类型。

(4)超量型。印刷版和电子版两种载体共同出版,而电子版的图象更多,甚至还有声音、动画等多媒体内容,比印刷版丰富多彩、内容更新也更及时。发行方式是CD—ROM型或者通过因特网传送。

(5)网络型。在因特网上出版发行的电子期刊,品种繁多,其编辑出版者有学术机构、民间团体或组织、因特网信息服务商、企业或个人网站等,以免费服务为主,通过电子信箱传送。

60

Page 61: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

与印刷版相比电子期刊在检索、复印、传送、收藏等方面有明显的优越性,便于读者利用和图书馆管理。但是,作为一种新生的文献载体,由于信息技术的快速发展,使电子期刊的形式呈现多样化和不稳定特征,在采购过程中要充分地考虑图书馆计算机设备和网络的条件,以及原有电子文献基础。

3.电子图书电子图书的出现较电子期刊要晚,种类也比较少,有 CD—ROM型、网络型和 E-Book

三种形式。(1)CD—ROM型。早期的电子图书内容基本是百科全书和词典,形式为 CD—ROM

型。百科全书和词典的内容属于非线性资料,是按照条目来查阅的,最适合采用数字化方式。可以充分运用电子版的特性,快速查询,提高效率。随着多媒体技术的发展,书中可以增添图片、声音、动画、影像等多媒体功能,可以附加字典、电子书签、查询纪录表、文字处理等功能。如:《美国学术百科全书》,这部 1980年问世的百科全书在 1985年就有了 CD—ROM版,1992年发展为多媒体光盘。大英百科全书公司出版的《不列颠百科全书》于 1994年推出光盘版。我国出版的中文电子工具书有《中国大百科全书》、 《中国少年儿童百科全书》、《世界科普知识百科》,《世界各国知识图典》等。

CD—ROM型的电子图书主要集中于艺术、旅游、教育、古典文献等门类,以及大型的综合性丛书。

(2)网络型。在因特网上发行,以免费服务为主的图书。如:《不列颠百科全书》的网络版(Britannica Online)于 1994年推出,它将《不列颠百科全书》和《不列颠百科年鉴》两者的内容合在一起,不仅在数量上超过了印刷版,而且加强了时效性。此外,它还挂接了《韦氏英语词典》,方便读者查字。其检索功能大大超越印刷版,网络版一共有 4400万个词、其主题词表内有 70万个主题词、全书有 20万个链接,读者可以从分类、主题词、关键词的角度进行超文本检索,也能在阅读时通过链接从一个概念跳跃到另一个概念,既方便效率又高。当时采取收费订阅制度,一年的订费是 85美元。1999年 10月 20日起网络版《不列颠百科全书》免费开放服务,只要点击 britannica.com,就可阅读或下载。

《美国学术百科全书》1997年出网络版,网址为(gme.grolier.com)。网络版的内容每月更新,条目共计 35000条,比光盘版多 5000条;有 5000张照片和 850 幅地图,比光盘版要少,多媒体效果较差。通过America Online和CompuServe也可检索该书网络版。

(3)E-Book 随着信息技术的不断发展,人们把微电子、因特网、数字化和电子商务技术结合起来,

创造出以网络出版形式传播的电子图书。当作者完成创作后,将书稿的电子文本传送给出版社,出版社编辑在计算机上对书稿进行编辑加工,不用印刷和装订,而是通过特定的入门网站向读者提供图书的下载服务,把电子图书送到读者的电脑硬盘或者便携式的电子书里,以电子结算方式完成销售。电子书也有封面、插图,还可以做成多媒体版。

便携式的电子书就是一台微型的存储阅读器。例如,台湾文化传信公司研制的全球首部便携式彩色中文电子书——“文昌电子书”,是以“文昌 2000”作为操作平台,全彩色显示屏幕,只需两节电池,便可连续使用十五个小时,机身重量只有五百克,面积三十二开,可放入口袋里。出版商把他们的书目放在入门网站上,读者便可在平台上,选取需要的书本,把图像、文字、声音一并下载。这样读者只需携带一本轻巧的电子书,便可随时随地地翻阅和选取有声有色及不同种类的书籍。

首次通过因特网销售电子书是在 2000年 3月 14日,美国著名恐怖小说家斯蒂芬·金的新作《子弹顺风车》(Riding the Bullet)在因特网上以电子书的形式发售。该小说全文16000字,约 60页,很适合从网上下载。14日午夜 12时 01分,著名网上书店“亚马

61

Page 62: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

逊”和“贝纳斯诺伯”准时将《子弹顺风车》传到网上,供读者在一定时间内免费下载到自己的硬盘或者便携式电子书上。另外有一些小型电子商务网站提供收费服务,下载一次需付 2.5美元。初步估计,一天之内有 40万人次从十几家网站成功地下载了《子弹顺风车》,要求下载的多达 200万人次,造成有的网站一时堵塞。网络出版的电子书具有多媒体、信息量大、出版周期短、成本低价格便宜、传送方便等优点,是发展前景很宽广的新媒体。国内的博库网(http://www.ebook.com.cn)在 2000年 8月 22日推出签约作家的数百部著作ebook,其中博库网独家拥有的 10部 ebook作品尝试免费下载.

4.采用虚拟图书馆的方法组织因特网信息资源因特网上的信息浩如烟海,据英国《金融时报》披露,在 2000年,每天网上刊载的免

费阅览的新的信息有将近 100万页,是世界上英语图书出版业产量的 10倍多。其表现形式多样,有文本、图像、表格、声音、超文本等;信息层次多,包括一次文献、二次文献、三次文献;信息更新及时。海量和迅捷是因特网最大的特点,而最大的缺陷是迅速无限增长的信息的无序化状态。无序的信息资源是难以有效利用的,图书馆的资源建设工作又增加了利用虚拟图书馆技术组织因特网信息资源的内容。

虚拟图书馆是对因特网上某一主题或类型的信息进行搜索、分类、整理,把分布在世界各地的数十万计的WWW服务器上的资源组织起来,建立资源链接中心。用户从虚拟图书馆站点出发,可以访问分布在世界各地的专业网站,获取所需的信息。虚拟图书馆组织网络信息不是简单地收集和分类,而是由专业的图书情报人员对因特网上的信息资源反复鉴别、筛选,制定明确的选择标准。采访人员要充分熟练地应用各种搜索引擎,掌握网站和网页评估技术,长期跟踪,定期调整。在信息组织上采用元数据等数字信息标引技术和图书情报的分类、主题组织方法,按照一定的索引语言抽取检索词,对每个专业站点作内容简介,对主题相关的站点和数据库进行归集,制作统一的检索界面,提供各种使用帮助和检索培训等。

图书馆组织因特网信息资源时要优先选择信息来源可靠、稳定、参考价值高的网站或网页,如图书情报网站、政府网站、教育网站、研究机构网站、媒体网站,例如:要收集有关美国的资料,可以优先考虑其政府网站,在白宫网页上有一个美国联邦政府站点的完整列表可以链接到美国政府所有已经上网的官方资源,如:《美国政府项目索引》可以帮助人们了解政府计划开发实施的项目;美国人口调查网址可以浏览州和县一级详细的人口统计数字包括当地从事各种职业的人口组成;美国农业市场服务局的网站每天公布全国农副产品的市场信息;美国食品和药物管理局(FDA)设立了食品和药物电子公告板,发布最新通过的药品和食品检验结果。而对于信息服务商网站、企业网站、社会团体网站、个人网站等要加以严格的考察。在组织因特网信息资源时,要综合考虑图书馆自建的数字化资源、采购的网络数据库和光盘数据库、电子期刊等的情况,做到目标一致、重点一致、特色一致,能够相互协调,优势互补。

5.获取文献使用权图书馆在传统上被视为“文献信息的海洋”,但是在信息时代有人认为图书馆的馆藏

不能局限于馆内文献信息,应该延伸到全社会的信息资源,提出了以“取得”代替“收藏”的观念。由于大量的数据库生产商和网络信息生产商根据不同用户对象的不同需求集中了各种信息资源,设计了多种电子商务模式,提供检索、提供全文、提供定题服务等,并按照不同的服务层次和服务内容制定不同的收费价格。例如 OCLC的第一检索系统(First Search),包括书目、索引、摘要、简讯、论文、报告、书评、年鉴、百科全书、政府文件、电子报刊、机构名录、事件和数据等数字化资源,服务收费也分为单次检索、批量检索,以及不同类型全文提供的多种价格标准,完全突破了传统图书馆购买文献的观念。

现在图书馆也将采购文献信息的使用权,所提供的文献信息中有一部分就不是它的馆62

Page 63: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

藏。随着因特网的发展会有越来越多的资源以数字化形式呈现,许多资料将会是按需求取得或出版的,所以图书馆要改变传统资源建设单一模式的观念,在读者有需求时设法取得“取得”的方式主要有:

(1)通过馆际互借或文献传递的方式获得文献信息。(2)利用网络数据库。(3)与其他图书馆和信息机构共同建设共享的虚拟信息资源体系。(4)与出版商信息商建立获取数字化资源的联系。图书馆要决定哪些资料应该收藏,哪些资料应按需求取得。如果图书馆不订购某些资

料,取得的费用由读者承担,读者能接受吗?数字化资源建设所面临的不仅是载体形态的改变,还有传送方式、服务方式、交易方式、

结算方式的改变,涉及图书馆采访工作的专用设备、工作程序、操作方式以及人员知识结构和专业技能等多方面的变革。

二.电子文献整理新标准

2.都柏林核心元数据集都柏林核心元数据集,是 1995年 3月由美国OCLC与NCSA(国家超级计算机应用中

心)联合发起、52位来自图书馆界和电脑网络界的专家共同研究产生的一套描述网络电子文献的方法,以实现网上信息的辩识、查询和检索。这一方法的核心是如何用一个简单的元数据记录来描述种类繁多的电子信息,使非图书馆专业人员也能够了解和使用这种著录格式,达到更有效地描述和检索网上资源。由于这次研讨会议是在俄亥俄州哥伦布市的都柏林镇举行,所以会议推出的“核心元数据集”被称为“都柏林核心元数据集”。

从 1995~2000年,OCLC与各有关机构联合举行了 8次研讨会,每次研讨会都推出一些具体的研究成果,目前都柏林核心元数据集已被翻译成 25种语言,其用户遍及世界各地。最近正在作为美国的国家标准 ANSI/NISO Z39.85-200x,交各有关部门听取意见,最后将以投票表决的方式决定其是否成为国家标准。澳大利亚、丹麦、芬兰等国政府已经将DC纳入国家标准中描述电子信息的一个部分,日本、葡萄牙和英国也紧跟其后。

都柏林核心元数据集由 15个基本元素组成,分成三大部分: 内容描述部分:题名、主题、说明、来源、语种、关联和覆盖范围; 知识产权部分:创建者、出版者、其他责任者和权限; 外形描述部分:日期、类型、形式和标识符。相比复杂的MARC格式,都柏林核心元数据集只有 15个基本元素,较为简单,而且

根据都柏林核心元数据集的可选择原则,可以简化著录项目,只要确保最低限度的 7个元素(题名、出版者、形式、类型、标识符、日期和主题)就可以了。

对于需要详细著录的资料,都柏林核心元数据集引进了修饰词的概念,如语言修饰词(Lang)、架构修饰词(Scheme)和子元素修饰词(Subelement),进一步明确元数据的特性。特别是通过架构修饰词,把MARC/AACR的优点和各种已有的分类法、主题词表等控

63

Page 64: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

制语言吸收进来,极大地丰富和增强了DC的描述性和权威性。同时还允许各个都柏林核心元数据集地方版在 15个元素的基础上增加新的元素或新的修饰词,但应坚持互操作性的原则。

(1)都柏林核心元数据集的基本元素集都柏林核心元数据集用来描述一个信息对象的内容和位置,以便能在网络中方便地查

找和检索。都柏林核心元数据集由于其内在本质性、可扩展性、语法独立性、可选择性、可重复性、可修改性及与其它元数据形式可进行桥接等特性,正在成为广受欢迎的网络资源描述的元数据格式。都柏林核心元数据集的整个元素集是可扩展的,每个标记元素均可重复使用或者有选择性地使用,而且还可以拥有子类型和子模式,它能通过扩展或通过对更复杂的记录的链接来增强其功能,并被对应到其它更复杂的记录中去。

1995年,当第一届元数据研讨会在美国俄亥俄州都柏林镇召开时,只设定了一个包含 13个元素的核心元素集。它们是:Subject(主题), Title(题名), Author(作者), Publisher (出版者), OtherAgent (相关责任者), Date (日期), ObjectType(对象类型), Form(格式), Identifier(标识符), Relation(关联), Source(来源), Language(语种), Coverage(覆盖范围)。但是在第三次元数据会议中对 DC的几个元素进行了修改,使它们不至于局限在文本信息上,改变了以文本为中心的做法。另外,在原来 13 个元素的基础上又新增加了两个元素 Description 和 Rights。使得Description 与 Subject成了两个独立的元素,Subject包括关键词、主题词和分类号,而Description 则用于图像方面的描述性文字或内容描述,并包括文本文件的摘要。于是都柏林核心元数据集便由 15个元素组成,每一个元素的基本定义如下:

①Title(题名)由创建者或出版者赋予资源的名称。一般而言,这一名称指的是资源对象的正式公开

名称。例:Title=The Wolf Lewkowicz Collection

②Creator(创建者)创建资源内容的主要责任者,可以是某个人、某团体或某项服务系统。一般而言,用创

建者的名字来标识这一条目。例:Creator=Lewkowicz, Wolf

③Subject(主题)描述资源主题或内容的关键词、词组短语或分类号。主题和关键词最好是取自一个受控

词表或是一个规范的分类体系。例:Subject=Jews·History·1789-1945

④Description(说明)资源内容的文本描述,包括类文件的文摘或可视资源的内容描述。说明元素可以包括

但不限于以下部分:文摘、目录、对以图形来表示内容的一个参照或者一个有关内容的自由文本描述、版本说明、注释等。

例 : Description=Web site maintained by Marc Zissman ; material copyrighted by Marshall L. Zissman and Sol J. Zissman。

64

Page 65: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

⑤Publisher(出版者)负责使资源成为可取得和利用状态的责任者,可以是某个人、某团体或某项服务系统。

一般用出版者的名字来标引这一条目。例:Publisher=National Academy Press

⑥Contributor(其他责任者)指在创建者元素中未被指定为最主要的知识贡献者,但仅次于在创建者中指定的个人

或团体的其他责任者,可以是某个人、某团体或某项服务系统。一般用其他责任者的名字来标引这一条目。

例:Contributor=Zissman, Sol J.⑦Date(日期)

指以现有形式出现的资源制作日期。一般而言,日期应与资源的创建或出版日期相关 。DC发布机构建议Date格式应符合 ISO 8601 [W3CDTF]规范,并使用 YYYY-MM-DD格式。

例:Date=1997-09-07(指 1997年 9月 7日)⑧Type(类型)

有关资源内容的特征和类型。Type包括描述资源内容的分类范畴、功能、特性或集合层次的术语。Type的值应从资源类型列表中选取。

例:Type=Text data⑨Format(格式)

资源的数据格式,用于注明需要什么软件或硬件来显示和执行这一资源。一般而言,Format可以包括资源的媒体形式或尺寸。Format元素可以用来决定对资源进行操作或显示所需的软件和硬件。Format的值应从 Format的列表中选取。

例:Format=text/html⑩Identifier(标识符)

用来标识资源的字串或数字。资源的标识应采用符合正式标识体系的规范的字串及数字组合。如网络资源标识中的 URI(统一资源标识符)、其他通用的唯一性标识如 ISBN(国际标准书号)、ISSN(国际标准刊号)等。

例:Identifier=http://www.libnet.sh.cn Source(来源)

二次资源的出处信息,当前资源可能源自来源资源的一部分或全部。最好是通过利用一个正式标记体系的字符串或数字指向参考资源。

例:Source=http://www.blm.govLanguage(语种)

反映资源知识内容的语种。本元素的值采用 RFC 1766中所定义的语种代码规范,该标准定义了一个由两个英文字母组成的语言代码(取自于 ISO 639标准),也可采用由三

65

Page 66: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

个英文字母组成的语言代码(取自 ISO 639-2标准)。例:Language=eng (ISO 639-2) 或:Language=en (ISO-639)

Relation(关联)该资源与其他资源之间的关联。表达一些资源同另外一些资源之间有正式关联但彼此

又互相分离的资源之间的关系。Relation的值应从Relation的列表中选取。例:Relation=http://www.studyusa.com

Coverage(覆盖范围)资源知识内容的时空特征。包括空间位置描述(一个地名或地理坐标)、时间段描述

(一个时间标识、日期或一个日期范围)或者管辖范围(如巳命名的行政实体),Coverage应使用受控词表。

例:Coverage=CanadaRights(权限)

有关资源本身所有的或被赋予的权限信息。可以指一个权限管理的陈述,也可以指一个权限管理陈述的标识,或者提供资源权限管理信息内容的服务器的标识。一般包括知识产权、版权或其他各种各样的产权。

(2)都柏林核心元数据集的修饰词随着都柏林核心元数据集在世界各国、各个学科和领域的广泛应用,只有十五个元素

的简单都柏林核心元数据集已经不能满足人们对资源作具体描述的需要。为了提高著录的精确性,各有关项目的机构团体都根据自己的特定需求,在十五个元素的基础上设置了修饰词。但是,不同学科、领域和地方机构设置的修饰词缺乏互操作性,相互之间理解的难度。都柏林核心元数据集第八次会议提出的都柏林核心元数据集修饰词标准,在很大程度上代表了各界有关人士对提高团体机构间互操作性问题的共识。虽然,该标准中所列出的修饰词并不能够满足各种应用描述需求,但它是都柏林核心元数据集修饰词未来发展的奠基石。

都柏林核心元数据集修饰词的含义是对 15个元素的语义进行限定和修饰的词,具有对具体资源描述的专指性特点。它们由控制词汇和编码体系组成,增加描述的精确性,可以进一步明确元素与资源本身的关系。都柏林核心元数据集修饰词的制定原则遵循著名的Dumb-Down(向上兼容)原则,即修饰词的语义包含于未修饰词中,在范围上,对未修饰词的语义进行限定,在深度上,对未修饰词的语义进行延伸。这样,对于不具备修饰词专业知识的用户来说,在使用这些修饰词时,可以象使用未修饰词一样来使用。都柏林核心元数据集修饰词分为以下两类:

①元素修饰词(Element Refinement) 这些修饰词缩小了元素的含义范围,使其具有专指性。修饰词与未修饰词共享一个含

义,只是对未修饰词的含义范围做了进一步的限定。一个不理解特定元素修饰词的用户,可以忽略修饰词,直接将它作为未修饰的(更宽泛的)元素来理解;象应用未修饰词一样来应用这些修饰词。目前,DC元素集在以下元素中设有元素修饰词: 题名:Alternative(交替提名) 说明:Table of Contents(目录)、Abstract(文摘) 日期:Created(创建)、Valid(有效)、Available(可获得)、Issued(发行)、Modified(修

66

Page 67: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

改) 格式:Extent(范围)、Medium(媒体) 关联:Is Version Of(版本继承)、Has Version Of(版本关联)、Is Replaced By(被替代)、Replace(替代)、Is Required By(被需求)、Requires(需求)、Is Part Of(组成部分)Has Part(部分为)、Is Referenced By(被参照)、References(参照)、Is Format Of(格式转换于)、Has Format(已有格式) 覆盖范围:Spatial(空间的)、Temporal(时间的) ②编码体系修饰词(Encoding Scheme)

编码体系有助于对元素修饰词值的理解。这类体系包括控制词表及正规的符号或解读方式。值的表示采用来自控制词表的表记符号(如分类体系或主题词表的术语)或者具有特定含义以及一定形式组成的字符串(如 2000-01-01,一个日期的标准表达方法)。如果一种编码体系无法被客户机或代理(agent)所理解,它的值仍能被其他人所理解。用于修饰的编码体系必须是清晰明确的说明,并能为公众所获取。目前,DC元素集在以下元素中设有编码体系: 主题:LCSH(美国国会图书馆主题词表)、MESH(医学主题词表)、DDC(杜威十进分类法)、LCC(美国国会图书馆分类法)、UDC(国际十进分类法) 日期:DCMI Period(DCMI时间范围) 格式:IMT(因特网媒体类型) 标识符:URI(统一资源标识符) 来源:URI(统一资源标识符) 语种:ISO 639-2、RFC 1766 关联:URI(统一资源标识符) 空间覆盖:DCMI Point(DCMI 地理位置)、DCMI Box(DCMI 框图)、 ISO 3166、TGN 时间覆盖:DCMI Period(DCMI时间范围)、W3C-DTF

都柏林核心元数据集修饰词具有 5个属性:①Name(名称): 是赋予该修饰词的唯一标识。②Label(标签): 是赋予该修饰词的人工可读标签。③Definition(定义): 表述该修饰词概念和重要性质的说明。④Comment(注释): 与该修饰词相关的另外信息(若能够获得)。⑤See Also(参见):关于该修饰词更多信息的链接(若能够获得)。例:题名(Title)修饰词元素修饰词:Alternative(交替题名)名称: 交替题名标签: 交替题名 定义: 任何一种用资源正式题名以外的任何题名。注释: 该修饰词可以包括缩写题名和翻译题名。

67

Page 68: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

例:主题(Subject)修饰词编码体系修饰词MESH (医学主题词表)名称:MeSH标签: MeSH定义: 医学主题词表。参见:http://www.nlm.nih.gov/mesh/meshhome.html

三.网上读者服务新形式

3.因特网上的信息服务创新模式(1)网络图书馆(NetLibrary)1998年 3月,美国科罗拉多州的傅尔德出现了一家新型的电子图书服务公司——网

络图书馆(NetLibrary)。它与出版商和大学图书馆合作,有选择地购买图书的网络出版权,然后把印刷型图书扫描转换为数字格式,制成电子图书。目前该公司已经和 180多家出版商建立了联系,拥有近 2万种电子图书,并且以每年 1万多种的速度增加。它通过因特网每周 7天,每天 24小时向全世界的用户提供电子图书的检索、阅览、复制和销售服务,其查找图书的方法与图书馆一样,有作者、书名、主题词、关键词和自由词检索,还有任意词或词组的全文检索。个人读者支付一定数额的费用后,(每天约合 11美分)即可在规定时期内阅览所有馆藏;图书馆订购其 500种电子图书即可使用全部馆藏,读者可以通过图书馆的网络查阅图书资料。目前已经有 30多家图书馆与它签订了利用网络电子图书的协议。网络图书馆提供的多数是教学参考用书和专业图书,其主要服务对象是图书馆团体用户,它是一种新型的数字图书馆公司,它为图书馆节省了采购、典藏、维护管理的费用,为图书馆开创了崭新的服务模式。

(2)网络的期刊目次数据库服务和电子期刊数据库服务90年代起,由于因特网的发展,欧美等国的期刊目次通报和文献传递服务获得极大

的发展,用户迅速增加。近年来,我国许多图书情报机构和科研单位也都加入到用户队伍中。通过因特网开展期刊目次通报服务的机构很多,主要有:文献传递公司,如 CARL公司的 UnCover系统;出版公司,如 Elsevier Science Ltd,Academic Press和 Oxford University Press等;数据库服务公司,如 ISI,Engineering Information Inc;学术或者专业团体,如Royal Society of Chemistry。

UnCover是由美国科罗拉多州(Colorado)研究图书馆联合系统组建的 CARL公司的期刊服务数据库。建成于 1988年底,1991年开始提供期刊文章复印传真服务以及电子文本传送服务,共提供 18000多种各学科的期刊的目次和 700多万篇全文。数据库内有联合系统内各图书馆的期刊联合目录、期刊目次、期刊论文索引。该系统提供两种途径的服务:

直接进入UnCover检索界面,其数据库检索是免费的。根据检索结果再要求传送

68

Page 69: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

原文。 最新期刊目次通告服务,用户可以从系统所有的 18000种期刊中挑选自己最关

心的经常需要阅读的 50种期刊,或者拟定 25组文献检索策略(如关键词、作者姓名等)发给UnCover,建立个人文档中,数据库系统每星期都会从最新的期刊目次中查到相匹配的文章题录,用电子邮件发送到用户的电子信箱里,然后订购所需要的原文。

EBSCO是美国著名期刊发行商公司,将其代理发行的 17000多种西文期刊的目次建成《Current Citations篇名目次数据库》,通过网络发行。该库能提供期刊的刊名检索、目次浏览、篇名检索、作者检索、出版者检索、ISSN检索、刊名和篇名的关键词检索等多项服务,可按照用户的要求进行文献定时定题检索和原文提供服务,并能实行自动化的用户管理,是一个实用价值较高的综合数据库。由于该数据库规模较大,价格昂贵,因此许多图书馆采取联合采购,资源共享的方式。

EBSCOhost数据库检索系统有 60多个数据库,其中包括 10个全文数据库,例如学术期刊全文库(Academic Search Elite)、医学文献全文库(Comprehenesive MEDLINE with Fulltext)、商业资源集成全文库(Business Source Premier)。

Elsevier Science Ltd是一家出版 1200种学术期刊的公司,它的 ContentsDirect提供由电子邮件传送的、免费的期刊目次和图书通报服务。提供目次通报服务的 1200种期刊涉及农业、生物学、物理学、天文学、化学化工、临床医学、计算机科学、地球和天体科学、工程学、能源科学、环境科学、生命科学、材料学、经济学、社会科学、工商管理等。范围从1995年起到最新出版的一期。用户可以直接在网络上注册,生成自己的电子文档,然后选择自己感兴趣的学科或期刊名称存入文档,没有数量限制。ContentsDirect会按照用户的要求把期刊目次发送到指定的电子邮箱里,用户如果要在线浏览电子文本或者下载全文,可以访问该公司收费服务的 ScienceDirect系统。

这种服务模式其特点是规模大、文献品种齐全、服务手段多样化、使用方便,收费和结算方式灵活。图书馆以批量的形式购买了这些服务,就可以替代相当一部分传统业务,节约经费、空间和人力。

(3)跨国联机检索系统80年代中期,欧美发达国家出现了几个国家联合建立的大型联机检索系统——

STN,它是美国化学文摘社、日本科学技术情报中心、德国卡尔斯鲁厄能源、物理、数学专业信息中心共同建立的国际科学技术信息网络系统。STN 拥有 300多个数据库,内容涉及农业、生物学、化学、物理学、电子工程、计算机科学、工程技术、环境、地质学、材料科学、药学、专利和政府法规。这些数据库分别保存在三个信息机构的主机里,通过卫星通讯相连接,用户使用任何一个信息机构的网络接口都可以查阅所有的数据库。STN有图形检索系统,它的化学物质和结构式检索功能是世界上最先进的。

(4)国家电子图书馆新加坡国家图书馆管理局和电子站(e-station)合作设立的电子图书馆(e-library)于

2000年 7月开幕。这是亚洲第一个完全电子化的图书馆,主要的服务对象是在市区上班的读者,他们不用上图书馆,就能轻易地利用国家图书馆所提供的网上服务,获取各种多媒体资料及使用图书馆的其他服务。

电子图书馆的收费每小时是 6元。利用装上电子图书馆服务的 20台电脑,可阅读到超过 1万 6000多本电子书、遨游各个电子数据库,及收看随选视讯服务的上千部录像带。电子图书馆除了能让公众更容易接触到线上教育与娱乐,还能帮助那些懂得互联网的人士,通过宽频科技互联网,获取多媒体资讯。

这是新加坡国家图书馆管理局第一次以特许经销方式与商业机构合作。图书馆所提供的服务,公众都能通过电子图书馆获得。这些服务包括 TiARA资料库、VEGAS虚拟展览厅

69

Page 70: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

系统,和 InfoXpress等,让使用者能轻易、快速地找寻所要的资料。公众也可以通过电子图书馆观赏唯读光碟及教育节目。此外,他们也能调取图书馆收存的照片、海报及本地广告等,并接达图书馆目录及 200多个本地和国际数据库。

与新加坡国家图书馆管理局合作的电子站(e-station)是星和与集益集团属下子公司资讯网系统与服务的合资项目。这个设在新达城的网上教娱中心集娱乐、商业与教育于一体,它拥有 400多台具有最先进液晶显示屏的电脑,通过宽频科技为公众提供网上消闲、培训及商务等服务。此外,它也提供 1000多种电脑培训课程及高速度的互动游戏项目等。

新加坡国家图书馆的新建筑在 2003年启用时,公众将可更快地获取图书资讯。图书馆计划在新馆让公众携带自己的膝上型电脑,下载馆内的数据库及储存其他资料。国家图书馆管理局还计划通过随身电话传达信号,提醒使用者他们的还书日期已到,或者通知他们所预定的书籍可供借阅了。图书馆管理局还将推出电子商务服务的新计划,图书馆将在互联网提供一些收费服务,比如与书商联合在网上售书,或让使用者直接缴付书本逾期罚款等等。

四.资源共建共享新网络 90年代开始,适应电子信息资源利用的需要,越来越多的出版商和学会开始在因特

网上出版和提供各种电子期刊的服务,如 Elsvier Science Group 出版社的 Science Direct、Academic Press出版社的 IDEAL,Springer出版社的 LINK。针对这类新型的文献资源和提供方式,图书馆开始建立地区性的以计算机网络为基础的新一代协作网,通过协作网和这些电子期刊的出版社签订集体利用网上资源的契约。这种方式从充分利用这些电子期刊的角度出发,要比单个图书馆的个别契约方式具有明显的优越性35。尽管集体利用电子期刊方式的价格比较高,但是对于协作网的图书馆来说,可以减轻期刊价格上涨对图书馆电子全文提供的压力;而且对利用者来说,可以提供的电子期刊的数量是显著增加了。特别是对于一些中小型的图书馆的读者效益就更明显。

新一代的图书馆协作网进一步深化图书馆服务,通过建立地区性的馆际互借的协定,协调藏书采购的分工,或者建立统一的的书目信息数据库或文献管理系统、统一的 OPAC和检索界面,建立本地区的文献传送的物流系统等方式,保证本地区的读者能够及时地获得文献资料。

美国图书馆学专家 Potter把这新一代图书馆协作网的功能归纳为以下三点: (1)共同拥有物理性的资源,提供联合目录、馆际互借、文献传送等系统; (2)能够提供因特网和WWW服务; (3)能够提供存取电子信息资源的服务。Potter认为第三点非常重要,是新一代图书馆协作网的重要特征。这里面既包含了建立

提供地区服务的硬件和软件设备如服务器,或者说具备提供连接其他平台的形式等技术环境来提供各种诸如 CD-ROM、电子期刊资源,同时也包含了利用电子信息资源的集体协议等方面的协作内容36。这些协作网可以分为两类:一类是地区性的,在美国比较著名的有伊利洛伊州的 Illinet、加利福尼亚州的MEIVYL、俄亥俄州的OhioLINK等等。另一类是同一或35 Kohl, David F. Resource Sharing in a Changing Ohio Environment. Library Trends, Vol.45, No.3, 1997. p.435-447.36 Potter, William Gray. Recent Trend in Statewide Academic Library Consortia. Library Trend. Vol.45, No.3, 1997, p.416-434.

70

Page 71: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

相似性质的图书馆组成的,如美国中东部地区的州立和私立的主要大学图书馆为成员的CICNet 。中国国家教委 211工程 61所院校图书馆为成员的CALIS。

随着网络资源日益丰富,使用日益方便,图书馆协作网的共建共享从电子期刊发展到虚拟信息资源体系。虚拟信息资源体系的内容包括数字化期刊、书目数据库、文摘索引数据库、全文数据库、多媒体图象数据库等。资源提供者包括书刊出版商、文摘索引商、数据库服务商、学术研究机构、图书馆。虚拟信息资源体系的服务方式主要是资源保存在由资源提供者的服务器上或者拷贝到服务提供者(例如图书馆)的服务器上,通过网络提供给读者使用。资源使用采取服务提供者购买资源使用权而不占有资源。多个服务提供者往往组成联合系统购买使用权,联合系统可提供集成化服务,包括统一的界面、使用管理和使用审计。一个虚拟信息资源体系可以连接多个不同内容、不同使用条件、提供不同服务的资源提供者,重新组合后向多个用户群提供不同层次的文献信息服务。

美国俄亥俄州的 OhioLINK和中国国家教委的 CALIS是比较典型的新一代图书馆协作网。

1.OhioLINK 俄亥俄州是美国中西部的一个州,对于图书馆员来说,它的名字更多的是与 OCLC

相联系起来。但是,OhioLINK(Ohio Libarary and Information Netwok)的成员馆尽管都是OCLC的成员馆, OhioLINK本身在组织上既不隶属于OCLC,也没有历史上的联系。

OhioLINK是一个 90年代建立起来的州规模的图书馆协作网络。它的成员目前包括了 17个公立大学、23个社区/专科学院、33个私立学院的图书馆以及州图书馆。主要的服务对象是大学的 54万名师生员工。

1989年,该州的高等教育委员会经过几年的调查发表了一份关于该州资源共享方面的研究报告。这份报告中分析了 1970年以来文献出版的基本情况以及该州图书馆购书经费的情况,认为在整个期刊价格上涨 13.5%以及出版媒体多样化的背景下,图书馆的预算即使每年增加也总是赶不上文献增长和发展,因此,该州的文献信息资源所能覆盖的只能是世界知识总量的一个部分。但是另一个方面,信息资源的选择能力,提供多样化的信息资源的获得途径能力的教育对于高等教育的重要性却日益重要。在这样一种大背景下,构建一个州规模的信息资源共享和利用的环境,对于缓解图书馆财政压力,提高服务水准,还是对高等教育本身的发展都很重要。根据这报告的建议,1990年以后,开始委托 Innovative Interfaces, Inc.公司开发中心目录的软件系统,Digital Equipment Corporation公司建立计算机硬件设备,并从 UMI 签定了协议引进 4个数据库。在此基础上,1992年正式网络开通 。1996年开始在WWW上提供服务。现在它拥有一个综合性的地区图书馆目录和 OhioLINK中心目录,一个联机馆际互借系统、各个学科的数据库和 48小时的文献配送系统。

OhioLINK最高机构为运营委员会(Governing Board)。由综合性大学的副校长、社区学院的校长、教师代表、图书馆长以及州高等教育委员会的官员构成。主要负责任命OhioLINK的负责人,批准工作人员的任用,年度计划的审定、批准新的成员馆、批准和外部的各种公司和机构的合同等。其下属机构有:

图书馆顾问委员会(Library Advisory Council)。由 18家综合性大学的图书馆长是常任委员,另由二年制社区学院选出 3名、三年制大学选出 1名非常任委员。每年轮选一次。主要任务是提出各种研究开发计划和提案。每月一次例会。下设 4个专业委员会:数据库标准管理委员会:负责数据库的调整、维护、和质量管理;读者服务委员会:为读者和馆员制作各种指南手册,设计利用者界面、新的电子信息产品的购入等;共同信息资源管理委员会藏书管理和共建,挑选新的电子信息资源等;图书馆相互服务委员会:馆际互借和文献配送问题。负责日常运营管理的专职人员有 12人。除一名负责人以外,另有 11人分别从事行政管理和技术管理。

71

Page 72: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

OhioLINK的经费由州政府的教育预算中全额拨款,每 2年一次。主要用于职员的工资、办公室的房租、中心计算机的设备费、远程通信的费用、硬件和软件的维持费用、数据库的年度契约费以及用于开展电子信息资源服务方面的支出等。

OhioLINK的主要服务项目有: 建立一个集中型的中央藏书目录体系。OhioLINK 拥有一个中央联机图书馆目录,各

个成员馆在编制本馆的图书馆目录时,同时也把书目记录输送到中央图书馆目录中。与此同时,除了这个中央目录以外,这个网络本身可以连接各个成员馆的 OPAC以及该州以外的地区的图书馆书目资源,如伊利洛伊州的研究图书馆中心(CRL,是有 100多家大学图书馆的集中藏书保存书库)的书目资源。现在,中央目录本身有 620万件的书目记录。

目前整个协作网的藏书量超过 2000万册以上,协作网藏书的 60%是不重复的,因此可以说它的整体藏书质量是很高的。

建立了联机馆际互借系统。OhioLINK的中央目录不仅记录了主要的书目信息以及该书的藏书所在,而且提供了即时性的出借情况。读者在需要借书时候,既可以直接向所属图书馆申请,也可以同时向OhioLINK 申请。馆际互借申请中常见的填表申请的手续就可以省略,而且寻找其他馆的复本的工作也是由该系统自动地处理。馆际互借系统开通后, Ohio大学的借出数从每年的 16,000件发展到每年的 48,000件,借入也从每年的 12,000件发展到 42,000件。

建立了文献配送系统。1993年 11月开始建立了文献配送系统。当时由于参加的图书馆是 50馆前后,所以实行的 48小时配送制度。但是到了 1995年以后,由于实施的图书馆已经超出 100家(包括非成员馆)以后,40%-45%是 48小时以内,30%-35%是 72小时以内。

提供多样化的数据库检索。OhioLINK所能提供的A&I数据库的数量是 53个,基本上是覆盖了全学科的一些核心的数据库。这些数据库的一部分是储存在OhioLINK的计算机中心的,一部分则是通过因特网直接连接到数据库的提供商。

全文数据库的提供。目前通过因特网所能提供的全文数据库的数量是 11个,主要是一些著名百科全书等工具书的联机版。

电子信息资源的集体利用契约。由于 OhioLINK是代表 54家图书馆,所以所有的电子信息资源是以全州性的图书馆利用作为前提的。由于契约的总金额比较大,而且订购的数量整体的保证、以及数年作为一个契约单位,不必担心中途中止停刊,所以一般的电子期刊的出版商可以提供优惠价格。另外,由于这种集体性的契约,对于大多数的读者来说可以以非常低廉的费用利用这些信息,所以随着检索数量的剧增,平均的检索单位的成本迅速下降。

期刊论文的电子传送服务。OhioLINK通过和 UMI公司签定合同,提供该公司的两个A&I数据库 Periodical Abstracts, ABI/Inform的 CD-ROM检索服务。由于其中有一部分的期刊(400种期刊)可以同时提供论文全文的,读者在检索这些文摘的同时,如果读者需要的话,也可以将存储在中心的计算机系统中的 CD-ROM的论文通过各个图书馆的高速 FAX打印机立即获得,打印费用自动结算。OhioLINK现在平均每周有 15,000件论文通过这种方式读者手中。

2. CALIS

72

Page 73: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

五.数字图书馆市场运作1.数字图书馆的电子商务运行管理和服务模式电子商务是在因特网基础上采用数字化电子方式进行商务数据交换和开展商务业务活

动。电子商务与数字图书馆在信息组织、信息内容管理、智能化服务、用户关系管理、信息安全和电子支付等领域具有多方面的共性。数字图书馆与电子商务的服务模式结合,是对传统图书馆管理和服务的彻底革命。

数字图书馆电子商务运行管理的核心是实行“内容管理”和“知识管理”。(1)利用智能化软件系统使文献加工整理从表面特征揭示进一步深入到内容的揭示,为读者提供文献信息的内容服务;(2)以知识库的形式发掘图书情报专家和各行业专家的专业知识,为读者提供知识服务;(3)建立远程文献传递和电子结算系统,延伸图书馆的信息服务能力;(4)建立图书馆内部的知识共享系统,提高职工整体的知识层次和专业能力。

传统图书馆的服务设置是面向全体读者的阅读和信息需求,限于图书馆设备、技术和服务能力,能够提供的是较低层次的标准化服务,只有少数特殊的读者可以享受特殊的服务。数字图书馆借助电子商务先进的计算机设备、技术和运行模式,对图书馆服务进行全面创新,不但可以提供高层次的个性化服务和知识服务,并且可以建立读者与图书馆之间的知识交流渠道,建立读者与信息专家之间的知识交流渠道。

电子商务中与知识信息相关的内容服务基本形式是:(1)深度挖掘信息内容,提供更深层次的服务。世界著名的企业名录出版公司——托

马斯名录(Thomas Register)对原来的名录数据库进行了改造,增加了互联网功能,包括超文本页面、CAD图象和在线采购。为名录中的每家公司专门建一个“电子门面”,其中包括产品列表,产品详细信息的目录,以及正在销售的商品的清单。现在,托马斯名录公司的站点上有非常丰富的信息,包括 8000种目录和 156000家公司名录,其中 23000家公司有电子门面。更多的信息还正在补充,其中包括对关键客户的秘密报价。联机信息的丰富使该公司提供的内容服务不再停留在目录阶段,他们给自己的新定位是:商品购买指南和来源指南。

(2)鼓励用户评价商品,为每个客户可能购买商品提供建议。亚马逊(Amazon)是电子商务之王,本着顾客为中心的信条,它鼓励顾客参与评价其销售的图书;并为每个客户可能购买的图书、音像提供建议,结果约 70%的销售额来自回头客。亚马逊又开发了“一次点击”(1-Click)的专利技术(回头客买东西时只需要一次点击),并在此技术基础上推出了 ZShops。Zshops就是许可其他网上零售商加盟,利用亚马逊的顾客资源和一次点击的专利技术,更重要的是帮这些公司解决电子支付。顾客可以在小网站买东西,亚马逊提供顾客信用卡的担保和认证,然后由亚马逊给小网站转帐。

(3)销售“知识”,开创内容产业。Rowe.com是一个卖知识的站点,它拥有企业对企业(B2B) 及企业对个人(B2C)的电子商务咨询能力。它卖的产品有两个∶一是知识,一是营运管理服务。销售知识首先要建立一个庞大的知识资料库,目前 Rowe.com网站提供 24万篇报道、3500种市场报告以及 800万本折扣书。有了这样的资料库,它就可以以租赁的方式来销售知识产品。它在网上提供书籍、杂志、期刊、电影、研究报告等,然后对每笔交易收取一定金额。例如原本价格昂贵的英特尔或高盛(Goldman Sachs)的投资研究报告,以租赁方式,就不再那么困难取得了。

(4)提供信息和知识的“导航”服务。电视广播等影响力巨大的传统媒体,但是,电视广播为了一般老百姓能看明白,经常把复杂的事情简单化报道,所以许多专家认为其非

73

Page 74: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

常浅薄,是快餐文化。Whyfiles网站通过互联网把新闻背后的知识背景作深刻挖掘,提供信息和知识的“导航”服务。例如:美国国会提出建立导弹防御系统,但是它真的管用吗?欧洲拒绝转基因牛肉,但是它真的对人体有害吗?如果读者看到的新闻与科学有关,提供信息和知识的“导航”服务的网站正好有这些有深度的科学背景或专业知识,就可以帮你了解新闻标题背后的东西。还有 Britannica.com是一个既独特又能称为第一的网站,它把《大英百科全书》的所有内容全都搬上了互联网,供访问者免费查阅。另外,它上面还有来自 76家著名杂志的相关文章,以及指向 125000个网站的链接,是一个非常有价值的研究工具。

(5)定题信息服务。传统情报服务中(SDI)的含义是:用户提出某一项具体的研究项目,由信息机构跟踪研究进程,提供相关的动态文献,它是情报服务中最有效的方法之一。这种服务模式也可以搬到互联网上,成为一种电子商务服务。增加自动搜索程序,搜索特定的主题信息;请有关的专家做远程讲解等。提供 SDI服务网站的内容都是经过精心挑选,服务于特定用户的需求。而且定时更新。iVillage就可以作为 SDI的一个例子,这是一个为社团和提供有针对性信息的著名网站。该网站上有许多专业论坛,除了网友的讨论以外网站本身为论坛提供了大量信息。

(6)建立专家网站,与客户共享专业知识。About.com网站上有 650位“向导”,也就是受邀负责网站上教育、商业、旅游等 18个主要领域内的专业人士。任何人如果在某特定领域具有专长,都可以申请成为“向导”,向导为网民提供“一对一”的直接服务。网站设立独特的激励机制,“向导”的报酬他们吸引到的访问量成正比。在这类网站上,网民可以找到有能力解答自己难题的专家,专家们也可以通过这里向他人提供服务,以获取收益。即使是免费解答网民提出的问题,专家也可藉此在网民中建立权威,最终在虚拟或真实的世界创立个人的事业。

电子商务的信息服务方式大都是借鉴了传统的图书情报工作方法和技术,与数字化技术和因特网相结合,加以创新而形成了第三产业的新领域,这种创新方式适应了知识经济社会发展的需要,发展很快,已经对图书情报事业造成竞争压力。数字图书馆可以引进这些观念、模式、技术和方法,改革图书馆的传统运行方法,提升图书馆的信息服务能力。

74

Page 75: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

第五章 数字图书馆实务

一.为什么要建设数字图书馆建设数字图书馆是一件十分耗费资金和人力的工作,对于我国这样一个信息化程度不

高、数字资源十分贫乏的发展中国家尤其如此,所以我们认为,并不是所有的图书馆适合建设数字图书馆。从目前国内的图书情报机构的现状来看,没有多少能够负担得起建设数字图书馆所需的高昂费用,国家只能集聚有限的财力,集中进行少量大项目的建设。

然而随着信息载体形式无纸化和信息传播的网络化,图书馆向数字图书馆的过渡是一种必然趋势,会影响到每一个图书馆和信息机构。否则图书馆就蜕变为书刊博物馆,或成为仅仅向大众提供一种消遣方式的场所。只有从这个意义上讲,图书馆无生存之虞。

我们对数字图书馆采取一种宽泛的解释,各种图书馆和信息机构能够成为数字图书馆的有机组成,并不一定需要其自身成为一个数字图书馆,同时数字图书馆可以有各种形态各种模式,如前文论述的三类数字图书馆,可以是技术导向、资源导向和服务导向,可以是纯粹建立在网上的虚拟图书馆,对于传统的图书馆来说,更有可能是以实体图书馆为基础的、将许多资源和服务扩大到网上的一种形式。

传统图书馆发展数字图书馆的起因常常来自以下两个方面:1. 解决越来越多的数字媒体的收藏、处理和服务问题;2. 期望通过互联网提供更方便、更快捷的信息服务;英国国家图书馆作为一个拥有丰富传统馆藏和历史文献的国家图书馆,在进行数字图

书馆建设时的考虑很具有典型性: 促进各类书目、联合目录的利用,对现有馆藏的揭示提供详尽信息,改善馆藏存取; 促进数字化馆藏资源的收藏和利用; 注重创新各种数字化资源的服务模式; 制订规划进行馆藏资源的数字化; 促成呈缴本制度的改革,使之包括数字化出版物; 在管理、用户服务、部门协作、员工技能等各方面均得到提高。

上述六项主要目标中有作为国家图书馆的特殊要求,例如希望通过呈缴本制的改革,更多地获取电子出版物,但大多数希望通过建设数字图书馆实现的目标,都同样是我国传统图书馆面临的问题。其中对于书目检索工具的重视,对于数字化保存的强调以及对于图书馆机构运行和服务的考虑都是纯粹的数字图书馆项目,特别是技术主导型和资源主导型数字图书馆开发中很少考虑的问题,构成了传统图书情报机构建设数字图书馆的特殊需求。

图书馆自动化与数字图书馆建设有着千丝万缕的联系,许多图书馆在建设新馆、或进行更新改造时除了要考虑先进的图书馆集成管理系统之外,还要考虑书目数据上网、网上提供读者查询自己借书信息、网上续借或预约等功能,还会考虑或建立光盘阅览室或网吧甚至提供一些数字资源会员制检索功能,我们认为虽然这些不是完全意义上的数字图书馆建设,但都是数字图书馆建设的基石。

75

Page 76: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

本章主要介绍在具体进行数字图书馆建设中可能遇到的各种管理和技术问题,从决策时应注意和考虑问题着手,既介绍美国提出的严格意义上的数字图书馆的体系结构,也涉及数字图书馆的各种具体技术,如数字化技术、存储与资源组织技术、信息发布技术等等,在介绍中多从传统图书情报机构的现实出发,希望为这些机构进行数字图书馆建设提供一些参考和思路。

二.数字图书馆的需求决策建设数字图书馆需要了解众多的计算机技术,但它绝不仅仅是技术问题,而更应看成

是管理问题。对于每一个建设数字图书馆的具体需求来说,目前的计算机技术提供了非常丰富的选择,但不要相信任何现成方案能满足你的所有需求。目前在计算机领域,数字图书馆的许多相关技术是最前沿的,并且涉及面极广,几乎涵盖了计算机网络技术的所有方面,从海量信息存储到面向对象的分布式管理,从模式识别、基于知识内容的挖掘和检索到人机界面技术,等等,这些技术同时是变化发展最为迅速的,目前还没有十全十美或一步到位的方案,可能永远不会有这种方案,因此如何以一定的代价,在各种条件的限制下最大程度地达到自己的需求,是决策时要考虑的主要问题。

因此对决策人员的提出了相当高的技术要求,决策必须建立在对各有关技术非常了解的基础上,目前对于广大图书情报机构的决策者来说可能有些勉为其难,所以就要求决策人员一定要尽可能地与技术人员沟通,确切表达需求,才能在各种各样的可能性和现实性中做出最好的抉择。

可以说在建设数字图书馆的决策阶段,需求分析是系统设计是核心问题。数字图书馆的建设没有现成的模式可以遵循,然而如果要开始一个数字图书馆项目时,

必须首先在心中有一个明确的目的:“要建设怎样的数字图书馆?”开发计划需要依此而制订和实施,如果目的不明确,边做边改,很容易造成灾难性的后果。大量的调研工作是必需的,可行性调研和需求分析阶段应该舍得投入,这种投入将在

将来建设和实施过程中取得丰厚的回报,即使调研结论否定建设某些预先的设想,也是值得的,因为如果贸然上马,资源的浪费将远远大于调研阶段的投入。需求分析是计划的第一步。需求往往应该首先由决策者构想,然后结合技术所提供的

可能性,丰富需求内容,并使需求具体化,可操作化。构想需求时要始终把用户的需求放在首要位置,通过数字图书馆,使用户得到了怎样的好处?这种好处是不是图书馆独一无二能够提供的?要围绕着用户需求设计系统。从技术上看,传统图书馆在通往数字图书馆的道路上通常要经过以下一些“驿站”: 图书馆自动化集成管理系统的选择和应用,实现业务流程的自动化和书目检索; 电子阅览室或 Internet阅览室建设 建立图书馆内部网 设立图书馆网站,提供书目查询等基本服务 数字资源的收藏和服务 馆藏资源数字化 各类资源整合,提供知识导航 数字图书馆服务整合,广域网服务(甚至结合电子商务)我们认为上述各项应用都是建设数字图书馆的必要过程,对于具体图书情报机构来说,

可以有所侧重,不必齐头并进。虽然数字图书馆自身没有专属技术,它本身也是技术各项

76

Page 77: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

的集成,但上述应用涉及太多的技术内容,不是本章所能完全涉及的。我们将对一些较为核心的技术和必要的数字化方案进行详细的阐述。

三.数字图书馆的体系结构

严格意义上的数字图书馆并不是简单的数字化收藏加上信息处理、传播和发布工具,而是支持面向对象的分布式查询的资源库,并且通常支持基于知识内容的检索,具有人性化的人机界面。这样一种数字图书馆将收藏、服务和人集成在一个环境中,支持数字化的知识在其整个生命周期内的所有活动,包括生成、发布、传播、利用和保存等,这是完全脱离传统图书馆实体的存在形式。

这一概念脱胎于 Internet的应用。因特网虽然将全球的信息资源连在了一起,但这些各自独立的资源库具有各自不同的组织、描述和检索方式,提供一种网络环境下跨资源库的、统一高效的访问和检索工具,以及提供一套高效的信息生成、组织和提取技术正是数字图书馆的研究内容。数字图书馆的终极目标就是要优化 Internet的信息存储结构,提供一致的检索接口,使整个网络成为一个虚拟的、单一的、有组织、有结构的信息集合,实现跨资源库的无缝信息检索。

为实现这一目的,美国一些数字图书馆专家提出一套新的网络信息资源的组织方式,成为构成数字图书馆基本结构的基础理论。这一结构即是前文提到的 k-w结构。最初由Robert Kahn 和 Robert Wilensky 描述于论文“A Framework for Distributed Digital Object Services” (1995)中,后由 William Y. Arms 详述于“Key Concepts in the Architecture of the Digital Library” (1995),同期 Carl Lagoze, David Ely, Robert McGrath, Ed. Overly等人的一系列论文补充和完善了这些最初的设计。这个结构初步体现在美国国家数字图书馆计划(NDLP)的项目中。

数字图书馆的体系结构主要解决两个问题:定义数字图书馆中数字对象的信息结构和由数字对象构成的资源库的组织结构。数字对象是数字图书馆中存储信息的基本逻辑单位它进一步决定着的信息组织、处理和利用方式。资源库的组织结构提供了统一的、互操作的、可伸缩的组织框架,将分散互连的“数字图书馆集”成为一个整体,并提供高质量的信息服务,如透明的跨库检索,提供统一的服务接口、基于多媒体知识内容的检索、智能代理等等。

数字图书馆的是数字对象(Digital Object)的集合,也就是说它是由数字对象构筑而成。数字对象存放于资源库(Repository)中。数字对象是以一定结构的数字形式来表达信息内容(Content)的一种方法,其中一些信息是元数据(Metadata,即结构化的关于数据的数据),并包括一个唯一的标识符,被称为“调度码(handle)”。鉴于数字图书馆要充分反映信息的复杂性,例如一个简单的作品可能有许多部分,有一个复杂的内部结构,并通过各种形式与其它数字对象有很多随机的关联,为了便于表示,若干数字对象可能被组合起来,称为“数字对象集”。所有数字对象符合基本形式,而数字对象集在基本形式之外还具有其它一些共同结构,这取决于它所表示的信息。数字图书馆中不同的信息可分为不同的“类别”,类别有不同的规则来定义和描述,例如可以采用MIME37来扩展因特网应用类别,规则可以定义每一类别数字对象的表示方式、内部结构、相关元数据、命名约定,以及如何组成数字对象集等。这些规则可以使用户不必知道复杂的规则也能方便地展现复杂信37 Multipurpose Internet Mail Extension 多用途因特网邮件扩展

77

Page 78: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

息,用户接口直接与复杂的规则打交道,用户只需通过人性化的用户界面就能得到智能化的服务。

上述结构主要涉及四个方面内容:用户界面、对象库、调度系统和查询系统。用户界面应该有两个,分别是面向最终用户和数字图书馆的系统管理员;对象库存储和管理数字对象和其它信息,在 k-w结构中对象库通过“库存取协议(RAP)”与外界交互,大型数字图书馆可能有许多不同类型对象库;调度系统是判断、识别和操控调度码的系统,调度码是一种数字对象的标识符,用于确认数字资源的唯一性,并对数字对象进行定位;查询系统可以有多种,传统的信息检索系统和书目系统都可以作为查询系统,只要可以跟调度码结合起来能够确认数字资源对象。

我们可以研究一个在这样一种结构中进行数字图书馆的查询实例。假定用户正在查找上图数字图书馆中是否有清代著名科学家“徐光启”的图片或图书,该交互可通过下列步骤:

第一步是查询符合条件的数据库记录。客户服务系统(我们称为图书馆服务器)通过Web服务器向客户浏览器提供固定的查询表格,用户通过在有关参数项中填写“徐光启”,或再选择相关选项(例如是否全文搜索),然后提交表格,Web服务器将表格内容返回到图书馆服务器。图书馆服务器经过校验和判断,交查询系统进行匹配,如有必要,还可将提问式翻译成进入查询系统所需的格式和协议,例如如果用户同时选择了要查询书目库,而书目查询系统提供标准的 Z39.50接口,图书馆服务器则可以与书目查询系统可以完成一个 Z39.50对话,将“徐光启”作为书目系统的查询请求输入,从而得到满足问询条件的数字对象清单,查询是通过与元数据库的匹配而实现的,数字对象用其调度系统来识别。

第二步用户选择浏览数字化图片。返回结果是一个命中结果的清单,标识了基本的元数据信息,如题名、责任者、载体类型、来源、简要说明,常常有拇指图或小图符,可以在其中选择用户确实需要的结果。

第三步是获取有关图片对象。经过用户选择,图书馆服务器将所选中图片的调度码送到调度系统,调度系统返回该库地址,图书馆服务器使用“库存取协议(RAP)”从对象服务器所管理的库中请求数字对象。该图片可能有几个版本(大中小或是否加水印)都存于库中,可根据用户对于返回结果的选择,或由系统缺省设置结合用户权限,通过调度码来识别。

最后符合用户查询条件的有关“徐光启”的图片或图书(也可能是作为数字对象的书目信息),直接由对象服务器生成浏览器页面,返回到用户桌面。

在当前情况下,我国的数字化电子文件主要通过以下几条产生途径: ①办公自动化过程中直接产生与接收的电子文件 政府机关、社会各行各业使用办公自动化系统、CAD(计算机辅助设计技术)、字处理软件和 E-mail工作,形成的各类文件数据均应属于直接产生的数字化电子文件。 ②模数转换过程中产生数字化电子文件 模数转换是指将模拟信息转换成数字信息,以便计算机处理的过程,模拟信息要转变为数字信息需要通过相应的转换设备方可进行。例如,数字扫描仪、数字相机,缩微胶卷、纸质文件通过扫描可以形成数字图像,数字图像再通过光学字符识别 (OCR)系统,可进一步由图形文件转化成字符文件,字符文件可通过关键词达到全文检索等。同时,可以以打印在纸上、印在胶片上等多种形式进行输出。 ③数字图形,数字图形是根据一定购算法绘制的图标,包括几何图形和把物理量如应力、强度等用图标表示的图形,它是以图画的形式表示数据内在联系的图表、曲线图等,通常一些技术图纸是用数字图形表示。 ④数字语音,数字语音是指计算机对人的声音进行识别后,再将人的声音变成“O”或

78

Page 79: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

“1”的符号进行传输或存贮,而由此形成数字语音文件。例如,语音邮件。 ⑤数字视频,数字视频是转换成数字形式的可视材料。许多录像材料通过帧捕获器或影视影像数字卡可将模拟的录像材料转换成以数字方式存储的影像信号。数字视频要求较大的存储空间。如果,分辨率提高,存贮空间更要加大,因而一般使用光盘或海量磁盘存贮。

信息资源数字化流程见下图(一):

数字化信息资源的传播主要有两种途径,一是脱机介质传播:二是网络在线传播。脱机介质传播是以磁盘、硬盘、磁带、光盘等介质传播数字化信息资源。网络传播则是通过计算机网络传播数字化信息资源。这两种传播方式,各有其长。以光盘为介质的传播方式,简单方便,容量巨大,是电子出版物的主要传播形式。在国内市场,一些大型光盘数据库,如《人民日报 50年》、中国人民大学《复印报刊资料》、《清华学术期刊》、《中国大百科全书》、《二十四史》、《四库全书》等等都已有数字化全文文献光盘。二次文献,如《北京图书馆国家书目》、中国人民大学《复印报刊资料索引》、《上海图书馆社科篇目索引》等等也都有数字化二次文献光盘。越来越多的传统文献出版单位,在出版印刷品的同时,同步出版电子版光盘。通过因特网传播数字化信息资源,由于技术日臻完善,操作越来越简便,更由于它的实时性、全球性,这种方式的优越性明显大干脱机介质传播,正成为数字化信息资源传播的主流。

四.数字图书馆资源库建设的具体步骤  资源库的建设可大致分为下面几个步骤:    1、编写脚本    对于资源内容的建设者来说,首先应当编写脚本,脚本要包括以下内容:    (1)搜集、整理素材    进入数字图书馆的资源应是高价值的。因此,合作者首先要确定需要数字化的的资源对象。例如,国家图书馆在中华文明史资源库的建设中,可以将现藏古籍善本中有价值的藏品整理出来,按类目列出清单,清单中要有资源的内容和它的载体形式。    (2)素材的编辑    数字图书馆资源内容的特点之一是以多种媒体表现。因此,优先采取用户易于接受的超媒体表现形式十分重要。为成功的建造资源库,需要很好的对所选素材进行编辑,包括收集相关素材、编写解说词、认真比较筛选图片、影象等。    (3)为确定元数据的格式,提出数据结构要求,供软件人员设计文献类型定义(DTD)。    在脚本编写时,还要确定元数据的格式。元数据分描述性数据、管理性数据和结构性数据。它包含了定位

79

Page 80: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

标识、书目记录、再制作品的结构化文件头等内容。    2、资源内容再制作    根据不同需求,数字图书馆的文本、图片和影象等一些原件通常要制作成几种类型。选用哪种用类型要根据用户访问的便捷、使用的效果、制作的费用、使用的标准以及占取的空间、档案的管理等综合因素考虑。    对于书刊、手册、手稿等文献资料的数字化采集,一般首先进行图象扫描。为方便用户通过主题、关键词和分类进行查找,还可将图象用OCR识别转成电子文本,但这样做会加大加工成本。所以,究竟用哪一种方式,应视情况而定。我们认为对不同资源的内容应将两种情况相结合,可以兼顾方便读者查询、减少存储空间以及降低成本等。    对于图片的处理,一般分为预览图像(略图)、服务图像、参考图象和档案图象。预览图象是很小的,它可以随条目记录呈现,用户可根据需求选择调用高质量图象。服务图象比预览图象分辨率高,兼顾了传输速度,经过压缩比档案图象分辨率低。参考图象是为研究人员提供的高质量图象。档案图象则是留做存档用的未经压缩的原图,可以提供给出版部门使用,也可以在更新图象格式时,供重新格式化使用。由于声音和影象的动态文件很大,目前,国际上还没有很成熟的文件格式,通常采用的是"可下载"文件和"流式文件"。"可下载"文件在播放前必须下载到用户本地,处理起来既耗时间又浪费存储空间。相比之下,"流式"文件采取的是边传输边播放,节省了传输时间和存储空间。但在并发用户量增大时,在保真度或分辨率上"流式文件"有明显损失。    数字图书馆内容的再制作常常依靠在这方面有经验的专业公司和图书馆等单位的加工部门共同完成。国家图书馆为此专门成立了文献数字化中心,对馆藏文献进行扫描、OCR识别等。    3、对资源内容标引经过再制作的数字文件,要由标引人员进行标引。包括分析内容,给出主题分类,并使用基于 SGML/XML

开发的资源加工系统软件对资源内容置标。SGML标准包含三个部分,SGML声明、文献类型定义(DTD)和被置标的文件。SGML声明中指定了应用中的字符与定位符,DTD定义了标注结构的语法。由于数字图书馆资源库的内容形式多样化的特点,许多DTD都要根据资源内容的结构及特点专门编写。DTD

的设计需要由脚本的编写者提出要求,软件人员加以实现。    4、质量检查    加工后的文件还要进行质量检查。其中包括对资源再制作的效果,如声音质量、图象大小、图象质量等以及标引的正确性等。不合格的加工产品还要返工。    5、归档当信息资源加工工作全部完成后,还需要将全部数字化文件归档,存入资源库。    6、元数据抽取    数字图书馆资源库中的元数据可分为三大类,即:描述性元数据;结构性元数据和管理性元数据。元数据抽取如果用人工来做,是十分麻烦的。我馆演示系统元数据的抽取由资源加工子系统的软件自动完成。

五.信息资源的数字化技术

数字化技术是指把原始的声音、文字、图像等信息用间断的电磁脉冲(用 0和 1来代表)来获取、存储、处理和传递的技术。信息资源数字化的关键技术有数字化信息生成技术、多媒体数据库技术、数字信号处理技术、数字压缩/解压技术、数字存贮技术、数字音/视频处理技术、数字通信技术、数字图书馆技术、数字化有关标准。一、数字化信息生成技术

80

Page 81: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

数字化信息的生成有键盘录入和非键盘录入两种方式。非键盘汉字录入技术包括手写识别技术,印刷文稿扫描与识别技术,语音识别技术。 手写识别技术的核心是识别算法。目前市场上有一定规模和经国家科委进行过测的算法有汉王公司的汉王识别核心,摩托罗拉公司的慧笔识别核心,清华的文通笔和紫光笔识别核心等。 扫描仪可将印刷型稿件作为一种图像迅速输入计算机。扫描仪有单色和彩色,台式和手提式,SCSI、EPP、USB接口之分。扫描时,首先要确定图像的分辨率,分辨率与文稿使用的宇体字号有关。分辨率以每英寸的像素数表示,单位为 DPI。分辨率高有利于提高文字识别的准确度,但存在处理时间长,消耗磁盘空间大的缺点。文稿本身的质量(光洁度),扫描仪的光源亮度以及扫描仅的特征曲线对录入图像质量均有影响。文稿扫入计算机后,通常以.TIF图像格式文件存盘,以供OCR识别软件处理。 OCR是“光学字符识别”软件。识别的一般步骤为:(1)打开文本图像文件,并对图像进行编辑,清除杂点,校正文字的方位;(2)划分识别区域,指定识别顺序:(3)文字的识别处理,按照识别区域自动拆分单字并进行识别,自动建立字符与图像的对应关系,生成识别文本;(4)对识别文本进行编辑。 正确识别率是 OCR性能的重要指标之一,目前,对于中等以上印刷质量的正确识别率达98——99%,高等印刷质量的正确识别率达 99—190%,低等印刷质量的印刷品,正确识别率也大于 95%,而对于规则书写体的正确识别率为 75—90%。由此可见,原文本的印刷质量对正确识别串有影响,规则手写体的识别串较低,有待于进一步完善与提高。二 多媒体数据库技术 文本、图像、音频、视频等信息资源数字化处理后,常以多媒体数据库(MDB) 的逻辑结构实现存储,并以多媒体数据库管理系统(MDBMS)实现管理。 多媒体数据库系统的实现技术有三种:扩充关系数据库的方法,面向对象的多媒体数据库方法及超文本或超媒体数据库方法。 传统的关系型数据库系统(RDBMS)只能描述宇符和数字等符号媒体信息,无法描述图像、动画、视频、声音等多媒体信息。扩充关系数据库的方法就是在 RDBMS的基础上引入新的数据类型以描述多媒体信息。如在 Paradox for Windows中增加了大二进制对象 Blob(可存储视频、声音、动画等多媒体信息)和图形( Graphic)对象(用于存储 BMP、GIF、TIF、PCX类型的图象)等。 面向对象的多媒体数据库 OOMDB( Object Oriented MDB)从多媒体的数据模型入手,采用面向对象中对象、方法、属性、对象类的层次结构和继承特点来描述多媒体的数据模型。其关键技术有 OOMDB 的系统结构,OOMDB 系统的存储结构与存取方法和版本控制 。OOMDB的系统结构取决于其功能模型。OOMDB系统的存储结构与存取方法主要有二:一是基于现有的 RDB的存储结构方法,二是重新设计更符合多媒体对象特点的存储方法,如 EXODS系统的 B+树索引结构和适合于多维空间对象的 R+索引结构。实现版本控制的有效技术是只保留一个完整的版本和同一对象各版本的“差”,在实际使用财,根据完整版本和对应的差值求出所需版本。 超文本采用非线性技术组织和表示块状信息。结点(Node)和链( Link)是超文本的两个核心。利用超文本实现MDBMS的相关技术有超媒体问题,多媒体检索问题,版本控制问题和标准化问题。超媒体是超文本的多媒体化,由此引起的问题有如何用结点和链来组织和表达多媒体及其相互关系(包括时空关系)以及如何实现媒体闻尤其是时基类媒体的同步和协调等,解决的方法是对节点和链进行扩充,使其支持除文本外的多媒体信息的描述及连接。多媒体检索包括内容查询和结核查询两种,内容查询采用的常用方法是相似性匹配,结构

81

Page 82: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

查询是找出与给定模型相匹配的子网络,以确定由此结构而构建的语义信息。实现版本控制的主要方法有层次结构冻结、链技术等。标准化包括数据交换格式与协议、用户接口等。 目前,对于MDBMS的研究处于初级阶段,很多技术问题还处于探讨之中。 三、数字信号处理技术 数字信号处理(Digital Signal Processing,DSP)技术是数字技术中的核心技术,是近年来成效最为显著、获得应用最快、在高新技术领域中占有重要地位的新兴技术学科,已广泛应用于音视频处理、通信、工业控制、航空航天、生物医药、自动化仪器仪表等众多领域。目前 DSP产品范围己十分广泛,主要可分为两大类,即:特性化可编程类 DSP器件和“硅算法”类 DSP器件。 特性化可编程类 DSP器件适用于各类算法的信号处理,编程比较复杂,但具有极大灵活性,当进行功能不完全确定的电路设计时,可选用这类器件。目前市场上以 TI公司(Texas lnstruments,美国德洲仪器公司)TMS320系列和motorolaSP56000、DSP96000系列为主。这两大系列应用各有侧重,TMS320系列 DSP器件应用主要侧重于电视图像、图像识别、图像与控制混合类的信号处理:DSP56000系列则侧重于数音频、通信类的信号处理,DSP96000系列则主要应用于图像类的信号处理。“硅算法”类 DSP的特性在于没有太多指令,而把功能赋予硬件系统,相应地编程简单,但灵活性受到限制,只能完成一种或几种专门的信号处理运算,现在已推出专门用于熙T(快速传输里叶变换)、滤波、卷积、相关等专用芯片,如 Inmos A109系列和 PIessey MS2914等属于此类器件。 如今一般的 DSP处理能力为 100MIPS(百万条指令/秒),而采用 ULIW(甚长指令字)结构的 DSP,其处理能力已达到 1600MIPS。结构上,多片 DSP并行结构的多媒体芯片和微控制器嵌入式 DSP芯片也己问世。 未来 DSP将在提高性能、加快速度、降低功耗、缩小体积和降低成本等方面取得更大的进展,控制的灵活性将继续提高,主要向两个方向发展:控制多样化和处理专用化相结合;继续研制开发新型低成本 DSP器件系列产品。

四、数字压缩技术 数字化后的音频和视频信号存储空间太大、冗余度太高,其传输和存储都很困难。尤其是视频信号的数字化,一直是数字技术中的难题。这一难题由于压缩技术的突破而获得解决。压缩技术可以检测并消除数字信号中的冗余度,使压缩后的音频和视频的传输及存储性能大大提高。 音频压缩包括语音和音乐两种。语音信号目前最好的技术可压缩约 8倍,数据率降为8Kbps,仍保持原语音质量,采用的压缩编码有 CELPC、MPLPC等。音乐 信号目前已实现压缩 7倍,主观音质没有下降,采用的压缩编码有“MUSICAM”及 AC一 3、AC一 2系统。其中“MUSICAM”对每个声道速率可压缩至 96K—192Kbps,有很好的音质,AC一 3系统在 128Kbps速率时也获得高质量音乐效果。 视频的压缩是数字视频技术的关键,由于存储 1 秒钟运动视频图像就需约 30MB存储空间。视频压缩方法总体上可分为两大类,即:无失真压缩和有失真压缩。无失真压缩编码包括 Huffman编码、算术编码、行程编码。有失真压缩编码包括预测编码、插值外推以及量化等。 静止图像压缩技术主要是对空间冗余信息进行压余,面对动态图像来说,除对空间冗余信息进行压缩外,还要对时间冗余信息进行压缩。目前已形成三种压缩标准: (1)JPEG(Joint Photographic Experts Group)标准:用于连续色调、多级灰度、彩色/单色静止图像压缩。

82

Page 83: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

(2)H.261标准:主要适用于视频电话和视频电视会议。 (3)MPEG(Moving Picture Expert Oroup)标准:主要是针对动态图像压缩,已推出MPEG—1,2,4,7。其中MPEG-1用于传输 1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码,经过MPEG—1标准压缩后,视频数据压缩率可达 1/100-1/200,音频压缩率可达 1/6.5。MPEG-2主要针对常规数字电视和高清晰度电视(HDTV),传输速率为10Mbps,与MPEG-1兼容,适用于 1.5b60Mbps甚至更高的编码范围。MPEG-4标准是超低码率运动图像和语言的压缩标准,用于传输速率低于 64Mbps的实时图像传输,其应用范围是无限窄带可视通信以及可视电话。MPEG-7标准是为多媒体对象提供摇述手段,以支持多媒体信息的检索,其实现的关键技术在于建立多媒体数据库和相应的搜索引擎之间的接口。MPEG_1、2及 4着重研究音/视频的高效压缩编码算法,而MPEG_7对多媒体对象的存储、编码不作专门讨论,而是将研究的重点放在对多媒体对象的特征提取、数据库的类层次划分、不同数据类型(诸如人物动作、背景、配音、主题思想等)之间的有机联系上。五、数字存贮技术 目前,数字化信息存贮的物理介质有磁存贮、光盘存贮和半导体存贮三种。 作为计算机重要储存器件之一的硬盘 HDD),接内部盘片分有:5.25,3.5,2.5和1.8英寸(后两种常用于笔记本及部分袖珍精密仪器中,现在台式机中常用 3.5英寸的盘片); 如果按硬盘与电脑之间的数据接口,可分为两大类:IDE接口及 SCSI接口。SCSI可以划分为 SCSI-1、SCSI-2(SCSI Wide与 SCSI Wind Fast)和最新的 SCSI-3,目前最流行的 SCSI版本是 SCSI-2。Enhanced IDE接口的硬盘除了容量不断提升之外,数据转输速度也开始紧追在 SCSI接口的硬盘之后(66Mbytes/sec与 80Mbyte/sec)。除此之外,HDD还有转速(从 3600RPM, 4500RPM, 5400BPM, 7200RPM 到 10000RPM)、数据缓 冲区 ( Cache Memory)、S.M.A.R.T技术、ECC错误修正码( Error Correction Code)技术等。 光盘存储系统中,除数字音频存贮媒体 CD、DAT(数字录音带)、MD(小型磁光盘)外,又出现了 VCD、CD—ROM这样的数字视频存贮媒体以及大容量、高画质和高音质的 DVD存贮媒体。CD系列产品有只读式 CD产品(包括 CD-A(Audio)、CD—ROM,Video-CD( VCD))、可录 CD(CD-R)和可擦重写 CD( CD-RW)。DVD 系列产品有只读 DVD,DVD-R和DVD-RAM。几年来,光存储技术有下述三方面明显的趋势:其一是多功能,从只读式 (ROM)到可记录 ( R),再到可擦重写或随机存储(RW,RAM);其二是提高存储密度—,从 CD-ROM 的 680M 到单面单层的 DVD-5(4.7GB)、双面单层的 DVD—10(9.4GB)、双面双层 DVD-18(17GB):其三是提高数据传输率( daat rate)和缩短存取时间(accesst time)。我们目前还处于 CD系列时代,正向 DVD时代过渡。目前的研究集中于高密度 DVD( HD—DVD)。超高密度 SHD( super high density)-DVD是要实现纳米级的光存储,可采用近场光学存储和数字全息光存储技术。 半导体存贮芯片以其体积小、功耗低、数据传输率快的特点而得到广泛应用。目前主要有 IC卡、EEPROM(电可擦除或可编程只读存储器)或 FLASH存储器、视霸卡。 目前正在研究开发的存储新技术有:联想记忆存储介质、智能存储器、约瑟夫逊结 RAM、全息存储器、单电子存储器、质子存储器、氢原子存储器、蛋白质分子存储器、光电学存储技术和三维光存储器等。六、数字化音/视频处理技术 数字化视频技术包括数字视频的获取技术、数字视频的输出技术、在MPC上数字视频数据的处理与编辑技术。

83

Page 84: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

数字视频的获取技术。数字视频的来源主要有三种:一种是利用计算机生成的动画;另一种是把静态图像或图形文件序列组合成视频文件序列;最后一种,也是最主要的一种是通过视频采集卡把模拟视频转换成数字视频,并按数字视频文件的格式保存下来。 数字视频的输出是数字视频采集的逆过程,也即把数字视频文件转换成模拟视频信号输出到电视机上进行显示,或输出到录像机记录到磁带上。与视频聚集类似这需要专门的设备来完成数字数据到模拟信号之间的转换。根据不同的应用和需要,这种转换设备也有多种。目前已开发出集模拟视频聚集与输出于一体的高档卡,它插在 PC机的扩充糟中,可以与较专业的录像机相连,并提供高质量的模拟视频信号采集和输出。这种设备可以用于专业缀的视频聚集、编辑及输出。另外还有一种称为 TV 编码器( TV Coder)的设备,它的功能是把计算机显示器上显示的所有内容转换为模拟视频信号并输出到电视机或录像机上。 数字视频的编辑。有许多应用程序都具有编辑 AW(Audio Video lnterleave)文件的功能,这类程序一般被称为数字视频编辑器或简称为视频编辑器。能够编辑数字视频数据的软件也称为非线性编辑软件,当然这是相对于传统的磁带和电影胶片的线性编辑而言的。数字视频编辑器的范围很广,从功能非常简单的软件到非常专业化的软件都有应用。 Adobe 公司开发的 Premiere是微机视频编辑软件中功能较强的一种。 数字视频的几种主要格式有 MPEG AVI和 MOV。 MPEG采用有损和不对称的压缩编码算法,详细地说明了视频图像的压缩和解压缩方法,以及播放 MPE9数据所需的图像与声音的同步。MPEG标准包括三个部分:MPEG视频( Video)、MPEG音频(Audio)和MPEG系统( System)。AVI是一种音频视像交插记录的数字视频文件格式,在 AVI文件中,运动图像和伴音数据是以交织的方式存储,井独立于硬件设备。这种按交替方式组织音频和视像数据的方式可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。构成一个 AVI文件的主要参数包括视像参数、伴音参数和压缩参数等。 AVI文件格式和 VFW软件是 Microsoft为 PC机设计的数字视频格式和应用软件, MOV( Movie digital video technology)的文件格式及应的视频应用软件 Apple’s QuickTime for Macintosh 是为 Apple 公司的 Macintosh设计的。 数字视频的三种数字视频文件(MPEGO、 AVI和 MOV),具有不同的格式,不同的压缩编码算法和不同的特性,必须要有相应的播放软件才能播放对应格式的视频文件。 音频技术包括音频的记录和产生方式(包括模/数、数/模转换)、数据压缩和声音合成、音频数据的编辑处理等。把模拟信号转换成数字信号的过程称为模/数转换,它主要包括(1)采样:在时间轴上对信号数字化;(2)量化:在幅度轴上对信号数字化;(3)编码:按一定格式记录采样和量化后的数字数据。脉冲编码调制 PCM( PulseCode Modulation)是一种模数转换的最基本编码方法, CD—DA采用的就是这种编码方式。 对音频信号的处理方法大致可分为两类:一种是数字音频方式,另一种是分析合成的方式。电子合成音乐——MDI(Musical Instrument Digital Intedace)是乐器数字接口的缩写,泛指数字音乐的国际标准,它是音乐与计算机结合的产物。MIDI不是把音乐的波形进行数字化采样和编码,面是将数字式电子乐器的弹奏过程记录下来,如按了哪一个键、力度多大、时间多长等等。当需要播放这首乐曲时,根据记录的乐谱指令,通过音乐合成器生成音乐声波,经放大后由扬声器播出。 WAVE文件和 MDI文件是目前计算机上最常用的两种音频数据文件。数字音频的技术指标有:采样频率、量化位数、声道数、编码算法、数据率及数据文件格式( WAVE、MP3及 MIDI)等数字视频处理技术大大提高了传输和存储性能、图像的清晰度和质量以及交互功能。因此目前模拟视频正逐步被数字视频所取代,而发展最为迅速的两大视频产品是亚洲的 VCD,DVD和美国的 DSS(数字卫星系统)。数字视频技术促进了消费类电子、通信和计算机领域的相互融合。在消费类电子市场,除 VCD和 DVD,数字照相机和数字摄像机也正得

84

Page 85: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

到广泛应用,数字交互式电视将随 DSS和 Internet的发展而形成巨大需求。在通信市场,除 DSS外,新的应用领域还包括 500个频道的有线电视、可视电话等。在 PC市场中,用户级视频编辑及光盘的应用,多媒体笔记本电脑的应用,将促进 PC市场的进一步发展。 数字音频技术促进了通信领域中数字移动电话、无线寻呼、无绳电话及移动数据通信业务的迅速发展。数字音/视频处理技术将消费类电子产品的性能、功能和应用范围推向新的高度,使其产品出现了巨大的市场需求,为我们发展数字式消费类电子产品创造了难得的发展机遇。七、数字通信技术 数字通信技术主要包括交换技术、传输技术、公用传输系统技术和宽带用户接入网技术等。 (1).交换技术。在实现计算机互连通信时,按网络采用的交换技术分类有三种:线路交换、分组交换和报文交换。目前,计算机网络从交换技术上看,线路交换和分组交换是两大主流。线路交换主要用于语音通信,分组交换主要用于数据通信。 (2).传输技术。目前,网络中所采用的传输介质有双绞线、电缎、光纤、无线介质和卫星通信等。 双绞线分为屏蔽双绞线和无屏蔽双绞线。电缆包括多芯电缆、同轴电缆、对称电缆和海底电缆等。光纤通信具有载波频率高、通信容量大、传输损耗小、不受外界电磁场干扰、体积小、重量轻等优点,目前正为计算机用户广泛采用,是未来计算机通信领域中颇具竞争性的一种传输介质。无线介质通信包括无线电通信、微波通信、红外通信等利用空间传输电磁波技术实现的通信。卫星通信适合长距离干线或幅员辽阔的地区。一般地面线路的成本与距离成正比,而卫星通信的成本与距离无关。 目前,从各种传输介质和传输系统购各自特点和应用看,光纤通信和卫星通信将是今后通信传输介质的应用主流,而新型无屏蔽双绞线在一定范围条件下仍将会得到广泛的应用。 (3).公用转输技术 公用传输技术包括:X.25协议、帧中继、ISDN 综合服务数字网、千兆快速以太网( Fast Ethemet)技术、ATM(异步传输模式)技术、B-lSDN(宽带综合业务数字网)、大容量无线网络技术和空间信息高速公路( SPacevrP)技术等。 X.25协议是目前应用较为广泛的一种传输协议。它规定了网桥和路由器等通信设备如何在连接线路上打包和选择路由。帧中继是一种( ISDN)技术的变形,是一种高速的分组交换技术。 ISDN试图通过一个完整的数字通信系统来满足广泛的用户通讯需要。当前,窄带综合业务数字网(N-ISDN)己成为世界各国电信网络发展的重点和目标。N—ISDN网提供的商用速率和接口标准有两种:一种是速率为 144KbPS(千比特/秒)的基本接口,可在一条用户电话线上同时接 8个终端,有 3个终端能同时工作,可向用户提供电话、数据、传真、电报、可视图文、可视电话/静止图像等业务;另一种是速率为 2.048MbPS(兆比特/秒)的基群接口,主要用于连接用户小交换机、集中交换机、计算机等大信息量的传输。ISDN作为一根连接世界各地数百万台 PC机、小型机和大型机的管道,将在很多方面替代传统的局域网。 千兆快速以太网较原来的快速以太网速度提高 10倍。达到 1000MbpS。 ATM (异步传输方式)技术作为网络技术的突出特点是可以提高传输和交换速率以及在同一网络上实现电话、语音、数据通信:另外,它还可以通过多路复用技术,实现按需分配带宽,从而最大限度地提高性能价格比。 B—ISDN技术建立在 SONET、SDH、ATM等技术之上,它同时支持面向连接和面向无联接的网络服务,可支持多媒体业务、局域网的互联、大容量数据文件传送、HDTV视频图像传送、三维图像传送等。

85

Page 86: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

大容量无线网络技术是以蜂窝式移动数字通信网实现个人数据通信的技术。美国微软公司与美国移动通信公司已开始联合投资 90亿美元开发卫星蜂窝网,建立 21世纪的个人数据通信。 Sp——W是休斯公司正在筹划的空间信息高速公路,拟发射三颗同步卫星,采用大功率的跳点波束、星上交换和 Ka波段,提供 X-Gbps的空间通信信道,对稀疏路由和跨洋通信具有重要意义。Teledesic公司也在规划“全球 Internet”通信卫星计划,其数据通信信道速率可达 1.249。 (4).宽带用户接入网技术 宽带用户接入网改造或重构传统用户接入网的实现,使其具有宽带、双向和传输多媒体信息的能力,是大势所趋。正在研制的方案有:ADSL(排对称数字用户线路)、HDSL(高比特率数字用户线路)、CableModwt电缆调制解调淑、支持光纤到路边( FITB)或光纤到家庭( FTTH)的 ATM无源光纤网(APON)、基于蜂窝通信的本地多路分布式业务( LMDS)等。 未来的传输网络将是以光纤通信网为主体,结合卫星通信、无线通信的宽带化、综合化、个人化、智能化的新型通信网,进入一个全数字传输的通信网络时代。八、数字图书馆技术 数字图书馆( DL—Digital Library)是众多技术的集成。除前述的各种技术外,还包括 DL的系统模型,多媒体网络和通信技术,多媒体同步模型等。 (1)数字图书馆的系统模型。数字图书馆的系统模型划分为四个部分:客户/节点机、多媒体网络、图书馆中心服务器和媒体(或对象)服务器,即采用客户机/服务器模型。客户/节点机一般是一个多媒体计算机,是为了保证用户能有效地查询和使用数字图书馆中的多媒体信息,其软硬件主要包括:多媒体 DBMS前端应用程序,多媒体操作系统,网络通信协议,网卡驱动程序和多媒体 I/O外部设备:图书馆中心服务器管理数据和全局数据宇典的索引和查询:多媒体服务器用于创建数字化的对象、管理多媒体数据库并完成多媒体数据的集成和同步等过程。客户/节点极、图书馆中心服务器、媒体服务器构成信息传递的三角形。客户/节点机通过向图书馆中心服务器发申请来获取多媒体数据,图书馆中心服务器将此申请转发 给多媒体服务器,当多媒体数据经过多媒体网络到达客户的时候,就实现了图书馆对媒体数据的发布。 (2)多媒体网络和通信技术。在 DL系统中,分布式多媒体信息的存取、查询、检索和表现要求具有服务质量保证( QoS)的通信网络。QoS技术指标包括网络的吞吐量、带宽、允许的延迟、抖动( jitter)和差错率等参数。设计一种综合的协议体系结构和高效、大容量、宽频带网络并从工程上实现满足上述技术指标要求的通信网络是建立 DL系统的基础和关键。ATM具有许多适于多媒体应用的优点:为每种媒体类型(音频、视频、图像和文本等)的通讯通道提供了单一的网络接口:提供应用程序需求的高质量带宽的适应能力;提供不同数据类型的灵活姓:提供动态带宽分配、数据的可变速率传输;提供多个视频业务共享信道及由用户控制的质量稳定的网络特性。作为一种有效的宽带多媒体传输技术,ATM必将成为高速网的重要发展方向。 ATM是一种面向连接的协议,通过 ATMAPI的编程来控制 ATM网卡完成建立连接阶段和数据传送阶段,实现三个功能:数据包的包装和发送、地址解释、多点广播组的管理。包括对 ATM的信元、ATM适应层(A AL3/4 层,AAL5 层)的处理和地址转换。从而向 ATM交换机发送用户需求的 QoS参数,对 文本、图像、视频和音频数据采用不同的 VC,同时为每个 VC分配不同的 QoS类型(包括三种:“尽最大力”类型、保证突发类型和保证流量类型),以保证不同媒体所需的不同优先级的传输质量。在通信控制算法中,由于预防性拥塞控制(呼允许控制和使用参数控制算

86

Page 87: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

法)不能获得高性能的缺点,系统采用基于 Q o S三种类型的动态自适应拥塞控制算法,媒体数据流通信(如视频和音频)仅受分配在一个呼叫建立上的峰值速率带宽的控制。“尽最大力”类型在处理传统的计算机通信服务(如 TCP/IP)中曾提出了一种自适应端一端峰值速率控制与链路—链路后压控制相结合的方案,该系统用反馈信息进行速率控制实现自适应拥塞控制算法,同时将后压控制和基本速率的控制相结合用来解决使用基于速率控制时出现的超载状态中信元丢失问题。 目前的 DL系统模型仅局限于 ATMLAN仿真实现环境,成熟的连接和通信控制算法MTP(多媒体传输协议)都需进一步研究。 (3)多媒体同步模型。为了实现DL系统中分布式多媒体信息的查询、表现和存储,多媒体同步是其关键技术之一。DL系统中集成了大量不同的态特性的媒体;时间相关媒体(音频、视频和动画)和时间无关媒体(文本、图形和图像),系统不仅需要提供对多媒体的 I/O支持,而且还要提供在客户/服务器之间进行多媒体传输时的同步支持。多媒体对象的正确表示称作多媒体同步。关于多媒体同步的研究分为两个问题:如何表示多媒体对象之间的时态关系——多媒体同步模型问题;如何保证时态关系的正确执行——多媒体同步机制问题。国际上关于多媒体同步模型的研究分为时间线模型、层次模型和参考点模型。 除此之外,DL还涉及到了异种文档转换与标准、异种操作平台互连、用户接口设计技术、数据仓库技术、数据挖掘技术、数据推进技术检索技术、信息安全及权益管理技益公里技术等。 目前国际上有影响的数字图书馆是 IBM数字图书馆,其结构是基于一个三角形的客户的客户机/服务器模型,其组成部分有 LibraryServer,一个或多个多媒体 ObjectServer,以及一个或多个 Client。其核心是 LibraryServer。该服务器运用 IBMDB2或 Oracle数据库,管理 IBM数字图书馆的目录信息,运用各类检索技术定位存储对象,提供安全查询,以及与 ObjectServer。通信。数据内容存内容存于 Object Server。ObjectServer支持 DASD附件及其他媒体设备,并可分布于企业网络,以便于用户查询。最终用户可客房机上直接接收所要求的信息,无论该数据存于何处。多台客户机可与 IBM数字图书馆系统中的 braryServer及 Object Server相连,利用测览器访问 IBM数字图书馆。多语言开发工具可帮助您开发 IBM数字图书馆应用程序,它们支持各类 APIs,包括 Java、C++、C及 Active X。IBM数字图书馆具有五项综合功能可对多媒体对象进行收集,编制,存储和管理,检索查询,保护及分布。 DL是计算机技术、通信技术、互联网技术、多媒体技术、数据存储技术等发展到一定阶段的产物。一方面,这些技术的发展将最终有可能使全世界图书馆都实现协作与资源共享,形成一个空前规模的“世界图书馆”,成为涵盖人类几乎所有知识的超级信息资源;另一方面,DL的发展也必然推动相关技术的进步。 九、数字九、数字化有关标准 (1) Dublin Core Metadata Element Set “都柏林核心“( Dublin Core)是目前功能最全的元数据标准草案。它是一种简单的信息资源描述格式,起始于 1995年 3月,在美国俄亥俄州的都柏林召开的第一 届元数据研讨会上,由美国的图书馆界、计算机界和博物馆界专家组成的委员会共同研制的标准。在此之后,国际上又召开五次会议,使“都柏林核心”更趋于完善。 由于它简练、易于理解、可扩张及能与其它元数据形式进行桥接等优点,1998年 9月,INTERNET工程专题组( IETF)将其作为一个正式标准予以发布。 都柏林核心是为网络资源或者说数字资源的著录而制定的,它由 15个数据单元(element)组成,其中内容 7个元素:题名( Title)、主题词和关键词( Subject)、内容描述( Description)、

87

Page 88: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

资源类型(Type)、来源(Source)、关系(Relation)、范围(Coverage);知识产权 4个元素:作者或创造者(Creator)、出版者(Publisher)、其他责任者(Contributor)、权限管理(Rights);例示 4个元素:日期(Date)、格式(Format)、资源标识(Identifier)、语言(Language)。(注:上述括号内为标识)。 Dublin Core的应用方式有 2种,其一是著录数据与著录对象存在于不同的文件中,利 用 URL等方式联接:其二是著录数据与著录对象同时包含在一个文件中,在这种 情况下,如果是 HTML文件,著录数据就要放在“头标(<HEAD>/<\HEAD〉, 部分,不能放在“正文(<body><\body>)”中与著录对象混同。 (2) The Standard Generalized MarkupLanguage(SGML) SGML(标准通用置标语言)是国际标准化组织( I S O)在 1986年 10月颁布的信息处理标准。目前为止,它己发展成为了一个具有 12个国际标准的系列标准体系。其中包括文献交换格式( SDIF),标准音乐描述语言( SMDL),超媒体/基于时间的结构化语言( HY Time),图书、连续出版物、论文和数学作品的文献类型定义( DTD),标准页面描述语言( SPDL),文献类型语义和规格语言( DSSSL)等等。SOML是一种信息处理的逻辑方法,它用中性办法置标,因而与未来系统、设备、文种及应用无关。它最早被使用于西方出版业,九十年代中期以后,已被发达国家广泛使用于大型数据库及数字图书馆建设中。目前用于因特网上的 W W W系统的 H T M L语言,就是其一个最简单的应用。美国国会图书馆于 1994年开始学习研究将 S G M L的一种应用 T E I用于“美国回顾”( A merica Memory)的由光盘版向数字图书馆资源库的转移再建中的标引,并创立了用于档案界的 EAD。 一个 SGML由以下几个部分组成:① SGML声明,设定基本情况;②定义 DTD文档类型,设定标记语言结构的语法;③描述用于标记的语义规格说明,做出了 DTD表达的语法限制;④包含数据和标记的文档实例。 (3) Extensible Marup Language——XML W3C对 XML进行了如下描述:“Extensible Markup Language,缩写为 XML,描述了一类被称为 XML文档的数据对象,并部分描述了处理它们的计算机程序的行为。XML是 SGML 【ISO 8879V1】)的一个应用实例或一种受限形式。从结构上说,XMI文档顺从 SGML文档标准。”比起 HTML来,XML继承了 SGML的三大优点:①可扩展性,信息提供者可以针对自己的应用程序定义新的标签和属性;②结构化,文档结构可以嵌套到任意复杂的层次;②确认化,应用程序不用应用外部定义的词汇就可以快速的检查 XML文档的结构正确性。 XML文件由称为实体的存储单元组成,实体可以包含己析数据或未析数据。己析数据由字符组成,其中一些字持组成字符数据,另一些字符组成标记。标记中包含了对文件存储格式(storage layout)和逻辑结构的描述。XMI提供了一种机制用于约束存储格式和逻辑结构。 XML 主要有三个要索:DTD(Document Type Declaration,文档类型声明 )或 XML Schema( XML 大纲 )、 XSL( eXtensible Stylesheet Language ,可扩展样式语言 )和 XLink( eXtensible Link Language,可扩展链接语言)。DTD 和 XML大纲规定了 XML 文件的逻辑结构,定义了XML 文件中的元素、元素的属性以及元素和元素的属性之间的关系;Ngmespace(名域)实现统一的XML文档数据表示以及数据的相互集成;XSL是用于规定 XML 文档呈现样式的语言,它使得数据与其表现形式相互独立;而 XLink将进一步扩展目前 Web上已有的简单链接一 World Wide Web Consodium (4) Z39.50 Z39.50协议是关于信息检索的美国 ANSVNISO标准和国际 ISO23950标准,它属于 ISO的 OSI( Open System lnterconnection)参考模型的应用层协议,其目的是实现网上多个数据库检索,规范查询格式,简化检索过程,实现异构机型和不同图书馆系统之间的通讯。该

88

Page 89: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

协议最初源于美国国会图书馆、加州大学图书馆和华盛顿州图书馆的“系统互联项目”。目前,该协议己发表 3个版本,即 1988年、1992年、1995年版本。 Z39.50主要内容有两大部分。一部分是检索服务的内容,另一部分说明了信息检索服务所使用的协议。检索服务的内容只包括协议所支持的应用服务所具有的功能,而不包括这些功能在某个特定系统内部的实现方法。检索服务协议在 OSI基本参考模型中所处的位置是应用层,即它是一个应用层协议。协议的内容包括协议控制信息定义、信息交换规则和实现协议必须具备的环境。 该标准为信息检索提供了七大服务功能,分别是初始化 ( Initialization Facility), 查找(Search Facility),索取( Retrieve Facility),结果集删除(Result-set-delete FaciIity),访问控制(Access Control FaciIity),记帐/资源控制( Accounting/Resource Control Facility),终止( Termination Facility)。Z39,50的全部服务都通过一系列参数表予以说明。 Z39.50协议在 1988年出台时的初衷是为检索书目信息而提出的 OSI应用层协议,主要满足网上检索和索取 USMARC格式的书目记录。近几年,基于 Z39.50的 Client/Server结构应用软件和系统不断推向市场,它的应用范围也扩展到了其它类型和其它格式的信息,如全文数据、文摘、索引、校园信息、新闻服务、医学和科技信息、图像等。 除了上述标准之外,还有如下标准: 资源描述框架(RDF)模型与句法( Resource Description Framework Model and Syntax 1.0)。http://www.w3.org/tr/wd-rd-syntax-971002。 统一资源特征(URL—Uniform Resource Characteristics)。http;//www.zcl.lanl.gov.URL/ 通用多八位编码字符集(ISO/IEC10646)(UCS——Universal Multiple-Octet Coded Character Set) http;//www.iso.ch/welcome.html EAD(Encode ArchivaI Description) http://sunsite.berkeley.edu/ead/ PICS(Platform for lnternet Content Selection)http://www.w3.org/pics

89

Page 90: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

第六章 数字图书馆建设中的著作权38保护问题研究

一.缘由

数字图书馆的研究和开发,是伴随着国际互联网的发展和普及而兴起的,它大致发源于 90年代初,并且,它并不是由图书情报界人士首倡,只是由于图书馆是一个无可替代的信息资源中心,缺少信息资源的任何类型的图书馆、数据库或信息资源的组织形式都不可能吸引读者或者用户,有“路”无“车”,有“车”无“货”的现象与数字图书馆的目标不相吻合。作为图书馆,想要在网络时代更好地发挥其信息储存、信息传递、大众教育、参考咨询的作用,也不能不充分利用电脑和网络等设施,将其拥有的信息资源更好地在新的环境中被社会大众充分地知晓和利用,并且,充分地通过数字、网络技术对有关社会资源进行搜集和整合,更好地为图书馆的读者服务。

图书馆或其他信息机构利用新的技术和设施将其拥有的信息资源,或者利用社会的数字信息资源,以另一种新的形式向社会大众提供服务本是一件顺理成章且理所应当之事。但是,由于数字图书馆利用数字技术对信息进行处理,利用网络向读者传递信息,使得众多读者可以在同一时刻阅读同一本书籍或期刊,并且,利用数字技术可以便利地在瞬间对所阅读的信息进行下载、传递;一台电

38 《中华人民共和国著作权法》第 51条规定:“本法所称的著作权与版权系同义语。”90

Page 91: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

脑、一个调制调解器、一根电话线、一台打印机,这些简单的构成犹如一家信息机构,即可方便地接收各式各样的信息,又可便捷地将仅仅是个体认可的信息发布在网上,让全世界因特网用户阅读和利用,致使原本在著作权法规范之下比较平衡的著作权人、出版发行机构、图书馆和读者之间的利益关系受到冲击,原先已经存在的著作权保护格局经历着种种震荡。

事实上,任何技术的产生和发展,只要它涉及人类知识的表现和传播,就会对版权保护制度产生影响。在文字诞生之前,人类还在寻求能便于表达、便于传递的信息、知识的记录方式,版权一事无从谈起;文字产生后,在印刷术尚未形成之前,人们用手抄等较为原始、繁复的方式来保留或传递所喜爱的文献,虽然似乎存在着可能的“侵权”行为,但是,如此代价的“复制”本身便是对“著作权人”利益的一种最好保护,或者说是没有版权法的最好保护方式,这就是为什么版权法并不是自作品诞生时就产生,而是自印刷术的诞生并发展普及后才应运而生的缘故;印刷术兴起使作品的复制和传播变得越加便捷的时候,现代版权保护制度才得以建立和发展,其基本手段便是利用经济的杠杆限制他人对作品的擅自复制和传播;网络的产生以及相关技术的发展,恰恰是在复制和传播手段方面发生了巨大的革命,致使原本需花费相当精力、财力和时间的复制和传播已可在瞬间以便捷和廉价的方式轻松实现,并且,这种变革来得如此迅猛,以至于社会各方还未有足够准备时就发生了,数字技术和网络革命与版权保护的矛盾无法避免。

对此,有人悲观地认为,数字化作品和网络传播技术的出现冲垮了现有的版权保护体系,面对繁多而又复杂的新现象、新矛盾,版权保护制度显得束手无

91

Page 92: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

策,甚至说出“国家信息基础设施的环境中没有知识产权的位置”39。但更多的人士却坚信,信息技术、数字化作品等的产生和发展对现有版权保护制度给予了极大的冲击,但并没有真正动摇版权保护制度的基础,其基本理念、哲学地基没有发生根本的变化,构成版权保护制度的独创性(Originality)原则、可复制性(Duplicability)原则和思想和表现二分法(Idea and Expression Dichotomy)的原则等理论基础依旧有效,因此,只要在原有基础上作一些适应性的、技术性的修正,“版权”大厦仍可发挥其独特的作用。

那么,现有的版权法究竟能不能保护网络作品?网络作品的作者如何确定?怎么才能有效地保护网络作品?如何看待作品的上下载以及复制问题?数据库的著作权可否保护?数字化转换的法律性质如何?等等,等等,版权保护制度必须回答这些新问题,数字图书馆建设中必须注意这些问题。因为,人们之所以期待数字图书馆,就是因为“计算机和网络已经改变了人类彼此交流的方式”,“相信数字图书馆能够比过去的模式更好地传递信息”40。而“传递”,正如前面所述的,是引起版权问题的一个关键,近几年来,有关网络著作权的纠纷和议论此起彼伏,接二连三的的官司引起了广泛的关注,理论研究各述己见,其结果有的已渐渐明了,而有的仍在云雾之中。面对每天发生的令人眼花瞭乱、作品被莫名其妙地“使用”现象,人们不禁要问:经过作者投入大量智力、体力和物化劳动而产生的作品,被搬上网络、移入数字图书馆后,不仅存在着被无数读者反复阅读、利用,方便地复制的可能,而且作者的经济利益还不知从何获得,这能有效地鼓励作者的创造?这岂能有效地繁荣社会创作?39 Information Infrastructure Task Force of USA, Greenpaper-Intellectual Property and the National Information Infrastructure, P10, 郭禾:“信息技术对著作权制度的影响”,《著作权》96年第 3期,P2940 William Y. Arms:《Introduction to the Digital Library》,Cambridge, Mass. MIT Press, 2000

92

Page 93: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

本章试图从数字图书馆作业中常见的一些版权问题着手,梳理分析其原委并对如何认识和解决这些问题提出一些可供进一步讨论的看法。

二.网上作品的著作权保护问题

网上作品是否受著作权法保护?或者说作品是用二进制编码形式表达的,它是否仍属于版权保护的对象?有人认为,网上作品没有著作权,我国著作权法中没有明确表示保护网上作品(或网络作品),凭什么对它实施保护。

对此,有四点必须弄清楚。第一:在我国,受著作权法保护的是作品,这种作品是智力创作成果并且可以被复制。也就是说,除法律明确规定的如法律、法规、时事新闻和历法、数表、通用表格等外,其余作品只要符合独创性和可复制性的特点均受著作权法保护。网上作品和传统作品的主要区别在于载体的不同,而不是内容。传统作品看得见,摸得着;网上作品看得见,摸不着。传统作品的载体多为纸张,网上作品的载体是硬盘、是网络,因为任何在因特网上显现的作品都得以数字化形式固定在计算机的存储媒介上。但这种区别并不影响作品上述两个特点的客观存在,不影响读者对相同信息接受的事实,虽然接受的感觉不一样。因此,以载体的不同来判定网上作品的著作权是否存在,其理由不足。事实上,最初列入美国版权法保护的只是地图、图表和书籍,尔后才扩展到照片及其底片,动画电影,直到计算机软件等41。也就是说,作品范围的扩大是基于新载体的出现,只要这种载体可较为稳定地保存作品,没有理由不把它列入保护41 李东涛:“来自网络空间的挑战”,《电子知识产权》,1999年第 9期,P 18

93

Page 94: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

范围。

第二:在立法时,对法定作品的种类和范围的表述方法是一个相当关键的技术问题。《伯尔尼公约》对“作品”的界定范围广泛且具有极大的开放性,它“包括文学、科学和艺术领域内的一切作品,而不管其表现形式或者表现方式。”同时,它以枚举的方式指出:文字、图形、讲话、布道、戏剧、建筑等平面或者立体作品均属著作权保护范围。而我国著作权法对作品下的定义是:“包括以下形式创作的文学、艺术和自然科学、社会科学、工程技术等作品”,共含文字作品、口述作品等其他作品等十一类。比较而言,不难看出两者的区别,我国法律所界定的作品范围相对要窄些,开放性要小些,而这种对“作品”界定时的缺憾或许就是导致网络作品著作权问题一个原因。

第三:我国著作权法是 1990年 9月 7日公布,1991年 6月 1日实施的。当时因特网尚在摇篮之中,因此无法苛求其具体指明网上作品是否受法律保护。事实上,1999年北京中级人民法院就“世纪互联通讯技术有限公司”擅自将王蒙等六位作家拥有著作权的作品搬上“北京在线”且未付报酬一案作出侵权判决、并责令赔偿经济损失,就说明了网上作品是受法律保护的。正如判决书42上指出的,作品上网是作品传播的一种新方式,作品的数字化行为本身并不具有著作权意义上的独创性,作品载体形式和传播手段的变化并不影响作者对其作品享有的专有权利。最近,“多来米” 科技信息(上海)有限公司中文网与苏童等十位作家签约43,购下他们全部或部分作品的网络著作权,此举已受到不少作家的欢42 张东操、崔丽:“六作家状告网站胜诉”,《北京青年报》,1999年 9月 19日43 上海热线报道:“网上版权受重视 苏童十作家签约”,www.online.sh.cn,(娱乐新闻)2000年 2月

94

Page 95: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

迎,也可视为网络著作权开始受到网络资源建设者重视的一个事例。

第四:更重要的是,从我国著作权法立法的初衷和原则来看,制定著作权法是为了鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进社会主义文化和科学事业的发展和繁荣。倘若允许擅自将他人作品进行复制并以一定的方式传播,那么,就显而易见地存在着读者仅从此传播渠道接受作品信息的可能,这种传播方式的受众者越多,著作权人的法定权利被侵害的可能就越大,其受损程度就越烈,而作者和出版商不免会担心他们编辑出版书刊的销量。因此,在我国目前的司法实践中一般均将作品的网络传输行为认作是使用作品的一种方式(虽说对这种“使用”的具体归类尚有不同的看法),而这种使用除著作权法规定的“合理使用”等情况外,应当得到著作权人的许可并支付报酬。这无疑有益于调整由科技发展而引发的社会关系的变化,有益于鼓励作者的创作,实现著作权法的立法初衷。

综上所述,网上作品不是保护不保护的问题,而是如何确权、怎么保护的问题。

三.网上作品的确权问题

网上作品的著作权归谁?这好象不能算是一个问题。按我国著作权法所言,除法律另有规定的以外,著作权属于作者;如无相反证明,在作品上署名的公民、法人或者非法人单位为作者。但是,与传统媒体不同,网络并非一定需要编

95

Page 96: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

辑部、并不需要象经过第三方的出版审查,作者完全可以以自己认可的方式上载作品,也许标上真实姓名,也许用笔名,也许不署名。其他网站也可以迅速地粘贴该作品,甚至修改其文字、内容、版式等,以不同的形式利用该作品。即使对于收到投稿的网站来说,也难以确认该作品是否原创、它的作者究竟是谁。毫无疑问,如果当某一作品受到侵犯,其著作权人无法证明该作品的著作权属于他(她)时,著作权就无法得到保障。因此,网上作品的确权问题是涉及到网上作品能否得到有效保护的重大问题。

对此,我认为,任何一个希望自己的作品受到著作权保护者,都应首先强化法律意识,在将自己的原创作品搬上网或通过他人上载至网上时,均应设立并保留日后可以证明这是自己作品的证据,或请求公证机关的公证,或通过某种技术加烙印记、作技术处理,如加标明、暗的“电子水印”,或与网站签署协议等。推而广之,任何一个作者在创作和完成创作时,或著作权人愿意将其拥有著作权的作品上网时,就应完成了保护自己著作权的构思和行动。除非你愿意放弃著作权,否则在日后确权时难免有种种麻烦。值得注意的是,数字身份证正在研究之中,它将由值得信赖的证书授权机构(Certificate Authority)发放,把有关信息储存在智能卡、移动电话或其他附带着密钥的载体之中,并且确保登录者的真实身份以及无人能在网络上假冒他们。

其次,应该建设一种能够表明作品在网上发表的时间软件系统,以便在判断由不同作者发表的两篇或两篇以上内容相同作品的权利归属时,有一客观的辨认依据。也就是说,网络应提供一种登记或确认系统和规范,任何作品进入网页后自动在网上进行相关内容的认证。这种登记制度应将作者的署名和作品本身

96

Page 97: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

的注册涵盖在内。让一切承认这种登记系统并遵守这种规范的人们,能找寻到一条合适的能够使自己的作品在网上受到有效保护的途径,否则就难以保证让公众获得真实可靠的信息。

再次,利用管理型元数据,如 Meta 标签(Meta Tag),在编写HTML(Hypertext Markup Language)文件时,使用隐藏有包含版权管理信息内容或其他特别记号的标签,以便为日后可能的侵权追寻工作提供方便。譬如,当你利用搜索引擎来追踪侵权者时,只要你将特别记号的标签送到主要搜索引擎注册,在搜寻时,就有可能找到标有这些特别记号的内容,从而最终查寻到侵权人。对于篡改、删除有关版权管理信息的行为,根据 1996年通过的《世界知识产权组织(WIPO)版权条约》规定,是非法的。可以相信,在我国著作权法的修订中,也会增加类似的规定。

此外,与网上作品发表时间确认系统相配套,建立网络自动公证系统,对欲求得到作品发表时间确认的作者来说,他应该自觉地去“公证处”获得网络公证。当然,值得一提的是,在网页的一角明示版权标志和著作权人名称,不仅

显示了著作权人应有的保护意识,而且能够起到威慑和警告作用。与此同时,我们是否可作出这样的规定(作家张承志曾有此建议44),即每一家网站在使用作品前出示作家的授权书,这样或许既可对一切愿意遵守法律的人们大大方方地使用他人的作品,又可便于执法机关了解和掌握谁在偷偷地非法使用他人的作品。

44 宋慧献:“网络著作权一言难尽”,《中国检察日报》,2000年 4月 26日97

Page 98: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

四.著作权集体管理组织

网上作品的确权问题不仅与技术相关,而且同著作权的管理密切相关。众所周知,作者对其创作的作品拥有著作权,但是在实践中,作者无法单靠自身的力量来实现对这种权利的保护。譬如,作者对他们的作品拥有使用权和获得报酬权,但在网络时代,作品一经发表后作者就不易控制他人对其作品复制、下载、粘贴,作者要向难以计数的使用者索取费用简直比登天还难。另一方面,作品的使用者即使愿意事先取得使用许可和支付使用费也难以寻找到作者。因此,在著作权人和作品使用者之间设立一个合适的中介以及制定合理的付酬标准是解决这一问题的要害。

国际上通常采用著作权集体管理组织的形式来代表著作权人行使某些权利,他们可以将其成员及其作品编号归类,并替代作者与作品使用者签订使用许可合同,集体授权,统一收费,然后再将费用按一定的规定分配给有关著作权人。通过他们的中介,作品得到了传播,作者保护了自己的著作权并获得了应有的报酬,作品使用者也免去了付酬时寻找作者的繁复和困难,显然,这应是一个“多赢”的结局。不过,在我国要创造这样一个较为理想的集体著作权管理体制至少要解决以下几个方面的问题。

第一,按行业或作品的类别建立著作权集体管理机构,最好一个行业或一类作品在全国只有一个这样的机构,各省市可以相应地建立从属于总机构管理的分支机构。否则,多头设置,各自为政,就会使著作权人和使用者无所适从,

98

Page 99: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

找不着北,从而给著作权管理带来不必要的麻烦。

第二,集体著作权管理机构的法律地位必须明确。要使著作权人和作品使用者信赖管理机构,不仅取决于机构的服务特性,而且取决于它的法律地位和权利。目前,我国只有一个著作权集体管理机构——中国音乐著作权协会,自1992年成立以来,为著作权人和作品使用者做了大量的工作,取得了不小的成绩。但是,由于其法律地位未得到有效的确认,机构与会员之间签订的有限转让合同或信托合同均不能在现行的著作权法中找到明确的依据,机构在向法院提起诉讼时本身的诉讼主体地位也成了问题,因而难以树立其应有的权威性。可喜的是,1998年 12月,国家版权局局长于友先在国务院向全国人大常委会提交关于著作权法修正草案的说明中,便曾提及在著作权法中增加权利人可以通过依法成立的社会组织行使其著作权45。今年,国家版权局召开了“网络著作权问题研讨会”,在国家版权局提出的解决问题方案中,就有“为增加网络环境下使用他人作品的操作性,同时保持著作权保护的基本原则,以法定形式规定著作权集体管理组织有权代表权利人为网络使用授予许可”46,相信著作权集体管理机构的法律地位可以较快地得到认可。

第三,应尽快制定网上作品的付酬标准。1999年 4月,国家版权局制定了《出版文字作品报酬规定》(以下简称《规定》),但它明确了只是适用以纸介质出版的文字作品,要有效地保护网上作品的著作权,必须有合适于保护以网络为载体的使用作品的付酬规定。我认为,对于原创的网上作品,其付酬标准可以参照《规定》,而对于转载、摘编其他媒体已发表的作品则似应低于《规定》的标45 王雷鸣等:“国务院提请审议著作权法修正草案”, 《人民日报》,1998年 12月 14日46 《网络世界》报讯:“版权界人士研讨网络著作权”,www.javaworld.com.cn/cnw/2000/17/1720.asp

99

Page 100: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

准。这是因为,现代传播技术的发展,使得作品的使用和传递变得更为便捷,可能的众多使用可以保证作者获得其合理的报酬;此外,现如今获利的网站不多,保障刚刚起步的数字图书馆等能在比较低廉的成本中运行,有助于促进网络资源建设和读者的利益。事实上,2000年 7月 1日施行的《制作数字化制品著作权使用费标准(试行)》,虽说它主要指 CD-ROM制品的复制、发行的著作权使用费,但可以看出,其使用费比《规定》中的要低,这是比较符合当前实际情形的收费标准,网上作品上下载的使用费等似可参照之。

第四,应呼吁电信部门合理地让利于网络信息内容的提供者。电信部门应努力建设好信息通道——“高速公路”,图书馆等应努力丰富网上信息资源,吸引读者的浏览或阅读,读者因为上网而向电信部门付费,图书馆等可依信息流量和电信部门分成,所得款项一来向著作权人付费,二来继续投资建设信息资源,这样就便于形成投资—建设信息资源—获利—再投资的良性循环。

值得一提的是,1999年 12月 9,在国家版权局发布的《关于制作数字化制品的著作权规定》中规定,在版权集体管理机构建立之前,暂由中国版权保护中心负责数字化技术使用他人享有著作权作品(音乐作品除外)的著作权管理工作。为此,版权保护中心制定了《制作数字化制品著作权使用费标准(试行)》和《制作数字化制品许可合同(式样)》(2000年 6月 16日实施),有关规定表明,数字化制品,是指将受著作权法保护的作品以数字化代码形式固定的有形载体,包括激光唱盘(CD)、激光视盘(LD)、数码激光视盘(VCD)、高密度光盘(DVD)、软磁盘(FD)、只读光盘(CD-ROM)、交互式光盘(CD-

I)、照片光盘(PHOTO-CD)、高密度只读光盘(DVD-ROM)、集成电路卡100

Page 101: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

(ICCARD)等。自 2000年 7月 10日起,版权保护中心开始受理有关使用他人作品制作数字化制品的书面申请,并签定《制作数字化制品许可合同》。凡未经著作权人许可便擅自利用受著作权保护的他人作品制作数字化制品的,版权保护中心将代表著作权人或接受著作权人的委托依法追究其民事责任,并提请著作权行政管理部门予以行政处罚。而版权保护中心将通过“中国版权信息网”(www. ccopyright.com)随时公告收到的著作权使用报酬的作者名单。

此外,规定还表明,利用表演者的表演、录音录像制作者的录音录像制品、广播电视组织的广播电视节目和出版者的版式设计制作数字化制品的,其权利亦暂由版权保护中心管理。

五.关于作品的上下载和复制问题

(一) 上载

一般认为,所谓上载是指运用一定的技术和手段将已发表或未发表的作品以数字化形式搭载至计算机互联网上向不确定的公众传播。譬如将自己或他人的作品以一定的方式在网上公布。

根据《中华人民共和国著作权法》第十条的规定,著作权人(copyright owner)

拥有发表权、署名权、修改权、保护作品完整权、使用权和获得报酬权等五项权利其中首项为“发表权,即决定作品是否公之于众的权利”。上载未发表的作品,涉及到发表权;上载或转载已发表的作品,涉及到使用权。因此,不能随心所欲

101

Page 102: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

而至少应该考虑以下几个方面的问题。

首先,上载的是谁的作品,如果是自己享有版权的作品,那么可以认为你有权将自己的作品上网,也可以允许他人将你的作品上网。但是,应该指出的是并不是说你创作的作品你就一定有权将它上载至因特网,例外的情况是,如果你已经将你的有关版权转让给他人,或者虽然是由你创作的但著作权归法人或非法人单位的作品,以及合同规定著作权归委托方的委托作品等,那就意味着你自己也在法律确定的时间内丧失了上载该作品的权利。

其次,如果上载的是他人的作品,根据版权法规定,必须经过著作权人许可后,才可将该作品上载到因特网。并且,不论该作品已经发表或尚未发表,因为,版权法保护的不仅是指已发表的作品,而且还包括未发表的作品,当然,不适用版权法保护的作品例外。其中,对于发表的作品,只要著作权人未公开声明未经许可、不得转载等除外,都可理解为可以将它搬上网,但是,只要该作品尚处法律保护期内,上载者应按法律规定向著作权人支付报酬;而未公开发表的作品则必须经过著作权人同意后才能上载。那种认为上载已发表的作品,只要不向网络用户收费、不在网站上做广告等就不算侵权的观点是错误的,因为,这种行为侵害了著作权人所拥有的五项权利中的另一项权利——使用权和获得报酬权。六位作家状告网站并胜诉,就说明了擅自上载作品是要负法律责任的。

事实上,已有不少作者首先将其作品(原创)在网上发表,它理应受到版权法的同样保护,其他媒体欲转载、使用之,除声明不经许可不得转载等外,也得向作者付酬金。今年 7月,“走进中关村”网站就因《工商时报》刊登了该网

102

Page 103: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

站上的作品而向法院提出诉讼便是一例47。被告方认为,网站应提供确切证明表明原告是作品的合法权利人,同时还应证明《工商时报》在刊登该作品前,原告已经完成了作品的创作并发表在原告的网站上。我以为,关于证明之事可以在今后的上载作业程序中加以改进,如事先获得上载的法律公证或法律规定让被告方提出相反的证据等,但应予确认的是,其他媒体转载网上首创作品也同样是侵权行为,这是无可争辩的。另外,网站转载网站的作品也应同样视为使用作品的行为,适合于传统媒体的关于转载的法律规定同样适合于网上的转载,虽然其中对原作品是否变动、修正的确认等有较多的技术难点。

值得一提的是,著作权中的发表权、使用权和获得报酬权是有期限的。依我国版权法,它的期限是作者有生之年加上 50年,截止至第 50年的 12月 31日;合作作品的这些权利计算至最后一位作者死亡后的第 50年的 12月 31日,法人作品等保护期,法律也有明确的规定。因此,上载(或下载)已超过法定保护期进入公有领域的作品,如上载《红楼梦》或鲁迅的作品,则无侵犯版权之嫌。

(二)下载

和作品上载相反,下载作品是指利用一定的技术和手段将因特网上的作品记录至有关载体的行为。

上载,如果作者选择将其作品首先在网上发表的话,则不涉及到复制问题,而下载则与复制有关。因此,复制概念的认定是分析下载行为的必须。根据《中华人民共和国著作权实施条例》第五条第一款可知,“复制,指以印刷、复印、

47 杨西菱:“《走进中关村》诉《工商时报》一案开庭”, ChinaByte(新闻总线),1999年7月103

Page 104: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

临摹、拓印、录音、录像、翻录、翻拍等方式将作品制作一份或者多份的行为”。显然,由于版权法及其实施条例颁布之时,网络与数字化作品还未深入至千家万户,有关问题尚未显现,故而条例所罗列的复制方式中并没有把下载包括在内。因此,引起了两种对下载行为的不同看法,有的说:既然法律中没有明确说明,那么就不能说下载便是复制;有的说:由于立法时不可能预见今后出现的新生事物,所以,条例中的“等方式”可以认为是涵盖了包括下载等新的复制方式。事实上,法律的滞后是绝对的,相反,在对新生事物尚未有足够的了解和把握时,轻易地立法、下定论、辨真伪倒是一种不科学的方法。也许,尽管网络的版权问题沸沸扬扬已有几年了,但版权法的修订版却至今未能面世就是这个缘故吧。不过,我觉得这并不影响对此问题的分析,在呼吁尽可能快地修订出我国版权法的同时,我们可以从版权法的立法精神和原则来对此作一审视。维护作者的权益是版权法的核心精神和原则,自愿、公平、等价有偿、诚实信用原则也是制订版权法时遵循的原则之一。试想,不经著作权人同意擅自下载享有著作权的作品,是否有助于维护作者的权益?是否符合自愿、公平、等价有偿和诚实信用的原则呢?答案是显而易见的,更不消说将他人的作品下载后用于商业或营利的目的。众所周知,尽管复制在各国版权法中的定义不尽相同,但是其基本的内涵是差不离的,那就是依据原件以一定的方法产生一份或者多份的内容相同的制作品,尤其是指以机械方式产生的制作品。下载的结果产生了与原件内容相同的作品,因此,将下载归于复制一类是可以接受的,是顺理成章的。

我国版权法规定,复制作品属于使用作品的一种,它的权利系著作权人所有。因此,未经许可,不能随意下载他人的网上作品,否则,即为侵权。也就是

104

Page 105: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

说,下载他人享有版权的作品,特别是有商业目的下载行为必须征得著作权人的同意,在著作权人未声明不得下载时下载其作品,应向著作权人支付报酬。当然,版权法第二十二条规定:“为个人学习、研究或者欣赏,使用他人已经发表的作品”、“为学校课堂教学或者科学研究,翻译或者少量复制已经发表的作品供教学或者科研人员使用,但不得出版发行”或者“图书馆、档案馆、纪念馆、博物馆、美术馆等为陈列或者保存版本的需要,复制本馆收藏的作品”等,可以不经著作权人的许可,不向其支付报酬地使用作品,只是应当指明作者姓名、作品名称,并且,不得侵犯著作权人的其他权利。这便是世界上许多国家法律均予认可的“合理使用”(fair use)。我想,既然将下载视为复制或复制的一种,那么下载者也当然地可以享有合理使用的权利。而这显然也符合并体现了著作权人、传播者与社会公众利益协调一致的立法原则。不过,不少人士指出,随着因特网的普及和发展,对网上作品的个人复制行为可能会成为利用网上作品的主要方式,而它显然会对作品的市场销售和著作权人的利益形成不小的威胁。因此这种原本天经地义的“合理使用”还能是否算作合理?看来还有待于进一步的研究和讨论。 另外,作品复制问题的复杂性还在于,现有版权法中涉及的是永久性的复制和永久性的复制品,如图书、录音录像带、磁盘光盘等。而借助于网络的数字化作品在传输中还存在着“临时复制”(temporary copy)问题,如作品在电脑随机存储器(RAM)中的暂存。显然,临时复制的存在致使一次性复制品的产生。对此,美国、英国、欧盟等认为48,尽管数字传输所导致作品在计算机上的显示时间是短暂的,但用户计算机毕竟再现了有关作品,而它是随机存储器对48 袁泳:“计算机网络上数字传输的版权问题研究(二)”,www.digilib.sh.cn

105

Page 106: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

作品进行了复制的结果,与其他永久性复制品一样,计算机显示器所展现的也是复制品,尽管它不具永久性。发展中国家的有关人士则强烈反对将暂存等同于复制,通过努力,1996年 12月世界知识产权组织(WIPO)撤消了将临时复制权纳入至有关条约的提案。鉴于计算机显示器与其他现有的物质载体在再现原件时明显的不同——一次性而非永久性(随着关机而消失),鉴于著作权人权利和社会公众权利的平衡,同时也鉴于版权保护的实际可能性和便利性,我认为,可以将临时存储视为复制,但是这种权利不应受到法律的保护,也就是说,读者有权对暂存于随机存储器中的信息进行浏览和阅读。如同国际图书馆联合会版权顾问 Sandy Norman对图书馆的公共外借权所呼吁的那样,它不应列入版权法的保护,甚至也不能由著作权人以合同形式对外借予以任何限制49。否则网络在传递信息时的优势将难以显现。

(三)其他复制问题

除下载中涉及复制问题之外,在其他数字图书馆作业中也会遇到诸如以下几类复制问题。

首先,馆藏资源数字化中的复制问题。对于古籍中的孤本、珍本等馆内独有的资源,一般均因作品已进入公用领域而无侵犯著作权之嫌疑,理可优先数字化和上网,这也是避免重复投资和重复劳动的良策。但是对于享有著作权的作品就不可随意数字化和上载,这将涉及到著作权人专有的复制权问题,图书馆在网页上发布享有著作权作品的内容,不仅可能会把有关信息储存在计算机硬盘

49 Sandy Norman: “Tackling international issues: the role of the IFLA Copyright Adviser”, Pre-Conference (62nd IFLA ) Seminar, Tianjin, China, Aug. 22, 1996

106

Page 107: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

或磁盘上,形成不少复制品,而且必定会在服务器上留下侵权记录。所以有关作业必须授权,否则终究是难圆其说。事实上,就当前而言,对于不少馆藏资源可以在网上公布书目、索引、文摘和授权的部分重要作品全文,并在网上提供获得读者所需全文的线索,使数字资源和纸质资源互相联动,使虚拟图书馆和物理图书馆交相辉映。这样,既可避免侵犯著作权,又可较好地在当前条件下满足读者的最一般需求。

其次,链接中的复制问题。图书馆在做“知识导航”时,要将内容相关的信息集中于一个页面上,以方便读者的查阅。通常有两种方法,其一是下载粘贴,即搜寻有关信息并下载,然后分类整理提供阅览等。显然,在未获得许可的情况下,它侵犯了复制权。其二是做超文本链接(hypertext links),即将存在于不同服务器(不同网址)上的文件在本网页上做一“记号”(一个词汇、图像等),以可方便地通过点击找寻到该文件。也就是说,先得找到想要链接内容的地址,它可以是一个网站,也可以是一个特定的网页。有趣的是,勾链者并不需要被链者的技术配合便可完成链接过程。而且,更有趣的是,链接作业可以不在勾链者的服务器上产生任何复制品。当读者的电脑在链接的导引下访问被链接的对象时有关信息进入到读者的电脑内存,而在勾链者的服务器上只有一行行包含着链接对象URL的HTML指令组成的文档,其本身对读者而言没有阅读的意义。以目前大多数人的认识而论,一般的超文本链接无侵犯复制权之虞。但是,对于跳过主页直接将读者引导到某个分页的深度链接( deep link)和采用窗框(frame)手段将某一对象链接至链接者的页面的某一部分,业界人士则比较倾向于属侵权行为。

107

Page 108: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

值得一提的是,2000年 11月,由国务院新闻办公室、信息产业部联合发布的《互联网站从事登载新闻业务管理暂行规定》正式面世。该暂行规定的第十四条明确表示:“互联网站链接境外新闻网站,登载境外新闻媒体和互联网站发布的新闻,必须另行报国务院新闻办公室批准。” 根据互联网的超链接特性,人们可以点击一个页面中的链接而方便地跳到另外一个页面浏览,这确实给现行的新闻管理带来了新的问题。但是,仅一个搜索引擎中就可能包含有成千上万个链接点,这其中有不少是境外的新闻站点。如果没有一个高效的申报和审批的操作方式和高效的新闻站点动态管理方式,链接业务中仍会有不少问题。

再次,局域网中的复制问题。有人认为,图书馆对已购图书进行数字化,并在局域网上向读者提供阅览服务,就好比是一本图书可以在馆中被多人阅读一样,只要不允许读者下载等,便可避免侵犯著作权。2000年 1月 11日,北方交通大学图书馆、中国版权保护中心和北京超星电子技术公司联合召开了数字图书馆版权问题研讨会50,与会代表纷纷表示要将数字化图书放在局域网中,并采取限制复制等措施,不失为一种认知趋向。但事实上,就目前的认识而言,由于未经授权便擅自复制(将有关图书数字化)他人的作品已属越轨行为。可以讨论的是,图书馆可否充分利用信息资源中心的优势,努力与有关著作权人协商,取得复制作品的某些权利并在局域网上向读者提供阅览服务,显然,对一些已获得作者授权的出版社和杂志社来说,这种协商和谈判会相对容易些。据说,有些国外图书馆便是通过联合成功地与数据库生产商签定了在馆域网上提供相关服务的协议,类似的情形可视为一种有益的启示。

50 吕贤如、王晓昱:“数字图书馆是否侵权”,《光明日报》2000年 1月 19日108

Page 109: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

六.数据库的著作权保护问题

根据《中国大百科全书》的定义,数据库是“为满足某一部门中多个用户多种应用的需要,按照一定的数据模型在计算机系统中组织、存储和使用的互相联系的数据集合”,也就是说,数据库一词是特指电子数据库。可是,图书馆界和版权界大多数人恐怕更倾向接受伯尔尼公约议定书专家委员会对数据库的认识——“所有的信息(数据、事实等)的编纂物,不论其是以印刷形式、计算机存储单元形式,还是其他形式存在,都应视为‘数据库’”51。

其实,判断是“电子数据库”还是其他类型的数据库并不是判断它是否受到版权法保护的难点。数据库所集合的内容——作品或作品的片段、数据等,如果其本身属于著作权法保护的对象并具有独创性、可复制性以及法律、法规规定的其他必备条件(如需注册),那么,只要对这些作品的使用是合法的,属于“根据特定要求选择若干作品或者作品的片段汇集编排成为一部作品”(《中华人民共和国著作权法实施条例》第五条)的,我们可将它作为编辑作品来保护。

问题是,对于内容仅是数据或其他材料的汇编,单独而言,它们可能是不受版权法保护的对象,一旦集合成数据库后如何看待呢?我国《实施国际著作权条约的规定》第八条规定:“外国作品是由不受保护的材料编辑而成的,但是在材料的选取或者编排上有独创性的,依照著作权法第十四条的规定予以保护。此种保护不排斥他人利用同样的材料进行编辑。”对照我国著作权法第十四条可以

51 赵小华译:“关于伯尔尼公约可能拟定的议定书的专家委员会第一次会议备忘录”,《著作权》,1992年第 4期

109

Page 110: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

知道,也可将这类数据库作为编辑作品来保护。从关贸总协定中《与贸易(包括假冒商品贸易在内)有关知识产权协议》(TRIPS)第十条的规定可知:“数据或者其他材料的汇编,无论采用机器可读形式还是其他形式,只要其内容的选择或者安排构成智力创作,即应予以保护。这类保护不延及数据或者材料本身的保护,不得损害数据或者材料本身已有的版权。”

由此可见,对于集中本身已受版权法保护作品的数据库而言,当然可获保护,而可能是由不受版权法保护的数据、材料作为内容的数据库,也只要其在“选取或者编排上有独创性的”或者说“选择或者安排构成智力创作”,同样可受到保护。笔者认为,在我国,就数据库(或多媒体)保护而言,恐怕在将焦点关注于它们是否保护的同时,应将更多的注意力放在数据库(或多媒体)生产者是否能按照版权法的要求在使用他人受法律保护的作品。试想,如果保护的是通过非正常手段制作而成的数据库,那还有什么意义呢?

  数据库保护的另一个值得讨论的问题恐怕是这类作品的保护时限问题。许多数据库是即时更新其内容的,那么,究竟用怎样的方式来区分一个数据库内不同内容的不同的输入时间?从理论上说,存在着这样一种可能,即一个数据库中的有些内容已经过了法定的保护期限,而另一些内容还在保护期中,届时,作品的使用者如何来区分它们的时限、作品的完整性如何看待、著作权人的权益如何得到保障?对这些问题提出一套便捷的解决方法,估计还得假以时日,还得好好研究。

110

Page 111: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

七.数字化转换的法律性质问题

(一)作品数字化转换行为的法律性质

何谓作品的数字化?它是指把作品的文字、数值、图形、图像、声音等信息输入计算机系统并转换成由 0和 1组成的二进制数字编码。在这个基础上对作品进行进一步的加工、存储和传输,并在需要时把这些数字化信息还原成文字、图像声音等。作品数字化是作品在计算机互联网上传播的先决条件。

问题是:对作品数字化是不是著作权人的专有权利?答案是简单的,将作品数字化是在网络(或其他)环境下使用作品的一个首要条件,而根据著作权法的规定,使用作品是著作权人的一个权利,那么,对作品进行数字化当然是著作权人的专有权利。那么,进一步地问:将作品数字化是一种什么样的行为,在法律上如何定性?对此,大致有两种不同的观点。

一种观点认为:把传统作品数字化的行为属于类似翻译的演绎行为,理由是数字化前后作品的关系是一种比较单纯的演绎关系,犹如将一件英文作品翻译成中文作品,并且,和传统翻译方式唯一的区别在于,传统的翻译是由人完成的,而数字化过程由机器完成的。

可是,何谓翻译?我国《著作权法实施条例》第 5条指出:“翻译,指将作品从一种语言文字转换成另一种语言文字”。遗憾的是,这个定义未进一步明确其中“语言文字”是否包含二进制数字编码。事实上,真实意义上的翻译无疑是

111

Page 112: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

指翻译者根据原著进行再创造的一种行为,是一种智力创作,即使面对同一原著,不同翻译者会因各自理解的差异而形成两种甚至更多的、均颇具特色的翻译作品。其实,对照世界知识产权组织(WIPO)的《关于伯尔尼公约议定书备忘录》第 31条就不难发现,翻译是“针对实际语言即人类语言”而言,并不包含二进制编码语言。也就是说,不应该将作品的数字化认作为法定的“演绎”。

另一种观点认为:数字化转换是一种复制行为,理由是作品的数字化没有产生新作者、没有产生新作品。数字化过程纯属机器代码的变换,而机器是不具创造能力的,人们在转换软件方面的创造性劳动是作品之外的,软件著作权人不能对被转换作品享有著作权。

那么,何谓复制?我国著作权法第 52条指出:“复制指以印刷、复印、临摹拓印、录音、录像、翻录、翻拍等方式将作品制作一份或者多份的行为。”另外,我国《计算机软件保护条例》第 3条中规定:“复制,指把软件转载在有形物体上的行为。”虽然,法律、法规条款中没有以枚举的方式明确断定作品数字化的行为属于复制,但是,这种数字化转换过程的实质显然属于将作品的一种形式转换成二进制编码形式并固定在某个载体上,类似于软件的复制,类似于录音、录像,将作品数字化认同为复制行为是正确的。值得一说的是,依本章涉及几个方面的议题来看,不少问题正是“法律滞后”的具体表现,这些问题,如明确将网上作品列入著作权法保护的范围、修改翻译的定义、复制概念的外延说明中添加作品的数字化转换等,理应在著作权法的修订中加以修正,尽管它们属于技术性的。

112

Page 113: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

事实上,作品数字化只是增加了使用作品的一种方式,不过是将作品转换成计算机可识别的语言,其间没有产生新的作品,数字化作品的著作权应属于原著作权人。在六位作家状告“北京在线”一案的法官审判书中已明确认定:“作品的数字化过程不具有著作权法意义上的独创性,不产生新作品52。”可将其视为“翻译”说不成立的一个注脚。

(二) 在因特网上向公众传播作品行为的性质

把数字化作品上载到计算机互联网上向公众传播属于对作品的使用,上载权利属于原作的著作权人,这是不应置疑之事。在 2000年 4月 19日,由国家版权局召开的“网络著作权问题研讨会”上,版权司负责人介绍了国家版权局提出的解决网络著作权的初步方案中提出,在现行著作权法第十条增加一项 “信息网络传播权”,即“以有线或者无线的方式向公众提供作品,使公众中的成员在其选定的地点和时间获得这些作品的权利”,同时,这种权利还要延及到表演者、录音录像制作者、演员以及唱片制作单位等对其作品也可享有网上著作权53。    事实上,1996年 12月,WIPO的两个新条约《WIPO版权条约》(WCT)和

《WIPO表演和唱片条约》(WPPT)对数字技术和网络环境下使用作品所引起的版权和邻接权问题作出了明确的规定。WCT第 8条规定了向公众传播的权利,即在不违反《伯尔尼公约》有关条款的情况下,“文学和艺术作品的作者应享有专有权,以授权将其以有线或者无线方式向公众传播,包括将其作品向公众提

52 洋泽策划:“中国网络第一大案水落石出”,《生活周刊》,2000年 9月 15日A13版53 同 7

113

Page 114: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

供,使公众中的成员在个人选定的地点和时间可获得这些作品。”WPPT第 10

条、第 14条也分别规定:表演者(唱片制作者)应当享有专有权,以授权通过有线或者无线的方式向公众提供其以唱片录制的表演(提供唱片),使该表演(唱片)可为公众中的成员在个人选定的地点和时间获得。

但是,对于作品在网络上向公众传播这一行为的性质认定方面,仍有不同的看法,有的认为它属于发行行为,理由是公众通过网络阅读或获得了作品。问题是:所谓发行是“指为满足公众合理需求,通过出售、出租等方式向公众提供一定数量的作品复制件。”(《中华人民共和国著作权实施条例》第 5条)这里“公众”和“复制件”是两个关键词,私人间的信息互通构不成“发行”;传播过程中没形成复制件也不能算作“发行”。作品在网上的传播,用户可能对其下载而获得一个复制件,也可能仅仅是浏览而没有获得复制件,它随关机而消失(有关“临时复制”参见本章第五部分),因此,这种行为不属于发行。退一步而言,如果将它认定为发行,那么,“发行权一次用尽原则”的合理性就将受到质疑,因为,传统作品经发行后,该作品的有形物体的发行权便用尽,而通过网络传播作品其情形就不一样,原来的作品还存在于传播该作品的计算机存储设备中,但在接收该作品的计算机存储器中却产生了一个复制件——与发行权一次用尽的原则不相符合!

另一些专家认为:作品在因特网上向公众传播属于类似“广播”的行为。一种形象的描述是,电脑和收音机、电视机的接收信息的机理有相似之处,当你不打开它,你无法从中获取什么,而只有打开它时才可获得信息。并且,“广播”之说可以回避“发行权一次用尽原则”的问题。

114

Page 115: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

其实,这两种分歧的要害还是在传播作品过程中有无复制件的形成,或者说如何看待暂时复制问题。认定暂时复制是复制的,当然会逻辑地认为作品在因特网上的传播属发行行为;而认为暂时复制不属于复制的,则自然地倾向于认定这种传播是类似“广播”的行为。

值得注意的是,如果将作品在因特网上的传播看作是类似“广播”的行为,则需要对现行著作权法规中的有关“播放”定义加以修正,因为目前《中华人民共和国著作权法实施条例》中对播放的界定是:“指通过无线电波、有线电视系统传播作品。”显然,它至少扩大至包括通过计算机互联网播放,其中“作品”应包括数字化的,并且还得对通过网络向公众和私人传播的问题加以合适的界定。

八.图书馆的“特权”问题

数字图书馆一词中的“图书馆”和我们平时所称的实体图书馆是两个不完全相同的概念,但是,现实的图书馆也是建设数字图书馆的一支不可忽略的队伍,有关版权问题事实上也引起了正在积极进行数字化建设的各类型图书馆的高度重视。国际图书馆协会联合会(IFLA)也因“版权法影响着几乎所有图书馆的作业”而“加入当今国际化的版权论争”,并在 2000年 8月表明了“IFLA

在数字化环境中的版权立场”54。IFLA认为,图书馆和情报专业机构应该关注和尊重版权,防止版权作品被盗用、不合理地使用和非许可下的使用,不论是印54 “IFLA Position on Copyright in the Digital Environment”, IFLANET, www.ifla.org,2000

115

Page 116: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

刷版还是数字化版。但是,IFLA声明,如果版权保护过份的严格,则会使必要的竞争和创新受到限制,并导致创造力的窒息。

因此,研究图书馆的“特权”问题,就是探讨著作权人、传播者和读者利益的平衡问题,就是探讨网络背景下图书馆如何发挥其独特作用、为读者提供更好的服务问题,其要害应当是充分发挥实体图书馆的长处,使现实的和虚拟的互为补充,交相辉映。

正如 IFLA在“IFLA在数字化环境中的版权立场”一文中所表明的那样,为教育和研究的需要,在合理合适的情形之下,允许图书馆为公众利益能免费地存取和利用享有著作权的作品。不然的话,一味强调只有付费才可享用信息社会的种种便利是十分危险的,它会导致信息富有者和信息贫穷者的两极分化。对此,我们是否能主张以下一些权利——

1,允许为保存目的和满足合理使用条件的数字化复制。在现行的我国著作权法中,有关图书馆“特权”的条款只有一条,那就是第 22条规定的“图书馆、档案馆、纪念馆、博物馆、美术馆等为陈列或者保存版本的需要,复制本馆收藏的作品”。很明显,这种复制权只能用于陈列和保存版本的目的,而不是用于阅览和其他什么目的。需要指出的是,就立法当时而言,这种复制也仅仅指纸质载体的复制。但就今天来说,它应扩大至数字化的复制。美国的《数字千年版权法案》(Digital Millennium Copyright Act of 1998, DMCA)中也准许图书馆为保存档案的需要而进行数字化复制,而不论其是否发表,且复制数量可为 3份,55。推而广之,对所购的电子出版物等,图书馆能否自行制作一份拷贝件,以便在55 Making Digital Copies in the Library, www.utsystem.edu/ogc/intellectualproperty/dmcalib.htm,1999

116

Page 117: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

母版自然或不经意人为损坏时,能以复制版为读者提供服务。

再者,为更好地满足读者的学习和科研等需要,图书馆能否对馆藏进行数字化复制,在当读者要求提供远距离服务时,向允许读者复制少量纸质文献一样,提供扫描或其他电子载体的复制件。所有这些,看来均有待于有关方面充分考虑到图书馆的公益性和非赢利性特点,在修订著作权法时予以考虑,这可视为我国著作权法中有关条款的合理延伸。

2,图书馆读者有权对暂存于随机存储器中的信息进行浏览和阅读。现有版权法中涉及的是永久性复制和永久性的复制品。而借助于网络的数字化作品传输中还存在着“临时复制”问题,如作品在电脑随机存储器(RAM)中的暂存。对此,美国、英国、欧盟等认为,尽管数字传输所导致作品在计算机上的显示时间是短暂的,但用户计算机毕竟再现了有关作品,而它是随机存储器对作品进行了复制的结果,而这种权利应当属于著作权人。发展中国家的有关人士则强烈反对将暂存等同于复制,通过努力,1996年12月世界知识产权组织撤消了将临时复制权纳入至有关条约的提案。鉴于计算机显示器与其他现有的物质载体在再现原件时明显的不同——一次性而非永久性(随着关机而消失),鉴于著作权人权利和社会公众权利的平衡,同时也鉴于版权保护的实际可能性和便利性,我曾在1999年底撰文56表示,可以将临时存储视为复制,但是这种权利不应受到法律的保护。至少,在图书馆中读者可享有浏览权。现如今,在IFLA所表示的版权立场中,也倾向于将临时复制排除在复制权之外,并建议考虑——对数字化作品而言,所有图书馆的读者可不经许可、免费地浏览可获得的受版权保护的

56 周德明:“一些网络版权问题的分析与思考”,《图书馆杂志》,1999年 12期117

Page 118: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

资料。

3,允许图书馆做超文本链接和深度链接。网络时代图书馆的重要功能之一是做“知识导航”,如将内容相关的信息集中于一个页面上,以方便读者的查阅,而做超文本链接和深度链接是常用手段,应允许图书馆利用此技术为读者提供相关服务。

4,在法定许可使用方面允许图书馆拥有一些权利。所谓法定许可使用,是指法律规定在某些特定条件下,作品使用人可以不经著作权人同意而使用其已经发表的作品,但仍须向著作权人支付报酬,并说明作者姓名、作品名称及其出处,而且著作权人声明未经许可不得使用的则不得使用。根据我国著作权法第32条第2款、第35条第2款、第37条第1款和第40条第2款的规定,作品刊登后,报刊可以转载或者作为文摘、资料刊登;表演者使用他人已发表的作品进行营业性演出;录音制作者使用他人已发表的作品制作录音制品;广播电台、电视台使用他人已发表的作品制作广播、电视节目等四种行为符合法定许可使用的条件。除此之外,任何形式的使用都得经过许可。鉴于图书馆工作的特殊性——对公开的信息进行收集、整理加工并传播等是图书馆的职责和区别于其他职业的特征,建议许可图书馆可以转载、摘录已发表的作品,并允许做文字修改等,当然,也得向著作权人支付报酬。此举显然有利于丰富网络信息,有利于读者的查寻和阅览,便于图书馆更好地做好信息加工整理工作,保障图书馆向读者提供较高水平的服务。

5,图书馆因其作业需要向著作权人支付费应区别于以营利目的的作业费用。

118

Page 119: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

图书馆的公益性和非赢利性应在尊重版权的同时获得尊重,虽然,我们不应以图书馆的公益性来丧失著作权人的利益,但是,将商业性网站和图书馆作严格的区分是完全必要的,它有利于加速信息传递、利用,加强公益性服务,又能充分维护著作权人的合法权益。鉴此,可在向著作权人支付作品使用费方面给图书馆以最大的优惠,而这部分费用可由政府投资或/和图书馆因提供有关服务而向电信部门或读者收取相应的费用来冲抵。

6,规定图书馆能按访问人次和信息流量向电信部门收取费用。正如本章第四部分所言,图书馆等应努力丰富网上信息资源,吸引读者的浏览或阅读,读者因为上网而向电信部门付费,图书馆可依信息流量向电信部门提取信息资源费,所得款项一来向著作权人付酬,二来继续投资建设信息资源。问题是,就目前而言,有些图书馆已从电信部门获得了此项费用,而更多的图书馆则未获此利,希望在不久的将来能以行政规定的方式来解决此问题。

九.几点启发和思考

国家版权局版权司王化鹏司长说57,发展数字图书馆,有着迫切的社会需求和市场需求。而网络技术的发展又给版权保护带来了许多新课题,版权问题在网络环境中越来越显得重要,这是目前国内外互联网发展面临的共同问题。但是,不论怎么说,各类作品的传播和利用,都应当首先考虑到维护著作权人的权益,这应当成为数字图书馆建设者的共识。57 陆彩荣:“国家数字图书馆须加快建设”,《光明日报》,2000年 8月 23日

119

Page 120: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

1,增强版权意识。“虚拟空间”的法律不虚拟,人们不能因为目前我国版权法的滞后、对有关网络作品传播等无明确规定而随意上载或下载,也不可因目前 ISP或 ICP大多难以维持生计为理由,贸然从事,而应按照法律或从法理和版权法的立法精神和原则出发,树立版权意识,正确对待著作权人的合法权益。要认识到不经著作权人的同意,随意使用他人的作品,不论是报纸、电视或者网络上的作品,都会构成侵权。特别是在“六作家状告网站胜诉”一案之后,鉴于判例事实上对今后案件有着不言而喻的借鉴作用(虽然我国不是判例法国家),我们更要谨慎地重新审视自己的作业,以免引起不必要的麻烦。上海歌舞团在排练舞剧《闪闪的红星》时,就事先寻找了同名电影中三首插曲的词作者,以确认使用许可并支付使用费58,取得了较好的效果,这种做法值得学习。

2,规范操作方式。由于被使用作品的作者不易找寻,可能近在眼前,也可能远在天边,所以即使上载者或下载者想征得许可、支付报酬也不是一件容易之事。因此,建立著作权集体管理机构,由该机构来实施有关管理和作业是众望所归。此外,还应当看到,对有些作者而言,将其作品上载至网上或予以下载是符合其本来愿望的,有的作家感谢网民收集整理他的作品并制作有关主页59,有的作者就公开表明,网站提供他的浏览信息的益处已超过了它们未经许可刊载其的作品可能带来的损害,因而不追究网站的转载责任60。因此,倘有专门机构搜罗有关声明或受理作者的有关声明并在网上布告,方便

58 杨建国:“寻找电影插曲的词作者”, 《新民晚报》,1999年 9月 17日59 范军:“六作家状告网络详情调查”,《中国青年报》,1999年 7月 5日60 寿步:“经济实力与知识产权保护水平——三论软件侵权如何界定”,www.8848.net, (网友来稿)1999年 9月

120

Page 121: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

ISP或 ICP等的作业,这将是一件功德无量的事情。

3,鼓励发展网络信息资源。信息资源是因特网发展的重要基础,否则,有路无车或有车无货的状况是无法吸引更多用户的。依我国目前情况来看,中文信息资源实在太少,因此,有关部门理应制定相应的政策鼓励发展网上资源,譬如:ISP或 ICP等向邮电机构等收取信息费应从政策甚至法律上加以认可,他们对网络及其资源建设所作出的贡献理应在经济上予以确认,读者通过因特网阅读作品要向邮电部门支付电话费和上网费,而网上的信息内容越是精彩,上网者越多,其费用也越大。因此,应从这部分费用中提取一定的比例交付给对信息资源建设作出贡献的 ISP和 ICP,这是天经地义的事情。并且,它势必对繁荣网上作品创作和制作带来不可估量的效应。又如:建议在制定网络作品稿酬规定时,充分考虑目前的情况,对在网络上首次发表作品或者网络转载已发表的作品,向其支付的稿酬能否低于在其他载体上发表的费用,以此作为对尊重版权、着力于网络信息资源建设的上载者或下载者的鼓励。

4,认清图书馆的新任务。数字和网络技术的发展给图书馆带来了新的机遇和挑战,任何图书馆都有可能借助网络方便地向读者提供远比其馆藏丰富得多的信息,同时,它也面临着如何处理诸如版权问题、利用网络信息向读者提供新的服务问题等。图书馆应当是信息、知识的管理者,是著作权人和最终用户之间的桥梁,是信息、知识在社会中快速流通的催化剂,是实施知识共享的组织者。鉴此,在数字化时代,图书馆首先得考虑如何依法从网络上下载有关信息为其读者服务,同时也要努力将作品上载至因特网为网络用户服务。可以相信,随着因特网的不断发展和普及,越来越多的作品将在网上或首先

121

Page 122: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

在网上发表,如果不对此项工作予以必要的重视,不以网上的信息来丰富、充实自己的馆藏,依旧仅从传统的信息载体中进行采集,那么,就有可能只能向读者提供过时甚至错误的信息,因而也就无法提高服务的水平和质量。迄今为止,还少有图书馆专门从网上搜集信息为众多的读者服务,这无疑是令人遗憾的。其次,图书馆应组织人力将网上搜集所得的信息予以整合,譬如目前网上可免费阅读的期刊很多,能否收罗有关网址并加以分类、标引等,将它们集于一个界面、以导航似地向读者提供服务?这样,不仅能在第一时间提供新到期刊,而且还可大大地节省采购费用,同时又免去了催刊等麻烦。再次,图书馆应该着手制定有关网上信息下载后的服务等工作规程和尝试这种服务。这种服务可以以软盘、光盘等形式,也可通过 Email形式进行信息传递等。即使是在有关版权规定尚不明确的情况下,图书馆也可先从丧失版权的文献资料、作者声明可以上载、下载的信息、允许免费使用的信息资料等着手进行。可以想象,这种服务必定会受到读者的欢迎和好评。当然,科技发展对图书馆带来的最大挑战是对馆员的要求提高了,图书馆的工作重心似乎正在或已经从传统的分类和编目等工作中游离出去,朝着利用先进的网络手段对信息和知识的搜集、信息和知识价值的判断、信息和知识的管理上靠拢,因为,这是向读者提供迅捷、有效、正确服务的基础、前提和保证。这就是说提高馆员的知识素质和水平是当今图书馆最主要和最重要的任务。

5,积极主张网络时代的图书馆“特权”。树立版权意识,正确对待著作权人的权益是必要的;一味地消极等待,过份夸大网络著作权是不明智的。美国图书馆协会的 Adam Eisgrau说:“过去法律只是在你滥用了所得到的信息

122

Page 123: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

时才给予制裁。而现在,只是简单地得到信息就被法律所禁止了。61”这番话表达了相当一部分图书馆业内人士对网络著作权问题的疑虑和担忧,从某种意义上说,如果不处理好图书馆工作、数字化作业和版权保护之间的矛盾,将会直接影响到图书馆的服务水平甚至图书馆的生存,因此,理性地分析数字、网络时代的特性,寻找在这一背景底下的著作权人和公众之间的平衡点,并积极地在著作权法修订过程中主张图书馆的权利,应当是我们当前另一个棘手的任务。

图书馆肩负着留存人类文明记录、传播知识、教育大众等重要职责,网络时代的图书馆,依然承担着这些职能。同时,它还得努力研究在新颖的数字时空中建设新的家园,承受起知识导航的新职能。而在这建设浪潮中,图书馆必须很好地处理种种著作权问题,不致于在建设数字图书馆之初留下让后人遗憾的话柄。

参考文献:

1,许超:“新技术与国际著作权保护的发展趋势”,《知识产权》,1997年第 2

期2,应明:“作品在计算机互联网上向公众传播行为的法律调整”,《著作权》,1997年第 2期3,应明:“作品数字化转换的著作权法律性质”,《著作权》,1997年第 1期4,沈仁干:“世界知识产权组织推出两个新条约”,《中国专利与商标》 ,61 谢新洲:《电子信息源与网络检索》,P300,北京图书馆出版社,1998年 12月

123

Page 124: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

1997年第 2期5,薛红:“因特网上的版权侵权责任”,《电子知识产权》,1998年第 10期第 2页6,Copyright in the library—the digital library”, www.utsystem.edu/ogc/intellectualproperty/1-diglib.htm

7,Georgia Harper: Copyright Law in the Electronic Environment, 出处同上8,唐进:“如何捍卫网上版权”,来自私人 EMAIL,原出处不祥,2000年9,中国版权保护中心:“关于落实国家版权局《关于制作数字化制品的著作权规定》的通知,中版权字[2000]第(043)号10 , Andrew Christie: Reconceptualising Copyright in the Digital Era, EIPR,

1995(11)

11,周德明:“关于数字化环境下图书馆的‘特权’问题”,《上海高校图书情报学刊》,2000年第 2期12,周德明:“网上著作权保护与数字图书馆建设“,《大学图书馆学报》 ,2000年第 4期

124

Page 125: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

第七章 数字图书馆人才建设

一.数字图书馆建设对人才的需求从信息经济到知识经济,人才已经成为最重要的生产力资源。而网络化、数字化正是

产生数字图书馆建设需求的技术背景与环境。数字图书馆是由于在信息经济、知识经济的热潮中,人们有更有效地利用与管理信息与知识的需求而应运而生的。数字图书馆领域本身是最为具有信息经济与知识经济时代特征的新兴领域。在这样的一个建设领域中,人才无疑是最重要的建设资源,是事业成败的关键。

70年代曾经有过一次关于“信息爆炸”的浪潮,那时人们普遍认为随着科学技术与经济的快速发展,人类社会产生的信息与知识呈指数型增长,对于信息的加工与利用成为一个亟待解决的问题。因此,这一次对于信息爆炸的充分认识也促使了以计算机为代表的信息处理技术的飞速发展,使计算机这一计算工具从主要为科学计算服务转变为主要为信息处理服务,同时也为这一产业的发展提供了广阔的市场空间。由于计算机的处理能力依照满足摩尔定律的速度高速发展,而且不光是硬件,软件也在短时间内得到长足的进步,所以它比较好地满足了许多行业对信息处理的需求,使得这些行业的工作效率与效果都得以很大的提高。这其中就包括图书馆行业。正是由于计算机应用在图书馆的成功,使得图书馆界的工作重点从手工加工为主逐渐转型,对于一些传统的专业人才的需求大为减少,很多人也认为依靠计算机就可以直接将图书馆的所有问题都解决了,图书馆界以后需要的大量是从事计算机开发与应用的专业技术人员。这样的背景也直接或间接的导致了象美国的大量图书馆学院裁并的情况,使得图书馆的专业教育进入了一个低谷。(这一点与我国目前的图书馆学教育进入一个低谷有一定的类似)。90年代,随着网络的发展,尤其是因特网的发展,一个完整意义上的信息社会的雏形诞生了。由于信息的大量无序的膨胀,使人们又一次惊呼“信息爆炸”的来临。但这一次的“信息爆炸”的热潮与 70年代那一次有着很大的不同,70年代的信息爆炸中的信息绝大部分来自于传统的媒介,比印刷型的文献、期刊、报纸,新型的影视与音频资料,绝大多数还是属于非数字化的信息资料,所以解决那一次信息爆炸难题的关键是找到并利用新的信息处理技术,这就是基于计算机处理的信息处理技术的由来。而由于多年来信息处理技术的推广应用,使 90年代的信息爆炸中的信息多半即是由计算机或网络技术环境下产生的数字化信息。对这一次信息爆炸难题的解决重点已从转换、处理及应用转变为管理、分析及应用上来。换言之,是要找到一些能够真正管理与利用海量信息的技术与方法,使信息从无序走向有序,使信息能得以更为有效地应用。在这样的背景下,图书情报业界的一些专业理论与方法重新受到了重视,因为这些理论与方法是百多年来经实践证明是行之有效的方法,有一些在 70年代后计算机应用的实践中又一次得到了验证。而将这些理论与方法应用于数字化与网络环境下的信息管理、分析加工及服务则成为数字图书馆建设的重要基石,也是数字图书馆员的首要任务。有意思的是

125

Page 126: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

也正是基于这样的认识,因特网的发展使得美国许多关闭的图书馆学院又得以恢复。62

在数字图书馆环境中,因为图书馆员所管理的信息的性质、数量与质量以及存取方式都发生了很大变化,虽然对信息的组织、管理与服务的效率应该比传统的方式有很大的提高,但并不能因此就认为对专业信息管理人员(图书馆员)需求的减少。有人认为技术与数字图书馆的概念减少了对专业人员的依赖,使数字图书馆管理与运作中人员数量大为减少,人才的需求并不是很大。其实事实并非如此。目前的信息技术发展一日千里,但信息技术的发展还是有其局限性。诸如参考服务、编辑、摘要评论与元数据标引等工作以及人性化的服务方面,并没有相对应的具体技术手段可以替代人。以我们现在面临的又一次信息爆炸的背景来看,我们对具有现代信息管理能力,掌握现代信息技术的专业人士的需求不是少了,而是多了。对这些人才的需求也不会再局限于传统的图书、情报行业,而是会延伸到所有需要信息管理与服务,所有需要应用数字图书馆概念与技术的广阔领域去。

相对于传统的图书馆行业来说,数字图书馆建设已经不再注重建筑物实体的建设,对信息资源也从保有转变为更注重获取的能力,所以在数字图书馆的建设与服务中更强调人员与技术的层面,强调人的作用,强调人的专业知识、技术能力、信息素养等等。

传统图书馆中,图书馆的馆员一般只是在一个已经建设完成的图书馆中专注于服务与自己的业务工作。而在目前图书馆业界的数字图书馆建设热潮中,数字图书馆员不仅仅要专注于数字图书馆的服务与业务工作,更多地是要与行业外的专业技术人员一起来规划设计与建设数字图书馆。在这一过程中,不仅对新型人才的需求更大,而且要求更高。那么数字图书馆建设与运作到底需要什么样的人才呢?本章将对数字图书馆建设与运作中所需要的人才结构、数字图书馆员的角色定位、数字图书馆员应用的能力与素质以及如何来建设与培养这样一支数字图书馆人才这些问题作一些初步的探讨。

二.数字图书馆建设所需人才队伍的结构就象传统的图书馆建设与运作一样,数字图书馆的建设与运作是一个系统工程。在

数字图书馆的建设与运作中,我们需要各种类型与技能的人才,实际上是需要一个有着合理结构的团队才能完成数字图书馆建设与运作这样一个系统工程。理解与掌握数字图书馆建设中所需人才的结构,对于数字图书馆建设与运作所需人才的建设是至关重要的。根据数字图书馆建设与运作的特点与要求,我们认为数字图书馆主要需要以下几类人才:(一) 管理人才

纲举目张,管理人才在整个数字图书馆建设与运作所需的人才队伍中是最为重要的。尤其是在数字图书馆的建设与运作中,由于数字图书馆的建设本身尚未在方案与技术上完全定型,因此更迫切需要具有领导才能的高级管理人才高屋建瓴的长远眼光与决策能力。

其次,数字图书馆建设的最终目标并不是靠一两个图书馆所能建成的。因此在一个系统、一个地区或者是国家范围内各个数字图书馆建设实体的领导层之间的合作与协调能力,是整个数字图书馆系统工程建设成败的关键。

第三,在数字图书馆以往的建设实践中,都存在一个理想的模型与现实的实践之间的矛盾。对于传统的图书馆行业来讲,比较现实的做法是在传统的图书馆基础之上着手进62 本段落所描写的年代与背景依国外的情况而言,我们国家由于 10年动乱的耽误。从 80年代初才走上改革开放的道路,所以在时间与背景上与国外有着明显示的不同。

126

Page 127: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

行数字图书馆的建设。如何解决在数字图书馆的建设与传统图书馆的运作之间的关系与矛盾,也是摆着数字图书馆建设管理人员面前的重要课题。解决与平衡这样的矛盾关系涉及到人员、资金、设备条件、技术条件与业务改革等诸多方面,不仅需要管理人员对传统的图书馆业务与管理有着深入的了解与经验,更需要他们对现代信息技术的相关知识与发展方向有很好的理解力。

第四,数字图书馆与图书馆自动化不同,因为后者已有着成熟的技术与模型。数字图书馆的建设就比如将一个个已知的技术方案作为零件组装起来,成为一个完整的系统,但是目前这个系统并没有一个放之四海而皆准、相对比较完整的设计方案。这样的系统往往因各个数字图书馆建设实体的资源组织、资源管理与服务模式的不同而有着很大的不同,同时也受限于各个单位的人力、资金与各种条件的限制。如何来设计与组装符合自己单位的实用系统,这里最主要的是依靠管理人员的创造能力与其对技术的理解能力。

我们在数字图书馆的建设中面临着许多新的技术课题、新的矛盾关系,需要新的思路。 所有这些原因都使得我们在数字图书馆的建设与运作中,对懂技术、善管理、具有创造性的高级管理人才的需求更为迫切。我们认为,在数字图书馆的建设中,管理与技术这两大要素中管理更为重要。由于在数字图书馆建设中所涉及的一些高精尖的技术课题,实际上也是整个信息产业界所面临的课题,有些还是多年来悬而未决的难题。对这些问题的解决,显然并不能依靠我们图书馆业界的数字图书馆建设者们去完成。而对我们所拥有的传统的信息管理理论与方法的应用,对新兴的信息技术的应用,并使之切合我们自身每个单位的特点,使之组合成为一个有效的应用系统,则一定要依靠我们自己的管理人员来完成。

对于数字图书馆建设与运作的管理来讲,所需的管理人才也是多种多样的。有的负责决策与规划,有的负责技术开发、工程管理,有的负责业务运作与服务等等。对于一个较为大型的数字图书馆系统建设来说,要求管理者具有面面俱到的能力是不现实的。为了讨论为满足数字图书馆的建设与运作的要求,而应具有的管理能力与素质问题,我们将相关的能力与素质要求列出,但这里并不等于说每一个管理者都应具有所有这些能力与素质。

我们认为数字图书馆建设与运作的管理者所应具有的能力与素质如下:领导才能;(包括决策能力与远见卓识)管理知识与经验;(包括对传统图书馆业务的管理知识与经验)对图书馆的基本理论与方法有很好的掌握;对数字图书馆概念与内涵有着正确与充分的认识;对新的信息技术有很好的理解力;软件系统开发、网络集成等技术工程管理能力;业务创新与管理能力;人际关系协调能力;对外宣传、合作的能力;市场运作能力。

(二) 数字图书馆员对应于传统图书馆员是图书馆建设与运作的中坚一样,我们将执行相类似任务的数

字图书馆工作人员定义为数字图书馆员,也就是在数字图书馆建设与运作中主要参与信息组织、管理与服务的工作人员。

数字图书馆的建设与运作需要合格的数字图书馆员,这是一个很简单的道理。那么什么是数字图书馆员呢?具有什么样的能力与素质才是合格的数字图书馆员呢?我们认为就象数字图书馆这一概念本身是一个还在不断发展的概念一样,数字图书馆的建设与运作还有很多的未知等待着我们去探索。在目前的情况下,强求关于数字图书馆员的精确定义

127

Page 128: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

意义不大。一般而言,我们可以简单地将其理解为能够满足数字图书馆建设与运作要求的合格人才为数字图书馆员。

从数字图书馆员的任务描述出发,数字图书馆员的许多工作与传统图书馆员的工作应该是相互对应的。

例如传统图书馆员要对数以万计的资料进行分类整理,通过提供读者检索工具以帮助读者更好地找到资料。这些任务在数字图书馆时代也一样是非常重要的,甚至是显得更为重要。

今天在网上的检索工具中,很少有象传统图书馆那样组织良好的检索工具。如何来对数字图书馆资源进行更好地组织与管理是值得探讨的一个课题,甚至可以说是最重要的课题。实际上,这也是对数字图书馆需求的根本起源。

另外一项图书馆员的传统工作是参考咨询,读者并不需要去了解如何来获得信息,图书馆员成为了用户与信息之间的桥梁,或者说是将是读者的信息或知识导航员。

这项传统的重要工作,实际上是包含两个方面的内容。第一,用户总是需要帮助来获得他所需要的信息,无论这些信息是否是数字化了的。当然开发上面介绍的检索系统能使这个工作变得更为方便,但是使这样的系统能够做到象今天的参考工作那样的有效则是需要进一步的研究;第二,用户所面临最困难的部分是如何来获得数字图书馆的服务,如何来联接上数字图书馆的网络。在今天,因特网是个很好的选择,但不管什么样的物理连接方式都会造成用户费用上的负担。另一个选择是到一个实体的图书馆中,而通过这个图书馆的数字图书馆终端则可以访问到其他图书馆以及整个广域网上的数字图书馆资源。

最后我们要提到的是传统图书馆员所需要完成的是馆藏建设任务。它是根据用户的需求,由图书馆员考察与评估所有可获得的信息资源,并将其中最适用于需求的部分采购进来。

如今的数字图书馆包括了各种各样的资源。有些资源的存取非常方便(例如 WWW网络资源),也会使得我们忽视对其他传统的资源组织,这一现象在我们的一些情报咨询部门显得较为普遍。实际上传统的印刷型的许多资源对上述存取方便的数字化或网络资源是很好的补充,并且更为可靠权威。在未来传统的藏书建设政策一定会有很大的改变与发展,其最终目的也是为了获得更为完整与有效的信息资源。数字图书馆员的任务就是要不断地学习与发展这样的策略,以使未来数字图书馆的信息资源的储备能够满足用户的需求。

在有关数字图书馆建设所需人才中,对数字图书馆员的讨论是本章的核心内容。在下面的各个小节中,我们将逐步地描述与界定数字图书馆员的内涵与要求,力求勾勒出未来数字图书馆员的大致概念。(三) 技术人才

传统图书馆管理与服务的主要内容是印刷型文献,而数字图书馆管理与服务的主要内容是数字化资源,相对应的,没有数字信息技术能力是不能胜任建设与服务工作的。正如在传统图书馆中,由于工作积累,涌现了许多文献整理与校勘专家。在数字图书馆的建设与运作中,没有对数字化资源的特点、管理以及存取的工具(软硬件平台)有充分的知识与操作能力,也是难以想象的。同样经过长年数字图书馆建设的经验积累与能力的提高在现有的数字图书馆工作人员中,出现一批对数字化资源管理、运作以及相关技术有相当造诣的专家也是有可能的。因此,在数字图书馆建设与运作中,对技术人才的需求是巨大的。可以说数字图书馆的建设与运作是一个信息技术密集型的行业。

对技术人才的需求也包含两个层次的含义:一是要引进数字图书馆建设与运作所需的高技术人才;二是现有的传统图书馆员必须要进行转型,增加技术能力的含量,否则将不能满足未来数字图书馆行业发展的需要。

128

Page 129: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

那么我们到底需要一些什么样的技术人才呢?这可以从技术与具体的工作内含两方面来加以界定。

从技术内容来看,数字图书馆建设与运作大致以下具体技术:数字化技术;信息管理63技术;网络技术;服务器及个人信息终端相关技术;多媒体及内容发布技术。在这些技术中,数字化与信息管理与传统的图书馆建设有一定的相关度,而后面的三项技术内容对图书馆员来讲则是全新的信息技术内容。

从具体的工作内容来看,数字图书馆建设与运作所需的技术工种大致有以下几类:开发主管与系统设计;软件工程管理;核心技术开发;编程人员;网络规划与设计;网络管理与维护工程师;网站工程师;小型机与大型机服务器管理;个人信息终端支持;资源数字化专家;内容管理专家;美工与设计人才;多媒体制作专家。64

同样在上述工作内容中,有一些可以由传统的图书馆员通过培训与学习顺利转型。而其中大多数都是需要全新的信息技术知识与能力,这些知识能力甚至经验与传统的图书馆员的专长差之甚远,这就更需要我们的绝大多数图书馆员为了跟上时代的步伐,甚至可以说为了自己的职业前途而付出加倍的努力。

当然,由于数字图书馆的建设与运作是一个技术含量较高的领域,其中涉及到一些高级的技术人才(尤其是在初创的建设阶段)以及纯粹的技术工作(如编程人员),对于这些人才的需求往往可以用外包或合作的形式来加以解决。这是因为,在建设初期所需的技术人才,一旦在建设阶段结束进入正常运营的阶段后就不再需要了。其次从图书馆的实际情况看,它也不可能养一批目前人力成本很高的信息技术专门人才,国内的情况是如此国外情况较好的图书馆也是如此。国外的一些图书馆也有将整个的信息技术支持的部门外包的情况。这样的做法,使得图书馆能以较低的成本得到最为专业的服务,也籍以人才使用的社会化分工使得专为人才的使用效率得到最大的发挥。而传统的做法使得图书馆很少能得到最好的技术人才,即使有幸找到这样的人才,也往往会造成人才高消费的现象,最终的结果也是难以留住人才。

但是以上的做法并不是说我们不需要专门引进专业的技术人才。对于我国的绝大多数图书馆来说,对技术人才的引进是不足的。虽然说这也有着各方面的原因(比如说待遇、工作条件等等),但是技术人员的引进不足也使得整个图书馆行业缺乏技术氛围,也由于没有相应的技术人员的带动,整个图书馆界的图书馆工作人员与管理人员对信息技术的相关知识与理解力偏弱。对于数字图书馆建设这样带有浓厚的系统工程来说,不能不说是一个致命的弱点。所以说,加强专业技术人才的引进、培养与管理,对于搞好数字图书馆建设63 也可以称为内容管理(content management)技术,在这里主要指在现代信息技术条件下如何对信息与知识进行管理的技术与方法。这些技术的很多理论与具体方法脱胎于传统的图书情报行业的科学方法。64 数字图书馆所涉及的技术内容与工种将随着信息技术与数字图书馆建设理念的发展而不断地发展。这里所列的一些内容仅是笔者在目前的技术环境下,所涉及到的一些主要技术内涵与工种,仅供参考。

129

Page 130: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

是十分重要的,尤其是在数字图书馆的初创阶段。总体而言,根据数字图书馆的建设实际需要出发,目前我们应该加强对技术人员的

引进与培养。引进与培养应偏重于技术管理与应用的人员,而将开发阶段所需的专业人才甚至是今后的技术维护都可以用外包与外协的方式予以解决。

(四) 市场营销人才我们都知道,传统图书馆与数字图书馆的定位有着很大的不同。传统的图书馆偏重

于文献资源的收藏,每一个图书馆的服务对象都有着其相对固定的社区、学校、城市或一个系统的范围。由于市场区隔相对固定,每个图书馆在其固定的用户区域内一般不存在与其他图书馆之间的直接竞争。可以这么说,原来的图书馆是没有多少市场意识的,可能也正是这一点,使得在信息社会到来之际,传统图书馆在信息服务领域的地位日渐衰弱。

数字图书馆则不同,数字图书馆的理念就是要在网络的环境下,打破时空的限制向用户服务。因此在相同的市场区域中,数字图书馆与数字图书馆之间的直接竞争应该说是不可避免的。一个数字图书馆要获得成功,赢得生存的机遇,也必然要在市场营销上赢得先机。虽然相对于传统图书馆的公益性来讲,数字图书馆是否仍然具有公益性尚无公论65。但不管数字图书馆的成败生存一定要建立在成功的市场营销基础上,因为它相对于传统图书馆而言,已经没有了地域与时空的壁垒,被替代的可能性要多得多。因此,每一个数字图书馆在建设之初就应把市场营销的观念放在首位,找到真正的用户需求,作出自己的市场定位,加强自己的核心竞争优势,在数字图书馆的市场区隔争一席之地。

这样的定位就带来了数字图书馆对市场营销人才的需求。严格意义上来说,市场营销观念应是数字图书馆建设的出发点,因此市场营销人才这一在传统图书馆中找不到位置的专业人才应成为数字图书馆建设的排头兵。与其他领域的市场营销不同,数字图书馆的市场营销实际上是一种针对信息市场服务的产品营销,数字图书馆的产品就是一种服务,而其服务的内容就是信息或知识。从这一点来说,数字图书馆的营销人才必须对信息市场营销的特点有深刻认识,掌握信息服务的主要业务内容甚至于对传统图书馆的服务有相当的认识。

从工作内容上来看,数字图书馆的市场营销人才其主要工作是:需求分析(市场调查、用户调研)、市场定位与营销战略、市场促销等等。与传统行业不同的事,由于数字图书馆本身的特点,在市场促销中网上促销方式将成为其重要内容。(五) 法律人才

我们知道在数字图书馆建设中会涉及很多的法律问题与相关事务 66,因此在数字图书馆的建设与运作过程中,法律人才是不可或缺的。由于数字图书馆建设中涉及的一些问题比较新,涉及面也较广,有些相关问题还难以在现在的法律框架中找到定论。这些不确定性与实施的难度使得数字图书馆建设中法律人才的需求更为迫切。国外在数字图书馆建设过程中,非常重视相关的法律问题。比如美国国会图书馆的美国回忆( American Memory)数字图书馆项目,其每一个子项目的内容版权问题都要经过专门的法律专家小组的审核。而我们国家的很多相关建设项目中,对版权问题的重视程度并不是很高。

对于数字图书馆建设来说,所需的法律人才首当其冲是版权问题方面的专家,他不仅能够帮助制定数字图书馆建设中的相关版权保护政策,进行一些版权内容的谈判,还可65 数字图书馆本身的概念实际是超出传统的图书馆这一公益性的社会机构这一领域的。所以最终极有可能表现出其多样性的形式,即包括公益性的机构形式、商业性或半商业化的机构形式等等。66 本书第章也就数字图书馆建设与运作的相关问题作了详细的论述,在此就不再重复展开论述。

130

Page 131: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

以帮助数字图书馆建设单位保护自身的知识产权。此外,数字图书馆建设也是一个资金密集型的事业,其中涉及相当多的设备购买、协作开发、外包等等很多商务运作内容,没有一个合同方面的法律顾问专家或专职工作人员是不行的。同时,数字图书馆的运营与服务,也同样会涉及到用户与服务方的利益纠纷、服务质量与内容的纠纷等等,对相关问题的解决也是需要在合同基础上,由法律专家或专业人士予以处理。

对于相应的法律人才需求,外聘的法律顾问是必须的。同时,专职的法律专业人员也是不可或缺的,尤其是对原来规模较大的单位来说,其原有的业务需求再加上数字图书馆建设中大量的版权及合同事务,不配备一至二名专职的法律事务工作人员一定会给今后的工作造成不小的麻烦。

三.数字图书馆员的角色定位角色,从社会学的意义来说,指的是与人们的社会地位、身份相一致的一整套权利、

义务的规范与行为模式。i 在过去的几十年间,图书馆员的职业角色发生了很大的变化。从传统图书馆走向图书馆自动化、电子图书馆以及数字图书馆,图书馆所管理的信息资源的形式特征、服务模式及各种相关工作内容都发生了很大的变化,这就迫使图书馆员的社会角色也发生不以自身意志为转移的变化。对于现代的图书馆员或者是新型的数字图书馆员来说,就其角色的变化而言,出现了许多新的称谓 ii。这些新角色如信息领航员(Information Navigator)、知识出版者 (Publisher)、信息管理与传播者 (Information manager and Communicator)、知识导航员(Knowledge Navigator)等。1993年,比利时人米歇尔·鲍文斯(Michel Bauwens)还首次使用了”Cybrarian”来称呼那些利用网络技术进行信息采集、管理和服务的人。iii

虽然以上这些称谓五花八门,不一而足,但大多是从一个侧面或某一个部分反映数字图书馆员职业角色的变化或其所具有的某种职能。在所有这些称谓中,笔者最认同的还是“知识导航员”这一名词。iv

从传统的图书馆员到“知识导航员”的角色的变化,正好体现了数字图书馆与传统图书馆在基本概念与服务理念上的不同。传统的图书馆员以管理传统的文献信息为主,然后作为文献与读者之间的二传手将文献提供给读者,许多工作是被动的和简单重复的。而“知识导航员”则是利用现代信息技术,根据用户的需求,组织自有或网络上的信息资源形成知识库,提供给用户服务。最终直接帮助用户找到其所需的相关知识。v 在这里,数字图书馆员的角色就不再是一个简单的类似仓库保管员的职能,以及类似二传手的简单服务能力,而是一个能主动了解用户的需求,利用现代信息技术,查找、管理、利用现有的信息与知识,分析、综合、加工成用户所需的知识内容,最后是利用信息技术发布或者帮助用户i 刘献君等编著. 社会学. 北京:科学技术文献出版社,1987:70ii 汪冰. 电子图书馆理论与实践研究. 北京: 北京图书馆出版社, 1997: 207iii http://www.lib.pku.edu.cn/98conf/paper/a/WuWeici.htm数字时代大学图书馆的战略对策 吴慰慈 周庆山iv 吴建中. 21世纪图书馆新论. 上海: 上海科学技术文献出版社, 1998: 62v 马远良. 图书馆面临新世纪挑战的对策. 图书馆杂志,1999(6)

131

Page 132: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

查找到他所需的知识。简而言之,数字图书馆员成为用户在知识与信息海洋中真正的导游主动服务替代了简单的保存与传递。

对于数字图书馆员在新时代的各种角色内涵,美国科罗拉多州的图书馆员 Nancy Bolt,对信息高速公路环境下的图书馆员的角色作了详细的论述67,她认为网络时代的图书馆员作为知识导航员主要具有以下的角色内涵:

1. 知识提供Knowledge Provider 2. 知识中介Knowledge Gateway 3. 知识教员Knowledge Teacher 4. 知识组织Knowledge Organizer 5. 知识创建Knowledge Creator 6. 知识交流Knowledge Partner对于上述角色的具体职能与要求,她在如下的表中作了详细完整的论述vi:角色 用户对图书馆的期望 图书馆员的专业知识与判断知识提供

Knowledge Provider用户希望图书馆不仅仅只有传统的信息资源,也要有充分的数字信息资源来满足他们的需求。

图书馆员作为用户的代理来访问信息高速公路68上的数字化资源。

知识中介Knowledge Gateway

用户希望能通过图书馆来访问信息高速公路

图书馆员负责制定政策、组织资源,并且作出让用户以何种物理方式通过图书馆访问信息高速公路的决策。

知识教员Knowledge Teacher

用户希望通过图书馆来学习如何使用信息高速公路上的信息。

图书馆员指导用户如何来访问、评价与利用信息高速公路上的信息。

知识组织Knowledge Organizer

用户希望图书馆能提供经过组织的信息高速公路上的知识导航

图书馆员选择、组织对信息高速公路上的资源导航,并且提供用户快速的访问通道。

知识创建与出版Knowledge Creator and

Publisher

用户希望提供由图书馆自己创建的用户需要的网上信息。

图书馆员创建联机目录与其他信息资源,并使它们可在信息高速公路上被用户访问。

知识交流与推动者Knowledge Partner

and Advocate

图书馆服务的社区及股东希望图书馆成为一个在设计与实施信息高速公路方面成为一个合作伙伴。

图书馆员应成一种粘合剂,它能将社区与各个学院机构的信息高速公路计划组合起来,并且推进图书馆在其中的作用。

数字图书馆的研究与实践使得数字图书馆的相关技术发展大大加快,但所有这些技术并不能替代数字图书馆员的作用,同时也没有一种相关技术能创造出自动的数字图书馆员来。反过来说,传统的图书馆员向数字图书馆员角色的转变并不是“顺理成章”的,这67 这篇论述最早被贴在一个名为 PUBLIB的讨论组中:"Role of Libraries on the Information Superhighway" by Nancy Bolt, Christine Hage ([email protected]) posted to the PUBLIB listserv, [email protected], 15 Aug 9668 信息高速公路作为一个年代已久的概念已被更为宽泛的全球网络与宽带高速网络的观念所替代。笔者忠于原文,译文保持原意。但从目前应用现实来说,似乎因特网一词更贴切一些。vi http://statelibrary.dcr.state.nc.us/hottopic/pubacc/Roles2.htmThe Role of Libraries on the Information Highwayby Nancy Bolt, State Librarian of Colorado

132

Page 133: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

需要图书馆员自身作出巨大的努力,不仅在观念与心理上要做好充分的准备,而且在知识技能方面都需要很大的提高。信息时代的冲击,信息资源的多样化,使得传统的图书馆功能削弱了,传统的图书馆员的社会角色在弱化,社会地位在下降。数字图书馆的发展给图书馆员自身的职业发展提供了一次挑战,但更是一次机遇。能否成功地转型就取决于各人的主观意志、能力与环境。

四.数字图书馆员的素质与能力要求数字图书馆员是建设与运作数字图书馆的骨干力量。数字图书馆员不仅需要具有传

统的文献信息及其相关的管理与服务知识,更需要对新技术尤其是信息技术与网络技术有深刻的认识与掌握。由于数字图书馆本身还是一个发展中的事物,新技术的发展也日新月异,那么对于数字图书馆员来讲,为了胜任在这样的环境中的任务要求,他们到底应该具有哪些素质与技能呢?我们认为,数字图书馆员应具有以下三种能力与素养:良好的信息素养、计算机技能与终身学习的能力。(一) 信息素养

什么是信息素养(information literacy):简言之,信息素养就是获取、评估、查找以及利用信息的能力,并且能据此能力成为一个终身学习者。vii 如果我们将信息素养中的信息能力再扩展一下,那就是能够明确信息的需求,对获取信息有进行综合与分析的能力,并将结果以一定的形式与他人进行交流与利用。

1992年,Christina Doyle 进一步利用 Delphi 循环问卷法的方式,结合全美各地 136位受访者的意见,将信息素养进一步定义为:有能力从各种不同的信息来源获取、评估和使用信息。并据此细分为十种能力:(1)能辨识自己的信息需求;(2)能了解完整的信息与智慧决策之间的关系;(3)能有效地陈述信息问题,表达信息需求;(4)知道有哪些有用的信息资源;(5)能制订妥善的信息检索策略;(6)能使用印刷型及不同方式储存信息资源;(7)能评估信息的关联及有用程度;(8)组织信息使其有实用性;(9)吸收新信息使之成为自己知识结构的一部分;(10)能利用信息进行批判性思考及解决问题。viii

在现代信息社会的环境中,每一个从业者对于信息的利用能力都是其自身社会竞争力的最主要组成部分。对于从事信息专业工作的图书馆员来讲,信息素养更是其必备的专业素质与能力。另外无论从社会环境,还是从传统图书馆到电子图书馆再到数字图书馆的发展演变,图书馆已从依赖于信息载体的信息管理与利用跨越到载体的无形时代,直接关注于信息与知识是目前建构于网络时代的数字图书馆的最主要的特点。数字图书馆员在建设与运作数字图书馆的过程中,正是要关注信息本身,加深对信息的理解与利用能力,不断地学习新的信息与知识,以完成管理、综合、加工与利用信息的任务,因此具有较高的信息素养能力是其能力结构中最重要的基石。

学会确定在网络时代中数字图书馆环境下用户对信息的需求,熟悉数字信息及其在网络环境下的特点,学会正确地评价数字化信息的价值,掌握网络环境中数字信息的查找与获取,对数字信息的综合与利用以及与其他信息机构及专业同行乃至用户的合作意识是数字图书馆员的信息素养能力在数字图书馆建设与运作中的具体表现。数字图书馆员只有viii 钱佳平. 知识经济时代的图书馆教育职能——信息素养教育. 图书馆杂志,1999(1):15-16

133

Page 134: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

加强自身信息创新方面的教育、提高信息素养,这样才能为用户提供全新的、深层次的信息服务。(二) 计算机素养

对应于信息素养有所谓计算机素养的要求。因为无可否认,计算机技术是现代信息社会中信息创建、处理与传播的基本工具与平台,也是现代信息技术概念的内涵。不掌握计算机相关技术,没有这一方面的基本能力,信息素养能力的发挥是要大打折扣的。

计算机素养(computer literacy),也有人称其为是工具素养(tool literacy)或者直接称其为信息技术素养,其含义就是利用计算机或者说是信息技术工具的能力 ix。这一素养强调操作与管理利用的能力,而不是以人作为机器的奴隶。实质上,计算机素养应该是信息素养的一个组成部分,它将对信息的知晓转向了对信息的利用工具与手段上。x

过去十年内,信息技术的一个最重要的进展就是能够更有效地组织与输送信息给每一个人,现在这一输送信息的能力早就大大超出个人所能管理与有效利用它们的能力。技术的进步,信息的洪流,推动着个人不断地去学习掌握计算机技术,并使之用于更有效地利用信息。这些技能都成为了信息素养的一个重要组成部分。这也就是谈到信息素养不能不重视计算机素养的主要原因。当然计算机素养服务于信息素养这一整体性的能力,而信息素养具有更为广泛的含义。

作为一种素养来说,并不是具体一种技能的代名词。对于不同的人,不同的应用需求素养可以表现为不同的要求,不同的层次。美国外语教育委员会(ACTFL,The American Council on the Teaching of Foreign Languages)对计算机素养进行了进一步的界定,划分成五个层次。这五个层次分别是游客级(偶而为之的用户);寄居级(日常用户);航行者级(专业用户);探索者级(高级用户)以及最高层次大使级。下面我们简单介绍这五个层次不同的能力与技能要求。

第一级:游客级(偶而为之的用户)能力:能够使用计算机上的预先安装的娱乐或教育软件包,或者能够使用文字处理

器、电子试算表或数据库来完成简单的任务。这一级的用户能够在需要的时候处理与使用相关技术。

技能:知道如何来同操作系统打交道,并且在能够在基本的层面上处理应用程序:包括装入和运行程序,管理文件。还具有一些管理在硬盘上的文件的技能并能独立的学习应用程序。理解计算机硬件与操作的基本概念。

第二级:寄居级(日常用户)能力:能够熟练运用一些较窄范围内的特定应用程序来完成比如桌面出版、作业与

工作任务,这些应用程序可能是文字处理程序、电子试算表、桌面出版以及图形制作等等。能够对一至二个应用程序掌握良好的技能,并且还熟悉许多其他应用程序。

技能:更为高级的应用程序与操作系统道管理,包括硬盘的组织管理。能够利用应用程序中的快捷键以及定制应用程序。利用 e-mail进行简单的交流能力以及利用万维网来查找信息。具有初步的解决系统故障问题的能力。

第三级:航行者级(专业用户)能力:有能力运用一个较大范围内的应用程序如完成创新的工作要求,包括多媒体

的报告,高级的桌面出版计划以及管理一个小型的企业。能够将许多的应用组合在一起,比如电子试算表、数据库和文字处理器等等,利用它们来管理大型的项目,并且为每项任务选择最合适的应用程序。专业用户应该能够引导以及创新地运用技术,能够创建并完成他或她不可能以其他方法完成的任务。

134

Page 135: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

技能:专业用户使用多个应用程序。他们很容易地利用电子邮件的附件及各种创新应用,利用万维网作为下载信息的来源(这意味着能够管理及操作许多不同的文件格式以及相应的工具)。能够完成简单的硬件安装与升级任务。

第四级:探索者级(高级用户)能力:不仅能够以专家的眼光选择商业的应用软件,而且能够选择共享软件与工具

来提供一个独特的解决方案。善于组合不同来源的数据。高级用户能够扩展出应用的局限性,比如专业用户只是做一个网页,而高级用户则会在网页上加上 Java与各种多媒体特性。高级用户也应成为各种问题解决的顾问。

技能:能够理解并有能力进行一些程序、程序脚本以及宏的编写,并用它们来开拓与扩展应用程序。熟练地进行硬件的升级与优化,包括使用一些类似视频捕捉的多媒体外设。

第五级:大使级(大师级用户)计算机高手,掌握几乎所有的应用程序与计算机外设,自如地运用它们作为个人娱

乐及丰富自己生活与工作的境界。xi

以上即是对计算机素养的一种具有操作性的具体定义与要求。对应于上面的五级能力层次来讲,我们认为数字图书馆员最低要求应具有第二级的能力,因为这样的能力要求是我们对信息检索、处理以及进行交流利用的基本保障。当然最好能达到第三级甚至第四级的能力,这样才能更高效、更有质量地完成信息服务的任务需求,相应的能力也将能够保证数字图书馆建设与开发的需求。在本节的第四部分中,我们还将提出在目前的信息技术环境下,数字图书馆员所应掌握的一些具体的技术能力要求。

需要指出的是,信息技术本身的发展是日新月异,比如芯片的计算能力就以符合摩尔定律的规律每十八个月翻一番,同时软件与相关知识更新的速度也非常快。这就导致了对具体的应用能力与技术来讲,今天的高级技能也许在明天就没有用武之地了。由于计算机终端设备本身的变化,计算机素养这个词也许明天就变成了个人信息终端素养了。因此在计算机素养的能力培养与评判上,应强调对计算机或者信息技术基本概念的掌握,强调对新知识与技能的学习能力,强调解决问题的能力。

(三) 自我学习的能力如何来培养或找到一个合格的数字图书馆员呢?哪些技能、经验或品质应该是被看

重的呢?对这个问题的回答可以有两种不同的角度。一种是从看重现有的知识与技能,从现有的具体工作与技术要求出发去挑选人才。而另一种则是从自我学习的能力出发,从未来发展的潜力出发去挑选人才。

数字图书馆的概念以及数字图书馆的建设事业,目前还是在不断发展与完善的过程中。其未来的发展以及新的技术与领域肯定有很多我们今天是无法预测的。我们所能预见的就是变化将是其中不变的主题,实际上变化也是这个世界许多事物发展永恒的主题。但是作为信息技术最前沿的应用领域数字图书馆来说,变化将会来得更快更多。在这样的环境下,数字图书馆员本身已所具有的知识与技能就变得不是很重要了,更重要的是他能够适应这个变化的环境,不断地学习新的知识与技能,才能跟上甚至带动这个领域的发展。

举例来说,随着科学技术的发展,知识增长速度大大加快。英国技术预测专家詹姆斯·马丁的测算结果表明:人类的知识在 19世纪是每 50年增加一倍,20世纪初是每 10年增加一倍,70年代是每 5年增加一倍,而近 10年则为每 3年增加一倍。同样以数字图书馆员所应掌握的具体的计算机软件或相关技能来说,目前这样的知识更新速度也大体上是三年左右的时间,也就是说三年前掌握的具体的计算机技能三年后大多应不适用了。在这样

135

Page 136: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

一个知识以爆炸式的速度急剧增长,老知识很快过时的时代,具有自我学习、终身学习的素养与能力要比你现在所掌握的知识与技能的多寡要重要得多。

从前面所讲的数字图书馆员所应具有的信息素养来看,其内涵也是信息素养、计算机素养与终身学习的能力三

位一体的。你必须具有了解信息、找到信息以及处理与分析信息的能力,而计算机或其他信息技术装备则是你完成这些工作的工具,而你对信息的处理、对表知识的发现则是你自我学习、终身学习的养分与资源。

美国图书馆杂志的数字图书馆专栏作者 Roy Tennant指出从自我学习的品质出发,数字图书馆员应具有如下的素质与特性:xii

能够不断地学习、快速地学习新的知识与技能。 保持灵活性。 怀疑一切。 敢于冒险。 对公众服务的热情与认识。 团队精神。 鼓励与促进变革的能力。 独立工作的能力。

(四) 数字图书馆员的技能要求诚然作为数字图书馆员来说,其自我学习能力素质是最重要的,但是对于目前的建

设应用来说,明确数字图书馆员应具有哪些基本的技能,对于我们在人才队伍的建设规范人员配置乃至作为数字图书馆员的学习的方向指导都是很必要的。当然,对于其中的信息技术技能的要求与内容来讲,只能是作为在目前的环境与技术条件下的一个参考,在今后的发展中这样的要求会随着发展而不断变化。

我们认为对于数字图书馆员来说,其现阶段所需掌握的基本技能实际上与数字图书馆的建设与服务需求相对应,大致上可以分为这几个方面:数字化信息的创建与获取;信息的管理与组织;信息的检索;信息的发布与服务。

在以上的工作任务中,信息的管理与组织以及信息的检索实际上沿用或发展了许多传统图书馆和图书馆自动化时代所使用的理论与方法,这些基本技能对于图书馆的专业人员是其长处所在。但是在数字图书馆时代,所有上述的技能需求都要求在网络环境下,在信息技术条件下来完成,计算机与网络的相关知识与技能就变得尤为重要了。

从计算机的技能来说,无非是对以下三个部分的掌握:(1)操作系统。要对目前的主流操作系统具有操作能力,以目前的主要操作系统类型有所了解;(2)硬件知识。即是要掌握硬件的基本概念并具有初步的解决硬件故障的能力;(3)软件系统。能够理解自己所使用的应用程序、数据库等xiii 。当然能利用一定的开发工具完成特定的任务则更好。

从目前的网络环境来说,最主要的是要了解网络的基本概念与组成模式,无论是局域网还是因特网。其次就是熟悉掌握网络环境下的信息资源,能够利用各种工具在网络上查找到所需要的信息或知识,这其中最重要的就是对搜索引擎的掌握与使用。最后是具有在网上发布信息与服务的能力,这就需要对WEB技术有充分的了解与掌握,能够独立地建立网站与主页,也能够熟练地使用 e-mail等网络通讯工具与用户进行交流并提供服务。

xiii Krissoff, A., & Konrad, L. (1998, January). Computer training for staff and patrons: A comprehensive academic model. Computers in Libraries, 1 (18), 28-30.

136

Page 137: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

归纳一下我们认为目前对于数字图书馆员来说最迫切需要掌握的计算机与网络技能包括如下:

1. 网络搜索引擎2. 搜索技巧3. 对专业及重要的网站的熟悉4. 网上数据库的检索5. 解决 PC等信息终端一般问题的能力6. E-MAIL7. 对主流操作系统如WINDOWS 等的掌握8. 建设网站的能力对于数字图书馆员所需掌握的技术,Roy Tennant在他的专栏文章中也作了如下的总

结,他认为如下的技术是未来的数字图书馆员所应掌握的(当然不是说每一个人都要掌握所有列出的技术):xiv

1. 图象技术(对数字化图象的处理等相关概念)2. OCR(光学字符识别,主要应用于传统印刷品数字化的技术)3. 标记语言(如 SGML/HTML/XML等)4. 编目与元数据5. 索引与数据库技术6. 用户界面设计7. 程序编写8. Web技术9. 项目管理

五.数字图书馆员队伍建设

(一) 人力资源的观念与规划1.人力资源管理的观念说起数字图书馆员的队伍建设,我们首先想引进的一个概念就是人力资源管理的观

念。什么是人力资源管理呢?这个被许多国际以及国内企业普遍应用的管理理念到底包含哪些内容?这一观念对我们数字图书馆所需人才队伍的建设有何启示呢?这些将是我们在下文中将要简要阐述的问题。

什么是人力资源管理?人力资源管理,就是指运用现代化的科学方法,对与一定物力相结合的人力进行合理的培训、组织和调配,使人力、物力经常保持最佳比例,同时对人的思想、心理和行为进行恰当的诱导、控制和协调,充分发挥人的主观能动性,使人尽其才,事得其人,人事相宜,以实现组织目标。xv

从人力资源管理的定义来看,可以将其对人力资源管理分为两个不同的方面,一个是量,一个是质。所谓量的管理即是根据组织的目标与需求,根据现阶段人力与物力的变化,对人力资源进行引进、培养、组织与协调,使人力资源与物力资源相互保持最佳比例,xv http://www.cc-jobs.com/hrmworld/knowledge/99112202.html人力资源管理的定义、任务和意义

137

Page 138: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

发挥最佳效应。从质的管理来看,则是对人的思想、心理与行为进行有效的管理,调控与培养员工的道德品质与职业技能,同时充分发挥人的主观能动性,以达成组织的目标。传统的人事管理将人力支出作为一种成本,只见“事”,不见“人”,也忽视人与事的整体、与系统性。而现代人力资源管理的重点则是以人为中心,以尊重个人,注重个人的能力培养及发挥为中心将人力资本作为组织最为重要的生产力资源,管理上着眼于人与事的系统优化,致使组织的运作能获得最佳的经济效益与社会效益。

除此而外,传统人事管理是某一职能部门单独使用的工具,与其他职能部门的关系不大。现代人力资源管理却与此有着截然不同。不仅实施人力资源管理职能的人事部门逐渐成为决策部门的重要伙伴,而且明确所有的管理人员除了既是部门的业务经理,也是这个部门的人力资源经理。人力资源管理部门的主要职责在于制订人力资源规划、开发政策,侧重于人的潜能开发和培训,同时培训其他职能经理或管理者,提高他们对人的管理水平和素质。而对于每一个部门的管理者来说,不单要完成自己的业务任务,还要培养一支为实现组织目标能够打硬仗的员工队伍。所以现代的人力资源管理是在组织整体上对人力资源进行系统管理。

2.数字图书馆与人力资源管理图书馆是一个较为保守的行业,这不仅体现在其原来的业务理念上,更体现在其对

人才队伍的建设上,现有的人事管理也是以几乎一成不变的固定的业务流程为中心的管理模式。同时囿于现有的人事制度,也存在不敢大胆地引进人才与培养人才,现有的环境缺乏活力等等许多问题,这些都使得整个图书馆行业目前优秀的人处于净流出的阶段。在有的地方,图书馆还成为事实上的养老院,人事制度改革的最后避风港,一些不好安排的人事都安排到了图书馆。实际上,这样的做法最后只能使得图书馆的发展走向一个死胡同。因此,在图书馆向数字图书馆转型的阶段中,第一就是要改革现有的人事制度与观念,引进人力资源管理的先进思想,使我们在人才的规划与培养,人才队伍的建设方面走上一个健康发展的道路。

传统图书馆跨入数字图书馆的时代,所需的人才结构已不再是仅仅专通图书馆理论与业务能力的专门人才,而是需要在管理、信息技术、信息管理以及市场、法律等等专业或综合性的人才。我们可以看到,所有这些人才也是其他行业建设与发展中所需的紧缺人才换言之,数字图书馆建设与运作所需的人才将在人才市场中与其他行业展开竞争,如果不能在人才管理与队伍建设中拿出与这个时代所相符的管理水平来,那么吸引与留住所需的人才就是奢谈了。

在数字图书馆的人才队伍建设中,由于图书馆行业具有其本身的特点,要想吸引与留住人才绝不是一句事业留人或待遇留人所能解决问题的。这是一个需要应用人力资源管理的系统观念进行系统管理的工程。另外,流水不腐,户枢不蠹,人才流动是必然的,也是必要的。我们没有必要为了每一个人才的离去都费心挽留。图书馆本身是一个职业较为稳定、工作压力较轻,因此收入也较低的行业,这一点在今后的若干年内都可能还是不争的事实。所以我们对于人才的流动应能处之泰然,一方面我们要改革目前的制度与管理模式另一方面我们要应用人力资源管理的观念来做好人才的规划,人力资源的调配,对人才的流动作出预测,并作出相应的调控与管理,使我们的人才队伍建设保持在所需的一个基本水准上,以保证我们数字图书馆建设与运作的顺利进行。

人力资源管理观念带给我们的认识是,在数字图书馆的建设与运作中,最重要的已不再是我们馆藏的信息资源,而是我们的人才资源。对人才资源要以动态的科学方法而不是静态地进行管理,只有真正的重视员工的自身发展才是吸引人才与留住人才的主要手段而人事管理将从事务型走向重视策略的时代。

3.数字图书馆人力资源管理内含138

Page 139: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

人力资源管理从某种意义上来说主要涉及以下六大职能:吸引、录用、保持、发展、评价以及调整。xvi

对于吸引与录用的职能来说,涉及到主要是确认组织的需求与作出人力资源规划,并根据所订立的要求指标与原则确定最合格的人选。对于数字图书馆的建设管理者来说,即是要明确近期与远期的建设目标,订立吸引与选用人才的规划。从数字图书馆的建设与运作需求来看,建立一个数字图书馆建设的人才高地是人才队伍建设的最终目标。要做到这一点,就需要根据我们前文所提到的数字图书馆建设所需的人才队伍的组成与特点,并结合本馆的具体人才状况,列出所需的各种人才的类型、数量与质量,建立数字图书馆建设所需人才和紧缺人才的档案;其次是要制定相应的人才鼓励与吸引政策,借人事改革的东风,给予一些特殊或高技术人才特殊政策,以最大限度地吸引与选用数字图书馆建设所急需的专门人才。

对于评价的职能来说,是对员工的基本技能与工作绩效的观察与鉴定。在数字图书馆员的培养与使用中,要特别注意人员的基本素质要求,除了职业道德、思想境界、身体条件以及工作能力,为了适应现代网络环境与数字图书馆建设与运作的具体要求,在这里我们要特别强调员工的一些基本技能,尤其是一些信息素养与计算机基本技能相关的指标的考核,例如对网上搜索引擎的使用,利用电子邮件的交流能力等等,这些指标应该成为数字图书馆员的基本素质要求,掌握这些基本技能是数字图书馆员上岗与否的必要考核指标。

保持的职能有两个含义,一是要保持员工本身的积极性与工作状态,二是要保证工作环境与条件的支持能力。我们觉得在对员工的工作条件的保障方面,是我们过去所做的不够的。由于数字图书馆的建设与运作是在高技术与网络环境下进行的,没有相应的信息技术装备是不能完成工作任务的。数字图书馆员作为知识经济时代的知识工人,就象现代军人与旧时代军人的不同,必须有相应的装备才有用武之地,才能真正地提高工效。近一二十年来,美国及西方一些现代化国家打了几场局部战争,都在人数并不绝对占优的情况下,以高精尖的装备、很小的伤亡获得了巨大的胜利,这些实例充分说明了现代高技术装备的重要性。在我们的传统观念中,对于办公环境的投入受到相对重视,而对于技术装备的投入则稍显不够。实际上,在人力资源的成本逐年增加,技术装备的价格逐年下降的情况下,我们要打破我们传统的偏见,对于数字图书馆员这样的知识员工给予充分的信息技术装备工作条件,例如对于微机这样的个人信息终端设备应达到一人一机的基本要求,这样才能达成人与技术装备的整体系统效率的提高。

发展的职能指的是对员工知识技能及其他特性素质的提高,以保持与发展员工胜任工作目标的能力与竞争性。人力资源管理专家通常用KSAO,即知识、技巧、能力与其他特性,来概括发展职能所涉及的员工素质内涵。对于员工相关素质的提高与发展,可以说是数字图书馆建设与管理的非常重要的内容,其理由也已在前文中多次涉及。在下一节的有关教育培训的内容中我们会谈到如何来培育与发展员工的相关知识与技能。

139

Page 140: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

图 6-1 人力资源管理的主要职能之间的相互关系毋庸赘言,人力资源管理的相关工作内容,也就是以上提到的六大职能,都是互相

关联的(其相互关系可参见图 6-1)。实际工作中偏颇了某一个工作职能都会降低人力资源管理开发的整体效率。而这些职能的相互联系、相合融合与促进就能构成一个高效的人力资源管理系统。对于传统图书馆行业来说,在向数字图书馆目标进军的时候,就需要根据现代人力资源管理的理论与职能内涵,对我们传统的人事管理方式进行重新规划与重组,这样才能建设一支能够满足数字图书馆建设与运作需求的合格的结构合理的人才队伍。(二) 教育培训

近几年来,国内外有关数字图书馆的研究开发项目层出不穷,资金投入也很大。但相对于数字图书馆建设的投入来说,对于数字图书馆相关的教育与培训在国内外都显得不足。迄今而止,尚没有一个大型的专事数字图书馆建设与使用者的大型教育或培训项目出现。虽然我们大家都认为合格的人才是建设数字图书馆的必要条件,但不可否认的事实是对数字图书馆员队伍的建设,无论从投入与实践来看都是滞后的。建设一支合格的数字图书馆员的队伍,最主要的手段就是教育与培训。

1.教育与培训的不同教育与培训虽然都是提高人员知识与能力的主要方法与手段,但是这两者之间还是

有着不同的侧重。一般而言教育侧重的是系统的理论知识、概念与方法,以及工作中可能应用到的工具与解决问题的方法,教育一般不针对具体的工作流程的工作技能知识。教育通常是在各类院校中完成,有完整的体系、理论与方法,这一完整的体系也构成了一个专业的职业内涵。培训通常是指经验的传授,或者是针对某一工作任务的具体的技能。通常情况下,经过教育体系培养的专业人士在正式踏上工作岗位时都应经过一定的培训,才能真正适应工作任务的需求。这一点,图书馆专业是如此,其他专业也大抵如此。

从教育与培训的不同来看,可以看出教育占有着更为重要的地位。这一点不仅仅是因为教育内涵支撑起了一个专业的职业,同时也因为教育提供了专业人士掌握自己专业的基本概念与理论,解决问题的方法等等,这一点比起专注于专门的一种工作技能更为重要在数字图书馆的建设与运作中,由于发展迅速,新技术层出不穷,各种工作所需的技能本身变化很大,没有人可以预知在未来的某一项工作中我们会需要什么技能。因此对于基本理论与方法的掌握,独立学习与解决新的技术问题的能力等等就显示得尤为重要。同时,对于基础理论与背景知识的掌握,也是完成一般培训课程的必要条件。xvii

140

吸 引

吸 引

吸 引

吸 引

吸 引

吸 引

Page 141: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

当然,在数字图书馆员的培养中,教育与培训都能够提供有价值的知识与技能,两者是缺一不可的。关键是要在两者之间找到一种平衡,使数字图书馆员在拥有作为一个专业职业所应具有的核心能力与竞争力之外,也能够适应工作中不断变化的各种技能需求。

2.教育与培训的方式与内容教育与培训可以有多种形式。有人提出图书馆信息人才的培养大致可以采取以下两

种途径:一是由图书馆自行培养。可采用的方法包括建立人才培训中心;根据实际需求分期分批进行轮训;有条件的单位可以设立硕士、博士点,培养高级信息人才。另一种人才培养的方式则是社会协助培养。可采用的方法包括改革现有的图书馆学情报学高等教育内容重组与开设新的课程以培养出符合信息时代需求的高级信息专业人才;利用高校优势,加大函授力度;发挥情报所传统的人才优势,为图书馆界培养人才;与国外教育机构或公司合作建立人才培训中心。xviii这些建议对于数字图书馆人才建设的途径也有着相当的参考价值。

从另一个角度来看,数字图书馆员的培养无非是通过教育与培训两种途径。从教育来说,我们的高等教育体系是主力军,提负着培养数字图书馆员及相关高级人才的主要任务。而从培训来说,则用人单位,也就是我们的图书馆单位担负着主要任务。对于培训而言,不管采用何种方式,首要的一点要保证规划与投入。有了规划,人才的培训机制才能得以建立,培训工作才能长治久安。而投入则是上述工作的必要的资金保证。在这一方面,我们有很多单位做得很不够,有些单位根本没有相应的投入计划与经费列支,有的单位有相关的经费列支却得不到落实,规划中的教育培训经费被挪用是常有的事。其实,对一个组织来讲,对员工的教育培训往往能得到很好的回报,这是一笔很好的投资。同时这样的投入对员工的个人发展也有着很大的好处,最后就形成了单位与个人双赢的局面,对于这一点应有充分的认识,这样才会在投入上加大力度,落到实处。

从培训的形式上来讲,我们觉得一可以在培训技术手段上予以加强,比如可以利用网络教育手段开发数字图书馆培训教程,这些教程可以放到广域网,也可以放到局域网上使员工可以根据自己的需要与时间做到随时随地的学习。同时由于这样的培训往往涉及一些相关技术内容,在网络环境下的学习使员工更能身体力行,效果更好。二是培训方式可以更多样化,培训的外延可以扩展。比如鼓励技术人员参加各种 IT的展示会及培训课程。因vii Commission on Colleges, Southern Association of Colleges and Schools (SACS). Criteria for Accreditation, Section 5.1.2 [Library and Other Information Resources] Services . 10th ed. Dec. 1996. (URL:http://www.sacs.org/pub/coc/cri70.htm#SECTION IV)ix http://www.ala.org/acrl/nili/whatis.html#knowx Pappas, M. L. (1993, September). A vision of school library media centers in an electronic information age. School Library Media Activities Monthly, 10(1), 32-34,38. (EJ 469 122)

xi www.actfl.orgxii Tennant, R. (1998). "The Most Important Management Decision: Hiring Staff for the New Millennium." Library Journal(Feb. 15) Retrieved August 29, 2000 from the World Wide Web: http://www.ljdigital.com/articles/infotech/digitallibraries/19980215_2276.aspxiv Tennant, R. (1999). " Skills for the New Millennium." Library Journal(Jan. 1) Retrieved June 29, 2000 from the World Wide Web: http://www.libraryjournal.com/articles/infotech/digitallibraries/19990101_4121.aspxvi 罗锐韧主编. 哈佛管理全集(上卷). 北京:企业管理出版社,1997:617

xvii John HubbardIssues In Library Education16-Apr-2000http://www.tk421.net/essays/sherpas.shtmlxviii 李敏. 知识经济时代图书馆信息人才需求论. 图书情报工作, 1998(12):21-23

141

Page 142: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

为由各类公司举办的产品演示及培训往往是了解最先进技术与产品的最好的渠道。也可邀请各个相关企业来做现场的演示与培训也不失为技术培训的一个很好的方法。其他诸如鼓励员工参加各种学术交流的会议,与国内同行加强观念与技术的交流,也能使员工的知识与能力在短期内得到提升。另外,数字图书馆的相关课题与技术往往走在信息技术发展的最前沿,要想掌握最新的理论技术与动态,最好的方法是走出国门与国外同行进行交流。在条件许可的情况下,选送骨干员工出国参加数字图书馆短期或长期培训,可以接触到国外最新的数字图书馆观念与技术,也会在交流的基础上带来国际合作的可能性。

数字图书馆员的教育的主要任务应由高等院校承担,但怎样的教育模式与内容才能培养出合格的数字图书馆员呢?这个问题在国内外都处于摸索阶段。由于客观环境的变化我国的图书馆学情报学教育本身处于一种变革时期,原先的面向单一图书馆学情报学专业能力培养的模式正在打破。有人提出,当今的图书馆学情报学专业因立足于更大的培养综合性信息人才的层面上,课程内容应以一个核心(信息管理专业知识课程)、三个支撑点(外语、计算机、管理)、若干专业方向为基本内容xix,这里的若干专业方向则是针对应用方向的不同而分别作出专业选择。类似地,也有人提出以基础课系列、核心课系列、应用分支系列的结构作为信息人才教育的基本结构xx。这些提议都提出了很好的教育内容的结构安排,我们可以将数字图书馆员的培养视为众多信息人才需求中的一个专业方向,对于这样的专业方向应该安排一些怎样的教学内容,这一点国内的高等教育体系对此所作的探讨与努力就显得有些不足。

包括北美在内的世界上许多地区与国家,都开展了数字图书馆相关的教学尝试。这其中有各种专门的短训班及高等院校的硕士与学士专业课程。1999年两位美国学者在考察了世界上 20所提供数字图书馆课程的大学的教育内容之后,提出了如下的数字图书馆课程与教学内容建议:xxi

课程领域: 主题:理论与历史基础 图书馆历史;人类信息行为学;信息检索历史;数字化馆藏与数字

图书馆的发展数字图书馆的技术架构

信息检索引擎;数字图书馆的数据库构造;分布式馆藏;多媒体内容类型及应用;互操作性;网络技术;数字图书馆中的Web应用;界面设计;通迅协议;查询语言

数字图书馆中的知识组织与管理

元数据;索引技术;分类;数据库集成;文档格式数字馆藏开发与维护 数字文档;数字化技术;数字化保存信息获得与数字图书馆的利用

用户与数字图书馆的利用;可用性与评价研究;在数字图书馆中的信息行为研究

社会、经济与政策讨论

电子出版;学术交流;版权问题与数字图书馆的知识产权保护;建设数字图书馆的成本问题;数字图书馆的资金来源

专业讨论 数字图书馆员的角色与责任;数字图书馆的管理;参考书目3.自我学习在前文中我们讲到数字图书馆员应有的素质与能力时,我们提到的很重要的一条就

xix 范并思. 论图书馆学专业教育的改革. 图书情报工作, 1998(11):50-53

xx 王学东. 面向现代信息技术的信息服务人才培养研究. 情报学报, 2000(5):418-425xxi Spink, A. & Cool, C. (1999). Education for Digital Libraries. D-Lib Magazine, May. Retrieved August 28, 2000 from World Wide Web: http://www.dlib.org/dlib/may99/05spink.html

142

Page 143: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

是自我学习的能力。虽说在数字图书馆员的培养过程中,较为正式的教育与培训占很大的比重,但自我学习也不能忽视。由于数字图书馆本身处于一个不断发展的过程中,其相关的知识与技能也一直在发展变化,正规的教育课程由于其本身的建设周期限制,一般总要落后于这一行业发展的现实。因此,自我学习的能力对于数字图书馆员的自身知识与技能的提高就显得更为重要。另外,工作中的实际技能的锻炼与经验的积累,也是需要个人自学习能力作为一个保障。

从传统图书馆员的职业角色来看,必须要通过继续教育来实现自身的转型,这样才能使我们在今后的社会发展、图书馆行业的发展过程中继续找到自己的位置。微软图书馆馆长的话充分验证了这一点,他说:“就业风险与商业竞争要求我们注重人员的培训与发展我们不仅要与时代的要求同步,而且要在工作基准不断提高的情况下走在前面。只有通过培训才能实现这个目标。”xxii 数字图书馆的出现,对于传统的图书馆员来说,是挑战也是机遇。所以我们要认清形势,强化职业的风险意识。从自我学习的角度来说,我们认为主要是两个方面,一个是自身的自学能力,另一个则是自己要学习的动力。后者强调要自己舍得投入进行教育与培训方面的投资,使得在传统体制思维下的要为学变为我要学。实际上从今后的社会变革与个人的职业发展来看,教育是一个很好的以资。这不仅对一个组织而言,对于个人也是如此。举例来讲,国外高等教育体系中,许多的专业都有高额的奖学金与各类补贴,但是在诸如法律、医学、工商管理等专业中却鲜有这样的情况,这是因为这些专业学生毕业之后往往能找到薪水很高的工作,因此学生的学费投入实际上就是一种最好的个人投资,这些专业也就能吸引大量的学生前来学习,而不用依赖奖学金等各种手段。

4.用户的培训除了对馆员的培训之外,数字图书馆也不能忽视对用户的培训。因为数字图书馆是

一个全新的架构,用户对这一新事物必然有一个熟悉与掌握的过程。在计算机平台与网络环境下,与传统的图书馆工作人员一样,对于这些新技术与新环境,有很多的用户对此缺乏必要的专业知识与使用经验,一定的帮助和训练是十分必要的。同时,在网络平台环境中,数字图书馆可能相对缺乏人与人(用户与图书馆员)之间的直接交流,如何在网络环境下寻求帮助及掌握进行交流的技巧对于用户而言就是十分重要的必备知识技能。我们要知道数字图书馆的最终目的是要让用户来使用,而不是为了研究或者显示开发建设者的技巧,实际上,只有让用户学会使用数字图书馆,利用数字图书馆,进而产生直接或间接的经济效益或社会效益,投资建设数字图书馆的资金才不会白费。所以对用户的培训也是建设数字图书馆过程中的一个重要环节。

与传统数字图书馆不同的是,数字图书馆更为强调的是个性化的服务,强调与用户的交互作用。在这样的环境中,用户在某种意义上来说也对数字图书馆的建设与发展作出自己的贡献。数字图书馆的使用效果与发展与用户的使用技能及创造力成正比,用户如能得到充分有效的训练也就是对数字图书馆的发展与利用打好了基础。另外,传统图书馆担负着一定的教育职能,数字图书馆同样也具有责无旁贷的相同职能,利用数字图书馆的多媒体特征,网络手段,在用户的教育方面数字图书馆相比传统图书馆有着与生俱来的优势利用数字图书馆的资源与技术条件来对用户进行教育培训将是数字图书馆的一个重要任务而教育培训的内容不仅仅限于帮助用户使用数字图书馆。

所以对用户的培训工作一定要纳入整个数字图书馆的工作计划中,这样才能使用户的培训工作受到重视,进而有条不紊的进行。对用户的教育培训手段可以利用数字图书馆本身多媒体及网络环境的优势,采用在线或远程的方式,也可以利用各种的帮助手段使用户在使用中学习。当然,在用户的培训中,我们也不能偏废传统的培训与教学手段,以使一部分对新技术并不熟悉的用户熟悉与掌握新的使用方法与网络环境。xxii 姚武斌. 网络时代图书馆员继续教育之重点. 福建图书馆学刊, 2000(1)∶26~28

143

Page 144: 数字图书馆引论 - kevenlw.name  · Web view第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到20世纪60年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统(Ohio

(三) 人才外包与合作人才外包,就是将数字图书馆中对部分人力资源的需求委托给馆外有条件的单位或

个人解决。人才或者说是人力资源的外包其根据目的在于提高人力资源利用的效果与效率减少数字图书馆的建设与运作成本,提高数字图书馆的建设与服务水准。

数字图书馆的主要任务是满足用户对专业领域的特定的知识或信息需求。从这样的工作内容来看,大多数的工作任务都需要三方面专家的配合:专业领域的行业专家、数字图书馆员、技术专家。xxiii从这三种人员构成来看,数字图书馆员是数字图书馆的人力资源主体,而行业专家与技术专家在图书馆或数字图书馆中,永远都会处于一种不足的状态,这是图书馆本身的性质与条件所决定的。因此对于行业专家与技术人员的人力资源需求就可以利用外包的形式来进行解决。从技术专家来说,数字图书馆的建设涉及到许多高技术的内容,需要这方面的专家或熟练的高手,这些对于一般的图书馆来讲,常备这样的人力资源是不现实的,也是他们负担不起的。这就可以利用外包的方法来加以解决。

除了技术人才以外,数字图书馆建设中不可缺少的法律专业人士往往也采用外聘的方式来加以解决。对于数字图书馆建设的规划及技术顾问小组,以及市场咨询等等专业人者需求,也都可以利用外脑来加以解决。采用人才外包的方式,提高了图书馆的专业水准提高了人才资源的利用效率,也使得图书馆可以更专注于自身数字图书馆员队伍的建设,降低了管理的复杂程度。同时对于数字图书馆建设中的一些资源建设,或传统资源数字化中的简单的初级加工的部分也可以外包,这样能降低成本,提高本馆的人力资源利用率。

除了简单的外包之外,合作也是一条利用外脑的有效途径。合作同样也弥补了数字图书馆建设与运作中人才的不足,充分发挥整个社会人才配置的效率。数字图书馆从其本质特点上来讲,从来就不是一个图书馆能够建成的,因此在数字图书馆的建设与运作中,合作是其必然的趋势。在中国的数字图书馆建设中,也有许多合作建设与研究的实例,如中国试验数字图书馆计划,中关村数字图书馆群等等。

有一些高校与科研院所具有很强的技术与科研能力,但却少有一些实用性强的课题与实验基地,而数字图书馆的建设正好为此提供了一块很好的土壤。通过与这样的单位进行合作,事实上也可以带动本单位一批数字图书馆建设管理与技术人才的成长。除了合作课题或项目以外,通过设立开放实验室或博士后工作站的作法,可以使图书馆的数字图书馆建设跻身数字图书馆研究最尖端的科技领域,甚至可以在实践过程中为图书馆培养一批研究与技术骨干人才。

参考文献:

xxiii http://www.onlineinc.com/onlinemag/NovOL97/matson11.htmlDo Digital Libraries Need Librarians?An Experiential Dialogby Lisa Dallape Matson and David J. BonskiONLINE, November 1997Copyright © Online Inc.

144