首页>中文会议>教科文艺>网络资源采集与数字资源长期保存学术研讨会
网络资源采集与数字资源长期保存学术研讨会

网络资源采集与数字资源长期保存学术研讨会

  • 召开年:2013
  • 召开地:北京
  • 出版时间: 2013-09

主办单位:中国国家图书馆

会议文集:网络资源采集与数字资源长期保存学术研讨会论文集

会议论文

热门论文

全部论文

全选(0
  • 摘要:计算机技术在图书馆的运用已经日趋完善.地处云南少数民族地区的普洱市图书馆将互联网资源运用于实践也走过了十多年的历程.本文从数据资源和数据库建设理念、数字图书馆硬件设施、互联网资源采集、主题数据资源库建设、数字文献资源服务、数字资源保存、待完善和充实部分等方面简要综述普洱市图书馆的互联网资源具体运用与实践.
  • 摘要:本文结合国内外的数字资源长期保存实践项目,就数字资源长期保存的必要性、数字资源长期保存的所存在的问题和国内外实践现状进行了简要概述,并对国内的数字资源长期保存问题,提出自己的一些想法.指出国内的研究机构,却相对单一独立,并没有形成大规模合作意向,没有找到成熟的合作模式。在数字资源长期保存的未来规划中,国家图书馆占领着先驱地位,并且不论对于促进国内的数字资源长期保存项目,还是国际上的项目,都可以起到协调促进,合作共享的作用。从国内数字资源长期保存的现状看来,国内的项目还是偏少,而且缺乏专业的数字资源长期保存的项目工程,多是参与其他项目当中,缺乏自主研发,技术创新的倡导项目。所以在技术层面上,还需多向国外先进图书馆学习,了解自身在技术上的差异,多学习,多培训,跟上国际统一技术步伐,这样才能更好地对本国的数字资源进行长期保存,减少数字资源的缺失。
  • 摘要:网络资源的采集与保存是互联网时代图书馆新的保存任务之一,很多国家图书馆都开发了自己的网络资源采集与保存软件平台.国家图书馆为了更好地开展网络资源存档工作,开发了网页资源获取软件平台用于该业务.本文介绍了该平台的设计初衷,以及系统的功能与特点,指出网页资源获取系统覆盖了网络存档工作的主要流程,但是仍然缺少针对所存档资源的管理与利用功能。网络资源的数据量巨大,通过人工对所有的网络资源进行编目是不可能完成的任务,需要依靠自动编目技术结合人工实现编目。网页资源获取系统支持对网页资源的全文索引,索引的速度在数据规模较小时比较可观,但是可以预见,将来数据索引规模越来越大时,索引合并工作会相当费时费力。网络资源的采集与保存是数字时代图书馆新的使命,但是网络资源的规模远远超出了目前图书馆所能承载的能力,仅仅依靠单一机构是无法完成中文网络资源的全面采集与保存的,图书馆以及其他机构联合起来共同参与是必然的趋势。随着云计算、大数据等新的技术概念的出现,网络资源采集与保存工作又面临着新的问题,同时也有着新的机遇。网页资源存档工具开发的下一步工作将是开发新的功能,支持多机构合作进行采集;对网络资源采集与存档工作流程进行研究,进一步增强系统数据分析、监控功能和质量检查功能;结合最新信息技术,实现网络资源的高速、完整、安全的存档与访问。
  • 摘要:数字资源的长期保存问题已经成为图书馆界关注的热点.本文从地方公共图书馆的角度,提出了数字资源长期保存的方案,指出金陵图书馆对数字资源的保存应立足自建资源,规避版权问题,为了避免某些数据格式随着时间和技术发展而消亡,必须规范需长期保存的数据的格式,包括元数据格式和对象数据格式。根据本馆制定的相关规范,对于备份数据的完整性和正确性检测。
  • 摘要:针对各图书馆普遍存在的古籍"藏与用"之间的矛盾,介绍了网络古籍信息资源采集的背景、意义、途径等,并提出了公共图书馆古籍采集与管理为读者提供关于古籍方面的网络信息服务的措施.
  • 摘要:伴随着计算机信息技术的发展,数字资源已成为图书馆资源的重要组成部分与未来发展方向.美国大学图书馆凭借学术与资源优势,在数字资源长期保存方面已形成了完善的规划,制定了成熟的策略,积累了相当丰富的经验.本文通过对美国大学图书馆数字资源保存策略与实践的分析,指出在制定数字资源长期保存的决策与标准时,美国的图书馆工作者一直采取着严格的要求,而高等学府作为美国科技、文化等方面的发展输出机构,一直严格遵照图书馆行业标准规范所属图书馆。数字资源具有高渗透性、高带动性与高创新性等特点,在高等院校研究学习过程中肩负第一工具的使命,在促进信息资源管理这一重要任务中担任催化剂的作用。数字资源的种种特点也为当代图书馆人提出了不断学习的要求,以知识为导向,实践为能量,才能更好地完成数字资源长期保存的使命。
  • 摘要:数字资源长期保存是数字资源管理领域一个非常关键的问题.本文从数字资源长期保存有效性、完整性和真实性的影响因素入手,分析了数字资源长期保存在存储介质、数据格式、技术手段和保存策略等方面的解决方案以及发展前景.
  • 摘要:随着数字化、网络化的发展,网络信息已成为图书馆重要的信息资源之一.如何采取科学、合理的措施,收集和保存有价值的网络信息,更好地为读者服务,是图书馆必须研究的问题.本文在概述网络信息资源的基础上,分析了影响网络信息长期保存的因素,提出了收集和保存网络信息的流程和方法,提出要尽快成立一个由国家图书馆主导的全国性的网络信息资源保存组织协调机构或是类似的专门协调机构,制定适合我国国情和地方特点的搜集保存策略,统一分工,职责明确、上下覆盖的网络信息保存体系。根据我国网络信息资源的总体情况和现实情况,制定网络信息资源的选择标准,同时还要颁布网络信息保存元数据的标准和细则,避免重复建设。要适当增加对网络信息资源保存的投入。
  • 摘要:网络时代,读者需求呈多元化发展趋势,笔者结合互联网络具有的几项基本功能,对公共图书馆如何利用互联网技术及资源提供的特色服务形式进行了初步分析,指出面对网络时代读者的多元化需求,公共图书馆必须探索新的特色服务,就是利用网络手段拓展与读者间的沟通渠道,用网络资源充实图书馆服务内容。这就需要图书馆转变理念,采用多元化的服务模式,为读者打造一个可供学习研究、互动交流、合作共享、休闲娱乐的综合性服务空间。通过特色信息服务催生新兴文化发展,实现社会主义文化大繁荣、大发展,为促进社会和谐发展发挥自己应有的作用。
  • 摘要:数字环境下,数字资源长期保存的重要性凸显出来.本文在论述数字资源长期保存、长期可用的意义基础上,对国家图书馆长期保存数据可用性采用的策略、技术及实践进行了阐述.经过多方调研,同时结合图书馆的数据特点、业务要求、设备情况,通过对长期保存工作进行统筹规划、合理分工,目前已经制定出一系列相关标准规范,并用其指导、规范长期保存的业务操作;形成了一套完整的长期保存体系,在严格规范的工作流程下保证了国家图书馆海量数字资源的长期保存和长效可用。
  • 摘要:文章指出多媒体技术将是数字资源保存的最佳媒介物.数字资源的长期保存,应得力于真实的传统实体信息资源的良好保存.利用通讯拨号实现互联网远程传递普通信息,或打破了时空限制,随时可看到自己想要查阅的普通信息,比传统图书馆更为便捷。把图书内容制成数字资源,突破人手一本书的材料限制,可供全体公民在相同的时间里共同查阅,使用效率大大提高。多媒体是传播信息的媒介,即信息在传递过程中,从信息源到受信者之间传递信息的载体,是实现信息从信息源传递到受信者的一切技术手段。多媒体一方面可承载信息,另一方面可储存、呈现、处理和传递信息。
  • 摘要:当前数据存储技术正以前所未有的速度发展,这为图书馆数字资源的保存提供了强大的技术保障.数字资源的长期可靠存取是保护人类文明与实现知识传递的重要基础.本文介绍了目前数字资源保存的现状和存在的问题,指出凡是藏有数字文献的图书情报单位都面临着承载数字文献的载体退化而带来的数字文献丢失的危险,以及数字文献利用、管理困难和法律障碍问题。并从技术、法律等方面有针对性地提出了策略.
  • 摘要:通过文献调研、网站调研和系统调研,结合现有的各种信息组织理念,分析了当前互联网免费文献资源的组织与管理的几种方式,指出当前信息标准、信息覆盖的全面性、语义异构性等方面存在的问题,并从互联网免费文献资源的标引规范、深层次揭示、筛选与评价、长久保存等角度给出了一些建议.
  • 摘要:机构知识库作为开放存取有效实现形式,是学术文献资源的收藏基地以及信息资源的重要传播者,是开放存取资源的重要载体.但是机构知识库资源同其他原生网络数字资源一样,具有易逝性的固有特点,如何长期保存这部分资源、确保机构知识库内容的长期有效性,不仅是当前研究的需要,而且具有重大的文化价值和历史意义.本文分析了OA机构知识库长期保存的必要性,并从法律、经济、标准规范、技术与策略、责任体系、管理机制等方面对影响OA机构知识库长期保存的因素进行了深入分析.指出机构知识库的长期保存是一项比较艰巨而复杂的系统工程,它需要国家政策、法律、经济、技术等多方面的支持才能进行,仅靠某一机构的力量是难以承担的,因此,合作就成为机构知识库长期保存的必由之路。为了提高长期保存的效率,节约成本,均衡负担,减少风险,有必要建立多个机构间不同层次的合作保存机制。保存机构可以选择以下合作方式:①保存机构之间的合作,包括战略合作、技术合作和内容合作;②保存机构和生产者之间的合作;③保存机构和技术部门的合作;④营利机构和非营利机构的合作。
  • 摘要:通过阐述华北电力大学图书馆网络资源建设的实践过程,认为采集资源是重要的业务环节,网络学术资源的采集是深层次挖掘的根本.指出了普通工科高校图书馆采集网络学术资源所需要遵循的选择原则、实现路径和解决措施.探讨了高校图书馆可以通过采集网络资源丰富特色馆藏、深化知识服务、开展共建共享、服务读者的策略.
  • 摘要:数字资源的长期保存技术已经成为公共图书馆高度关注的问题.本文在分析公共图书馆数字资源长期保存所面临的挑战和模式选择的基础上,以南京图书馆为例,通过自建网络存储系统、构建自动备份系统、开展云存储技术实践等三方面,阐述了南京图书馆对数字资源长期保存技术的应用.
  • 摘要:随着网络保存工作的研究逐步深入,深层网络(deep web)信息的价值日益显现,仅仅保存网络资源中的浅层网(surface web)资源难以满足网络信息保存的要求,而深网资源有着和浅层网资源完全不同的获取方法,这给深网资源的获取带来不小挑战.本文从浅层网信息获取的一般原理开始,讨论了深网信息获取的特点和难点,并提出了深网资源获取的一般思路,最后举出了在这种思路下两种具体流程并分析了其中存在的问题.指出针对多个网络数据库的集成访问方式研究如何实现自动选择和查询主题相关的数据库,并通过集成的查询模式对多个数据库统一查询,旨在提供众多web数据库的统一访问途径。从原理上来看这种集成访问方式更像是对多个数据库同时访问,统一处理结果。针对某主题的深网资源获取要求配备和所涉主题相关的领域本体知识库,即要求有丰富的领域知识的支持。
  • 摘要:在开放共享的互联网环境下,公共图书馆要密切关注用户的需求变化,利用新技术构建知识库、聚合信息资源,丰富信息服务方式,通过图书馆员与读者的深度互动不断优化资源建设和服务提供.高速发展的互联网技术正对图书馆发展和服务产生着积极的影响。图书馆要与时俱进,充分利用新技术,整合各类开放资源,以自己的核心资源和核心能力不断推进图书馆事业发展。
  • 摘要:在网络上采集信息资源,经过精心整合后再向读者发布,是当前数字图书馆信息资源建设与服务的重要内容.本文论述了网络信息资源采集与整合的定义与技术要求,提出了网络信息资源采集与整合的基本原则、方法及其案例.在网络信息资源急剧增长,信息技术已十分成熟的今天,数字图书馆建设面临的一个重要问题,就是如何把这些分布在不同网络、不同系统、不同类型、不同格式、不同检索方法的信息资源采集、整合成为本地资源,形成一个良好的信息资源使用环境,提高数字图书馆的服务效率。
  • 摘要:随着信息技术的发展,数字资源已成为人类知识信息传播与利用的主要形式.本文从数字资源长期保存和长效利用的重要性出发,探析了影响新疆生产建设兵团数字资源长期保存和长效利用的主要因素,并结合兵团实际,就如何做好数字资源保存和利用的策略进行了积极探索,以期在实践探索中达到良好效果.
  • 摘要:政府网站公开信息资源日益增长,其价值日益彰显.采集是资源保存和整合服务的首要环节.本文从国家图书馆"中国政府公开信息整合服务平台"项目中网络资源采集的实践出发,概述了政府网站公开信息资源的采集方法。指出国家图书馆对政府网站公开信息资源的采集已初具规模,但是在实际的采集工作中同样存在一些问题。在政府网站公开信息资源的采集工作中,相关从业人员要主动加强学习,提高业务能力,采集工具的功能需要进一步完善,以提高所采集资源的价值属性,充分发挥政府公开信息资源的服务作用。
  • 摘要:本文通过对网络信息资源的特点、图书馆开展网络信息资源组织与管理的意义以及网络信息资源5种组织方式的分析,对图书馆开展网络资源组织和管理提出了几点建议.提出图书馆应该做好资源建设规划,建立一个良性的馆藏资源保障系统,根据目的性、系统性、连续性、准确性、开放性的原则对网络资源进行“选择性采集”,确定任务,明确目标,通过某种方式进行资源组织,最终将网络资源纳入统一的馆藏资源系统中,建成具有馆藏特色的数字资源体系。目前,图书馆从业人员的知识结构比较单一,高级人才和复合型人才比例偏低,图书馆在引进复合型人才的同时,加强现有人员的人才继续教育,培养复合型人才。网络资源的组织管理不仅仅是作为图书馆馆藏资源的补充,更重要的是作为图书馆为用户提供信息服务的平台。网络信息资源经过采集、加工和组织整理,实现了网络信息资源的增值。图书馆以用户需求为导向,有计划地组织网络信息资源,建成特色馆藏资源,并与本馆资源融为整体,形成一个良好的信息资源使用环境,是当前图书馆的重要职责。
  • 摘要:近年来,随着Web2.0的兴起,社交网络已经成为互联网的重要应用之一,由于这种互联网资源类型对保存国家记忆和文化具有独特的历史作用,其保存问题正日益引起图书馆界的重视,本文通过简要评述美国国会图书馆对社交网络资源的采集和保存实践,指出社交网络信息的采集与保存是一项庞大的系统工程,它涉及保存理念、技术风险、经济成本、法律依据、管理体制、隐私保护等诸多方面的问题,因此,需要图书馆更加积极地面对新挑战,认真思考我国社交网络资源的采集与保存策略问题,保存好我国数字文化遗产,服务社会。
  • 摘要:网络信息资源保障体系建设是现代化数字图书馆建设的一项重要内容,网络信息资源的长期保存工作影响和决定着图书馆服务工作的发展方向.首先对日本国立国会图书馆WARP项目的发展历程、采集策略和工作流程进行了研究分析,然后通过总结WARP项目的特点和优势,为我国相关信息资源保存项目的发展和建设提供借鉴.
  • 摘要:随着数字技术和因特网的发展,数字资源不断涌现,数字资源的长期保存成为了一大难题.本文从数字资源长期保存的基本内容出发,分析了我国目前数字资源长期保存所面临的各方面挑战,指出具有数字内容的载体更容易受到破坏和灾难性的损失。由于数字资源依赖于计算机,没有合适的软件和硬件是无法对其中的信息进行存取的。目前,一些标准尤其是行业标准严重滞后于国际发展水平,滞后于实际操作,而且至今仍没有一套关于兼容问题的全球公认的数字资源长期保存的国际性标准。因此,这样也就增加了数字信息在新旧平台间转换的难度。提出必须对信息寄存的载体进行选择,对保存媒体的环境进行控制,以延长媒体的使用寿命。在数字资源长期保存中,技术策略是全部策略赖以依附和执行的基础,是数字资源长期保存的核心与关键。在贮存与存取数字信息等方面,也存在着ISO标准,如互用性标准、资源著录标准、数据格式标准、资源标记标准、数据归档与文献管理标准等。借鉴这些标准,有利于图书馆间的数据交换,促进图书馆系统的互操作并支持我国与国际图书馆网络的互操作,这些无疑对开展数字信息资源长期保存活动起到了很好的规范和引导作用。
  • 摘要:本文介绍了对网络信息资源进行组织管理的几种方式以及图书馆如何对网络信息资源进行组织与管理,指出图书馆应在网络信息资源组织与管理方面积极有为。在网络环境下,信息资源在其数量的巨大、分布和传播范围的广泛、信息内涵的扩大、信息类型的多样以及信息传递的快速等方面,远远超出了传统的非网络信息资源组织管理方式和技术所能覆盖的范围。网络环境为信息资源的管理创造了空前复杂的环境,对信息资源的组织与管理提出了更高的要求。目前对网络信息资源进行组织使用得较多的方式主要有4种:文件方式、主题树方式、数据库方式和超媒体方式。图书馆必须针对不同的网络用户群,对网络信息资源进行科学而实用的组织管理,通过对网络信息资源的挖掘,将无序分散的信息经过重构与整序,成为符合用户需求的信息,方便用户利用。面对因特网上五彩缤纷且杂乱无章的庞大信息资源,信息的组织管理显得日益重要,图书馆应充分发挥自己分类加工、组织整序文献信息的专业特长,用“图书馆员的思维”组织管理网络信息资源。通过对网络信息资源进行有效的组织管理,使现代信息环境高度有序化,方便用户查询信息,从而提高信息资源的利用率。图书馆完全可以在网络信息资源组织管理方面积极有为,积极进行数字图书馆的研究和建设,形成自己的优势,成为网上信息资源的中心枢纽,从而转变图书馆的传统形象,赢得生存和发展。
  • 摘要:数字资源长期保存是图书馆资源建设的一个重要环节,本文介绍了数字资源的特点,分析了数字资源长期保存所面临的相关技术问题,提出了解决数字资源长期保存的技术方法.指出数字资源的依存性对长期保存是一个严峻的挑战,一旦软硬件技术升级换代,原有的信息可能会无法读取。为了克服设备、技术的更替对数据保存带来的不利影响,选择恰当的技术策略显得尤为重要,国际上通用的保存技术有迁移、仿真、UVC法。
  • 摘要:本文针对地市级图书馆数字资源长期保存面临的难点,分析了其资源构成特点和实际状况,指出了地市级图书馆数字资源长期保存建设中存在的问题,从地方政府层面制定数字资源长期保存相关政策,争取专项资金;确定数字资源保存规划;建立数字资源长期保存的标准;完善体制管理四方面论述,并提出了相应的解决方案.
  • 摘要:互联网资源是图书馆的虚拟资源和战略资源,其作为馆藏建设和发展的核心,对于提升图书馆的公共文化服务能力具有重大作用.本文论述了互联网资源的特点和类型以及我国图书馆互联网资源采集过程中存在的诸多问题,并从法规制度、馆际合作、资源开发、人员经费等几个方面阐述了图书馆互联网资源采集的可行性策略.
  • 摘要:文章阐述了数字资源长期保存的概念,分析了数字资源长期保存的现状及面临的问题,提出数字资源长期保存是一项长期复杂的工作,保存机构要加强人才队伍建设,确保数字资源保存工作能够长期有效地进行下去。对图书馆的特色馆藏、核心数据须进行长期保存,以保证数字资源的长期安全存取。如果能在数字信息的生产和管理中使用标准格式,将更利于数字资源存取与维护的完整性,使数字资源更好地得到长期保存和可持续利用。
  • 摘要:随着时间的流逝,中国互联网上出现过的信息资源会成为一笔宝贵的财富,会为各领域和各行业提供持续价值.为了使历史网页不会随时间的流逝而改变,并且每日不断记录网站的变化,不更改以前的保存结果,需要一个适合于Web规模的存档系统.在本文中,提出Web Infomall系统,它是专为搜集、组织与服务大量的网页而设计的,该系统从2001年以来收录了约85亿网页,每天还以约100万到200万网页的数量增加.在保存下来的网页集合中,可以通过时间和空间URL两个维度来定位一个网页.因此对于一个URL,可能有一组在不同时间抓取的网页与其对应.在系统中,排好序的网页是依照一定的时空粒度放在一起的.这样的好处是,指定URL和时间,用户能够有效地检索到相应网页;或者根据URL范围和时间范围,获得某些批次的网页.
  • 摘要:本文介绍了网络环境下公共图书馆信息资源的基本概念,信息资源采集的技术方法和主要采集策略,并结合国外网络信息资源采集的经验提出了我国公共图书馆网络信息资源采集的建议.
  • 摘要:信息时代,网络信息资源极为丰富并保持高速增长,为了保存这些弥足珍贵却又转瞬即逝的互联网文化遗产,各国图书馆纷纷开展了网络信息资源的采集与保存工作.中国国家图书馆也在网络资源采集方面进行了积极的实践与思考,在采集策略和采集资源的整合与利用方面均积累了丰富的经验,但是在保存标准、技术更新、经费投入和法律保护等方面仍然面临着很多问题和挑战,需要以后不断改进和完善.未来,国家图书馆将依托数字图书馆推广工程,采用与各省图书馆联合共建的方式,推动我国互联网信息采集与保存工作的全面开展.
  • 客服微信

  • 服务号