首页>中文会议>工业技术>自动化技术与计算机技术>第七届(2009)两岸三院信息技术与应用交流研讨会
第七届(2009)两岸三院信息技术与应用交流研讨会

第七届(2009)两岸三院信息技术与应用交流研讨会

  • 召开年:2009
  • 召开地:丽江
  • 出版时间: 2009-09-14

主办单位:中科院计算机网络信息中心

会议文集:第七届(2009)两岸三院信息技术与应用交流研讨会论文集

会议论文

热门论文

全部论文

全选(0
  • 摘要:文献、文物与档案资料,在透过数位化处理後,成为人文教育上的素材与资源。如何运用这些素材与资源,从而落实数位典藏资讯的知识化与社会化,成为近年数位典藏工作主要课题。由於图像动画的特质,加上资讯媒体与网路科技,试着将专业知识转化为浅显易懂,藉由动画来引发观赏者的学习兴趣,让一般社会大众得以方便迅速地亲近历史与学习文化,已然成了现代趋势。本文尝试说明本计画在历史素材之应用与推广上,结合动画方式的实际经验,及实作过程中所依循的原则与方向。
  • 摘要:「国家型数位典藏计画」─「语言典藏计画」始於2001年;共五个汉语与台湾南岛语的数位化典藏子计画。数位化的内容有甲骨金文简牍,近代汉语文献,现代汉语文献,现代汉语语音,台湾闽南语与客语古籍文献与资讯地理语言调查,以及台湾南岛语故事叙述语言调查与标记。计画的目的在纵向典藏汉语的演变资料与横向记录汉语在台湾的使用情况。在汉语典藏计画,由於典藏物为古籍,影像与语音,因此数位化後设资料必需能描述多样性的内容。语言相关的外在後设资料例如使用的区域,使用者的社会经济条件等必须记录。语言的数位化并不仅止於资料的电子化。语言经过标记与处理才能真正达到数位化应用与典藏的目的。因此语言本身的内在後设资料,例如文字的释义,词语的词类等也都列入汉语典藏的数位化内容。文字内容数位化过程中,解决缺字问题尤为重要。目前由资讯所提供协助以汉字构形资料库建置。台湾南岛语目前各族群能使用母语的人口正在逐年下降。数位典藏保留濒危语言工作亦是刻不容缓。後设资料包含族群,区域,语类,语言标记。典藏对象也多有相应的语音档案,以供记录保存第七届(2009)两岸三院信息技术与应用交流研讨会论文报告集汉语与台湾南岛语的数位典藏之用。
  • 摘要:在历史研究的领域中,「个人到社会关系」是很重要的焦点核心,提供了历史研究的多元切入点。从个人到社群,从姓名到身份地位,从人生价值到生命功过,这些资讯不仅谱写了过往的历史,也丰富了後世的追寻与探索。因此,成为历史研究不可或缺的经典素材,而层出不穷的工具书,也致力於此资讯的整理,提供各式各样的资讯脉络。本文从资讯内涵及系统功能二方面进行关连性分析,聚焦在明清二朝,试图重整分散在史料、参考工具书中的多元资讯,以「尊重史料」的原则,建立详实的【明清档案内阁大库系统】、【明清档案人名权威资料查询】、【明清职官系统】;以「资讯服务」为目的,提供多元、弹性的系统功能;以「使用者特质」为依归,透过系统的分析与规划,展开明清二朝个人(人名)至社会关系(职官)的脉络连结,再藉此脉络重新组织明清档案,辅助历史研究者寻找研究议题,连结研究取径,以此提供「多元脉络」的资讯服务。
  • 摘要:网路资讯应用环境错综复杂,使资讯单位的临柜服务工作,显得捉襟见肘。今日客户为迅速获得问题的解答,多迳洽相关资讯技术人员,使传统单一服务窗口的功能日渐萎缩,甚至乏人问津。为有效运用服务资源并管理服务品质,化整为零的电子服务台乃继之而起。基本上,电子服务台系网路化的单一服务虚拟窗口,其内建的工作流程管理机制,将客户问题派给恰当的技术人员,并自动记录个案处理过程。因此,规划设计得宜的电子服务台,不仅可提供丰富亲和的客服介面,并可有效汇集可靠的服务管理资讯。中央研究院计算中心电子服务台於2008年7月正式上线使用,本报告将分别说明其背景理念、使用情形、遭遇的困难及後续发展等。
  • 摘要:根据国务院《地方志工作条例》的规定,地方志是指全面系统地记述本行政区域自然、政治、经济、文化和社会的历史与现状的资料性文献。从工作属性来说,地方志是由各级政府组织编纂,属于公共文化的重要组成部分。截至2008年底,全国已出版第一轮省市县三级志书5800 余部,第二轮三级志书 370 余部;编纂部门志、行业志、山水名胜古迹志16000 余部,乡镇村志2000 余部;整理历代方志2000 余部;出版地情书6000 余部;编辑年鉴2000 余种,字数数以千亿计,形成我国社会科学领域的重要成果群,世界上独一无二的地方志文化资源宝库。如何将地方志文化资源和当前迅猛发展的数字化、网络化技术紧密结合起来,通过网站、数据库,充分发挥其在公共文化服务体系的重要作用,是当前各级地方志工作机构正在探索的重要课题。本文试从当前地方志数字化、网络化建设的现状着手,就地方志数字化、网络化建设的属性,在公共文化服务体系中的地位和作用,以及存在的问题及解决问题的途径等进行阐述。
  • 摘要:信息技术应用于社会科学研究是社会发展的必然趋势。信息技术对社会科学研究做出了积极贡献,但目前还面临着许多问题。解决之道就是政府、企业和学术界的联合与合作。
  • 摘要:对於历史文化及环境变迁研究工作来说,时间与空间是其中两大核心要素。要将现代化的地理资讯系统技术应用於人文社会科学研究上,首要是建立历史地理资讯系统解决时空资讯对位的基本问题;中央研究院在2000年完成「中华文明时空基础架构」建立,搭建出新、旧空间资讯可以彼此整合的资讯平台,之後并积极谋求与各式主题资料库结合,并运用新的网际网路地理资讯系统技术,形成各具特色的专题人文地理资讯系统。本研究举「殷周青铜器地理资讯系统」为例,将地理资讯系统结合中央研究院历史语言研究所建立「殷周金文暨青铜器资料库」,运用「中华文明时空基础架构」之上古时期(商、西周、春秋、战国)的河川、国名、地名点、城邑等历史图层,搭配当代地形图和卫星影像等图层相互套叠,提供文物出土地准确与翔实的地理参照与定位资讯;该系统提供地图检索介面,让使用者可以方便地透过地理区域 /范围进行资料检索,直观地展示出青铜器出土的具体地点及其地貌状况,并能透过设定不同检索条件来筛选资料库,探讨相同类型青铜器之地理分布特性,对於学者进行相关历史学研究带来很大的助力。
  • 摘要:本文主要阐述中国社科院社会调查数据平台基本功能。数据平台主要是是针对目前国内对调查数据资料分散、难以共享的现状,根据国内外的经验,社会调查数据平台的目标首先是收集、汇聚各类社会调查数据和资料,整合信息资源,其次是整理、规范社会调查数据和资料,提高数据和资料的利用价值。第三是建立社会调查数据和资料的发布与共享机制,对平台建设的功能设计是以项目组为单位,功能包括数据资料采集、数据校验、数据上传下载与检索、数据在线分析四个功能。其中数据采集功能整合了CAPI系统,完成数据接收以及调查流程管控等功能;数据校验功能包括批量定义校验数据规则、记录修改流程等;数据上传下载与检索主要是汇集调查数据并提供适用,同时通过内容检索和空间信息检索来查询相应的调查数据;数据在线分析是将R 嵌入到数据平台针对调查数据提供相应的基本统计分析。另外相关的定性访谈资料等,与地理信息系统相结合进行相应的检索。
  • 摘要:实时多媒体交互网络教学平台是基于远程教学过程中师生不能及时沟通、交互距离较远的现状提出的,满足了远程教学中师生沟通、远程答疑、远程答辩等实时交互的需求。平台整合了多媒体音视频、白板、文字、协同浏览、协同编辑、程序共享等交互手段,拉近师生情感距离,创造学习的共同体,提高远程教学效果。
  • 摘要:基因转录体分析系针对生物体全部基因进行表现内容研究,旨在探究与比较细胞在特定组织、阶段与条件下的基因表现序列、表现程度与功能等,是基因体科学研究的重要课题。对於快速增加的转录体表现序标帜列(Expressed Sequence Tags,EST)资料等,需要整合式的自动化生物资讯平台来协助生物学家进行快速与有效的转录体分析。因此,我们开发出Bio301-EST序列注解分析系统(http://bio301.iis.sinica.edu.tw/),提供序列清理、组合(assembly)、相似序列资料库搜寻、Gene Ontology(GO)功能注解、统计分析报表、GO图形化操作介面、Microarray探针序列自动筛选以及比较不同EST序列库(library)之间的功能差异。实验测试结果显示,Bio301提供可靠的功能性比较分析结果;同时,Bio301已经累积服务来自台湾、大陆与澳洲(Australia)共计~140专案,~60万EST序列。近来,随者次世代高通量定序技术的进步与落实,愈来愈大量的转录体序列不断增加,且一次实验产量从先前的百万硷基对(base pair)提升到百亿硷基对,造成转录体资料处理分析极大的挑战。我们已经建构了雏形系统,开始协助生物学家进行数个台湾特有物种的高通量定序转录体分析研究。
  • 摘要:本文结合世界史学科特性及学科资源特点,以科研教学信息的需求和现状为出发点,阐述学科网站在提供“一站式”资源信息服务的同时,还应结合科研活动深入开展知识服务。并以哈佛大学图书馆开放式馆藏计划为例,分析了一种主题式的网络知识服务。
  • 摘要:中国科学院网站群建设是一项庞大的系统工程,目标是建成以中国科学院门户网站为主站,院属各单位网站为子站的中国科学院网站群体系。本文主要介绍该工程的设计思路与实施进展,并从子站建设方式、实施流程、项目管理与进度控制等方面进行详细探讨。
  • 摘要:冷冻电镜是研究生物大分子结构的重要手段,本文研究了冷冻电镜技术的关键问题之一,重构三维密度数据的分析问题。我们研究设计了一个冷冻电镜重构数据的可视分析系统-VAT4M。VAT4M把体绘制引入该数据的可视化中,研究了基于GPU硬件加速的raycasting算法,帮助生物学家快速轻松的发现隐含的数据内涵。在数据分析处理方面,利用了病毒结构的特点,提出了自动分割算法和骨架搜索算法。最后给出了应用实例。
  • 摘要:为配合推动生物多样性公约与台湾生态的保育及永续发展,及执行数位典藏计画,国科会生物处与农委会林务局分别自2002及2005年起委托中研院执行「建置台湾物种名录计画」。在全台湾160余位各生物类群分类专家的共同努力下,於2009年初出版了台湾第一本官方物种名录,共登录了五万多种生物。目前本土种共有8界55门128纲613目2,917科16,482属50,387种。外来种及归化种等共有8门14纲82目171科644属1,056种。其中,台湾的「特有种」比例极高。在哺乳类约为71%、鸟类17%、爬虫类22%、两栖类31%、淡水鱼19%、植物有25%,某些类群的昆虫更高达60%。这些物种名录的资料包含有分类阶层、命名者、年代、引用文献或标本记录等,均可在TaiBNET(http://taibnet.sinica.edu.tw)及TaiBIF(http://taibif.org.tw)网站上查到。此二网站亦提供完整的网路查询及服务功能,如由学名、俗名之字串查询,或由分类树查询,并提供学名核对、下载、同种异名录,及支援合作网站之学名连结等功能。本资料库目前正努力蒐集照片及物种基本解说等资料,相信对研究、教育、保育,农林渔牧之应用,及提升台湾分类学的能力建设均甚有助益。未来会持续与大陆和国际相关的资料库计划合作(Species2000,GBIF,BOL,EOL…),交换资料及相互接轨。
  • 摘要:由中国科学院计算机网络信息中心、中国科学院植物研究所、中国科学院深圳仙湖植物园“三方两地”共同合作研究建设的陆地植物发育系统系统发育平台(PALPP)意在为科研人员提供数据和分析并举的工作平台,承担数据汇集和面向实际科研工作应用的双重作用。PALPP的应用数据涉及到核酸(DNA、RNA)、蛋白等的相关数据。在数据的整合以及各处理模块输入输出处理中,涉及多种生物信息学数据格式的应用和转换。本文针对陆地植物发育系统系统发育平台(PALPP)涉及的生物信息数据格式和其抽提技术进行研究总结,比较了国际生物信息学数据的主要存取式(GenBank、EMBL和SwissProt、FAST和NBRF、Intelligenetics格式、PIR格式等)和典型生物信息学处理工具的应用格式特点,提出在生物信息学术的抽提方法并进行应用示例。
  • 摘要:科学研究离不开对知识的理解和共享。科研信息化(e-Science)使得科学研究越来越多地通过因特网进行全球性、跨学科的大规模的合作,这也为知识共享提出了新的要求和挑战。中国科学院青海湖联合科研基地是一种跨多个研究所、结合院地合作,基于信息化e-Science科研、协作模式。本文在分析了该环境下科研协作的特征和对知识共享需求的基础上,着重研究了从数据的共享和融合到信息与知识的共享和融合等不同层次协同活动要求。结合虚拟科研平台(duckling),建立了一个基于知识共享的协作模型,保证了在虚拟环境下的科研协作中,科学家可以得到及时、个性化的信息知识服务。该模型利用了本体映射、元搜索、信息可视化等技术。
  • 摘要:青海湖自然保护区的工作者以及中国科学院多个研究所的工作人员对基于移动设备的数据采集系统均存在着迫切的需求,在这个背景下,我们提出了可定制移动数据采集系统的研究目标。经过近一年的努力,我们基本实现了可定制移动数据采集系统,达到预期的设计目标:通过定制操作满足各种不同的需求,扩展了系统的适用性。本文通过描述该系统在青海湖自然保护区的应用,介绍可定制移动数据采集系统的功能、使用方法及使用效果。
  • 摘要:伴随着信息技术的发展,卫星跟踪技术使得长时间连续跟踪野生鸟类成为可能。同时,鸟类长距离迁徙过程中的栖息地,迁徙路线的知识,在生物学行为研究,动植物栖息地保护,以及鸟类禽流感(H5N1)传播路线的研究上有着重要的科学意义。为了满足卫星跟踪知识发现的需要,本文将传统生物学的问题转化为一个计算问题,并利用数据挖掘的相关方法来进行鸟类跟踪数据的分析。本文首先利用层次聚类(HDBSCAN)的方法从空间中的离散数据点中发现鸟类的栖息地,然后使用关联规则(AssociationRule)得到鸟类的迁徙路线。实验证明层次聚类方法能够有效的发现斑头雁秋季迁徙的不同生活史阶段相应栖息地空间分布;关联规则挖掘能够发现斑头雁群落秋季迁徙过程中在青海湖和拉萨河谷地区之间的迁徙路线。
  • 摘要:产业结构与区域经济发展之间存在密切联系,工业化和城市化已经被证明为是经济发展的一条必由之路。产业结构的变化也会带来经济发展模式的调整,工业化是推进地区经济成长的积极动力。反之,经济的发展往往伴也会推动产业结构的变化。然而产业结构的变化在很大程度上与区位和交通状况是密切相关的,工业化程度较高的地区往往都是那些交通条件便利的地区。因此,在很大程度上可以说是区位和交通状况影响了产业结构,从而影响了区域经济发展模式。本文的研究基于县域经济之上,以河南省县域经济发展为具体研究对象,利用地理信息技术,分析了交通状况、产业结构和区域经济增长之间的关系,证实了交通状况对于产业结构变化的推动作用,同时指出,区域经济发展模式有趋同的特征,但河南县域经济增长之间的差距却有扩大的趋势。从发展区域经济的角度来看,通过改善交通条件,优化产业结构以及加强区域间经济合作等举措是有效推动区域经济发展的主要举措。
  • 摘要:考古调查和发掘中获得的资料都具有空间属性,考古遗址内的遗迹、现象乃至一件器物或陶片也都可以用准确的数据来表示各自的空间位置。所以考古GIS的建设首先应该表现在考古发掘中,发掘墓葬或探方中的所有数据都可以在GIS中进行组织,建立考古发掘的图文数据库。考古发掘中各墓葬、灰坑、建筑基址等的详细图形也都应该通过GIS进行表示,甚至表现墓葬中的器物、陶片分布等细节特征。考古GIS建设对整理发掘报告、开展后续工作以及遗址的保护规划等都具有重要的价值。由于现有的商业GIS软件功能庞大,价格昂贵,操作复杂,考古专业人员与技工很难掌握和使用,所以并不适合田野考古发掘现场GIS建设的需要。为此,考古研究所主持开发了一套发掘现场GIS数据采集的软件,依据国家有关技术规定与要求,结合空间数据库等先进技术,采用先进的软件设计思想,基于当前田野考古管理工作的实际需求开发管理程序,以实现对数据方便、快捷、高效的管理;建立数据动态更新机制,以维持信息的现势性,有效的提高工作效率。
  • 摘要:媒体技术的革命和经济的高速增长,引发了文化需求量的放大,网络的写作与言说使人们实现了快捷的诉说和自由发表的梦想,网络文学就是这样一种依托技术力量形成的文化,网络多媒体技术和超文本技术的交互性和人——机主体界面的生成改变了文学的生成方式,在某种意义上成为人们尤其是年轻人的网上生存方式。本文分析了技术与商业双重推动带来的负面影响,探讨了如何在产业化过程中保持文学主体性,并指出商业资本的注入壮大了网络文学。
  • 摘要:本研究目标旨在探讨全民健保的医院总额支付对住诊医疗品质的初步影响。研究方法以回归分析的方式在控制病患的疾病严重度後,於2002年7月开始实施的总额支付对病患住院30日内死亡率、出院後30日内再住院率及感染率的影响,特别关注医院层级、权属等特性的影响。采用的资料为2000至2004年全民健保住院明细资料。财团法人与私立医院的死亡率在总额支付实施後有所改善。私立地区医院病患的再住院率较总额实施前显着为低。财团法人与公立医学中心的再住院率较总额实施前与私立地区医院病患的差异显着为高,感染率则显着为低。财团法人与公立区域医院的再住院率及感染率皆较总额实施前与私立地区医院病患的差异显着为高。全民健保的医院总额支付使医院冲高服务量以为因应,再住院率是冲量的管道之一。总额实施後公立与财团法人医院病患的感染率恶化,医学中心则有所改善。以死亡率为指标时,则是不分权属都有医疗品质改善的结论。
  • 摘要:随着多媒体技术的不断发展,多媒体文件越来越多,如何管理、开发和利用好这方面的资料,使展示变得更加方便快捷,是数据库建设的一个主要内容。多媒体数据库就是通过对图像、语音、视频等载体形式资料进行管理和利用的数据库,与传统文献类数据库相比内容更加生动形象,形式更加多样复杂。本文主要介绍几种常用的多媒体文件格式及其特点,以及在SQL Server环境下实现多媒体数据存储与读取的常用工具和具体方法,并对多媒体数据库如何进行深度挖掘进行了探讨。
  • 摘要:社群网路网站是Web2.0世代里十分重要的服务之一。在这类型的网站上,人们可以认识新朋友,互相交流,或与现实世界中的朋友们保持连系及互动;透过网际网路的通讯能力,连接处於不同位置的人们。然而,当人们的互动从面对面的形式转变成在网路上进行,许许多多的个人资讯及行为不知不觉中累积、甚至曝露在网路空间中。人们在欣喜互动的过程中,通常忘了自己的隐私资讯正一点一滴地泄露给网路上不知名的窥探者。在本文中,笔者将从网路资料的不可抹灭性开始,探讨在社群网路服务中常见的资讯泄露方式,以及哪一种系统/设计/使用习惯容易造成这些资讯泄露情形,这包含使用者主动的自我资讯泄露以及不是由使用者本身造成的二手资讯泄露。同时,笔者也将介绍由於社群网路服务流行为後而兴起的网路资安隐忧,并以可能的解决方案做结。透过这篇论文,以倾听的姿态,希望见到大众对於Web2.0资安隐忧的正视与回响。
  • 摘要:近年来由於资讯科技的进步以及档案法施行的影响,台湾档案馆之营运管理亦需随之调整。在数位化的时代,无论就档案徵集、档案编排、档案描述、馆藏数位化、读者服务、资源整合与馆际合作等,档案馆的经营策略皆有不同於传统的处理方式,本文拟针对这些问题,以中央研究院近代史研究所档案馆的管理经验为主,并附带比较国史馆与档案管理局数位档案的经营管理之现况,作为探讨「台湾经验」之例证。
  • 摘要:日记是历史研究的顶级资料,直接反映记主的想法、真实感受及其生活的时代背景,不仅可以研究记主个人生命史和家族史,更可提供异於统治者制式说法之庶民观点。本所蒐藏的民间文书中,私人日记为主要特色典藏之一,包括:日治时期台湾政治民族运动领导人物林献堂(1881-1956)日记27本(1927-1955);黄旺成(1888-1879)日记49本(1912-1973),以及杨水心(林献堂之妻)、高慈美等女性日记。日记是第一手史料,但在历史研究的运用上,却有其限制,主要是内容记载简略,需要进一步补充相关史料佐证;且台湾日记在记载语言的多元性特质,有中文、日文、白话罗马字、外国语言,或因记主跨越不同政权时有不同语文夹杂情形等。原始资料利用不便,需有专业研究人员进行全文解读与相关史实考证。由本所殖民地史研究群召集成立的日记解读班,已有可观的出版成果。为扩展日记史料及注解内容的应用,本所自2008年起规划建置「台湾日记知识库」,期望突破纸本印刷发行的限制,以数位内容形式,提供日记全文及其注解的线上查询与开放取用。知识库系统的设计,是以水竹居主人(张丽俊)、灌园先生(林献堂)等已出版的台湾人日记,将第一手史料作为知识库原始资料来源,经由专业社群解读内容与考证注解等知识组织程序,并应用Web2.0之协同创作系统,扩大专业社群所参与的协作环境建置而成的知识库,最终目标是开放公众利用专业社群共同创作的资讯与知识。本文将以台湾日记知识库为主题,分析知识库规划面向,和介绍雏形系统功能。
  • 摘要:本文以词典数据库的建立和管理、以及词条结构定制为例,介绍辞书数据结构模式(XML Schema)在辞书辅助编纂系统中的应用。在辞书辅助编纂系统的任务流程中需要多部词典参与,词典是这个系统最基本的数据资源。文本形式的词典是一种用非结构化形式表现的、具有半结构化特征的语言数据。为了能够系统地组织并完整地描述词典中语言数据的表现形式和其中蕴涵的语言知识。我们在辞书数据结构模式(XML Schema)框架下,对词典文本进行词条结构标注,再把文本形式的词典转换成XML文档,在非关系型嵌入式数据库Berkeley_DB XML平台为几部现有词典建立了数据库,供辞书辅助编纂过程中用作参照。对于新编词典数据库,也要先在辞书数据结构模式的支持下定制词条结构,编纂系统会根据定制了的词条结构生成新编词典数据库的数据结构、生成管理和访问在编词典数据库的辅助数据表,同时还生成在前台供编者使用的编写操作界面、数据显示格式和数据保存格式。在编纂系统里,可以用同样的方法同时创建几部新的在编词典。各部在编词典数据库,连同已有的参照词典数据库,都在辞书数据结构模式的支持下统一管理,用统一的操作进行访问。
  • 摘要:本文介绍我们在研制辞书辅助编纂系统的过程中,用数据库软件管理辞书内容和语料的实验与探讨。以往的辞书数字化工作大多是把词典做成二维表,再用关系型数据库来处理。我们选择用XML Schema作为辞书数据结构模式来为词典数据建模,用原生XML数据库Berkeley DB XML作为辞书数据的管理平台。XML的数据结构适合描述语文词典的结构形式,XML Schema的树形模式能够很好地体现词条结构的层次关系和管辖关系,可以方便地描述不定长内容的词条属性、不定量重复出现的词条属性和词条属性的嵌套关系。另外还可以根据词条描述的需要,动态地为XML Schema补充子树或者元素,只要不违背原有的树形结构规则,就不会影响以前标注过的词典数据的有效性。这些都是关系型数据模式不容易作到的。用Berkeley DB XML处理辞书数据,与传统的二维数据库相比,文档格式也更自然、灵活,存取更便利,有利于辞书数据的高效存储和快速访问。在Berkeley_DB XML上创建词典数据库之前,需要对辞书文本做预处理。我们先在XML Schema框架下,对已有辞书的文本做词条结构标注,经过验证,得到格式良好并有效的XML文档。然后建立在XML Schema约束下的、以词目为单位的辞书XML文档,再将文档以节点方式批量导入Berkeley DB的容器中,并同时根据使用方式设定多线程(进程)锁策略。辞书容器建立以后,根据词典编写过程中的各种编辑检索需求,还要针对XML文档元素设置相应的索引类型,编制适当的索引策略,以达到快速读写、高效访问的要求。在Berkeley_DB XML上为辞书辅助编纂系统建立的词典数据库,包括全部在编词典和参照词典,不同的词典在数据库容器里用命名空间加以区别。在Berkeley_DB XML上,词条检索任务是由XQuery解释器来完成的。为提高检索速度,需要对元素进行路径、节点和关键字的索引创立。BDB的事务子系统、锁子系统和日志子系统共同协调完成对多用户查询和单用户修改的多进程操作和数据库的数据保护。
  • 摘要:社会科学研究领域的师承关系是一类重要信息。为了解师承关系对社会科学研究活动的影响状况,结合特定领域的学术特点和关系特点,构建该领域的具有特定师承关系的人物关系网络,应用社会网络分析方法,得出定性和定量两方面的结论。在中国少数民族语言文学研究领域的实验结果表明,师承关系的影响是多方面的,每一个方面的影响范围和程度与其对应的人物关系网络的结构和属性紧密相关。
  • 摘要:数据的存储与处理在科学研究中的地位越来越重要。高效、绿色、可靠的存储环境是科研活动的基础要素之一。本文介绍了中国科学院数据中心的建设情况。针对不同科研单位各自科研数据的特点,采用多样化、分层次的虚拟存储结构,把存储资源组成同一文件系统对用户提供服务。利用linux下开源的XEN虚拟机技术,整合数据资源中心计算资源为用户提供云计算服务。通过把虚拟化存储与云计算应用相结合,用户既可以直接访问存储资源,又能方便的利用计算资源对数据进行处理、发布。本文就并行存储、分级存储、节能、虚拟化、云计算等方面进行了详细讨论。
  • 摘要:现代图书分类法在适用古籍文献时常有削足适履、生搬硬套之嫌。因此,对於大型传统古籍数据库建设而言,中国传统目录学中以经、史、子、集四部分类为基础的图书分类法仍具有不可或缺的作用,这是由学科特点和数据库建设的基本要求两方面因素所决定的,传统文献学所积累的学科规范与现代数据技术处理的有机结合才能更好地适应新时期数据库建设的需要。对於文献种类繁多、内容庞杂的综合性古籍数据库而言,尽管计算机有强大无比的检索功能,可以任意提取所需字段或数据,但是,相关数据按照一定的规则进行有序排列仍然是十分必要的。而对於古籍数据库建设而言,按照经、史、子、集四部分类法进行排列仍然是迄今为之最好的解决方案。将传统目录学与古籍数据库建设联姻,进行古籍分类和数据导入,其优越性表现在:一、作为数据库底层数据分类的依据,有效避免因分类混乱产生的讹误。二、可以作为确定数据属性的依据,每一条数据都属於每个部类下的某个子类,只有首先按照目录学知识对每条数据进行定性,才能使整个数据库具备符合学科要求的检索功能。中国社科院A 类课题“元代文献数据库”以四部分类法为基础,选择精良善本作为底本和校本,在古籍数字化和电子文献学建设方面进行了有益探索。以下从四个方面对此稍加梳理,以就教于学界方家。
  • 摘要:资源匮乏、能源短缺和环境污染日趋恶化等现实问题,已经成为社会可持续发展的巨大障碍。工业生物技术是解决人类目前面临的资源、能源及环境危机的有效手段。中国科学院在“1+10”基地建设中,设置了“先进工业生物技术基地”,面向国际工业生物技术科学发展前沿和国家能源、资源、环境重大需求在生物能源、生物炼制、绿色工业过程等领域布局了一批重要的项目,因此,迫切需要利用e-Science的手段,建设工业生物技术的知识环境,促进资源共享和合作研究。工业生物技术知识环境在中国科学院现有信息化和工业生物技术研究布局的基础上,整合和集成必须的生物实物资源信息、专利信息、文献情报、产品、企业、政策等信息,建立工业生物技术基地综合知识仓库、开展信息定制、信息推送等主动的个性化信息服务;建立虚拟实验室,促进交流与合作,从而改变科研人员传统地进行科研活动的方式;同时开展面向重大科研项目的综合信息服务,从项目立项调研、给予全方位的信息技术支撑,提高IT 手段对生物学领域重大科研项目的支撑能力,对于提高中国科学院在我国工业生物技术领域的影响力和竞争力有着非常重要的意义。
  • 摘要:中央研究院早在1990年即已展开学术资源数位化工程。1995年上线的 汉籍电子文献资料库是迄今最广受学界重视和使用的巨型中文古籍资料库。2002年开始至今,本院更大规模将各所蒐藏且具特色的原始典藏品数位化、网路化,供学界运用。内容包括:台湾地区鱼类、贝类、植物、原住民文物、台湾古文书、古地图、古契约、近代中国历史地图遥测影像、外交经济档案、珍藏中国历史文 物(中原与台湾考古遗存、殷墟墓藏、金石拓片、简牍文书、善本图籍、西南民 族学、明清档案),汉语与台湾南岛语典藏,以及数位典藏资讯技术等。现己有中央研究院早在1990年即已展开学术资源数位化工程。1995年上线的 汉籍电子文献资料库是迄今最广受学界重视和使用的巨型中文古籍资料库。2002年开始至今,本院更大规模将各所蒐藏且具特色的原始典藏品数位化、网路化,供学界运用。内容包括:台湾地区鱼类、贝类、植物、原住民文物、台湾古文书、古地图、古契约、近代中国历史地图遥测影像、外交经济档案、珍藏中国历史文 物(中原与台湾考古遗存、殷墟墓藏、金石拓片、简牍文书、善本图籍、西南民 族学、明清档案),汉语与台湾南岛语典藏,以及数位典藏资讯技术等。现己有将近百个学术资源库。本院为方便网路使用者了解和使用,特意设置数位典藏资源网站,用以显示其多 元性,除提供跨资料库搜寻机制,浏览与关键字查询本院学资源库以外,设计各 种页面和游戏促进数典知识的散布与流通。本院亦透过数位资源网站,协助各资 源库进行智慧财产授权。又本院技术团队过去在技术研发方面,曾陆续开发多项 技术,包括Metadata分析、图片影音多媒体资料处理技术、典藏资料库建置与 检索技术、地理资讯系统技术、Web 网路服务与推广技术、缺字与异体字相关 技术等,未来将继续为数位典藏工作提供稳固的技术资源。为求推广数位成果,本院更设置数位典藏展示中心,邀请本院各数位典藏单位轮 流策画专属特展,提供各级学校与机关人员前来参观学习,重点并非了解专业知 识,而是打开一般民众的视野,使其体会数位资源库在提供知识的巨大潜力和无 比方便,更愿意支持国家的数位化计画。本展示中心开展迄今不到两年,现在每年己可接待各级学校与机关团体达8,000 人以上。
  • 摘要:秋海棠属植物约1,600 种,为全球植物第六大家族,广泛分布於热带、亚热带地区,具有丰富的物种与生态多样性,加上特殊的分布式样,为植物研究的绝佳素材。但由於秋海棠家族庞大(仅亚洲至少就有750 种),分类难度极高,兼以标本、文献资料取得不易,许多地区的秋海棠多样性乏人研究。本实验室进 行秋海棠植物分类研究多年,已栽培逾300 种各地原生的秋海棠进行形态解剖、细胞学、人工杂交、分子系统等研究,发表了逾30个秋海棠新种。由於植物分 类资料庞杂,为促进资料的整合,本实验室以「数位典藏国家型科技计画︰台湾 本土植物数位典藏计划」为基础,设置「秋海棠植物知识单元」,内容包含:1. 秋 海棠属植物学名统整;2. 秋海棠属植物田野资料;3. 秋海棠属植物影像(含生 态影像、标本照及植物手绘图);4. 秋海棠属植物地理分布;5.温室植栽资料库,运用条码系统管理温室栽培的秋海棠植株,使温室栽培植物、腊叶标本与影像资 料彼此连结。秋海棠植物分类研究所需的资讯经过整合後,植物分类专业人员得 以同时搜寻以上资讯,且便於植物监定与订正以及资料之同步更新,加速秋海棠植物分类研究。
  • 摘要:本文针对农业领域网络资源的开放性、分散性、层次性、演化性、巨量性等本质特性,提出了一种新的复杂自适应搜索模型。该模型建立了农业信息采集、分类、清洗与服务主体联盟,通过主体对农业资源的网络环境、网页内容、网络拓扑结构的学习与进化和对用户需求的获取与聚焦,提高了搜索引擎对农业领域资源的查全率与查准率。目前,中国搜农已开始为我国广大农业协会、企业、大户以及农技人员提供农业智能化、个性化专业化服务。同时,本文提出的复杂自适应搜索模型对建立其它行业的专业化搜索引擎也具有指导意义。
  • 摘要:随着考古学研究和文化遗产保护的不断深入,考古调查与发掘中空间信息的采集和展 示显得越来越重要。为此考古研究所引进了Lensphoto 多基线数字近景摄影测量系统,用于 对考古遗址、发掘区域、石刻、造像乃至器物进行近景摄影测量,提供地面或石刻、造像、古建筑立面的各种线划图、等值线图、数字高程模型、正射影像图和三维影像图等产品,满 足各种文物考古工作的需要。考古研究所2008年秋季购置了LensPhoto 软件后,进行了大量的现场试验,取得了令 人满意的结果。通过对摩崖石刻、考古发掘现场、小型文物等的摄影测量与数据处理,表明 该软件能够检校照相机参数,并根据电子全站仪的控制测量数据和拍摄的照片,进行数据处 理之后,可以生成数字表面点云、数字高程模型、正射影像图与真实三维模型等多种产品,进一步处理可以得到等值线图、线划图等传统图件,能够对发掘过程中不同层位进行高精度的摄影和测绘,全面纪录发掘现场出现的文物和文化层的三维空间信息,满足考古研究与文 化遗产保护中空间信息快速提取与三维展示的要求,得到了考古界同行的认可。
  • 摘要:为了满足未来社会的能源战略需求,以煤气化、煤热解为核心的能源化工多联产系统将逐渐成为煤炭领域研究的热点和发展方向。我国煤炭资源丰富,不同地区的煤种的品质及其热转化特性差异巨大。因此,利用现代计算机技术,构建中国典型煤种热转化特性数据库将具有重要的科学价值。本数据库收集、整理不同煤种的热转化特性数据,并加以分析和对比,有助于深入研究煤种的物理化学性质与其转化特性的关系;为不同煤种的高效、合理利用提供基础科学数据和技术路线选择的依据。该数据库的建立将满足国家和中科院的重大科研项目,以及企业煤炭综合利用的需要,具有重要的意义。
  • 摘要:有监於执行难度和调查成本日益升高,以及学者对於兼具品质及内涵的调查资料的即时性需求,中央研究院调查研究专题中心负责推动和管理的「学术调查研究资料库」(Survey Research Data Archive,SRDA) 自1994年起开始蒐集台湾地区使用问卷调查得到的原始数据资料,检误、整理以及对外释出,同时建置网站供国内外学术界人士加入会员後,线上查询及下载资料再次利用分析。SRDA 主要以学术性研究及政府机关的调查统计资料为主,为了满足使用者需求,除了释出资料前检核资料正确性并加以格式化之外,我们针对使用者经常遭遇的问题予以处理,尽力消除使用资料的障碍,并且研拟各种增加资料价值的方案,透过训练及推广活动,促进这些调查资料的使用以及增加应用层面的深度和广度。由於SRDA 并非研究委托单位亦非资料收集单位,调查资料需要取得所有权者的授权才能公开让会员使用,依据以往与学者及研究委托单位接触的经验,台湾资料共享风气已普为大家接受,虽仍有提升的空间。此外,政府机关对於能够开放的调查资料内容限制亦趋严格,能否透过公部门与学术界建立信任与合作的关系,依据资料性质设计不同的使用方式来扩大这些调查资料的近用性,分类分级管理和释出,亦是一项有待克服的挑战。
  • 摘要:自Linux开始,开源思想在软件界可谓盛极一时,此类以源代码开放,共同创新为基本思想的软件的兴起,不仅降低了使用者的成本支出,同时也降低了使用者开发的难度,提高了再开发和定制修改的成功可能性。本文从自由软件R的介绍入手,通过对比R与主流统计分析软件的优劣,阐述引入R的原因。同时结合院内相关基础平台的建设情况,着重介绍利用统计软件包R定制开发数据基本统计分析功能的理念和实现方法。
  • 摘要:1928年到1946年间,中研院史语所曾经多次派遣研究人员到黑龙江、湖南、浙江、云南、贵州、四川等地进行民族学调查,拍摄大批少数民族的照片与影片,也蒐集少数民族的文书与文物。并曾於1935年底参与「中英滇缅南段未定界」堪界工作。如此近20余年的时间,史语所研究人员收集了许多珍贵的调查研究资料,包括田野照片5,560张、民族文书872册、民族文物1,279件、以及拍摄了田野影片56分钟。这批尘封的资料在静静躺了70多年之後,因数位典藏计画得以重现於世人面前。「再现」(Representation)4是一种脉络性的呈现,这批民族学资料在数位典藏之後,面对庞大纷杂的资料,该如何呈现这些典藏品,一点一滴的拼凑出典藏品背後的脉络,应用数位典藏深化人文研究,是本计画人员努力的目标。本计画「中国西南少数民族资料库」之田野照片中,更藏有大批的未辨识照片,等着我们去解开它的脉络之谜。拜数位典藏技术所赐,我们得以放大检视这批藏品的细节,配合早期研究人员之文章与调查报告,再加上本计画人员实地之走访,这批田野照片背後许多有趣的故事得以一一呈现。
  • 摘要:国家动物博物馆展示馆位于中国科学院奥运园区,隶属中国科学院动物研究所,是北京地区中型的专业博物馆,以宣传和普及动物科学知识为宗旨,宣传生态环境保护和人与自然和谐共处为理念。博物馆浓缩了动物进化和发展的历史,汇集了大众耳熟能详的动物明星和绝大多数国家保护动物,浓缩了我国960万平方公里土地上的动物物种资源,是开展爱国主义教育的重要基地。本文指出作为科普实体场馆的国家动物博物馆十分需要开发网络资源,开发建设国家动物博物馆网络系统,以解决全国更多的无法到现场参观学习的观众和动物爱好者的求知欲望。
  • 摘要:中央研究院民族学研究所自1998年起即参与数位典藏相关计画,其中包括隶属「数位博物馆先导计画」之「平埔文化资讯网」(1998~,潘英海等人主持)、「数位典藏国家型科技计画」第一期项下之「台湾原住民数位典藏计画」(2002~2007,潘英海主持)、第二期之「台湾民族志数位影音典藏计画」(2008~,胡台丽主持)与「台湾原住民数位知识聚落开发合作计画」(2008~,潘英海、黄树民主持)、及本所自建资料库等。典藏范围含括本所博物馆、图书馆及研究人员保存之文物、文献、影音、出版品与田野工作纪录。计画期间进行了大量且多样的民族学/人类学藏品之数位化作业,并透过相关研究、典藏单位之合作,建立人类学数位资料共通栏位标准,期能使不同典藏单位之数位化藏品得以彼此整合与交流。2008年开始的「数位典藏与数位学习国家型科技计画」(数位典藏国家型科技计画第二期)强调有系统地推广数位典藏之成果。本所数位典藏工作亦由初期的藏品数位化作业,迈向数位典藏成果及相关知识数位化发布与推广之新阶段。本阶段之工作,除继续进行本所藏品之数位化外,也着重在资料库之整合、典藏资料释出规范之确立、数位典藏成果使用机制之建置、及跨单位间数位资料之交换与合作等面向,并建立一套数位资料描述语汇与数位典藏发布平台,以简化典藏资料库管理与维护成本,俾使本所数位典藏得以永续利用。由此,我们着重的议题在如何将民族所已数位化完成的典藏资料以适当的方式释出供研究者以及大众利用。决定以一个「入口网」的形式来作为相关数位典藏资料的整合与发布平台,并开始发展此入口网之资讯系统。将中研院民族所数位典藏之网站定位为一个入口网,而非纯粹的资料库系统之目的,在透过一致性的资讯发布与资料典藏系统与介面,以达成建立数位典藏资料整合入口、数位化资料展示场域、民族学/人类学知识网、与跨单位合作平台等目标。第七届(2009)两岸三院信息技术与应用交流研讨会论文报告集本文分成两个部份描述中研院民族所数位典藏入口网之建置。第一部份将描述典藏资料资讯系统之建置方式,第二部份则将说明从一个入口网的角度建置数位典藏网站的经验。
  • 摘要:台湾由於地理位置与历史发展等因素,无论生态环境或是人文地景都是丰富而多样,极具学术研究价值。国科会目前正在进行的数位典藏国家型科技计画,其主要目的就是要典藏台湾这些自然与人文的多样风貌。然而在典藏的同时,我们也希望透过网路资讯让社会大众与国际友人了解台湾的多重美丽。因此,如何因应网路环境日新月新的变动,是我们必须面对的新课题。网际网路(Internet)经过二十多年来的发展已经成为一种新兴的「社会媒体」,这不仅仅是技术上的改变,也重新改变人们对於网路的观念和行为;这对我们固然是一项挑战,但也提供我们发展数位典藏新策略的机会。美国国会图书馆与知名的网路相片平台Flickr的合作就是一个很好的例子。也就在这样的背景下,我们尝试建构「台湾多样性知识网」。除了整合目前「数位典藏」详实的内容,我们更进一步结合网路「社会媒体」,发展「分享」、「组织」、「合作」、「连结」的策略,并且导入「RIA」(Rich Internet Application)的概念和技术,以此促成「典藏内容」、「电子地图」以及「使用者参与」的三方面结合;一方面藉由使用者的参与和诠释,提升藏品的知识脉络,进一步促成藏品内容及其文化内涵的扩散,另一方面也希望把「数位典藏」发展为一种「全民」参与的「对话」,期盼在大众的参与及对话中,在网路世界呈现台湾的多元面貌。
  • 摘要:在现今的商品仓储或图书管理系统中,条码已经是被广泛利用的技术,而研究机构与典藏单位所拥有的庞大收藏,如果也能整合数位条码等相关技术,针对典藏品进行科技化的管理,相信能加强流通与查询效率,如此,不仅可以节省人力,更可进一步节省宝贵的时中央研究院生物多样性研究中心的软体动物学研究室,在累积多年研究成果之後,现阶段所典藏的贝类生物学标本、贝类人文科学标本与贝类相关文献专书等收藏项目,已具相当的规模。研究团队於2008年起,开始尝试将数位条码技术导入贝类数位知识管理系统。换句话说,也就是积极引进数位条码系统,将软体动物学研究室所典藏的标本、文献、贝类文物等等的「典藏元素」进行知识化管理,希望能够跳脱早期「人工-标签」系统的呆板模式与刻板印象,进一步以「数位资料库-条码」标签系统取而代之。本研究是采用数位条码标签系统,分为「一维条码」与「二维条码」两种,一维条码所搭载的是文献专书编号与标本号,主要是方便管理者管理该笔典藏品的典藏位置与流通情形;二维条码部分,则可以在水平和垂直方向的二维空间储存资讯,将图像、语音、文字等资讯进行整合,进而增加搭载的资讯量。目前,二维条码的资料存储量可达一维条码的数十倍到数百倍,就像是一个携带型的资料库,通过此特性,研究团队所建置的二维条码系统,以记录该笔典藏品的直接资料库网页连结网址为主,使用者仅需要以光学扫瞄器读取条码後,就可以迅速的查阅文献及标本等典藏品的相关资讯,跳过传统生物分类学的搜寻方式,不但增加使用者的查询效率与方便,同时更减少了一般使用者本身对数位条码专业知识程度上的设限,降低网页资料库使用上的门槛,可以使资料库网站的流通更为顺畅。
  • 客服微信

  • 服务号